EM Algoritmo Básico

Expectation Maximization:
o básico do básico
Nicolau L. Werneck
Geekie
Geekie, São Paulo
03 de Setembro de 2014

Resumo e Sumário
Expectation Maximization (EM) é um algoritmo lato
sensu. É uma técnica de estimação de parâmetros que
permite lidar com dados faltantes.
Muitos algoritmos já foram e são propostos para lidar
com esse problema, e na verdade são instâncias do EM.
Caso usual: estimação de parâmetros q dadas
observações x com classes z desconhecidas.
p(x; z;q)
1 / 18

Métodos de estimação
Vários metodos de estimação foram desenvolvidos ao
longo da história...
Máxima probabilidade—pega o valor mais provável.
Máxima verossimilhança—Fisher, ca. 1912...
Máxima probabilidade a posteriori— MP via Bayes.
ML é MAP com uma priori uniforme.
EM — Maximização do valor esperado da
verossimilhança. Média de funções de verossimilhança
sobre variáveis não-observadas.
2 / 18

Métodos de estimação
Máxima probabilidade
^x = argmax
x
p(x)
Máxima verossimilhança
^q = argmax
q
p(xjq)
Máxima probabilidade a posteriori
^q = argmax
q
p(xjq)p(q)
EM e EAP
^q = argmax
q
Ezfp(xjz;q)g
3 / 18

História
1960s, 1970s — M-estimation, IRLS. (Tukey,
Huber, Wedderburn...)
1970 — Algoritmo de Baum et al. para HMM.
1977 — EM por Dempster, Laird e Rubin.
1981 — Wu, prova de convergência do EM.
1981 — Bock e Aitkin, EM aplicado à TRI.
4 / 18

M-estimação
MLE:
q Õip(xi jq)
^q = argmax
q åi
^q = argmin
log(p(xi jq))
M-estimation:
q åi
^q = argmin
r(xi )
Modelo gaussiano vira minimizar o erro médio
quadrático. M-estimação generaliza a função de erro.
6 / 18

M-estimação: IRLS
Problema:
ri = yi f (xi ;q)
^q = argmin
q åi
r(ri )
Solução: IRLS (iteratively re-weighted least squares.)
^qt = argmin
q åi
w(rt1
i )r2
i
7 / 18

M-estimação: funções
8 / 18

M-estimação: funções
9 / 18

EM: algoritmo
EM se resume a aplicar alguma otimização para resolver
^q = argmax
q
Ezfp(xjz;q)g
Isto é feito iterativamente, atravé sde dois passos
alternantes
Passo “E”, encontrar os parâmetros de
Q(qjq(t)) = EZjX;q(t) [logL(q;X;Z)]
Passo “M”, aplicar alguma otimização para
q(t+1) = argmax
q
Q(qjq(t))
14 / 18

EM: algoritmo
Passo “E”
yi;j =
ai fY (xj ;qi )
fX (xj )
Passo “M”
ai =
1N
Nå
j=1
yi;j
mi =
åj yi;jxj
åj yi;j
15 / 18

EM Algoritmo Básico

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (6)

Mais de Nicolau Werneck

Mais de Nicolau Werneck (8)

EM Algoritmo Básico