SlideShare una empresa de Scribd logo
1 de 48
Descargar para leer sin conexión
An´alisis de Influencia en el modelo de Regresi´on Beta
por inferencia Bayesiana
Mg. Jim Roland Silvestre Valer
jrsilvestrev@pucp.pe
PeruStat
Analytics training, consulting and researching
Semana Cient´ıfica en UNMSM
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 1 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
2 Objetivos
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
2 Objetivos
3 Modelo de Regresi´on Beta
Funci´on de densidad y propiedades
Reparametrizaci´on alternativa
Modelo de regresi´on Beta
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
2 Objetivos
3 Modelo de Regresi´on Beta
Funci´on de densidad y propiedades
Reparametrizaci´on alternativa
Modelo de regresi´on Beta
4 Inferencia Bayesiana en el MRB
Funci´on de verosimilitud
Distribuci´on a priori
Distribuci´on a posteriori
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
2 Objetivos
3 Modelo de Regresi´on Beta
Funci´on de densidad y propiedades
Reparametrizaci´on alternativa
Modelo de regresi´on Beta
4 Inferencia Bayesiana en el MRB
Funci´on de verosimilitud
Distribuci´on a priori
Distribuci´on a posteriori
5 An´alisis de Influencia
An´alisis de Influencia con la Estad´ıstica Bayesiana
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
2 Objetivos
3 Modelo de Regresi´on Beta
Funci´on de densidad y propiedades
Reparametrizaci´on alternativa
Modelo de regresi´on Beta
4 Inferencia Bayesiana en el MRB
Funci´on de verosimilitud
Distribuci´on a priori
Distribuci´on a posteriori
5 An´alisis de Influencia
An´alisis de Influencia con la Estad´ıstica Bayesiana
6 Aplicaci´on
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Resumen
1 Introducci´on
Consideraciones previas y justificaci´on
2 Objetivos
3 Modelo de Regresi´on Beta
Funci´on de densidad y propiedades
Reparametrizaci´on alternativa
Modelo de regresi´on Beta
4 Inferencia Bayesiana en el MRB
Funci´on de verosimilitud
Distribuci´on a priori
Distribuci´on a posteriori
5 An´alisis de Influencia
An´alisis de Influencia con la Estad´ıstica Bayesiana
6 Aplicaci´on
7 Conclusiones y Recomendaciones
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
Introducci´on Consideraciones previas y justificaci´on
Consideraciones Previas
Puede ser interesante analizar:
La tasa de desempleo en Lima en funci´on del nivel educativo de los
habitantes,del n´umero de horas laborables al d´ıa, de la edad del
habitante,etc.
La proporci´on de ni˜nos en edad escolar que trabajan en funci´on del
n´umero de hijos por familia, el ingreso familiar, etc.
Kieschnick y McCullough (2003) plantean que la distribuci´on Beta es
adecuada para el an´alisis de este tipo de datos.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 3 / 40
Introducci´on Consideraciones previas y justificaci´on
Justificaci´on
Seg´un Cho et al (2009) la importancia de identificar observaciones
influyentes en un an´alisis estad´ıstico es un problema metodol´ogico bien
reconocido y el desarrollo de medidas de diagn´ostico para detectar
observaciones influyentes es de inter´es para muchos investigadores. Las
observaciones influyentes son una parte importante del an´alisis de datos y
por lo tanto requieren un trato m´as exhaustivo dado que pueden tener un
fuerte impacto en las conclusiones que se lleguen con la inferencia
estad´ıstica.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 4 / 40
Objetivos
Objetivo principal
Detectar puntos influyentes empleando inferencia Bayesiana en modelos de
regresi´on para proporciones espec´ıficamente en el modelo de Regresi´on
Beta.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 5 / 40
Objetivos
Objetivos secundarios
Mostrar diferentes propuestas del modelo de regresi´on Beta.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 6 / 40
Objetivos
Objetivos secundarios
Mostrar diferentes propuestas del modelo de regresi´on Beta.
Dar a conocer algunas propiedades sobre el an´alisis de influencia.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 6 / 40
Objetivos
Objetivos secundarios
Mostrar diferentes propuestas del modelo de regresi´on Beta.
Dar a conocer algunas propiedades sobre el an´alisis de influencia.
Realizar aplicaciones a conjuntos de datos reales.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 6 / 40
Modelo de Regresi´on Beta Funci´on de densidad y propiedades
Modelo
EL MODELO DE REGRESI´ON BETA
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 7 / 40
Modelo de Regresi´on Beta Funci´on de densidad y propiedades
funci´on de densidad
La funci´on de densidad de una variable aleatoria y que sigue una
distribuci´on Beta es la siguiente:
fY (y | α, β) =
Γ(α + β)
Γ(α)Γ(β)
yα−1
(1 − y)β−1
, 0 < y < 1
α, β > 0
La media y la variancia de una distribuci´on Beta son expresadas por:
E(y) =
α
α + β
y V ar(y) =
αβ
(α + β)2(α + β + 1)
(1)
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 8 / 40
Modelo de Regresi´on Beta Reparametrizaci´on alternativa
Reparametrizaci´on alternativa
Ferrari y Cribari Neto (2004) reparametrizaron el modelo haciendo
µ = α/(α + β) y φ = α + β, y se obtiene que:
E(y) = µ y V ar(y) =
V (µ)
1 + φ
donde V (µ) = µ(1 − µ).
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 9 / 40
Modelo de Regresi´on Beta Reparametrizaci´on alternativa
Reparametrizaci´on alternativa
Luego, en la nueva parametrizaci´on la densidad de la distribuci´on Beta
puede ser escrita como
fY (y | µ, φ) =
Γ(φ)
Γ(µφ)Γ((1 − µ)φ)
yµφ−1
(1 − y)(1−µ)φ−1
, 0 < y < 1 (2)
donde 0 < µ < 1 y φ > 0.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 10 / 40
Modelo de Regresi´on Beta Modelo de regresi´on Beta
Antecedentes de la dispersi´on en el modelo
Ferrari y Cribari Neto(2004) plantean un MRB con dispersi´on fija
(φ=constante)
Smithson y Verkuilen(2006) plantearon un MRB con dispersi´on
variable (φ=variable)
Espinheira(2008) tambi´en hizo su aporte en el MRB y
consider´o dispersi´on constante.
Simas et al(2010), Ferrari et al. (2011); Cribari-Neto y Zeileis(2010)
analizaron el MRB con dispersi´on variable.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 11 / 40
Modelo de Regresi´on Beta Modelo de regresi´on Beta
An´alisis de influencia en el modelo
Ferrari y Cribari Neto(2004) presentan directrices para el an´alisis de
influencia desde la perspectiva cl´asica.
Espinheira et al (2008b) propone diversas medidas de influencia y
muestra que tan influyente puede ser una observaci´on at´ıpica en el
MRB.
Bayes y Baz´an(2012) estudian la influencia de una observaci´on at´ıpica
en el MRB desde la perspectiva Bayesiana.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 12 / 40
Modelo de Regresi´on Beta Modelo de regresi´on Beta
El modelo y sus caracter´ısticas
Estamos analizando el MRB con dispersi´on variable propuesto por
Smithson y Verkuilen(2006).
Sean y1, ..., yn variables aleatorias tales que:
yi ∼ Beta(µi, φi)
g(µi) =
k
j=1
xijβj
h(φi) =
p
l=1
zilγl
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 13 / 40
Modelo de Regresi´on Beta Modelo de regresi´on Beta
Tama˜no de muestra en el modelo
Ferrari y Cribari Neto (2004) consideran que el m´etodo de m´axima
verosimilitud es adecuado cuando el tama˜no de muestra es
suficientemente grande.
Por otro lado si tenemos situaciones en las cuales el tama˜no de
muestra sea peque˜no y se conozca cierta informaci´on a priori sobre los
par´ametros del modelo, entonces Congdon (2003) sugiere realizar el
an´alisis desde la perspectiva Bayesiana.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 14 / 40
Inferencia Bayesiana en el MRB Funci´on de verosimilitud
Inferencia Bayesiana
INFERENCIA BAYESIANA EN EL MODELO DE REGRESI´ON
BETA
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 15 / 40
Inferencia Bayesiana en el MRB Funci´on de verosimilitud
Funci´on de verosimilitud
La funci´on de verosimilitud es dada por:
L(θ | y) =
n
i=1
Γ(φi)
Γ(µiφi)Γ(φi(1 − µi))
yµiφi−1
i (1 − yi)φi(1−µi)−1
donde θ = (β, γ)
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 16 / 40
Inferencia Bayesiana en el MRB Distribuci´on a priori
Distribuci´on a priori
Consideraremos las siguientes prioris:
p(βj) ∼ Normal(0, σ2
β)
p(γl) ∼ Normal(0, σ2
γ)
con j = 1, 2, ..., k y l = 1, 2, ..., p y adem´as se puede asignar incluso
valores grandes para los hiperpar´ametros σ2
β y σ2
γ, como una distribuci´on a
priori no informativa. Asumimos que los par´ametros β y γ son
independientes y por lo tanto:
p(θ) = p(β) × p(γ)
con θ = (β, γ)
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 17 / 40
Inferencia Bayesiana en el MRB Distribuci´on a posteriori
Distribuci´on a posteriori
La distribuci´on a posteriori es proporcional a la multiplicaci´on de la priori
por la respectiva funci´on de verosimilitud, es decir:
p(θ | y) ∝ L(θ | y) × p(θ)
Entonces la distribuci´on a posteriori es:
p(θ | y) ∝
n
i=1
Γ(φi)
Γ(µiφi)Γ(φi(1 − µi))
yµiφi−1
i (1 − yi)φi(1−µi)−1
×
e
−1
2
k
j=1
β2
j /σ2
β+
p
l=1
γ2
l /σ2
γ
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 18 / 40
An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana
Medidas de influencia
MEDIDAS DE INFLUENCIA
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 19 / 40
An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana
CPO: Conditional Predictive Ordinate
Seg´un Congdon(2003) el CPO, para la observaci´on i- ´esima, se define
como:
CPOi = f(yi | y(i)) = f(yi | θ, y(i))p(θ | y(i))dθ
donde yi ∈ y siendo y = {y1, y2, ..., yn} y y(i) = {y1, ..., yi−1, yi+1, ..., yn}
Pero en este trabajo asumimos que los yi son independientes de y(i) dado
un θ desconocido entonces el CPOi queda dado por:
CPOi = f(yi | y(i)) = f(yi | θ)p(θ | y(i))dθ
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 20 / 40
An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana
Estimaci´on del CPO por MCMC
Una aproximaci´on por el m´etodo Monte Carlo es la siguiente:
CPOi = ˆf(yi | y(i)) =
1
1
B
B
s=1
1
f(yi|y(i),θs)
θs representa un conjunto de valores extra´ıdos de la funci´on a posteriori de
θ, p(θ | y) asumiendo que el modelo fue ajustado por un m´etodo basado
en alg´un tipo de muestreo.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 21 / 40
An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana
Divergencia de Kullback- Leibler (Divergencia KL)
La divergencia KL se define como:
DKL(f, g) = f(x) log
f(x)
g(x)
dx
donde f(.) y g(.) son dos funciones de densidad.
Un valor grande de la divergencia KL implica mayor diferencia entre las
funciones de densidad.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 22 / 40
An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana
Divergencia de Kullback- Leibler (Divergencia KL)
DKL(i) mide la distancia entre las distribuciones a posterioris con todos
los datos y eliminando el i- ´esimo dato y lo definimos como:
DKL(i) = f(θ | y) log
f(θ | y)
(f(θ | y(i))
dθ
f(θ | y) es la distribuci´on a posteriori de θ dado y y f(θ | y(i)) es la
distribuci´on a posteriori de θ dado y(i) siendo
y(i) = (y1, ..., yi−1, yi+1, ..., yn).
Un valor grande de DKL(i) implica mayor influencia de la observaci´on
i-´esima en la estimaci´on.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 23 / 40
An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana
Estimaci´on de la Divergencia KL por MCMC
La estimaci´on de la divergencia KL por MCMC es dada por:
ˆDKL(i) =
1
B
B
s=1
log(f(yi | θs
, x, y(i))) − log





1
1
B
B
s=1
1
f(yi|θs,x,y(i))





Como la expresi´on en el segundo t´ermino es la estimaci´on del CPOi ,
entonces:
ˆDKL(i) =
1
B
B
s=1
log(f(yi | θs
, x, y(i))) − log(CPOi)
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 24 / 40
Aplicaci´on
Aplicaci´on
APLICACI´ON A UN CASO REAL
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 25 / 40
Aplicaci´on
APLICACI´ON
Se consideraron 37 atletas de remo de un total de 202 deportistas del
Instituto Australiano del Deporte (AIS). Se eligieron 2 variables (Bfat y
lbm) para realizar la detecci´on de puntos influyentes, donde:
lbm: (lean body mass) significa masa corporal magra, medida en
kilogramos.
Bfat: (body fat percentage) es un indicador de grasa corporal y
est´a expresado en unidades porcentuales.
En el gr´afico se puede observar que hay dos valores at´ıpicos, los cuales
deber´ıan ser detectados por el CPO y la divergencia KL
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 26 / 40
Aplicaci´on
Gr´afico de dispersi´on
q
q
q
q
q
q
q
qq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
40 50 60 70 80
0.100.150.200.25
masa corporal magra
%degrasacorporal
Dispersión considerando solo remadores (Row)
Figura: Dispersi´on entre la masa corporal (lbm) y el % de grasa corporal
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 27 / 40
Aplicaci´on
Estimaci´on de los par´ametros
El modelo es:
Bfati ∼ Beta(µi, φ)
logit(µi) = β0 + β1 × lbmi
las distribuciones a priori no informativas son: β0 ∼ N(0; 1000000),
β1 ∼ N(0; 1000000) y φ ∼ Gama(0,01; 0,01)
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 28 / 40
Aplicaci´on
Estimaci´on de los par´ametros
Realizando la estimaci´on de los par´ametros por MCMC utilizando
OpenBugs considerando 100000 iteraciones, per´ıodo burnin de 50000 y
thin de 10, se obtuvo:
media sd 2.5 % 25 % 50 % 75 % 97.5 %
β0 0.086 0.22 -0.34 -0.07 0.09 0.24 0.52
β1 -0.027 0.001 -0.03 -0.03 -0.03 -0.02 -0.02
φ 88.012 20.78 52.37 73.16 86.34 101.43 133.36
Dbar -139.60 2.35 -142.33 -141.34 -140.18 -138.50 -133.76
Cuadro: Estimaci´on de los par´ametros del modelo
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 29 / 40
Aplicaci´on
Detecci´on con el CPO
q
q
q
q
q
q
q
q q
q q
q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
0 5 10 15 20 25 30 35
024681012
Observación
CPO
16
30
Figura: menor valor del CPO refleja observaciones influyentes
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 30 / 40
Aplicaci´on
Detecci´on con la divergencia KL
q q q
q
q q q q q q q q q
q q
q
q q q
q q q q q q q q q q
q
q q q q q q q
0 5 10 15 20 25 30 35
0.00.51.01.5
Observación
DivergenciaKL
16
30
Figura: mayor valor de la divergencia KL refleja observaciones influyentes
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 31 / 40
Aplicaci´on
Estimaci´on de los par´ametros sin la observaci´on {16}
media sd 2.5 % 25 % 50 % 75 % 97.5 %
β0 0.412 0.26 -0.10 0.23 0.41 0.58 0.93
β1 -0.032 0.0007 -0.04 -0.03 -0.03 -0.03 -0.02
φ 102.85 24.67 59.22 85.35 101.02 117.83 156.33
Dbar -141.623 2.61 -144.67 -143.59 -142.26 -140.33 -134.81
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 32 / 40
Aplicaci´on
an´alisis de la variaci´on de los par´ametros
par´ametros inicio -{16} variaci´on IC95 % IC-{16} variaci´on
β0 0.086 0.412 379.07 % 0.86 1.03 19.77 %
β1 -0.027 -0.032 18.52 % 0.01 0.02 100 %
Cuadro: An´alisis de la variaci´on porcentual en la estimaci´on puntual (media a
posteriori) de los par´ametros y el ancho del IC eliminando la observaci´on {16}
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 33 / 40
Aplicaci´on
Estimaci´on de los par´ametros sin la observaci´on {30}
media sd 2.5 % 25 % 50 % 75 % 97.5 %
β0 0.41 0.26 -0.10 0.25 0.40 0.57 0.97
β1 -0.03 0.003 -0.04 -0.03 -0.03 -0.03 -0.02
φ 123.58 29.80 72.49 102.38 120.73 142.69 188.41
Dbar -148.50 2.91 -151.89 -150.72 -149.24 -147.05 -141.11
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 34 / 40
Aplicaci´on
an´alisis de la variaci´on de los par´ametros
par´ametros inicio -{30} variaci´on IC95 % IC-{30} variaci´on
β0 0.086 0.41 376.74 % 0.86 1.07 24.42 %
β1 -0.027 -0.03 18.52 % 0.01 0.02 100 %
Cuadro: An´alisis de la variaci´on porcentual en la estimaci´on puntual (media a
posteriori) de los par´ametros y el ancho del IC eliminando la observaci´on {30}
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 35 / 40
Aplicaci´on
Estimaci´on de los par´ametros sin las observaciones {16,30}
media sd 2.5 % 25 % 50 % 75 % 97.5 %
β0 0.825 0.18 0.45 0.71 0.84 0.95 1.14
β1 -0.038 0.0003 -0.04 -0.04 -0.04 -0.04 -0.03
φ 206.41 51.21 119.42 169.93 202.10 237.22 319.25
Dbar -163.83 2.66 -166.95 -165.80 -164.44 -162.54 -157.03
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 36 / 40
Aplicaci´on
an´alisis de la variaci´on de los par´ametros
par´ametros inicio -{16,30} variaci´on IC95 % IC-{16,30} variaci´on
β0 0.086 0.825 859.3 % 0.86 0.69 19.77 %
β1 -0.027 -0.038 40.74 % 0.01 0.01 0.0 %
Cuadro: An´alisis de la variaci´on porcentual en la estimaci´on puntual (media a
posteriori) de los par´ametros y el ancho del IC eliminando las observaciones
{16,30}
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 37 / 40
Conclusiones y Recomendaciones
Finalmente
CONCLUSIONES Y RECOMENDACIONES
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 38 / 40
Conclusiones y Recomendaciones
Conclusiones
Las observaciones influyentes detectadas por los m´etodos de la
estad´ıstica cl´asica, coinciden con los de la estad´ıstica Bayesiana, pero
no necesariamente en todos los casos.
El m´etodo de diagn´ostico de la divergencia de Kullback - Leiber (KL)
detecta observaciones influyentes con mejor precisi´on que el m´etodo
de la ordenada predictiva condicional (CPO), como se observ´o en la
aplicaci´on.
Las observaciones influyentes detectadas por el m´etodo CPO y la
divergencia KL no necesariamente coinciden en todos los casos.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 39 / 40
Conclusiones y Recomendaciones
Recomendaci´on
Al querer detectar puntos influyentes empleando estad´ıstica
Bayesiana, se recomienda detectarlas con la divergencia KL y el CPO.
Posteriormente analizar, en lo posible, las observaciones influyentes
comunes.
Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 40 / 40

Más contenido relacionado

La actualidad más candente

STATA - Linear Regressions
STATA - Linear RegressionsSTATA - Linear Regressions
STATA - Linear Regressionsstata_org_uk
 
Frequency Distributions for Organizing and Summarizing
Frequency Distributions for Organizing and Summarizing Frequency Distributions for Organizing and Summarizing
Frequency Distributions for Organizing and Summarizing Long Beach City College
 
SPLIT PLOT DESIGN new.pptx
SPLIT PLOT DESIGN new.pptxSPLIT PLOT DESIGN new.pptx
SPLIT PLOT DESIGN new.pptxValeDiode
 
Applications to Central Limit Theorem and Law of Large Numbers
Applications to Central Limit Theorem and Law of Large NumbersApplications to Central Limit Theorem and Law of Large Numbers
Applications to Central Limit Theorem and Law of Large NumbersUniversity of Salerno
 
Chapter 1 introduction to statistics for engineers 1 (1)
Chapter 1 introduction to statistics for engineers 1 (1)Chapter 1 introduction to statistics for engineers 1 (1)
Chapter 1 introduction to statistics for engineers 1 (1)abfisho
 
Anova randomized block design
Anova randomized block designAnova randomized block design
Anova randomized block designIrfan Hussain
 
Chapter8 Introduction to Estimation Hypothesis Testing.pdf
Chapter8 Introduction to Estimation Hypothesis Testing.pdfChapter8 Introduction to Estimation Hypothesis Testing.pdf
Chapter8 Introduction to Estimation Hypothesis Testing.pdfmekkimekki5
 
Elements of Graph Theory for IS.pptx
Elements of Graph Theory for IS.pptxElements of Graph Theory for IS.pptx
Elements of Graph Theory for IS.pptxmiki304759
 
Statistika Ekonomi II: Teori Regresi Linier Sederhana
Statistika Ekonomi II: Teori Regresi Linier SederhanaStatistika Ekonomi II: Teori Regresi Linier Sederhana
Statistika Ekonomi II: Teori Regresi Linier SederhanaArie Khurniawan
 
Sampling and Sampling Distributions
Sampling and Sampling DistributionsSampling and Sampling Distributions
Sampling and Sampling DistributionsBk Islam Mumitul
 
Complements and Conditional Probability, and Bayes' Theorem
 Complements and Conditional Probability, and Bayes' Theorem Complements and Conditional Probability, and Bayes' Theorem
Complements and Conditional Probability, and Bayes' TheoremLong Beach City College
 
What is a Factorial ANOVA?
What is a Factorial ANOVA?What is a Factorial ANOVA?
What is a Factorial ANOVA?Ken Plummer
 
Solution to the Practice Test 3A, Normal Probability Distribution
Solution to the Practice Test 3A, Normal Probability DistributionSolution to the Practice Test 3A, Normal Probability Distribution
Solution to the Practice Test 3A, Normal Probability DistributionLong Beach City College
 

La actualidad más candente (20)

Confidence interval
Confidence intervalConfidence interval
Confidence interval
 
STATA - Linear Regressions
STATA - Linear RegressionsSTATA - Linear Regressions
STATA - Linear Regressions
 
Basic Concepts of Probability
Basic Concepts of ProbabilityBasic Concepts of Probability
Basic Concepts of Probability
 
Lilliefors test
Lilliefors testLilliefors test
Lilliefors test
 
Addition Rule and Multiplication Rule
Addition Rule and Multiplication RuleAddition Rule and Multiplication Rule
Addition Rule and Multiplication Rule
 
Doe07 bibd
Doe07 bibdDoe07 bibd
Doe07 bibd
 
Frequency Distributions for Organizing and Summarizing
Frequency Distributions for Organizing and Summarizing Frequency Distributions for Organizing and Summarizing
Frequency Distributions for Organizing and Summarizing
 
SPLIT PLOT DESIGN new.pptx
SPLIT PLOT DESIGN new.pptxSPLIT PLOT DESIGN new.pptx
SPLIT PLOT DESIGN new.pptx
 
Applications to Central Limit Theorem and Law of Large Numbers
Applications to Central Limit Theorem and Law of Large NumbersApplications to Central Limit Theorem and Law of Large Numbers
Applications to Central Limit Theorem and Law of Large Numbers
 
Chapter 1 introduction to statistics for engineers 1 (1)
Chapter 1 introduction to statistics for engineers 1 (1)Chapter 1 introduction to statistics for engineers 1 (1)
Chapter 1 introduction to statistics for engineers 1 (1)
 
Counting
CountingCounting
Counting
 
Anova randomized block design
Anova randomized block designAnova randomized block design
Anova randomized block design
 
Chapter8 Introduction to Estimation Hypothesis Testing.pdf
Chapter8 Introduction to Estimation Hypothesis Testing.pdfChapter8 Introduction to Estimation Hypothesis Testing.pdf
Chapter8 Introduction to Estimation Hypothesis Testing.pdf
 
Elements of Graph Theory for IS.pptx
Elements of Graph Theory for IS.pptxElements of Graph Theory for IS.pptx
Elements of Graph Theory for IS.pptx
 
Statistika Ekonomi II: Teori Regresi Linier Sederhana
Statistika Ekonomi II: Teori Regresi Linier SederhanaStatistika Ekonomi II: Teori Regresi Linier Sederhana
Statistika Ekonomi II: Teori Regresi Linier Sederhana
 
Sampling and Sampling Distributions
Sampling and Sampling DistributionsSampling and Sampling Distributions
Sampling and Sampling Distributions
 
Complements and Conditional Probability, and Bayes' Theorem
 Complements and Conditional Probability, and Bayes' Theorem Complements and Conditional Probability, and Bayes' Theorem
Complements and Conditional Probability, and Bayes' Theorem
 
What is a Factorial ANOVA?
What is a Factorial ANOVA?What is a Factorial ANOVA?
What is a Factorial ANOVA?
 
The Standard Normal Distribution
The Standard Normal DistributionThe Standard Normal Distribution
The Standard Normal Distribution
 
Solution to the Practice Test 3A, Normal Probability Distribution
Solution to the Practice Test 3A, Normal Probability DistributionSolution to the Practice Test 3A, Normal Probability Distribution
Solution to the Practice Test 3A, Normal Probability Distribution
 

Último

Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 

Último (20)

Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 

Análisis de Influencia en el modelo de regresión Beta por Inferencia Bayesiana

  • 1. An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana Mg. Jim Roland Silvestre Valer jrsilvestrev@pucp.pe PeruStat Analytics training, consulting and researching Semana Cient´ıfica en UNMSM Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 1 / 40
  • 2. Resumen 1 Introducci´on Consideraciones previas y justificaci´on Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 3. Resumen 1 Introducci´on Consideraciones previas y justificaci´on 2 Objetivos Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 4. Resumen 1 Introducci´on Consideraciones previas y justificaci´on 2 Objetivos 3 Modelo de Regresi´on Beta Funci´on de densidad y propiedades Reparametrizaci´on alternativa Modelo de regresi´on Beta Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 5. Resumen 1 Introducci´on Consideraciones previas y justificaci´on 2 Objetivos 3 Modelo de Regresi´on Beta Funci´on de densidad y propiedades Reparametrizaci´on alternativa Modelo de regresi´on Beta 4 Inferencia Bayesiana en el MRB Funci´on de verosimilitud Distribuci´on a priori Distribuci´on a posteriori Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 6. Resumen 1 Introducci´on Consideraciones previas y justificaci´on 2 Objetivos 3 Modelo de Regresi´on Beta Funci´on de densidad y propiedades Reparametrizaci´on alternativa Modelo de regresi´on Beta 4 Inferencia Bayesiana en el MRB Funci´on de verosimilitud Distribuci´on a priori Distribuci´on a posteriori 5 An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 7. Resumen 1 Introducci´on Consideraciones previas y justificaci´on 2 Objetivos 3 Modelo de Regresi´on Beta Funci´on de densidad y propiedades Reparametrizaci´on alternativa Modelo de regresi´on Beta 4 Inferencia Bayesiana en el MRB Funci´on de verosimilitud Distribuci´on a priori Distribuci´on a posteriori 5 An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana 6 Aplicaci´on Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 8. Resumen 1 Introducci´on Consideraciones previas y justificaci´on 2 Objetivos 3 Modelo de Regresi´on Beta Funci´on de densidad y propiedades Reparametrizaci´on alternativa Modelo de regresi´on Beta 4 Inferencia Bayesiana en el MRB Funci´on de verosimilitud Distribuci´on a priori Distribuci´on a posteriori 5 An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana 6 Aplicaci´on 7 Conclusiones y Recomendaciones Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 2 / 40
  • 9. Introducci´on Consideraciones previas y justificaci´on Consideraciones Previas Puede ser interesante analizar: La tasa de desempleo en Lima en funci´on del nivel educativo de los habitantes,del n´umero de horas laborables al d´ıa, de la edad del habitante,etc. La proporci´on de ni˜nos en edad escolar que trabajan en funci´on del n´umero de hijos por familia, el ingreso familiar, etc. Kieschnick y McCullough (2003) plantean que la distribuci´on Beta es adecuada para el an´alisis de este tipo de datos. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 3 / 40
  • 10. Introducci´on Consideraciones previas y justificaci´on Justificaci´on Seg´un Cho et al (2009) la importancia de identificar observaciones influyentes en un an´alisis estad´ıstico es un problema metodol´ogico bien reconocido y el desarrollo de medidas de diagn´ostico para detectar observaciones influyentes es de inter´es para muchos investigadores. Las observaciones influyentes son una parte importante del an´alisis de datos y por lo tanto requieren un trato m´as exhaustivo dado que pueden tener un fuerte impacto en las conclusiones que se lleguen con la inferencia estad´ıstica. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 4 / 40
  • 11. Objetivos Objetivo principal Detectar puntos influyentes empleando inferencia Bayesiana en modelos de regresi´on para proporciones espec´ıficamente en el modelo de Regresi´on Beta. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 5 / 40
  • 12. Objetivos Objetivos secundarios Mostrar diferentes propuestas del modelo de regresi´on Beta. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 6 / 40
  • 13. Objetivos Objetivos secundarios Mostrar diferentes propuestas del modelo de regresi´on Beta. Dar a conocer algunas propiedades sobre el an´alisis de influencia. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 6 / 40
  • 14. Objetivos Objetivos secundarios Mostrar diferentes propuestas del modelo de regresi´on Beta. Dar a conocer algunas propiedades sobre el an´alisis de influencia. Realizar aplicaciones a conjuntos de datos reales. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 6 / 40
  • 15. Modelo de Regresi´on Beta Funci´on de densidad y propiedades Modelo EL MODELO DE REGRESI´ON BETA Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 7 / 40
  • 16. Modelo de Regresi´on Beta Funci´on de densidad y propiedades funci´on de densidad La funci´on de densidad de una variable aleatoria y que sigue una distribuci´on Beta es la siguiente: fY (y | α, β) = Γ(α + β) Γ(α)Γ(β) yα−1 (1 − y)β−1 , 0 < y < 1 α, β > 0 La media y la variancia de una distribuci´on Beta son expresadas por: E(y) = α α + β y V ar(y) = αβ (α + β)2(α + β + 1) (1) Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 8 / 40
  • 17. Modelo de Regresi´on Beta Reparametrizaci´on alternativa Reparametrizaci´on alternativa Ferrari y Cribari Neto (2004) reparametrizaron el modelo haciendo µ = α/(α + β) y φ = α + β, y se obtiene que: E(y) = µ y V ar(y) = V (µ) 1 + φ donde V (µ) = µ(1 − µ). Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 9 / 40
  • 18. Modelo de Regresi´on Beta Reparametrizaci´on alternativa Reparametrizaci´on alternativa Luego, en la nueva parametrizaci´on la densidad de la distribuci´on Beta puede ser escrita como fY (y | µ, φ) = Γ(φ) Γ(µφ)Γ((1 − µ)φ) yµφ−1 (1 − y)(1−µ)φ−1 , 0 < y < 1 (2) donde 0 < µ < 1 y φ > 0. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 10 / 40
  • 19. Modelo de Regresi´on Beta Modelo de regresi´on Beta Antecedentes de la dispersi´on en el modelo Ferrari y Cribari Neto(2004) plantean un MRB con dispersi´on fija (φ=constante) Smithson y Verkuilen(2006) plantearon un MRB con dispersi´on variable (φ=variable) Espinheira(2008) tambi´en hizo su aporte en el MRB y consider´o dispersi´on constante. Simas et al(2010), Ferrari et al. (2011); Cribari-Neto y Zeileis(2010) analizaron el MRB con dispersi´on variable. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 11 / 40
  • 20. Modelo de Regresi´on Beta Modelo de regresi´on Beta An´alisis de influencia en el modelo Ferrari y Cribari Neto(2004) presentan directrices para el an´alisis de influencia desde la perspectiva cl´asica. Espinheira et al (2008b) propone diversas medidas de influencia y muestra que tan influyente puede ser una observaci´on at´ıpica en el MRB. Bayes y Baz´an(2012) estudian la influencia de una observaci´on at´ıpica en el MRB desde la perspectiva Bayesiana. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 12 / 40
  • 21. Modelo de Regresi´on Beta Modelo de regresi´on Beta El modelo y sus caracter´ısticas Estamos analizando el MRB con dispersi´on variable propuesto por Smithson y Verkuilen(2006). Sean y1, ..., yn variables aleatorias tales que: yi ∼ Beta(µi, φi) g(µi) = k j=1 xijβj h(φi) = p l=1 zilγl Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 13 / 40
  • 22. Modelo de Regresi´on Beta Modelo de regresi´on Beta Tama˜no de muestra en el modelo Ferrari y Cribari Neto (2004) consideran que el m´etodo de m´axima verosimilitud es adecuado cuando el tama˜no de muestra es suficientemente grande. Por otro lado si tenemos situaciones en las cuales el tama˜no de muestra sea peque˜no y se conozca cierta informaci´on a priori sobre los par´ametros del modelo, entonces Congdon (2003) sugiere realizar el an´alisis desde la perspectiva Bayesiana. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 14 / 40
  • 23. Inferencia Bayesiana en el MRB Funci´on de verosimilitud Inferencia Bayesiana INFERENCIA BAYESIANA EN EL MODELO DE REGRESI´ON BETA Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 15 / 40
  • 24. Inferencia Bayesiana en el MRB Funci´on de verosimilitud Funci´on de verosimilitud La funci´on de verosimilitud es dada por: L(θ | y) = n i=1 Γ(φi) Γ(µiφi)Γ(φi(1 − µi)) yµiφi−1 i (1 − yi)φi(1−µi)−1 donde θ = (β, γ) Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 16 / 40
  • 25. Inferencia Bayesiana en el MRB Distribuci´on a priori Distribuci´on a priori Consideraremos las siguientes prioris: p(βj) ∼ Normal(0, σ2 β) p(γl) ∼ Normal(0, σ2 γ) con j = 1, 2, ..., k y l = 1, 2, ..., p y adem´as se puede asignar incluso valores grandes para los hiperpar´ametros σ2 β y σ2 γ, como una distribuci´on a priori no informativa. Asumimos que los par´ametros β y γ son independientes y por lo tanto: p(θ) = p(β) × p(γ) con θ = (β, γ) Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 17 / 40
  • 26. Inferencia Bayesiana en el MRB Distribuci´on a posteriori Distribuci´on a posteriori La distribuci´on a posteriori es proporcional a la multiplicaci´on de la priori por la respectiva funci´on de verosimilitud, es decir: p(θ | y) ∝ L(θ | y) × p(θ) Entonces la distribuci´on a posteriori es: p(θ | y) ∝ n i=1 Γ(φi) Γ(µiφi)Γ(φi(1 − µi)) yµiφi−1 i (1 − yi)φi(1−µi)−1 × e −1 2 k j=1 β2 j /σ2 β+ p l=1 γ2 l /σ2 γ Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 18 / 40
  • 27. An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana Medidas de influencia MEDIDAS DE INFLUENCIA Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 19 / 40
  • 28. An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana CPO: Conditional Predictive Ordinate Seg´un Congdon(2003) el CPO, para la observaci´on i- ´esima, se define como: CPOi = f(yi | y(i)) = f(yi | θ, y(i))p(θ | y(i))dθ donde yi ∈ y siendo y = {y1, y2, ..., yn} y y(i) = {y1, ..., yi−1, yi+1, ..., yn} Pero en este trabajo asumimos que los yi son independientes de y(i) dado un θ desconocido entonces el CPOi queda dado por: CPOi = f(yi | y(i)) = f(yi | θ)p(θ | y(i))dθ Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 20 / 40
  • 29. An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana Estimaci´on del CPO por MCMC Una aproximaci´on por el m´etodo Monte Carlo es la siguiente: CPOi = ˆf(yi | y(i)) = 1 1 B B s=1 1 f(yi|y(i),θs) θs representa un conjunto de valores extra´ıdos de la funci´on a posteriori de θ, p(θ | y) asumiendo que el modelo fue ajustado por un m´etodo basado en alg´un tipo de muestreo. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 21 / 40
  • 30. An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana Divergencia de Kullback- Leibler (Divergencia KL) La divergencia KL se define como: DKL(f, g) = f(x) log f(x) g(x) dx donde f(.) y g(.) son dos funciones de densidad. Un valor grande de la divergencia KL implica mayor diferencia entre las funciones de densidad. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 22 / 40
  • 31. An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana Divergencia de Kullback- Leibler (Divergencia KL) DKL(i) mide la distancia entre las distribuciones a posterioris con todos los datos y eliminando el i- ´esimo dato y lo definimos como: DKL(i) = f(θ | y) log f(θ | y) (f(θ | y(i)) dθ f(θ | y) es la distribuci´on a posteriori de θ dado y y f(θ | y(i)) es la distribuci´on a posteriori de θ dado y(i) siendo y(i) = (y1, ..., yi−1, yi+1, ..., yn). Un valor grande de DKL(i) implica mayor influencia de la observaci´on i-´esima en la estimaci´on. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 23 / 40
  • 32. An´alisis de Influencia An´alisis de Influencia con la Estad´ıstica Bayesiana Estimaci´on de la Divergencia KL por MCMC La estimaci´on de la divergencia KL por MCMC es dada por: ˆDKL(i) = 1 B B s=1 log(f(yi | θs , x, y(i))) − log      1 1 B B s=1 1 f(yi|θs,x,y(i))      Como la expresi´on en el segundo t´ermino es la estimaci´on del CPOi , entonces: ˆDKL(i) = 1 B B s=1 log(f(yi | θs , x, y(i))) − log(CPOi) Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 24 / 40
  • 33. Aplicaci´on Aplicaci´on APLICACI´ON A UN CASO REAL Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 25 / 40
  • 34. Aplicaci´on APLICACI´ON Se consideraron 37 atletas de remo de un total de 202 deportistas del Instituto Australiano del Deporte (AIS). Se eligieron 2 variables (Bfat y lbm) para realizar la detecci´on de puntos influyentes, donde: lbm: (lean body mass) significa masa corporal magra, medida en kilogramos. Bfat: (body fat percentage) es un indicador de grasa corporal y est´a expresado en unidades porcentuales. En el gr´afico se puede observar que hay dos valores at´ıpicos, los cuales deber´ıan ser detectados por el CPO y la divergencia KL Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 26 / 40
  • 35. Aplicaci´on Gr´afico de dispersi´on q q q q q q q qq qq q q q q q q q q q q q q q q q q qq q q q q q q q q 40 50 60 70 80 0.100.150.200.25 masa corporal magra %degrasacorporal Dispersión considerando solo remadores (Row) Figura: Dispersi´on entre la masa corporal (lbm) y el % de grasa corporal Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 27 / 40
  • 36. Aplicaci´on Estimaci´on de los par´ametros El modelo es: Bfati ∼ Beta(µi, φ) logit(µi) = β0 + β1 × lbmi las distribuciones a priori no informativas son: β0 ∼ N(0; 1000000), β1 ∼ N(0; 1000000) y φ ∼ Gama(0,01; 0,01) Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 28 / 40
  • 37. Aplicaci´on Estimaci´on de los par´ametros Realizando la estimaci´on de los par´ametros por MCMC utilizando OpenBugs considerando 100000 iteraciones, per´ıodo burnin de 50000 y thin de 10, se obtuvo: media sd 2.5 % 25 % 50 % 75 % 97.5 % β0 0.086 0.22 -0.34 -0.07 0.09 0.24 0.52 β1 -0.027 0.001 -0.03 -0.03 -0.03 -0.02 -0.02 φ 88.012 20.78 52.37 73.16 86.34 101.43 133.36 Dbar -139.60 2.35 -142.33 -141.34 -140.18 -138.50 -133.76 Cuadro: Estimaci´on de los par´ametros del modelo Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 29 / 40
  • 38. Aplicaci´on Detecci´on con el CPO q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 0 5 10 15 20 25 30 35 024681012 Observación CPO 16 30 Figura: menor valor del CPO refleja observaciones influyentes Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 30 / 40
  • 39. Aplicaci´on Detecci´on con la divergencia KL q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 0 5 10 15 20 25 30 35 0.00.51.01.5 Observación DivergenciaKL 16 30 Figura: mayor valor de la divergencia KL refleja observaciones influyentes Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 31 / 40
  • 40. Aplicaci´on Estimaci´on de los par´ametros sin la observaci´on {16} media sd 2.5 % 25 % 50 % 75 % 97.5 % β0 0.412 0.26 -0.10 0.23 0.41 0.58 0.93 β1 -0.032 0.0007 -0.04 -0.03 -0.03 -0.03 -0.02 φ 102.85 24.67 59.22 85.35 101.02 117.83 156.33 Dbar -141.623 2.61 -144.67 -143.59 -142.26 -140.33 -134.81 Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 32 / 40
  • 41. Aplicaci´on an´alisis de la variaci´on de los par´ametros par´ametros inicio -{16} variaci´on IC95 % IC-{16} variaci´on β0 0.086 0.412 379.07 % 0.86 1.03 19.77 % β1 -0.027 -0.032 18.52 % 0.01 0.02 100 % Cuadro: An´alisis de la variaci´on porcentual en la estimaci´on puntual (media a posteriori) de los par´ametros y el ancho del IC eliminando la observaci´on {16} Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 33 / 40
  • 42. Aplicaci´on Estimaci´on de los par´ametros sin la observaci´on {30} media sd 2.5 % 25 % 50 % 75 % 97.5 % β0 0.41 0.26 -0.10 0.25 0.40 0.57 0.97 β1 -0.03 0.003 -0.04 -0.03 -0.03 -0.03 -0.02 φ 123.58 29.80 72.49 102.38 120.73 142.69 188.41 Dbar -148.50 2.91 -151.89 -150.72 -149.24 -147.05 -141.11 Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 34 / 40
  • 43. Aplicaci´on an´alisis de la variaci´on de los par´ametros par´ametros inicio -{30} variaci´on IC95 % IC-{30} variaci´on β0 0.086 0.41 376.74 % 0.86 1.07 24.42 % β1 -0.027 -0.03 18.52 % 0.01 0.02 100 % Cuadro: An´alisis de la variaci´on porcentual en la estimaci´on puntual (media a posteriori) de los par´ametros y el ancho del IC eliminando la observaci´on {30} Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 35 / 40
  • 44. Aplicaci´on Estimaci´on de los par´ametros sin las observaciones {16,30} media sd 2.5 % 25 % 50 % 75 % 97.5 % β0 0.825 0.18 0.45 0.71 0.84 0.95 1.14 β1 -0.038 0.0003 -0.04 -0.04 -0.04 -0.04 -0.03 φ 206.41 51.21 119.42 169.93 202.10 237.22 319.25 Dbar -163.83 2.66 -166.95 -165.80 -164.44 -162.54 -157.03 Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 36 / 40
  • 45. Aplicaci´on an´alisis de la variaci´on de los par´ametros par´ametros inicio -{16,30} variaci´on IC95 % IC-{16,30} variaci´on β0 0.086 0.825 859.3 % 0.86 0.69 19.77 % β1 -0.027 -0.038 40.74 % 0.01 0.01 0.0 % Cuadro: An´alisis de la variaci´on porcentual en la estimaci´on puntual (media a posteriori) de los par´ametros y el ancho del IC eliminando las observaciones {16,30} Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 37 / 40
  • 46. Conclusiones y Recomendaciones Finalmente CONCLUSIONES Y RECOMENDACIONES Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 38 / 40
  • 47. Conclusiones y Recomendaciones Conclusiones Las observaciones influyentes detectadas por los m´etodos de la estad´ıstica cl´asica, coinciden con los de la estad´ıstica Bayesiana, pero no necesariamente en todos los casos. El m´etodo de diagn´ostico de la divergencia de Kullback - Leiber (KL) detecta observaciones influyentes con mejor precisi´on que el m´etodo de la ordenada predictiva condicional (CPO), como se observ´o en la aplicaci´on. Las observaciones influyentes detectadas por el m´etodo CPO y la divergencia KL no necesariamente coinciden en todos los casos. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 39 / 40
  • 48. Conclusiones y Recomendaciones Recomendaci´on Al querer detectar puntos influyentes empleando estad´ıstica Bayesiana, se recomienda detectarlas con la divergencia KL y el CPO. Posteriormente analizar, en lo posible, las observaciones influyentes comunes. Silvestre Valer, Jim.R. (UNI-PUCP) An´alisis de Influencia en el modelo de Regresi´on Beta por inferencia Bayesiana 40 / 40