SlideShare una empresa de Scribd logo
El modelo Lee-Carter para estimar y pronosticar
mortalidad: Una aplicaci´on para Colombia
Carlos Andr´es Ochoa
caochoam@unal.edu.co
Universidad Nacional de Colombia
Sede Medell´ın
14 de julio de 2015
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 1 / 62
Contenido
Contenido I
1 Introducci´on
Planteamiento del problema
2 Modelo Lee-Carter
Las funciones de la tabla de vida
El modelo
Matriz de descomposici´on singular
Modelos lineales generalizados
3 Herramientas para la estimaci´on del modelo Lee-Carter
Librer´ıa gnm
4 Estimaci´on de la mortalidad en Colombia
Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres
Estimaci´on del modelo a trav´es de gnm
Proyecci´on de mortalidad
5 Estimaci´on de la poblaci´on universitaria
Estimaci´on del modelo a trav´es de gnm
Proyecci´on de mortalidad
6 Conclusiones y recomendaciones
Conclusiones
Recomendaciones
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 2 / 62
Contenido
Contenido II
7 Agradecimientos
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 3 / 62
Introducci´on Planteamiento del problema
Porqu´e es importante analizar la din´amica de mortalidad?
Pasivos pensionales
Impacto de eventos sociales y/o demogr´aficos
Evoluci´on de poblaciones
Motivaci´on:
Revisi´on del modelo LC realizada por Betzuen 1
en la que ajusta los datos
poblacionales espa˜noles y concluye acerca de la esperanza de vida.
Estudio sobre la poblaci´on Mexicana 2
enfocada en proyecci´on de mortalidad a
trav´es del modelo LC en la que se concluye objetivamente sobre la din´amica
de la mortalidad en hombres y mujeres.
1Betzuen, A. (2010). Un an´alisis sobre las posibilidades de predicci´on de la mortalidad futura
aplicando el modelo lee-carter. Anales
2Garc´ıa, G. & Ordorica, M. (2012). Proyecci´on estoc´astica de la mortalidad mexicana por
medio del m´etodo de Lee-Carter. Estudios Demogr´aficos y Urbanos, vol. 27, pp. 409-448
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 4 / 62
Introducci´on Planteamiento del problema
Objetivos de la investigaci´on
Objetivo general:
Analizar las diferentes metodolog´ıas y herramientas de estimaci´on del modelo
Lee-Carter aplicado a datos de mortalidad poblacional tanto en datos
demogr´aficos Colombianos, como en datos de poblaci´on estudiantil en la
Universidad Nacional Sede Medell´ın. Adem´as realizar la correspondiente
proyecci´on bajo un ajuste de series de tiempo de manera que permita concluir
constructivamente acerca de la din´amica poblacional.
Objetivos espec´ıficos:
Realizar una revisi´on del modelo LC y de las metodolog´ıas apropiadas para
hacer su estimaci´on (Matriz de descomposici´on singular y modelos lineales
generalizados).
Concluir acerca de las librer´ıas de R; demography(), ilc() y gnm() sobre la
estimaci´on de los par´ametros del modelo LC ajustados a datos poblacionales
de Colombia y de la poblaci´on estudiantil de la Universidad Nacional de
Colombia Sede Medell´ın.
Realizar una modelaci´on apropiada mediante metodolog´ıas de series de
tiempo del indice calculado de mortalidad la cual sea v´alida para generar
proyecciones de dicho ´ındice.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 5 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Las funciones de la tabla de vida (I)
Funci´on de supervivencia:
S(x) : = 1 − F(x); (1)
T(x) : = X − x|X > x; ∀x ≥ 0 (2)
G(t) : = P(T(x) ≤ t) (3)
La funci´on G(t) se interpreta como la probabilidad de muerte antes de t a˜nos
habiendo llegado a x a˜nos de edad
La notaci´on actuarial para esta funci´on es tqx , as´ı mismo tpx := 1 −t qx
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 6 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Las funciones de la tabla de vida (II)
Fuerza de mortalidad:
µx :=
1
S(x)
dF(x)
dx
(3
) (4)
tpx = e(− t
0
µx+s ds) (5)
3Px (∆x) = P (x < X < x + ∆x|X > x) =
FX (x+∆x)−FX (x)
1−FX (x)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 7 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Las funciones de la tabla de vida (III)
Se define como lx la poblaci´on que llega con vida a una poblaci´on x:
lx := E(L(x)) = l0S(x); L(x) ∼ Bin(l0, S(x)) (6)
El n´umero de personas que mueren entre la edad x y x + 1 es una variable
aleatoria binomial:
D(x) ∼ Bin(l0, S(x) − S(x + 1)) (7)
dx = E [D(x)] = l0(S(x) − S(x + 1)) = lx − lx+1 (8)
dx /lx = (S(x) − S(x + 1))/S(x) = qx (9)
Por lo tanto, tomando (5) podemos reescribir la ecuaci´on as´ı:
lx+1 = lx e(− 1
0
µx+s ds) (10)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 8 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Las funciones de la tabla de vida (IV)
El supuesto de fuerza de mortalidad constante por tramos establece:
µx+s = µx ; 0 ≤ s < 1. (11)
Por lo tanto:
lx+1 = lx e−µx
; qx = 1 − e−µx
(12)
Se introduce una nueva variable Lx , tambi´en denominada Ex :
Lx ≈ lx − dx /2 (13)
La cual representa el n´umero de personas que llegaron a la edad x y que murieron
antes de cumplir a˜nos.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 9 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Las funciones de la tabla de vida (V)
Tasa de mortalidad:
qx = dx /lx (14)
Tasa central de mortalidad
mx = dx /Lx (15)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 10 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Cohorte (I)
Una cohorte da una especificaci´on a un grupo en la poblaci´on, y lo caracteriza de
la siguiente manera:
1 El grupo consta de una poblaci´on inicial de l0.
2 Cada miembro del grupo tiene una probabilidad qx de muerte al iniciar la
edad x.
3 Al grupo no ingresan otras personas fuera de los l0 iniciales.
4 Los tiempos de supervivencia en cada grupo de an´alisis se asumen variables
aleatorias independientes, lo que sugiere que no hay relaci´on entre las causas
de mortalidad entre las diferentes cohortes.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 11 / 62
Modelo Lee-Carter Las funciones de la tabla de vida
Cohorte (II)
lx,t ser´a el total de personas que llega a la edad x correspondientes a la
cohorte t
nc ser´a el n´umero total de cohortes observadas de tal manera que
t = t1, . . . , tnc
ωt corresponde a la ´ultima edad a la que lleg´o la cohorte t entonces
x = 1, . . . , ωt
Incorporando el concepto de cohorte podemos escribir (10) de la siguiente manera:
lx+1,t = lx,te(− 1
0
µx+s,t ds)
(16)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 12 / 62
Modelo Lee-Carter El modelo
El modelo (I)
El modelo Lee-Carter (LC) se plantea como la relaci´on lineal entre el logaritmo de
la tasa central de mortalidad y las variables explicativas del fen´omeno tales como
edad y tiempo.
mx,t = eαx +βx κt + x,t
; ln (mx,t) = αx + βx κt + x,t (17)
donde x = 1, . . . , ωt, t = t1, . . . , tnc
y x,t ∼ i.i.dN(0, σ2
). αx , βx y κt son los
parametros a estimar
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 13 / 62
Modelo Lee-Carter El modelo
El modelo (II)
En donde las variables se definen de la siguiente manera:
µx : Fuerza de la mortalidad.
mx,t : Tasa de mortalidad central para la edad x en el tiempo t (Hazard rate).
N´umero de muertes de edad x a x + 1 con respecto los que ten´ıa x en la mitad del
a˜no t.
dx,t : Muertes registradas para la edad x en el periodo t.
Ex,t : Expuestos al riesgo en la edad x correspondientes al periodo o cohorte t.
αx : Logaritmo del comportamiento medio de µx (Fuerza de la mortalidad).
βx : Descripci´on del patron de desviaci´on del perfil de edad x a medida que k var´ıa.
Medida de variaci´on de mx,t a medida que κt cambia.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 14 / 62
Modelo Lee-Carter El modelo
El modelo (III)
κt : ´Indice de mortalidad o tendencia en el tiempo de la fuerza de mortalidad. Este
par´ametro define la direcci´on de la esperanza de vida, ante una reducci´on en el
´ındice de mortalidad habr´a una mayor esperanza de vida. Este ´ındice podr´a ser
negativo para as´ı reflejar cambios en la din´amica de la tasa de mortalidad central.
x,t : T´ermino de error.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 15 / 62
Modelo Lee-Carter El modelo
El modelo (IV)
Debido al t´ermino bilineal βx κt estos par´ametros del modelo no ser´an
identificables (no podr´an ser estimados) debido a que el modelo es invariante a
transformaciones lineales, por ejemplo si αx , βx y κτ son una soluci´on, entonces
∀c = 0, αx − βx c, βx y κτ + c tambi´en ser´an soluciones y de la misma manera,
αx , βx c y κτ /c ser´an soluciones; pero con las restricciones
τ
κτ = 0;
x
βx = 1 (18)
el modelo queda identificable
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 16 / 62
Modelo Lee-Carter El modelo
El modelo (V)
Bajo el supuesto de mortalidad constante 4
:
µx+s,τ = µx,τ , 0 ≤ s < 1. (19)
por tanto
lx+1,τ = lx,τ e(−µx,τ )
= lx,τ e−eαx +βx κτ
(20)
tambi´en se cumple
qx,τ = 1 − e−eαx +βx κτ
(21)
4Este supuesto nos permite calcular la probabilidad P (T (x) ≤ 1) = qx como
s qx = 1 − es log(1−qx ); ver: Bowers, N., Gerber, H., Hickman, J., Jones, D., & Nesbitt, C. J.
(1986). Actuarial Mathematics. Ithasca, Il.: The Society of Actuaries.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 17 / 62
Modelo Lee-Carter El modelo
Matriz de descomposici´on singular (SVD) (I)
La estrategia original de estimaci´on del modelo de LC 5
se basa en la minimizaci´on de la
funci´on
D(α, β, κ) =
x,t
(log(mx,t ) − (αx + βx κt ))2
(22)
con respecto a (α, β, κ), α, β ∈ Rna
, κ ∈ Rnc
. En forma matricial, si
M = [log(mx,t )] ∈ Rna×nc
, 1nc
= (1, . . . , 1) ∈ Rnc
D(α, β, κ) = ||M − α1nc
− βκ ||2
2. (23)
Donde ||A||2 = i j |Ai,j |2 es la norma Frobenius para matrices. A partir de la
ecuaci´on ∂D/∂α = 0 las restricciones (18) permiten obtener como soluci´on el vector
dado por los promedios de las filas de M, α = 1
nc
M1nc
. Reemplazando esta soluci´on en
(23), el problema ahora consiste en minimizar con respecto a (β, κ) la funci´on
D(β, κ) = ||M − α1nc
− βκ ||2
2. (24)
5Lee, R. & Carter, L. R. (1992). Modelling and Forecasting U.S.Mortality. Journal of the
American Statistical Association, 87, 659 − 671.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 18 / 62
Modelo Lee-Carter El modelo
Matriz de descomposici´on singular (SVD) (II)
La minimizaci´on en (24) es un caso particular del problema general de aproximar
una matriz dada H por otra matriz de rango igual o menor, X, es decir, se trata
de encontrar X tal que
X = argmin
rank(X)≤r
||H − X||2, (25)
donde r = rank(H). La soluci´on X se puede encontrar mediante la
descomposici´on singular de la matriz H.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 19 / 62
Modelo Lee-Carter El modelo
Matriz de descomposici´on singular (SVD) (III)
H ∈ Rm×n
→ H = UΣV ; U ∈ Rm×m
; V ∈ Rn×n
(26)
Σ = diag(σ1, . . . , σp); σ1 ≥ . . . ≥ σp ≥ 0 (27)
p = min(m, n) (28)
H =
r
j=1
σj uj vj (29)
Si la matriz original es real, no se generar´an n´umeros complejos ya que los valores
singulares σj son reales no negativos y los vectores uj , vj son reales. (ver shores6
,
sec. 5.6)
6Shores, T. (2004). Applied Linear Algebra and Matrix Analysis. Heildelberg: Springer Verlag.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 20 / 62
Modelo Lee-Carter El modelo
Matriz de descomposici´on singular (SVD) (IV)
Aplicando este resultado a la matriz H = M − α 1nc
, asumiendo na = m < n = nc ,
con r = na,
M − α1nc
=
h
j=1
σj uj vj . (30)
En el trabajo original de Lee y Carter (1992) utilizan una aproximaci´on de rango
h = 1 y por tanto, se estiman β =
√
σ1u1 y κ =
√
σ1v1, respectivamente. Este
resultado se puede poner de manera informal como
M ≈ α 1nc
+ β κ . (31)
En Shapiro & Koissi7
y Brouhns8
se analiza con detalle esta metodolog´ıa.
7Koissi, M.−C. & Shapiro, A. (2008). The Lee-Carter model under the condition of variables
age-specific parameters. 43rd Actuarial Research Conference, Regina, Canada
8Brouhns, N., Denuit, M., & Vermunt, J. (2002). A Poisson log-bilinear regression approach
to the construction of projected lifetables. Insurance: Mathematics and Economics, 31, 373 −
393
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 21 / 62
Modelo Lee-Carter El modelo
Modelos lineales generalizados (I)
Dado que el supuesto de homocedasticidad no se cumple para datos de tablas de
vida se realiza una correcci´on planteada por Brouhns9
, asumiendo
D(x, t) ∼ Poisson(Ex,tmx,t) en lugar de D(x) ∼ Bin(l0, S(x) − S(x + 1)), tal que
log(mx,t) = αx + βx κt. (32)
donde dx,t/Ex,t = mx,t; siendo dx,t las muertes de edad x para la cohorte t. Una
expresi´on equivalente del modelo es
log(dx,t) = log(Ex,t) + αx + βx κt. (33)
El t´ermino log(Ex,t) se denomina offset. Esta diferenciaci´on se hace ya que el
t´ermino observado es dx,t (muertes) y Ex,t (expuestos al riesgo)
9Brouhns, N., Denuit, M., & Vermunt, J. (2002). A Poisson log-bilinear regression approach
to the construction of projected lifetables. Insurance: Mathematics and Economics, 31, 373 −
393
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 22 / 62
Modelo Lee-Carter El modelo
Modelos lineales generalizados (II)
Dado D(x, t) ∼ Poisson(Ex,tmx,t) se construye la m´axima verosimilitud basado en
las variables observadas dxt, Ex,t y haciendo λx,t = Ex,tmx,t:
l(d, λ) =
x,t
dx,t ln(λx,t) − λx,t − ln(dx,t!). (34)
o de otra forma:
l(α, β κ) =
x,t
dx,t ln(Ex,teαx +βx κt
) − Ex,teαx +βx κt
(35)
con respecto a αx , βx , κt, x = 1, . . . , na, t = t, . . . , tnc
y teniendo en cuenta que
λx,t = Ex,tmx,t = Ex,teαx +βx κt
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 23 / 62
Modelo Lee-Carter El modelo
Modelos lineales generalizados (III)
El estimador de m´axima verosimilitud en el contexto de modelos lineales
generalizados se obtiene minimizando la funci´on deviance. Si dx,t es el conteo de
bajas observado y dx,t = Ex,teα+βκ
, la funci´on deviance se define como
D(dx,t, dx,t) = 2
x,t
ωx,t dx,t log
dx,t
dx,t
− (dx,τ − dx,t) , (36)
donde ωx,t = 0 si dx,t = 0 y ωx,t = 1 si dx,t > 0. La minimizaci´on de la funci´on de
deviance se hace mediante el m´etodo de Newton-Raphson unidimensional,
aplicado a cada par´ametro θ = αx , βx , κt, el cual actualiza el valor de θ seg´un la
expresi´on
θj+1 = θj −
∂D
∂θ
∂2D
∂θ2
(37)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 24 / 62
Herramientas para la estimaci´on del modelo Lee-Carter
Librer´ıas para la estimaci´on del modelo LC
La librer´ıa Demography creada por Rob J Hyndman (2014), ver 10
, permite
realizar an´alisis de datos demogr´aficos que incluyen el an´alisis de tablas de
vida. El an´alisis generado por esta herramienta es basado en la metodolog´ıa
original planteada por Lee y Carter 11
de descomposici´on en valores singulares.
La estimaci´on a trav´es de m´axima verosimilitud sobre el modelo lineal
generalizado se realiza con la librer´ıa Ilc creada por Butt, Z. & Haberman12
El modelo log-bilineal Poisson (log(dx,t) = log(Ex,t) + αx + βx κt) se puede
definir como un ejemplo de la clase de modelos no-lineales generalizados el
cual puede ser estimado a trav´es de la librer´ıa gnm de Turner, H. & Firth,
D.13
10Hyndman, R. J. (2015). Demography: Forecasting mortality, fertility, mi- gration and
population data. http://robjhyndman.com/software/demography/
11Lee, R. & Carter, L. R. (1992). Modelling and Forecasting U.S.Mortality. Journal of the
American Statistical Association, 87, 659 − 671.
12Butt, Z. & Haberman, S. (2009). Ilc: A Collection of R Functions for Fitting a Class of
Lee-Carter Mortality Models using Iterative Fitting Algorithms. Ac- tuarial Research Paper No.
190,Faculty of Actuarial Science and Insurance, Cass Business School, (pp. 1−37)
13Turner, H. & Firth, D. (2015). Generalized nonlinear models in r: An overview of the gnm
package. v1.0-8. http://CRAN.R-project.org/package=gnm
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 25 / 62
Herramientas para la estimaci´on del modelo Lee-Carter
Librer´ıa gnm
La sintaxis para estimar el modelo consiste en definir las variables t,x,dx (dx,t ),Ex (Ex,t ),
contenidas en un data.frame, por ejemplo, D, con la instrucci´on
m1 = gnm(dx ~ x + Mult(x, t), offset = log(Ex),
family = "poisson", data = D)
formula (Ej. dx~x+Mult(x, t)): F´ormula en la cual se indica la relaci´on entre los
par´ametros a estimar y el dato observado. En este caso ser´a dx (Muertes) se regresar´a
contra un t´ermino multiplicativo en t, x
offset: Este par´ametro indica que hay informaci´on adicional que debe incluirse en el
an´alisis. En este caso ser´an los expuestos al riesgo
family: Especifica la funci´on link del modelo
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 26 / 62
Estimaci´on de la mortalidad en Colombia
Estimaci´on de la mortalidad en Colombia - Datos
Los datos para realizar este an´alisis fueron tomados del texto Colombia,
Tablas Abreviadas de Mortalidad por Sexo Para Fechas Censales y
Estimaciones Quinquenales 1995 - 2025 14
elaborado por el Dane bajo el
marco de los estudios censales desarrollados luego del censo de 1993
Los registros de mortalidad no hacen ning´un tipo de exclusi´on referente a
enfermedades o causas de muerte particulares, por lo que se considera
exhaustivo en todas las posibles causas registrables de mortalidad
El estudio agrupa la informaci´on de los mayores de 80 a˜nos en el ´ultimo
grupo de edad (80+) el cual se presenta aqu´ı como un ´unico grupo, lo que
puede afectar la varianza del modelo en este rango
14G´omez, C. L. M. (1998). Colombia. tablas abreviadas de mortalidad por sexo para fechas
censales y estimaciones quinquenales 1995 − 2025. Estudios Censales
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 27 / 62
Estimaci´on de la mortalidad en Colombia
Datos
x t Ex,t (Hombres) dx,t (Hombres) Ex,t (Mujeres) dx,t (Mujeres)
1993 0 100,000.00 3,870.00 100,000.00 2,977.00
1993 1-4 96,130.00 1,279.00 97,023.00 1,098.00
1993 5-9 94,851.00 273.00 95,925.00 199.00
1993 10-14 94,578.00 326.00 95,726.00 189.00
1993 15-19 94,252.00 1,687.00 95,538.00 394.00
1993 20-24 92,565.00 2,812.00 95,144.00 465.00
1993 25-29 89,753.00 2,708.00 94,679.00 518.00
1993 30-34 87,045.00 2,439.00 94,161.00 613.00
1993 35-39 84,606.00 2,500.00 93,548.00 817.00
1993 40-44 82,106.00 2,407.00 92,731.00 1,111.00
1993 45-49 79,698.00 2,530.00 91,620.00 1,634.00
1993 50-54 77,168.00 3,334.00 89,986.00 2,521.00
1993 55-59 73,834.00 4,824.00 87,465.00 3,960.00
1993 60-64 69,010.00 6,323.00 83,505.00 5,618.00
1993 65-69 62,687.00 9,123.00 77,887.00 8,411.00
1993 70-74 53,564.00 11,119.00 69,476.00 11,532.00
1993 75-79 42,445.00 12,862.00 57,944.00 14,682.00
1993 80+ 29,583.00 23,583.00 43,262.00 43,262.00
Cuadro: Datos de expuestos al riesgo y muertes referentes al a˜no 1993 para ambos
generos (Ex,t y dx,t )
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 28 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (I.a)
Las librer´ıas Demography e ilc ajustan a valores muy similares, en estricto sentido
solo se observa alguna diferencia relevante para los datos pertenecientes a las
edades mayores
La librer´ıa gnm tiende a desviarse hacia una menor fuerza de mortalidad media
ln (αx ) en las edades entre 0 − 40 y a tener una mayor magnitud en las edades de
40 − 80 a˜nos, lo que en primera instancia nos indica que la librer´ıa gnm logra
representar una mayor variabilidad en estos rangos extremos de edades
Para el caso de βx , observamos una diferencia significativa entre los ajustes
presentados por las dos primeras librer´ıas en el sentido que para la edad x = 80 la
librer´ıa Demography continua una tendencia decreciente, sin embargo la librer´ıa ilc
cambia de tendencia presentando un incremento en la sensibilidad
En el caso de la librer´ıa gnm se nota un cambio menor para βx en los a˜nos menores
de 20 y una din´amica diferente a las dem´as librer´ıas para los mayores de 55 a˜nos
Es importante anotar que las tres librer´ıas coinciden en poca variabilidad de este
par´ametro entre las edades de 20 a 60 a˜nos, los que sugiere que el valor de la tasa
de mortalidad para estas edades es invariante ante cambios en el tiempo medidos a
trav´es de κt (recordemos la ecuaci´on LC, mx,t = eαx +βx κt + x,t
)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 29 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (I.b)
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
0 20 40 60 80
−2−10123
edad
ln(a_x)−mean(ln(a_x))
q
q
q
q
q
q q q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q
Demography
ilc
gnm
I
q
q
q
q
q
q
q
q
q
q
q
q
q q
q
q
q
q
0 20 40 60 80
−0.050.000.050.100.150.20
edad
ln(b_x)−mean(ln(b_x))
q
q
q
q
q
q q
q
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
q q
q q
q q q
q q q q
q
q
Demography
ilc
gnm
II
Figura: Comparaci´on entre par´ametros αx y βx para los modelos Demography, ilc y gnm
para hombres. Para los par´ametros αx y βx se presenta normalizado restando su
respectiva media en aras de poder hacer comparaciones ya que los valores generados con
la librer´ıa gnm presentan diferencias debido a su algoritmo de estimaci´on
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 30 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (II.a)
κt presenta una pendiente mayor para la librer´ıa gnm, n´otese el cambio de
pendiente entre los a˜nos 1993 y 1999, a diferencia de las librer´ıas
Demography e ilc las cuales se muestran con una pendiente constante
Dado que los par´ametros estimados no son observables, no hay forma de
comparar con la realidad, sin embargo, realizando una revisi´on bibliogr´afica,
podemos corroborar que los par´ametros estimados a trav´es de gnm son los
que m´as se asimilan en tendencia a los datos presentados por el DANE 15
15G´omez, C. L. M. (1998). Colombia. tablas abreviadas de mortalidad por sexo para fechas
censales y estimaciones quinquenales 1995 - 2025. Estudios Censales.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 31 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (II.b)
q
q
q
q
q
q
1950 1960 1970 1980 1990 2000
−505
ln(k_t)−mean(ln(k_t))
q
q
q
q
q
q
q
q
q
q
q
q
Demography
ilc
gnm
Figura: Comparaci´on del par´ametro κt para los modelos Demography, ilc y gnm para
hombres. El par´ametro se presenta normalizado restando su respectiva media en aras de
poder hacer comparaciones ya que los valores generados con la librer´ıa gnm presentan
diferencias debido a su algoritmo de estimaci´on
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 32 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (III.a)
Se observa una tendencia decreciente en la mortalidad a medida que pasa el
tiempo
El punto com´un entre las librer´ıas se encuentra en las edades entre 0 y 20
a˜nos, para lo cual se presenta una ca´ıda con curvatura y evoluci´on (en
magnitud) similar
A partir del punto de inflexi´on com´un que se presenta en los 20 a˜nos, se
presentan diferencias entre las librer´ıas usadas para la estimaci´on
Luego de una revisi´on num´erica, las mayores diferencias se presentan en la
estimaci´on de µx,t para x ≥ 70
La librer´ıa Demography presenta una evoluci´on creciente del par´ametro para
esta edad, lo cual se opone a la sugerencias observadas en la librer´ıa gnm en
la que la mortalidad es decreciente a medida que el tiempo avanza. En
contraste, la librer´ıa ilc no captura el cambio en la mortalidad en este punto
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 33 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (III.b)
0 20 40 60 80
678910
edad
ln(mu_x,t)
1951
1964
1973
1985
1993
1999
mu estimado, Hombres en t (Demog)
Figura: µx,t estimado para hombres con librer´ıa Demography
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 34 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (III.c)
0 20 40 60 80
678910
edad
ln(mu_x,t)
1951
1964
1973
1985
1993
1999
mu estimado, Hombres en t (ilc)
Figura: µx,t estimado para hombres con librer´ıa ilc
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 35 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC ajustado a datos de hombres (III.d)
0 20 40 60 80
−6−5−4−3−2−10
edad
ln(mu_x,t)
1951
1964
1973
1985
1993
1999
mu estimado, Hombres en t (gnm)
Figura: µx,t estimado para hombres con librer´ıa gnm
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 36 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC (I)
Se presentan los residuales tipo Deviance y tipo Pearson de la estimaci´on de dx,t
(Varianza del error residual para dx,t = Ex,t eα+βκ
)
G´enero SVD GLM GNM
Hombres 13,881.7 14,748.9 8,540.7
Mujeres 23,454.2 17,999.7 10,733.0
Cuadro: Residuales tipo Deviance de la estimaci´on de dx,t discriminados por g´enero
G´enero SVD GLM GNM
Hombres 1.218 -0.076 0.806
Mujeres 0.843 0.311 0.836
Cuadro: Residuales tipo Pearson de la estimaci´on de dx,t discriminados por g´enero
Con base principalmente en los residuales tipo Deviance, en los que se observa menor
variaci´on del error entre dx,t y dx,t para ambos g´eneros, se concluye que la mejor
estimaci´on es la realizada por el modelo log-bilineal de Poisson a trav´es del uso de la
herramienta gnm
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 37 / 62
Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos
Modelo LC (II)
q
q
q
q
q
0 5 20 35 50 65 80
020040060080010001200
(I) Residuales por edad − Hombres
edad
residuosDeviance
q
q
q
q
q
1951 1973 1993
020040060080010001200
(II) Residuales por año − Hombres
residuosDeviance
Figura: Residuales Deviance para el modelo gnm por edad y a˜no en hombres
En la edad de 80 a˜nos, se evidencia heterocedasticidad debida a la baja calidad en
los datos ya que esta edad representa el rango de edad de 80 a˜nos en adelante, la
cual representa un n´umero mayor de muertes que sus intervalos previos
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 38 / 62
Estimaci´on de la mortalidad en Colombia Estimaci´on del modelo a trav´es de gnm
Modelo LC (III)
## Modelo LC
LCgnm <- gnm(mDeaths ~ -1+ Age + Mult(Age, Year),
offset = log(mExposure), family = poisson(link="log"), data = dane)
coeff=LCgnm$coefficients
## Ajuste parametros Currie 2014
alfa=coeff[1:nx]
beta=coeff[(nx+1):(2*nx)]
k=coeff[(2*nx+1):(2*nx+nt)]
kR = sum(k)/nt
betaR = sum(beta)/nx
| alfa.est = alfa +kR*beta.h
| k.est = nx*betaR*(k-kR)
| beta.est = beta/(nx*betaR)
|
|
|
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 39 / 62
Estimaci´on de la mortalidad en Colombia Estimaci´on del modelo a trav´es de gnm
Modelo LC (IV)
Edad αx βx Edad αx βx
0 -2.99 0.07 40 -3.93 0.05
1 -3.83 0.10 45 -3.63 0.04
5 -5.25 0.11 50 -3.24 0.03
10 -5.58 0.10 55 -2.83 0.02
15 -5.05 0.09 60 -2.42 0.02
20 -4.83 0.09 65 -1.98 0.02
25 -4.69 0.08 70 -1.57 0.02
30 -4.48 0.07 75 -1.14 0.02
35 -4.22 0.06 80+ -0.08 0.02
Cuadro: Valores de αx y βx para hombres a trav´es de la librer´ıa gnm
t 1951 1964 1973 1985 1993 1999
κt 12.25 6.64 3.19 -4.06 -6.63 -11.40
Cuadro: Valores de κt para hombres a trav´es de la librer´ıa gnm
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 40 / 62
Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad
Proyecci´on de mortalidad (I)
#An´alisis pron´osticos con Loess span=0.75, Hombres
kt.h=ts(k.h.est,frequency=1)
m.lo.gnm.h=loess(kt.h ~ t,
control =
loess.control(surface = "direct"))
| tt = seq(1999,by=4,length.out=6)
|
| pr.lo.gnm.h =
| predict(m.lo.gnm.h,
| data.frame(t = tt))
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 41 / 62
Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad
Proyecci´on de mortalidad (II.a)
Se sugiere una disminuci´on en el ´ındice de mortalidad para ambos g´eneros,
siendo m´as marcada esta disminuci´on para el g´enero masculino, es decir, los
hombres presentan una mortalidad menor que las mujeres para los periodos
mayores al a˜no 2000
Esta evidencia sugiere un argumento que se busca evidenciar con este texto;
la esperanza de vida en la poblaci´on analizada esta incrementando con
el tiempo, o de otra manera, la din´amica demogr´afica de Colombia
est´a cambiando hacia una mayor longevidad en ambos g´eneros
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 42 / 62
Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad
Proyecci´on de mortalidad (II.b)
q
q
q
q
1950 1960 1970 1980 1990 2000 2010
−60−50−40−30−20−10010
k_t
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
Estimado Hombres
Proyectado Hombres
Estimado Mujeres
Proyectado Mujeres
Figura: kt estimado (1951-1999) y proyectado (2003-2011)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 43 / 62
Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad
Proyecci´on de mortalidad (III.a)
Llama la atenci´on la forma marcada en la que evoluciona la mortalidad para
las edades entre los 0 y 20 a˜nos, evidenciando el car´acter exponencial del
modelo llevando la mortalidad a unos niveles m´ınimos alejados de lo que
sucede en los periodos siguientes
Lo anterior es seguido de una evoluci´on mas constante a partir de los 40 a˜nos
Adem´as, el modelo logra capturar un cambio importante para una edad de
aproximadamente 70 a˜nos en donde se presenta un punto de inflexi´on para la
estimaci´on del 2011
Se sabe a partir del an´alisis de residuales que, los datos para las edades de 80
a˜nos y m´as presentan sobredispersi´on, la cual puede ser la causante de la
mayor variaci´on en la mortalidad para este rango, como fue anotado
anteriormente esto es causado por la agrupaci´on que tienen los datos para el
rango de 80 a˜nos y m´as
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 44 / 62
Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad
Proyecci´on de mortalidad (III.b)
0 20 40 60 80
−10−8−6−4−20
edad
log(mu_x,t)
1951
1964
1973
1985
1993
1999
2003
2007
2011
Figura: log (µx,t ) estimado (1951-1999) y proyectado (2003-2011) - Hombres
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 45 / 62
Estimaci´on de la poblaci´on universitaria
Estimaci´on de la poblaci´on universitaria
0 5 10 15 20 25 30 35
050010001500
semestres cursados
poblacion
Figura: Evoluci´on de las cohortes: 1989/02 - 2006/01
Se consideraron datos de pregrado para las cohortes entre 02/1989 y 01/2006, para la
Universidad Nacional de Colombia, Sede Medell´ın, proporcionados por el Sr. Fabio Rico
de la Oficina de Planeaci´on Acad´emica de la Sede
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 46 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (I.a)
Se realiza la estimaci´on de los par´ametros αx , βx , κτ , y µx,τ
(x = 1, 2, 3, . . . , 17 y
t = 1989 − 02, 1999 − 01, 1999 − 02, . . . , 2005 − 02, 2006 − 01)
La salida de alumnos se evidencia en el panel I.a con el par´ametro αx , para lo
cual se observa una menor deserci´on en los semestres 6, 7 y 8 para luego
tomar una inclinaci´on positiva y llegar a un equilibro luego del semestre
n´umero 13, en donde se presenta la mayor relaci´on con la fuerza de
mortalidad
En (c) se observa la evoluci´on de κt cuya din´amica muestra una reversi´on a
mediados del 2005 al nivel de inicios de la d´ecada de 1990. µx,τ , quien
determina la tasa central de mortalidad es mostrada en el panel II.c para los
datos correspondientes a 1989 − 02 y 2006 − 01
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 47 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (I.b)
q
q
q
q
q
q
q q
q
q
q
q
q
q q
q q
5 10 15
−3.5−3.0−2.5−2.0−1.5−1.0
semestres cursados
log(a_x)
I
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
5 10 15−0.050.000.050.100.150.20
semestres cursados
log(b_x)
II
Figura: Modelo LC para mortalidad acad´emica, par´ametros logαx y logβx estimados
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 48 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (I.c)
q
q
qq
q
qq
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
−4−2024
cohortes
log(k_t)
1989 1993 1997 2001 2005
I
5 10 150.050.100.150.200.250.300.35
semestres cursados
log(mu_x,t)
2006−01
1989−02
II
Figura: Modelo LC para mortalidad acad´emica, par´ametros κτ y log(µx,τ ) estimados
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 49 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (II.a)
En el semestre 1, el cual representa los estudiantes que ingresaron a la
universidad y permanecieron en ella solo un semestre, evoluciona de manera
creciente a trav´es de las diferentes cohortes, esto es, en una cohorte del 2004,
un estudiante tiene m´as probabilidades de salir en el primer semestre que
para una cohorte del 1990
Tambi´en se puede evidenciar, que los estudiantes que permanecen entre 3 y 9
semestres son los m´as constantes entre las cohortes
Como punto relevante se evidencia que los alumnos que est´an 10 o mas
semestres presentan un cambio notorio entre las cohortes de 1993 y 1998,
con un incremento en variabilidad hasta las ´ultimas cohortes revisadas
Respecto a la reforma mencionada, la cual inici´o en el semestre 2008 − 01, se
considera que puede afectar a alumnos que ingresaron alrededor del a˜no
2001, quienes para el a˜no 2008 llevaban aproximadamente 14 semestres en la
universidad
Se evidencia a partir del a˜no 2001 una disminuci´on en variabilidad para los
estudiantes que permanecen entre 8 y 16 semestres en la universidad y una
tendencia de disminuci´on en el logaritmo del par´ametro µx,τ , lo cual podr´ıa
se un efecto de la reforma
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 50 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (II.b)
0.00.10.20.30.4
Semestre de ingreso (cohorte)
ln(mu_x,t)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1989 1992 1995 1998 2001 2004
Figura: log(µx,t ) para los 17 semestres a trav´es de las 34 cohortes analizadas
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 51 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (III)
q
q
q
q
q q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q q
q
qqq
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
1 3 5 7 9 12 15
0102030405060
(I) Residuales por semestre cursado
semestre
residuosDeviance
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
0102030405060
(II) Residuales por cohorte
cohorte
residuosDeviance
89 92 95 98 01 04
Figura: Residuos (deviation) del Modelo LC
Se grafican diagramas box-plot para Dx,τ para cada x = 1, . . . , na, y para cada cohorte,
τ = 98/01, . . . , 06/01. Inicialmente se observa que hay varianza constante a pesar de que
los primeros semestres 1,2,3 presentan mayor dispersi´on. En el panel II se observa una
posible heterocedasticidad, debido a que los semestres del a˜no 2000 en adelante
muestran mayor dispersi´on.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 52 / 62
Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm
Estimaci´on del modelo a trav´es de gnm (IV)
Se muestra la siguiente tabla en la que se comparan los residuales de la estimaci´on
por descomposic´on singular vs. la estimaci´on por minimizaci´on del estad´ıstico
deviance equivalente a la m´axima verosimilitud en el modelo log-bilineal de
Poisson, mediante el valor del estad´ıstico chi-cuadrado Deviance y el estad´ıstico
chi-cuadrado Pearson
SVD Max.Ver
Deviance 2090.93 1699.17
Pearson 2188.70 1645.29
Cuadro: Comparaci´on de residuales Deviance y Pearson
Como se puede observar el ajuste mediante m´axima verosimilitud con el modelo
log-bilineal de Poisson resulta mejor ya que la varianza del error cuadr´atico es
menor bajo ambas medidas (Deviance y Pearson).
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 53 / 62
Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad
Proyecci´on de mortalidad (I.a)
Se ajust´o un ARIMA(1,1,0) con par´ametro autoregresivo ϕ = −0,3419 y
error est´andar 0.1666 determinado a trav´es de la funci´on auto.arima de la
librer´ıa forecast 16
para R
Se realiz´o una regresi´on local Loess con la funci´on loess() con un ancho de
ventana spam=0.42 (no se utiliz´o el valor por defecto de 0.75).
Para un pron´ostico de 10 semestres entre 2006 − 02 y 2011 − 01 la tendencia
generada por el modelo ARIMA(1,1,0) es constante, a diferencia de la
tendencia generada por el modelo Loess, la cual es decreciente
16Hyndman, R., Athanasopoulos, G., Razbash, S., Schmidt, D., Zhou, Z., Khan, Y., Bergmeir,
C., & Wang, E. (2014). forecast: Forecasting functions for time series and linear models. R
package version 5.5
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 54 / 62
Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad
Proyecci´on de mortalidad (I.b)
−6−4−20246
cohorte
kt
1989 1992 1995 1998 2001 2004 2007 2010
lc.poisson
loess−poisson
arima(1,1,0) con tendencia
Figura: Ajuste de κt con ARIMA y Loess, y pron´ostico a 10 semestres
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 55 / 62
Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad
Proyecci´on de mortalidad (II.a)
Dado que al momento del estudio se cuenta con la informaci´on hasta el
octavo semestre de la cohorte del 2011-01 (κ34+10) se puede establecer cual
genera un mejor pron´ostico de la mortalidad acad´emica. A partir de esta
informaci´on se reconstruye la tasa central de mortalidad mx,2011−01 y los
valores lx+1 = lx e−µx,2011−01
, para los semestres x = 1, . . . , 17
Para 2014-02 se conoc´ıan los valores de 8 de estos 17 semestres; son:
1465,1124,1107,1007,961, 908, 878 y 851. Utilizando l1 = 1465 los valores
obtenidos a partir de la estimaci´on de µx,2011−01 por Loess y ARIMA(1,1,0)
est´an en (II.b) y en (III). En ambas se observa que, excepto los 4 primeros
semestres, los pron´osticos con Loess sobre-estiman mientras que con
ARIMA(1,1,0) se sub-estiman los valores observados en 2014 para los
primeros 8 periodos del semestre 2011-01.
Mediante una revisi´on del error cuadr´atico de la estimaci´on se concluye que el
mejor ajuste, y por ende la mejor proyecci´on, es la presentada por el modelo
ARIMA(1,1,0)
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 56 / 62
Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad
Proyecci´on de mortalidad (II.b)
observada pron.Loess pron.Arima
1 1465 1465 1465
2 1124 1291 1269
3 1107 1151 1115
4 1007 1043 1004
5 961 972 942
6 908 924 896
7 878 894 864
8 851 869 836
9 849 807
10 823 758
11 774 663
12 690 530
13 570 388
14 437 276
15 320 198
16 231 144
17 161 104
Cuadro: Semestre
2011-01, pronosticada con
Loess y Arima; Fuente de
datos observados: Oficina
de planeaci´on acad´emica,
Universidad Nacional Sede
Medell´ın
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 57 / 62
Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad
Proyecci´on de mortalidad (III)
200400600800100012001400
cohorte
kt
2011 2012 2013 2014 2015 2016 2017 2018 2019
Loess
ARIMA(1,1,0)
Observado cohorte 2011−01
Figura: Pron´osticos de 17 semestres a partir del 2011-01 con modelo LC usando Loess y
ARIMA, datos observados para 8 semestres (Fuente: Oficina de Planeaci´on, Universidad
Nacional de Colombia Sede Medell´ın
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 58 / 62
Conclusiones y recomendaciones Conclusiones
Conclusiones
El modelo LC sugiere que la mortalidad en Colombia ha venido decreciendo
en las ´ultimas 5 d´ecadas y, a trav´es de los resultados de pron´osticos Loess, se
puede afirmar que este factor poblacional seguir´a disminuyendo a trav´es del
tiempo.
A partir de la informaci´on analizada se puede sugerir que la mortalidad
masculina es menos cambiante que la mortalidad femenina, especialmente
para edades entre los 20 y los 60 a˜nos, lo que por ende permite concluir que
en el futuro la esperanza de vida para las mujeres ser´a mejor que la de las
hombres.
Es valido afirmar que la implementaci´on de un modelo como el LC para la
informaci´on demogr´afica de un pa´ıs puede sugerir din´amicas poblacionales
que permitan revisar las formulaciones que basan los modelos previsionales de
fondos de pensiones y seguros. Es evidente que la disminuci´on en la tasa de
la mortalidad llevar´a a un costo m´as alto de rentas vitalicias, lo que pone en
riesgo el modelo previsional dado las cifras en las que est´a basado por ley.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 59 / 62
Conclusiones y recomendaciones Conclusiones
Conclusiones
Con base en los resultados obtenidos se puede conclu´ır que la evoluci´on de la
poblaci´on universitaria muestra un incremento en la deserci´on en los primeros
semestres, 1 a 4, a partir de 2001, y al mismo tiempo, una disminuci´on del
tiempo requerido para graduarse en 10 semestres.
La utilidad de esta metodolog´ıa puede verse desde la planeaci´on acad´emica
ya que ser´ıa posible analizar indicadores tales como n´umero de estudiantes
por docente, deserci´on estudiantil, permanencia promedio en la universidad,
entre otros.
La metodolog´ıa original de LC con base en la descomposici´on en valores
singulares no parece f´acil de implementar en modelos alternos de LC como los
propuestos en Cairns et al., 2009 17
, por lo que la implementaci´on en R de
la estimaci´on con base en modelos no lineales generalizados resulta de suma
utilidad y permite la extensi´on de otros modelos, por ejemplo, incorporando
decrementos m´ultiples (riesgos competitivos)
17Cairns, A. J. G., Blake, D., Dowd, K., Coughlan, G. D., Epstein, D., Ong, A., & Balevich, I.
(2009). A Quantitative Comparison of Stochastic Mortality Models Using Data from England
and Wales and the United States. North American Actuarial Journal, 13(1), 1−35
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 60 / 62
Conclusiones y recomendaciones Recomendaciones
Recomendaciones
Bajo el supuesto de que las empresas de seguros y pensiones est´an
concentradas regionalmente, se sugiere realizar un estudio de la din´amica
poblacional que diferencie la tasa de mortalidad por regiones. Lo anterior
podr´a sugerir un riesgo diferencial por region y por ende a costos
previsionales m´as altos o m´as bajos para diferentes participantes en sector.
De manera similar, un estudio de mortalidad acad´emica por sede podr´a
sugerir en qu´e lugares se est´an evidenciando con mayor fuerza las pol´ıticas
implementadas en t´erminos acad´emicos y de regulaci´on para determinar qu´e
condiciones particulares afectan a las diferentes poblaciones. As´ı mismo se
pueden generar estudios adicionales que incorporen variables como estado
civil, ocupaci´on laboral, estrato, g´enero, etc. de forma que identifiquen
factores externos que afecten la mortalidad acad´emica.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 61 / 62
Agradecimientos
Agradecimientos
A la Universidad Nacional de Colombia y a la Escuela de Estad´ıstica de la
Facultad de Ciencias por contribuir al fortalecimiento de mi perfil acad´emico y
profesional. Especiales agradecimientos al Profesor Norman Giraldo por su apoyo y
contribuci´on al presente trabajo. Adem´as, se agradece a la Oficina de Planeaci´on
Acad´emica de la Universidad Nacional de Colombia, sede Medell´ın por
proporcionar los datos para la estimaci´on de la poblaci´on universitaria.
Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 62 / 62

Más contenido relacionado

Similar a OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una aplicacion para Colombia 2015

Modelos Dinamicos y poblacionales (modelación matemática)
Modelos Dinamicos y poblacionales (modelación matemática)Modelos Dinamicos y poblacionales (modelación matemática)
Modelos Dinamicos y poblacionales (modelación matemática)
CarolJulianaSarmient
 
Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...
Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...
Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...
Carlos M Martínez M
 
Propagación de una enfermedad en poblaciones dinámicas
Propagación de una enfermedad en poblaciones dinámicasPropagación de una enfermedad en poblaciones dinámicas
Propagación de una enfermedad en poblaciones dinámicas
Carlos Perales
 
Actividad_15_LCKD
Actividad_15_LCKDActividad_15_LCKD
Actividad_15_LCKD
danielaC37
 
parámetros poblacionales
parámetros poblacionales parámetros poblacionales
parámetros poblacionales Lina Muñox
 
3.4 modelo matematico para enfriamiento
3.4 modelo matematico para enfriamiento3.4 modelo matematico para enfriamiento
3.4 modelo matematico para enfriamiento
Dagoberto Gonzalez
 
Crecimiento_y_Decrecimiento.pptx
Crecimiento_y_Decrecimiento.pptxCrecimiento_y_Decrecimiento.pptx
Crecimiento_y_Decrecimiento.pptx
PaulaCastillo484557
 
Infomacion ecologia de poblaciones
Infomacion ecologia de poblacionesInfomacion ecologia de poblaciones
Infomacion ecologia de poblacionesBerenice Infante
 
Métodos avanzados de Estadística Aplicada
Métodos avanzados de Estadística AplicadaMétodos avanzados de Estadística Aplicada
Métodos avanzados de Estadística Aplicada
Igor García Atutxa
 
Trabajo de ecuaciones diferenciales
Trabajo de ecuaciones diferencialesTrabajo de ecuaciones diferenciales
Trabajo de ecuaciones diferencialesLuis Viteri
 
Modelos discretos en una dimensión
Modelos discretos en una dimensiónModelos discretos en una dimensión
Modelos discretos en una dimensión
Edward Reyes Saez
 
Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferencialesAplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales
juliocesarmontoya
 
Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales
Ingeniero Edwin Torres Rodríguez
 
El_Cuaderno_38 bioestadistica.pdf
El_Cuaderno_38 bioestadistica.pdfEl_Cuaderno_38 bioestadistica.pdf
El_Cuaderno_38 bioestadistica.pdf
ang325
 
Proyecto ED
Proyecto EDProyecto ED
Proyecto ED
CesarPalacio8
 
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...Carlos Andr Ochoa
 
3_3_crecimiento_poblaciones.pdf
3_3_crecimiento_poblaciones.pdf3_3_crecimiento_poblaciones.pdf
3_3_crecimiento_poblaciones.pdf
DarlingJosLuisRojasG
 

Similar a OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una aplicacion para Colombia 2015 (20)

Modelos Dinamicos y poblacionales (modelación matemática)
Modelos Dinamicos y poblacionales (modelación matemática)Modelos Dinamicos y poblacionales (modelación matemática)
Modelos Dinamicos y poblacionales (modelación matemática)
 
Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...
Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...
Pruebas estadísticas para comparar curvas de supervivencia de k grupos con ev...
 
Propagación de una enfermedad en poblaciones dinámicas
Propagación de una enfermedad en poblaciones dinámicasPropagación de una enfermedad en poblaciones dinámicas
Propagación de una enfermedad en poblaciones dinámicas
 
Actividad_15_LCKD
Actividad_15_LCKDActividad_15_LCKD
Actividad_15_LCKD
 
parámetros poblacionales
parámetros poblacionales parámetros poblacionales
parámetros poblacionales
 
3.4 modelo matematico para enfriamiento
3.4 modelo matematico para enfriamiento3.4 modelo matematico para enfriamiento
3.4 modelo matematico para enfriamiento
 
Crecimiento_y_Decrecimiento.pptx
Crecimiento_y_Decrecimiento.pptxCrecimiento_y_Decrecimiento.pptx
Crecimiento_y_Decrecimiento.pptx
 
Infomacion ecologia de poblaciones
Infomacion ecologia de poblacionesInfomacion ecologia de poblaciones
Infomacion ecologia de poblaciones
 
Métodos avanzados de Estadística Aplicada
Métodos avanzados de Estadística AplicadaMétodos avanzados de Estadística Aplicada
Métodos avanzados de Estadística Aplicada
 
Trabajo de ecuaciones diferenciales
Trabajo de ecuaciones diferencialesTrabajo de ecuaciones diferenciales
Trabajo de ecuaciones diferenciales
 
Funcion log. exp.
Funcion log. exp.Funcion log. exp.
Funcion log. exp.
 
Presentación grupo 2
Presentación grupo 2Presentación grupo 2
Presentación grupo 2
 
La
LaLa
La
 
Modelos discretos en una dimensión
Modelos discretos en una dimensiónModelos discretos en una dimensión
Modelos discretos en una dimensión
 
Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferencialesAplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales
 
Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales Aplicaciones de las ecuaciones diferenciales
Aplicaciones de las ecuaciones diferenciales
 
El_Cuaderno_38 bioestadistica.pdf
El_Cuaderno_38 bioestadistica.pdfEl_Cuaderno_38 bioestadistica.pdf
El_Cuaderno_38 bioestadistica.pdf
 
Proyecto ED
Proyecto EDProyecto ED
Proyecto ED
 
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
 
3_3_crecimiento_poblaciones.pdf
3_3_crecimiento_poblaciones.pdf3_3_crecimiento_poblaciones.pdf
3_3_crecimiento_poblaciones.pdf
 

OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una aplicacion para Colombia 2015

  • 1. El modelo Lee-Carter para estimar y pronosticar mortalidad: Una aplicaci´on para Colombia Carlos Andr´es Ochoa caochoam@unal.edu.co Universidad Nacional de Colombia Sede Medell´ın 14 de julio de 2015 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 1 / 62
  • 2. Contenido Contenido I 1 Introducci´on Planteamiento del problema 2 Modelo Lee-Carter Las funciones de la tabla de vida El modelo Matriz de descomposici´on singular Modelos lineales generalizados 3 Herramientas para la estimaci´on del modelo Lee-Carter Librer´ıa gnm 4 Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres Estimaci´on del modelo a trav´es de gnm Proyecci´on de mortalidad 5 Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Proyecci´on de mortalidad 6 Conclusiones y recomendaciones Conclusiones Recomendaciones Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 2 / 62
  • 3. Contenido Contenido II 7 Agradecimientos Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 3 / 62
  • 4. Introducci´on Planteamiento del problema Porqu´e es importante analizar la din´amica de mortalidad? Pasivos pensionales Impacto de eventos sociales y/o demogr´aficos Evoluci´on de poblaciones Motivaci´on: Revisi´on del modelo LC realizada por Betzuen 1 en la que ajusta los datos poblacionales espa˜noles y concluye acerca de la esperanza de vida. Estudio sobre la poblaci´on Mexicana 2 enfocada en proyecci´on de mortalidad a trav´es del modelo LC en la que se concluye objetivamente sobre la din´amica de la mortalidad en hombres y mujeres. 1Betzuen, A. (2010). Un an´alisis sobre las posibilidades de predicci´on de la mortalidad futura aplicando el modelo lee-carter. Anales 2Garc´ıa, G. & Ordorica, M. (2012). Proyecci´on estoc´astica de la mortalidad mexicana por medio del m´etodo de Lee-Carter. Estudios Demogr´aficos y Urbanos, vol. 27, pp. 409-448 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 4 / 62
  • 5. Introducci´on Planteamiento del problema Objetivos de la investigaci´on Objetivo general: Analizar las diferentes metodolog´ıas y herramientas de estimaci´on del modelo Lee-Carter aplicado a datos de mortalidad poblacional tanto en datos demogr´aficos Colombianos, como en datos de poblaci´on estudiantil en la Universidad Nacional Sede Medell´ın. Adem´as realizar la correspondiente proyecci´on bajo un ajuste de series de tiempo de manera que permita concluir constructivamente acerca de la din´amica poblacional. Objetivos espec´ıficos: Realizar una revisi´on del modelo LC y de las metodolog´ıas apropiadas para hacer su estimaci´on (Matriz de descomposici´on singular y modelos lineales generalizados). Concluir acerca de las librer´ıas de R; demography(), ilc() y gnm() sobre la estimaci´on de los par´ametros del modelo LC ajustados a datos poblacionales de Colombia y de la poblaci´on estudiantil de la Universidad Nacional de Colombia Sede Medell´ın. Realizar una modelaci´on apropiada mediante metodolog´ıas de series de tiempo del indice calculado de mortalidad la cual sea v´alida para generar proyecciones de dicho ´ındice. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 5 / 62
  • 6. Modelo Lee-Carter Las funciones de la tabla de vida Las funciones de la tabla de vida (I) Funci´on de supervivencia: S(x) : = 1 − F(x); (1) T(x) : = X − x|X > x; ∀x ≥ 0 (2) G(t) : = P(T(x) ≤ t) (3) La funci´on G(t) se interpreta como la probabilidad de muerte antes de t a˜nos habiendo llegado a x a˜nos de edad La notaci´on actuarial para esta funci´on es tqx , as´ı mismo tpx := 1 −t qx Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 6 / 62
  • 7. Modelo Lee-Carter Las funciones de la tabla de vida Las funciones de la tabla de vida (II) Fuerza de mortalidad: µx := 1 S(x) dF(x) dx (3 ) (4) tpx = e(− t 0 µx+s ds) (5) 3Px (∆x) = P (x < X < x + ∆x|X > x) = FX (x+∆x)−FX (x) 1−FX (x) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 7 / 62
  • 8. Modelo Lee-Carter Las funciones de la tabla de vida Las funciones de la tabla de vida (III) Se define como lx la poblaci´on que llega con vida a una poblaci´on x: lx := E(L(x)) = l0S(x); L(x) ∼ Bin(l0, S(x)) (6) El n´umero de personas que mueren entre la edad x y x + 1 es una variable aleatoria binomial: D(x) ∼ Bin(l0, S(x) − S(x + 1)) (7) dx = E [D(x)] = l0(S(x) − S(x + 1)) = lx − lx+1 (8) dx /lx = (S(x) − S(x + 1))/S(x) = qx (9) Por lo tanto, tomando (5) podemos reescribir la ecuaci´on as´ı: lx+1 = lx e(− 1 0 µx+s ds) (10) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 8 / 62
  • 9. Modelo Lee-Carter Las funciones de la tabla de vida Las funciones de la tabla de vida (IV) El supuesto de fuerza de mortalidad constante por tramos establece: µx+s = µx ; 0 ≤ s < 1. (11) Por lo tanto: lx+1 = lx e−µx ; qx = 1 − e−µx (12) Se introduce una nueva variable Lx , tambi´en denominada Ex : Lx ≈ lx − dx /2 (13) La cual representa el n´umero de personas que llegaron a la edad x y que murieron antes de cumplir a˜nos. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 9 / 62
  • 10. Modelo Lee-Carter Las funciones de la tabla de vida Las funciones de la tabla de vida (V) Tasa de mortalidad: qx = dx /lx (14) Tasa central de mortalidad mx = dx /Lx (15) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 10 / 62
  • 11. Modelo Lee-Carter Las funciones de la tabla de vida Cohorte (I) Una cohorte da una especificaci´on a un grupo en la poblaci´on, y lo caracteriza de la siguiente manera: 1 El grupo consta de una poblaci´on inicial de l0. 2 Cada miembro del grupo tiene una probabilidad qx de muerte al iniciar la edad x. 3 Al grupo no ingresan otras personas fuera de los l0 iniciales. 4 Los tiempos de supervivencia en cada grupo de an´alisis se asumen variables aleatorias independientes, lo que sugiere que no hay relaci´on entre las causas de mortalidad entre las diferentes cohortes. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 11 / 62
  • 12. Modelo Lee-Carter Las funciones de la tabla de vida Cohorte (II) lx,t ser´a el total de personas que llega a la edad x correspondientes a la cohorte t nc ser´a el n´umero total de cohortes observadas de tal manera que t = t1, . . . , tnc ωt corresponde a la ´ultima edad a la que lleg´o la cohorte t entonces x = 1, . . . , ωt Incorporando el concepto de cohorte podemos escribir (10) de la siguiente manera: lx+1,t = lx,te(− 1 0 µx+s,t ds) (16) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 12 / 62
  • 13. Modelo Lee-Carter El modelo El modelo (I) El modelo Lee-Carter (LC) se plantea como la relaci´on lineal entre el logaritmo de la tasa central de mortalidad y las variables explicativas del fen´omeno tales como edad y tiempo. mx,t = eαx +βx κt + x,t ; ln (mx,t) = αx + βx κt + x,t (17) donde x = 1, . . . , ωt, t = t1, . . . , tnc y x,t ∼ i.i.dN(0, σ2 ). αx , βx y κt son los parametros a estimar Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 13 / 62
  • 14. Modelo Lee-Carter El modelo El modelo (II) En donde las variables se definen de la siguiente manera: µx : Fuerza de la mortalidad. mx,t : Tasa de mortalidad central para la edad x en el tiempo t (Hazard rate). N´umero de muertes de edad x a x + 1 con respecto los que ten´ıa x en la mitad del a˜no t. dx,t : Muertes registradas para la edad x en el periodo t. Ex,t : Expuestos al riesgo en la edad x correspondientes al periodo o cohorte t. αx : Logaritmo del comportamiento medio de µx (Fuerza de la mortalidad). βx : Descripci´on del patron de desviaci´on del perfil de edad x a medida que k var´ıa. Medida de variaci´on de mx,t a medida que κt cambia. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 14 / 62
  • 15. Modelo Lee-Carter El modelo El modelo (III) κt : ´Indice de mortalidad o tendencia en el tiempo de la fuerza de mortalidad. Este par´ametro define la direcci´on de la esperanza de vida, ante una reducci´on en el ´ındice de mortalidad habr´a una mayor esperanza de vida. Este ´ındice podr´a ser negativo para as´ı reflejar cambios en la din´amica de la tasa de mortalidad central. x,t : T´ermino de error. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 15 / 62
  • 16. Modelo Lee-Carter El modelo El modelo (IV) Debido al t´ermino bilineal βx κt estos par´ametros del modelo no ser´an identificables (no podr´an ser estimados) debido a que el modelo es invariante a transformaciones lineales, por ejemplo si αx , βx y κτ son una soluci´on, entonces ∀c = 0, αx − βx c, βx y κτ + c tambi´en ser´an soluciones y de la misma manera, αx , βx c y κτ /c ser´an soluciones; pero con las restricciones τ κτ = 0; x βx = 1 (18) el modelo queda identificable Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 16 / 62
  • 17. Modelo Lee-Carter El modelo El modelo (V) Bajo el supuesto de mortalidad constante 4 : µx+s,τ = µx,τ , 0 ≤ s < 1. (19) por tanto lx+1,τ = lx,τ e(−µx,τ ) = lx,τ e−eαx +βx κτ (20) tambi´en se cumple qx,τ = 1 − e−eαx +βx κτ (21) 4Este supuesto nos permite calcular la probabilidad P (T (x) ≤ 1) = qx como s qx = 1 − es log(1−qx ); ver: Bowers, N., Gerber, H., Hickman, J., Jones, D., & Nesbitt, C. J. (1986). Actuarial Mathematics. Ithasca, Il.: The Society of Actuaries. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 17 / 62
  • 18. Modelo Lee-Carter El modelo Matriz de descomposici´on singular (SVD) (I) La estrategia original de estimaci´on del modelo de LC 5 se basa en la minimizaci´on de la funci´on D(α, β, κ) = x,t (log(mx,t ) − (αx + βx κt ))2 (22) con respecto a (α, β, κ), α, β ∈ Rna , κ ∈ Rnc . En forma matricial, si M = [log(mx,t )] ∈ Rna×nc , 1nc = (1, . . . , 1) ∈ Rnc D(α, β, κ) = ||M − α1nc − βκ ||2 2. (23) Donde ||A||2 = i j |Ai,j |2 es la norma Frobenius para matrices. A partir de la ecuaci´on ∂D/∂α = 0 las restricciones (18) permiten obtener como soluci´on el vector dado por los promedios de las filas de M, α = 1 nc M1nc . Reemplazando esta soluci´on en (23), el problema ahora consiste en minimizar con respecto a (β, κ) la funci´on D(β, κ) = ||M − α1nc − βκ ||2 2. (24) 5Lee, R. & Carter, L. R. (1992). Modelling and Forecasting U.S.Mortality. Journal of the American Statistical Association, 87, 659 − 671. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 18 / 62
  • 19. Modelo Lee-Carter El modelo Matriz de descomposici´on singular (SVD) (II) La minimizaci´on en (24) es un caso particular del problema general de aproximar una matriz dada H por otra matriz de rango igual o menor, X, es decir, se trata de encontrar X tal que X = argmin rank(X)≤r ||H − X||2, (25) donde r = rank(H). La soluci´on X se puede encontrar mediante la descomposici´on singular de la matriz H. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 19 / 62
  • 20. Modelo Lee-Carter El modelo Matriz de descomposici´on singular (SVD) (III) H ∈ Rm×n → H = UΣV ; U ∈ Rm×m ; V ∈ Rn×n (26) Σ = diag(σ1, . . . , σp); σ1 ≥ . . . ≥ σp ≥ 0 (27) p = min(m, n) (28) H = r j=1 σj uj vj (29) Si la matriz original es real, no se generar´an n´umeros complejos ya que los valores singulares σj son reales no negativos y los vectores uj , vj son reales. (ver shores6 , sec. 5.6) 6Shores, T. (2004). Applied Linear Algebra and Matrix Analysis. Heildelberg: Springer Verlag. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 20 / 62
  • 21. Modelo Lee-Carter El modelo Matriz de descomposici´on singular (SVD) (IV) Aplicando este resultado a la matriz H = M − α 1nc , asumiendo na = m < n = nc , con r = na, M − α1nc = h j=1 σj uj vj . (30) En el trabajo original de Lee y Carter (1992) utilizan una aproximaci´on de rango h = 1 y por tanto, se estiman β = √ σ1u1 y κ = √ σ1v1, respectivamente. Este resultado se puede poner de manera informal como M ≈ α 1nc + β κ . (31) En Shapiro & Koissi7 y Brouhns8 se analiza con detalle esta metodolog´ıa. 7Koissi, M.−C. & Shapiro, A. (2008). The Lee-Carter model under the condition of variables age-specific parameters. 43rd Actuarial Research Conference, Regina, Canada 8Brouhns, N., Denuit, M., & Vermunt, J. (2002). A Poisson log-bilinear regression approach to the construction of projected lifetables. Insurance: Mathematics and Economics, 31, 373 − 393 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 21 / 62
  • 22. Modelo Lee-Carter El modelo Modelos lineales generalizados (I) Dado que el supuesto de homocedasticidad no se cumple para datos de tablas de vida se realiza una correcci´on planteada por Brouhns9 , asumiendo D(x, t) ∼ Poisson(Ex,tmx,t) en lugar de D(x) ∼ Bin(l0, S(x) − S(x + 1)), tal que log(mx,t) = αx + βx κt. (32) donde dx,t/Ex,t = mx,t; siendo dx,t las muertes de edad x para la cohorte t. Una expresi´on equivalente del modelo es log(dx,t) = log(Ex,t) + αx + βx κt. (33) El t´ermino log(Ex,t) se denomina offset. Esta diferenciaci´on se hace ya que el t´ermino observado es dx,t (muertes) y Ex,t (expuestos al riesgo) 9Brouhns, N., Denuit, M., & Vermunt, J. (2002). A Poisson log-bilinear regression approach to the construction of projected lifetables. Insurance: Mathematics and Economics, 31, 373 − 393 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 22 / 62
  • 23. Modelo Lee-Carter El modelo Modelos lineales generalizados (II) Dado D(x, t) ∼ Poisson(Ex,tmx,t) se construye la m´axima verosimilitud basado en las variables observadas dxt, Ex,t y haciendo λx,t = Ex,tmx,t: l(d, λ) = x,t dx,t ln(λx,t) − λx,t − ln(dx,t!). (34) o de otra forma: l(α, β κ) = x,t dx,t ln(Ex,teαx +βx κt ) − Ex,teαx +βx κt (35) con respecto a αx , βx , κt, x = 1, . . . , na, t = t, . . . , tnc y teniendo en cuenta que λx,t = Ex,tmx,t = Ex,teαx +βx κt Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 23 / 62
  • 24. Modelo Lee-Carter El modelo Modelos lineales generalizados (III) El estimador de m´axima verosimilitud en el contexto de modelos lineales generalizados se obtiene minimizando la funci´on deviance. Si dx,t es el conteo de bajas observado y dx,t = Ex,teα+βκ , la funci´on deviance se define como D(dx,t, dx,t) = 2 x,t ωx,t dx,t log dx,t dx,t − (dx,τ − dx,t) , (36) donde ωx,t = 0 si dx,t = 0 y ωx,t = 1 si dx,t > 0. La minimizaci´on de la funci´on de deviance se hace mediante el m´etodo de Newton-Raphson unidimensional, aplicado a cada par´ametro θ = αx , βx , κt, el cual actualiza el valor de θ seg´un la expresi´on θj+1 = θj − ∂D ∂θ ∂2D ∂θ2 (37) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 24 / 62
  • 25. Herramientas para la estimaci´on del modelo Lee-Carter Librer´ıas para la estimaci´on del modelo LC La librer´ıa Demography creada por Rob J Hyndman (2014), ver 10 , permite realizar an´alisis de datos demogr´aficos que incluyen el an´alisis de tablas de vida. El an´alisis generado por esta herramienta es basado en la metodolog´ıa original planteada por Lee y Carter 11 de descomposici´on en valores singulares. La estimaci´on a trav´es de m´axima verosimilitud sobre el modelo lineal generalizado se realiza con la librer´ıa Ilc creada por Butt, Z. & Haberman12 El modelo log-bilineal Poisson (log(dx,t) = log(Ex,t) + αx + βx κt) se puede definir como un ejemplo de la clase de modelos no-lineales generalizados el cual puede ser estimado a trav´es de la librer´ıa gnm de Turner, H. & Firth, D.13 10Hyndman, R. J. (2015). Demography: Forecasting mortality, fertility, mi- gration and population data. http://robjhyndman.com/software/demography/ 11Lee, R. & Carter, L. R. (1992). Modelling and Forecasting U.S.Mortality. Journal of the American Statistical Association, 87, 659 − 671. 12Butt, Z. & Haberman, S. (2009). Ilc: A Collection of R Functions for Fitting a Class of Lee-Carter Mortality Models using Iterative Fitting Algorithms. Ac- tuarial Research Paper No. 190,Faculty of Actuarial Science and Insurance, Cass Business School, (pp. 1−37) 13Turner, H. & Firth, D. (2015). Generalized nonlinear models in r: An overview of the gnm package. v1.0-8. http://CRAN.R-project.org/package=gnm Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 25 / 62
  • 26. Herramientas para la estimaci´on del modelo Lee-Carter Librer´ıa gnm La sintaxis para estimar el modelo consiste en definir las variables t,x,dx (dx,t ),Ex (Ex,t ), contenidas en un data.frame, por ejemplo, D, con la instrucci´on m1 = gnm(dx ~ x + Mult(x, t), offset = log(Ex), family = "poisson", data = D) formula (Ej. dx~x+Mult(x, t)): F´ormula en la cual se indica la relaci´on entre los par´ametros a estimar y el dato observado. En este caso ser´a dx (Muertes) se regresar´a contra un t´ermino multiplicativo en t, x offset: Este par´ametro indica que hay informaci´on adicional que debe incluirse en el an´alisis. En este caso ser´an los expuestos al riesgo family: Especifica la funci´on link del modelo Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 26 / 62
  • 27. Estimaci´on de la mortalidad en Colombia Estimaci´on de la mortalidad en Colombia - Datos Los datos para realizar este an´alisis fueron tomados del texto Colombia, Tablas Abreviadas de Mortalidad por Sexo Para Fechas Censales y Estimaciones Quinquenales 1995 - 2025 14 elaborado por el Dane bajo el marco de los estudios censales desarrollados luego del censo de 1993 Los registros de mortalidad no hacen ning´un tipo de exclusi´on referente a enfermedades o causas de muerte particulares, por lo que se considera exhaustivo en todas las posibles causas registrables de mortalidad El estudio agrupa la informaci´on de los mayores de 80 a˜nos en el ´ultimo grupo de edad (80+) el cual se presenta aqu´ı como un ´unico grupo, lo que puede afectar la varianza del modelo en este rango 14G´omez, C. L. M. (1998). Colombia. tablas abreviadas de mortalidad por sexo para fechas censales y estimaciones quinquenales 1995 − 2025. Estudios Censales Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 27 / 62
  • 28. Estimaci´on de la mortalidad en Colombia Datos x t Ex,t (Hombres) dx,t (Hombres) Ex,t (Mujeres) dx,t (Mujeres) 1993 0 100,000.00 3,870.00 100,000.00 2,977.00 1993 1-4 96,130.00 1,279.00 97,023.00 1,098.00 1993 5-9 94,851.00 273.00 95,925.00 199.00 1993 10-14 94,578.00 326.00 95,726.00 189.00 1993 15-19 94,252.00 1,687.00 95,538.00 394.00 1993 20-24 92,565.00 2,812.00 95,144.00 465.00 1993 25-29 89,753.00 2,708.00 94,679.00 518.00 1993 30-34 87,045.00 2,439.00 94,161.00 613.00 1993 35-39 84,606.00 2,500.00 93,548.00 817.00 1993 40-44 82,106.00 2,407.00 92,731.00 1,111.00 1993 45-49 79,698.00 2,530.00 91,620.00 1,634.00 1993 50-54 77,168.00 3,334.00 89,986.00 2,521.00 1993 55-59 73,834.00 4,824.00 87,465.00 3,960.00 1993 60-64 69,010.00 6,323.00 83,505.00 5,618.00 1993 65-69 62,687.00 9,123.00 77,887.00 8,411.00 1993 70-74 53,564.00 11,119.00 69,476.00 11,532.00 1993 75-79 42,445.00 12,862.00 57,944.00 14,682.00 1993 80+ 29,583.00 23,583.00 43,262.00 43,262.00 Cuadro: Datos de expuestos al riesgo y muertes referentes al a˜no 1993 para ambos generos (Ex,t y dx,t ) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 28 / 62
  • 29. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (I.a) Las librer´ıas Demography e ilc ajustan a valores muy similares, en estricto sentido solo se observa alguna diferencia relevante para los datos pertenecientes a las edades mayores La librer´ıa gnm tiende a desviarse hacia una menor fuerza de mortalidad media ln (αx ) en las edades entre 0 − 40 y a tener una mayor magnitud en las edades de 40 − 80 a˜nos, lo que en primera instancia nos indica que la librer´ıa gnm logra representar una mayor variabilidad en estos rangos extremos de edades Para el caso de βx , observamos una diferencia significativa entre los ajustes presentados por las dos primeras librer´ıas en el sentido que para la edad x = 80 la librer´ıa Demography continua una tendencia decreciente, sin embargo la librer´ıa ilc cambia de tendencia presentando un incremento en la sensibilidad En el caso de la librer´ıa gnm se nota un cambio menor para βx en los a˜nos menores de 20 y una din´amica diferente a las dem´as librer´ıas para los mayores de 55 a˜nos Es importante anotar que las tres librer´ıas coinciden en poca variabilidad de este par´ametro entre las edades de 20 a 60 a˜nos, los que sugiere que el valor de la tasa de mortalidad para estas edades es invariante ante cambios en el tiempo medidos a trav´es de κt (recordemos la ecuaci´on LC, mx,t = eαx +βx κt + x,t ) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 29 / 62
  • 30. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (I.b) q q q q q q q q q q q q q q q q q q 0 20 40 60 80 −2−10123 edad ln(a_x)−mean(ln(a_x)) q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q Demography ilc gnm I q q q q q q q q q q q q q q q q q q 0 20 40 60 80 −0.050.000.050.100.150.20 edad ln(b_x)−mean(ln(b_x)) q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q Demography ilc gnm II Figura: Comparaci´on entre par´ametros αx y βx para los modelos Demography, ilc y gnm para hombres. Para los par´ametros αx y βx se presenta normalizado restando su respectiva media en aras de poder hacer comparaciones ya que los valores generados con la librer´ıa gnm presentan diferencias debido a su algoritmo de estimaci´on Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 30 / 62
  • 31. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (II.a) κt presenta una pendiente mayor para la librer´ıa gnm, n´otese el cambio de pendiente entre los a˜nos 1993 y 1999, a diferencia de las librer´ıas Demography e ilc las cuales se muestran con una pendiente constante Dado que los par´ametros estimados no son observables, no hay forma de comparar con la realidad, sin embargo, realizando una revisi´on bibliogr´afica, podemos corroborar que los par´ametros estimados a trav´es de gnm son los que m´as se asimilan en tendencia a los datos presentados por el DANE 15 15G´omez, C. L. M. (1998). Colombia. tablas abreviadas de mortalidad por sexo para fechas censales y estimaciones quinquenales 1995 - 2025. Estudios Censales. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 31 / 62
  • 32. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (II.b) q q q q q q 1950 1960 1970 1980 1990 2000 −505 ln(k_t)−mean(ln(k_t)) q q q q q q q q q q q q Demography ilc gnm Figura: Comparaci´on del par´ametro κt para los modelos Demography, ilc y gnm para hombres. El par´ametro se presenta normalizado restando su respectiva media en aras de poder hacer comparaciones ya que los valores generados con la librer´ıa gnm presentan diferencias debido a su algoritmo de estimaci´on Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 32 / 62
  • 33. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (III.a) Se observa una tendencia decreciente en la mortalidad a medida que pasa el tiempo El punto com´un entre las librer´ıas se encuentra en las edades entre 0 y 20 a˜nos, para lo cual se presenta una ca´ıda con curvatura y evoluci´on (en magnitud) similar A partir del punto de inflexi´on com´un que se presenta en los 20 a˜nos, se presentan diferencias entre las librer´ıas usadas para la estimaci´on Luego de una revisi´on num´erica, las mayores diferencias se presentan en la estimaci´on de µx,t para x ≥ 70 La librer´ıa Demography presenta una evoluci´on creciente del par´ametro para esta edad, lo cual se opone a la sugerencias observadas en la librer´ıa gnm en la que la mortalidad es decreciente a medida que el tiempo avanza. En contraste, la librer´ıa ilc no captura el cambio en la mortalidad en este punto Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 33 / 62
  • 34. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (III.b) 0 20 40 60 80 678910 edad ln(mu_x,t) 1951 1964 1973 1985 1993 1999 mu estimado, Hombres en t (Demog) Figura: µx,t estimado para hombres con librer´ıa Demography Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 34 / 62
  • 35. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (III.c) 0 20 40 60 80 678910 edad ln(mu_x,t) 1951 1964 1973 1985 1993 1999 mu estimado, Hombres en t (ilc) Figura: µx,t estimado para hombres con librer´ıa ilc Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 35 / 62
  • 36. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC ajustado a datos de hombres (III.d) 0 20 40 60 80 −6−5−4−3−2−10 edad ln(mu_x,t) 1951 1964 1973 1985 1993 1999 mu estimado, Hombres en t (gnm) Figura: µx,t estimado para hombres con librer´ıa gnm Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 36 / 62
  • 37. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC (I) Se presentan los residuales tipo Deviance y tipo Pearson de la estimaci´on de dx,t (Varianza del error residual para dx,t = Ex,t eα+βκ ) G´enero SVD GLM GNM Hombres 13,881.7 14,748.9 8,540.7 Mujeres 23,454.2 17,999.7 10,733.0 Cuadro: Residuales tipo Deviance de la estimaci´on de dx,t discriminados por g´enero G´enero SVD GLM GNM Hombres 1.218 -0.076 0.806 Mujeres 0.843 0.311 0.836 Cuadro: Residuales tipo Pearson de la estimaci´on de dx,t discriminados por g´enero Con base principalmente en los residuales tipo Deviance, en los que se observa menor variaci´on del error entre dx,t y dx,t para ambos g´eneros, se concluye que la mejor estimaci´on es la realizada por el modelo log-bilineal de Poisson a trav´es del uso de la herramienta gnm Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 37 / 62
  • 38. Estimaci´on de la mortalidad en Colombia Comparaci´on entre modelos Modelo LC (II) q q q q q 0 5 20 35 50 65 80 020040060080010001200 (I) Residuales por edad − Hombres edad residuosDeviance q q q q q 1951 1973 1993 020040060080010001200 (II) Residuales por año − Hombres residuosDeviance Figura: Residuales Deviance para el modelo gnm por edad y a˜no en hombres En la edad de 80 a˜nos, se evidencia heterocedasticidad debida a la baja calidad en los datos ya que esta edad representa el rango de edad de 80 a˜nos en adelante, la cual representa un n´umero mayor de muertes que sus intervalos previos Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 38 / 62
  • 39. Estimaci´on de la mortalidad en Colombia Estimaci´on del modelo a trav´es de gnm Modelo LC (III) ## Modelo LC LCgnm <- gnm(mDeaths ~ -1+ Age + Mult(Age, Year), offset = log(mExposure), family = poisson(link="log"), data = dane) coeff=LCgnm$coefficients ## Ajuste parametros Currie 2014 alfa=coeff[1:nx] beta=coeff[(nx+1):(2*nx)] k=coeff[(2*nx+1):(2*nx+nt)] kR = sum(k)/nt betaR = sum(beta)/nx | alfa.est = alfa +kR*beta.h | k.est = nx*betaR*(k-kR) | beta.est = beta/(nx*betaR) | | | Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 39 / 62
  • 40. Estimaci´on de la mortalidad en Colombia Estimaci´on del modelo a trav´es de gnm Modelo LC (IV) Edad αx βx Edad αx βx 0 -2.99 0.07 40 -3.93 0.05 1 -3.83 0.10 45 -3.63 0.04 5 -5.25 0.11 50 -3.24 0.03 10 -5.58 0.10 55 -2.83 0.02 15 -5.05 0.09 60 -2.42 0.02 20 -4.83 0.09 65 -1.98 0.02 25 -4.69 0.08 70 -1.57 0.02 30 -4.48 0.07 75 -1.14 0.02 35 -4.22 0.06 80+ -0.08 0.02 Cuadro: Valores de αx y βx para hombres a trav´es de la librer´ıa gnm t 1951 1964 1973 1985 1993 1999 κt 12.25 6.64 3.19 -4.06 -6.63 -11.40 Cuadro: Valores de κt para hombres a trav´es de la librer´ıa gnm Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 40 / 62
  • 41. Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad Proyecci´on de mortalidad (I) #An´alisis pron´osticos con Loess span=0.75, Hombres kt.h=ts(k.h.est,frequency=1) m.lo.gnm.h=loess(kt.h ~ t, control = loess.control(surface = "direct")) | tt = seq(1999,by=4,length.out=6) | | pr.lo.gnm.h = | predict(m.lo.gnm.h, | data.frame(t = tt)) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 41 / 62
  • 42. Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad Proyecci´on de mortalidad (II.a) Se sugiere una disminuci´on en el ´ındice de mortalidad para ambos g´eneros, siendo m´as marcada esta disminuci´on para el g´enero masculino, es decir, los hombres presentan una mortalidad menor que las mujeres para los periodos mayores al a˜no 2000 Esta evidencia sugiere un argumento que se busca evidenciar con este texto; la esperanza de vida en la poblaci´on analizada esta incrementando con el tiempo, o de otra manera, la din´amica demogr´afica de Colombia est´a cambiando hacia una mayor longevidad en ambos g´eneros Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 42 / 62
  • 43. Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad Proyecci´on de mortalidad (II.b) q q q q 1950 1960 1970 1980 1990 2000 2010 −60−50−40−30−20−10010 k_t q q q q q q q q q q q q q q q q Estimado Hombres Proyectado Hombres Estimado Mujeres Proyectado Mujeres Figura: kt estimado (1951-1999) y proyectado (2003-2011) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 43 / 62
  • 44. Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad Proyecci´on de mortalidad (III.a) Llama la atenci´on la forma marcada en la que evoluciona la mortalidad para las edades entre los 0 y 20 a˜nos, evidenciando el car´acter exponencial del modelo llevando la mortalidad a unos niveles m´ınimos alejados de lo que sucede en los periodos siguientes Lo anterior es seguido de una evoluci´on mas constante a partir de los 40 a˜nos Adem´as, el modelo logra capturar un cambio importante para una edad de aproximadamente 70 a˜nos en donde se presenta un punto de inflexi´on para la estimaci´on del 2011 Se sabe a partir del an´alisis de residuales que, los datos para las edades de 80 a˜nos y m´as presentan sobredispersi´on, la cual puede ser la causante de la mayor variaci´on en la mortalidad para este rango, como fue anotado anteriormente esto es causado por la agrupaci´on que tienen los datos para el rango de 80 a˜nos y m´as Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 44 / 62
  • 45. Estimaci´on de la mortalidad en Colombia Proyecci´on de mortalidad Proyecci´on de mortalidad (III.b) 0 20 40 60 80 −10−8−6−4−20 edad log(mu_x,t) 1951 1964 1973 1985 1993 1999 2003 2007 2011 Figura: log (µx,t ) estimado (1951-1999) y proyectado (2003-2011) - Hombres Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 45 / 62
  • 46. Estimaci´on de la poblaci´on universitaria Estimaci´on de la poblaci´on universitaria 0 5 10 15 20 25 30 35 050010001500 semestres cursados poblacion Figura: Evoluci´on de las cohortes: 1989/02 - 2006/01 Se consideraron datos de pregrado para las cohortes entre 02/1989 y 01/2006, para la Universidad Nacional de Colombia, Sede Medell´ın, proporcionados por el Sr. Fabio Rico de la Oficina de Planeaci´on Acad´emica de la Sede Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 46 / 62
  • 47. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (I.a) Se realiza la estimaci´on de los par´ametros αx , βx , κτ , y µx,τ (x = 1, 2, 3, . . . , 17 y t = 1989 − 02, 1999 − 01, 1999 − 02, . . . , 2005 − 02, 2006 − 01) La salida de alumnos se evidencia en el panel I.a con el par´ametro αx , para lo cual se observa una menor deserci´on en los semestres 6, 7 y 8 para luego tomar una inclinaci´on positiva y llegar a un equilibro luego del semestre n´umero 13, en donde se presenta la mayor relaci´on con la fuerza de mortalidad En (c) se observa la evoluci´on de κt cuya din´amica muestra una reversi´on a mediados del 2005 al nivel de inicios de la d´ecada de 1990. µx,τ , quien determina la tasa central de mortalidad es mostrada en el panel II.c para los datos correspondientes a 1989 − 02 y 2006 − 01 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 47 / 62
  • 48. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (I.b) q q q q q q q q q q q q q q q q q 5 10 15 −3.5−3.0−2.5−2.0−1.5−1.0 semestres cursados log(a_x) I q q q q q q q q q q q q q q q q q 5 10 15−0.050.000.050.100.150.20 semestres cursados log(b_x) II Figura: Modelo LC para mortalidad acad´emica, par´ametros logαx y logβx estimados Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 48 / 62
  • 49. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (I.c) q q qq q qq q q q q q q q q q q qq q q q q q q q q q q q q q q q −4−2024 cohortes log(k_t) 1989 1993 1997 2001 2005 I 5 10 150.050.100.150.200.250.300.35 semestres cursados log(mu_x,t) 2006−01 1989−02 II Figura: Modelo LC para mortalidad acad´emica, par´ametros κτ y log(µx,τ ) estimados Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 49 / 62
  • 50. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (II.a) En el semestre 1, el cual representa los estudiantes que ingresaron a la universidad y permanecieron en ella solo un semestre, evoluciona de manera creciente a trav´es de las diferentes cohortes, esto es, en una cohorte del 2004, un estudiante tiene m´as probabilidades de salir en el primer semestre que para una cohorte del 1990 Tambi´en se puede evidenciar, que los estudiantes que permanecen entre 3 y 9 semestres son los m´as constantes entre las cohortes Como punto relevante se evidencia que los alumnos que est´an 10 o mas semestres presentan un cambio notorio entre las cohortes de 1993 y 1998, con un incremento en variabilidad hasta las ´ultimas cohortes revisadas Respecto a la reforma mencionada, la cual inici´o en el semestre 2008 − 01, se considera que puede afectar a alumnos que ingresaron alrededor del a˜no 2001, quienes para el a˜no 2008 llevaban aproximadamente 14 semestres en la universidad Se evidencia a partir del a˜no 2001 una disminuci´on en variabilidad para los estudiantes que permanecen entre 8 y 16 semestres en la universidad y una tendencia de disminuci´on en el logaritmo del par´ametro µx,τ , lo cual podr´ıa se un efecto de la reforma Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 50 / 62
  • 51. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (II.b) 0.00.10.20.30.4 Semestre de ingreso (cohorte) ln(mu_x,t) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1989 1992 1995 1998 2001 2004 Figura: log(µx,t ) para los 17 semestres a trav´es de las 34 cohortes analizadas Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 51 / 62
  • 52. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (III) q q q q q q q q q q q q q q q qq q q q q q q q qqq qq q q q q q q q q q q q q q 1 3 5 7 9 12 15 0102030405060 (I) Residuales por semestre cursado semestre residuosDeviance qq q q q q q q q q q q q q q q q q q qq q q q qqq q q q q q q q q q q q q q q q qq q q q q q q 0102030405060 (II) Residuales por cohorte cohorte residuosDeviance 89 92 95 98 01 04 Figura: Residuos (deviation) del Modelo LC Se grafican diagramas box-plot para Dx,τ para cada x = 1, . . . , na, y para cada cohorte, τ = 98/01, . . . , 06/01. Inicialmente se observa que hay varianza constante a pesar de que los primeros semestres 1,2,3 presentan mayor dispersi´on. En el panel II se observa una posible heterocedasticidad, debido a que los semestres del a˜no 2000 en adelante muestran mayor dispersi´on. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 52 / 62
  • 53. Estimaci´on de la poblaci´on universitaria Estimaci´on del modelo a trav´es de gnm Estimaci´on del modelo a trav´es de gnm (IV) Se muestra la siguiente tabla en la que se comparan los residuales de la estimaci´on por descomposic´on singular vs. la estimaci´on por minimizaci´on del estad´ıstico deviance equivalente a la m´axima verosimilitud en el modelo log-bilineal de Poisson, mediante el valor del estad´ıstico chi-cuadrado Deviance y el estad´ıstico chi-cuadrado Pearson SVD Max.Ver Deviance 2090.93 1699.17 Pearson 2188.70 1645.29 Cuadro: Comparaci´on de residuales Deviance y Pearson Como se puede observar el ajuste mediante m´axima verosimilitud con el modelo log-bilineal de Poisson resulta mejor ya que la varianza del error cuadr´atico es menor bajo ambas medidas (Deviance y Pearson). Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 53 / 62
  • 54. Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad Proyecci´on de mortalidad (I.a) Se ajust´o un ARIMA(1,1,0) con par´ametro autoregresivo ϕ = −0,3419 y error est´andar 0.1666 determinado a trav´es de la funci´on auto.arima de la librer´ıa forecast 16 para R Se realiz´o una regresi´on local Loess con la funci´on loess() con un ancho de ventana spam=0.42 (no se utiliz´o el valor por defecto de 0.75). Para un pron´ostico de 10 semestres entre 2006 − 02 y 2011 − 01 la tendencia generada por el modelo ARIMA(1,1,0) es constante, a diferencia de la tendencia generada por el modelo Loess, la cual es decreciente 16Hyndman, R., Athanasopoulos, G., Razbash, S., Schmidt, D., Zhou, Z., Khan, Y., Bergmeir, C., & Wang, E. (2014). forecast: Forecasting functions for time series and linear models. R package version 5.5 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 54 / 62
  • 55. Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad Proyecci´on de mortalidad (I.b) −6−4−20246 cohorte kt 1989 1992 1995 1998 2001 2004 2007 2010 lc.poisson loess−poisson arima(1,1,0) con tendencia Figura: Ajuste de κt con ARIMA y Loess, y pron´ostico a 10 semestres Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 55 / 62
  • 56. Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad Proyecci´on de mortalidad (II.a) Dado que al momento del estudio se cuenta con la informaci´on hasta el octavo semestre de la cohorte del 2011-01 (κ34+10) se puede establecer cual genera un mejor pron´ostico de la mortalidad acad´emica. A partir de esta informaci´on se reconstruye la tasa central de mortalidad mx,2011−01 y los valores lx+1 = lx e−µx,2011−01 , para los semestres x = 1, . . . , 17 Para 2014-02 se conoc´ıan los valores de 8 de estos 17 semestres; son: 1465,1124,1107,1007,961, 908, 878 y 851. Utilizando l1 = 1465 los valores obtenidos a partir de la estimaci´on de µx,2011−01 por Loess y ARIMA(1,1,0) est´an en (II.b) y en (III). En ambas se observa que, excepto los 4 primeros semestres, los pron´osticos con Loess sobre-estiman mientras que con ARIMA(1,1,0) se sub-estiman los valores observados en 2014 para los primeros 8 periodos del semestre 2011-01. Mediante una revisi´on del error cuadr´atico de la estimaci´on se concluye que el mejor ajuste, y por ende la mejor proyecci´on, es la presentada por el modelo ARIMA(1,1,0) Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 56 / 62
  • 57. Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad Proyecci´on de mortalidad (II.b) observada pron.Loess pron.Arima 1 1465 1465 1465 2 1124 1291 1269 3 1107 1151 1115 4 1007 1043 1004 5 961 972 942 6 908 924 896 7 878 894 864 8 851 869 836 9 849 807 10 823 758 11 774 663 12 690 530 13 570 388 14 437 276 15 320 198 16 231 144 17 161 104 Cuadro: Semestre 2011-01, pronosticada con Loess y Arima; Fuente de datos observados: Oficina de planeaci´on acad´emica, Universidad Nacional Sede Medell´ın Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 57 / 62
  • 58. Estimaci´on de la poblaci´on universitaria Proyecci´on de mortalidad Proyecci´on de mortalidad (III) 200400600800100012001400 cohorte kt 2011 2012 2013 2014 2015 2016 2017 2018 2019 Loess ARIMA(1,1,0) Observado cohorte 2011−01 Figura: Pron´osticos de 17 semestres a partir del 2011-01 con modelo LC usando Loess y ARIMA, datos observados para 8 semestres (Fuente: Oficina de Planeaci´on, Universidad Nacional de Colombia Sede Medell´ın Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 58 / 62
  • 59. Conclusiones y recomendaciones Conclusiones Conclusiones El modelo LC sugiere que la mortalidad en Colombia ha venido decreciendo en las ´ultimas 5 d´ecadas y, a trav´es de los resultados de pron´osticos Loess, se puede afirmar que este factor poblacional seguir´a disminuyendo a trav´es del tiempo. A partir de la informaci´on analizada se puede sugerir que la mortalidad masculina es menos cambiante que la mortalidad femenina, especialmente para edades entre los 20 y los 60 a˜nos, lo que por ende permite concluir que en el futuro la esperanza de vida para las mujeres ser´a mejor que la de las hombres. Es valido afirmar que la implementaci´on de un modelo como el LC para la informaci´on demogr´afica de un pa´ıs puede sugerir din´amicas poblacionales que permitan revisar las formulaciones que basan los modelos previsionales de fondos de pensiones y seguros. Es evidente que la disminuci´on en la tasa de la mortalidad llevar´a a un costo m´as alto de rentas vitalicias, lo que pone en riesgo el modelo previsional dado las cifras en las que est´a basado por ley. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 59 / 62
  • 60. Conclusiones y recomendaciones Conclusiones Conclusiones Con base en los resultados obtenidos se puede conclu´ır que la evoluci´on de la poblaci´on universitaria muestra un incremento en la deserci´on en los primeros semestres, 1 a 4, a partir de 2001, y al mismo tiempo, una disminuci´on del tiempo requerido para graduarse en 10 semestres. La utilidad de esta metodolog´ıa puede verse desde la planeaci´on acad´emica ya que ser´ıa posible analizar indicadores tales como n´umero de estudiantes por docente, deserci´on estudiantil, permanencia promedio en la universidad, entre otros. La metodolog´ıa original de LC con base en la descomposici´on en valores singulares no parece f´acil de implementar en modelos alternos de LC como los propuestos en Cairns et al., 2009 17 , por lo que la implementaci´on en R de la estimaci´on con base en modelos no lineales generalizados resulta de suma utilidad y permite la extensi´on de otros modelos, por ejemplo, incorporando decrementos m´ultiples (riesgos competitivos) 17Cairns, A. J. G., Blake, D., Dowd, K., Coughlan, G. D., Epstein, D., Ong, A., & Balevich, I. (2009). A Quantitative Comparison of Stochastic Mortality Models Using Data from England and Wales and the United States. North American Actuarial Journal, 13(1), 1−35 Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 60 / 62
  • 61. Conclusiones y recomendaciones Recomendaciones Recomendaciones Bajo el supuesto de que las empresas de seguros y pensiones est´an concentradas regionalmente, se sugiere realizar un estudio de la din´amica poblacional que diferencie la tasa de mortalidad por regiones. Lo anterior podr´a sugerir un riesgo diferencial por region y por ende a costos previsionales m´as altos o m´as bajos para diferentes participantes en sector. De manera similar, un estudio de mortalidad acad´emica por sede podr´a sugerir en qu´e lugares se est´an evidenciando con mayor fuerza las pol´ıticas implementadas en t´erminos acad´emicos y de regulaci´on para determinar qu´e condiciones particulares afectan a las diferentes poblaciones. As´ı mismo se pueden generar estudios adicionales que incorporen variables como estado civil, ocupaci´on laboral, estrato, g´enero, etc. de forma que identifiquen factores externos que afecten la mortalidad acad´emica. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 61 / 62
  • 62. Agradecimientos Agradecimientos A la Universidad Nacional de Colombia y a la Escuela de Estad´ıstica de la Facultad de Ciencias por contribuir al fortalecimiento de mi perfil acad´emico y profesional. Especiales agradecimientos al Profesor Norman Giraldo por su apoyo y contribuci´on al presente trabajo. Adem´as, se agradece a la Oficina de Planeaci´on Acad´emica de la Universidad Nacional de Colombia, sede Medell´ın por proporcionar los datos para la estimaci´on de la poblaci´on universitaria. Carlos Andr´es Ochoa (UNAL) Maestr´ıa en Ciencias-Estad´ıstica 14 de julio de 2015 62 / 62