El documento describe los modelos de extensión multinomial para variables dependientes con más de dos categorías. Existen tres casos principales: 1) categorías no ordenadas, donde se aplica el modelo logit multinomial; 2) categorías agrupadas, donde se usa el modelo logit anidado; y 3) categorías jerárquicas, con los modelos logit y probit ordenados. Para categorías no ordenadas, el modelo estima m-1 vectores de parámetros para m categorías y calcula las probabilidades relativas de cada par de categorías en función de las características. La interpretación de los coeficient
Clase10 Endogeneidad y estimación por variables instrumentalesNerys Ramírez Mordán
Tratamiento, variables instrumentales, Validez del instrumento, Varianza del estimador VI, Mínimo cuadrado en 2 etapas
(MC2E), Prueba de endogeneidad de Hausman
Modelos de respuesta binaria. Modelo lineal de probabilidad. Modelos Logit y Probit. Formas de interpretación. Ratios de probabilidades. Efectos marginales. Bondad de ajuste
Bondad de ajuste. tabla de clasificación. Pseudo r-cuadrado. Aplicaciones. Perfiles de probabilidad.
Clase10 Endogeneidad y estimación por variables instrumentalesNerys Ramírez Mordán
Tratamiento, variables instrumentales, Validez del instrumento, Varianza del estimador VI, Mínimo cuadrado en 2 etapas
(MC2E), Prueba de endogeneidad de Hausman
Modelos de respuesta binaria. Modelo lineal de probabilidad. Modelos Logit y Probit. Formas de interpretación. Ratios de probabilidades. Efectos marginales. Bondad de ajuste
Bondad de ajuste. tabla de clasificación. Pseudo r-cuadrado. Aplicaciones. Perfiles de probabilidad.
Breve introducción al álgebra: métodos básicos de Factorización.
Documento con introducción, ejercicios y métodos comunes de factorización. Matemáticas sencillas.
Elaborado por Fernando Félix Solís Cortés
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)Álvaro Fierro
Primera parte de cómo la econometría es válida para decidir acciones de marketing online. Parte teórica introductoria a la econometría que se irá ampliando con casos reales.
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.ManfredNolte
Hoy repasaremos a uña de caballo otro reciente documento de la Comisión (SWD-2024) que lleva por título ‘Análisis de países sobre la convergencia social en línea con las características del Marco de Convergencia Social (SCF)’.
PMI sector servicios España mes de mayo 2024LuisdelBarri
Estudio PMI Sector Servicios
El Índice de Actividad Comercial del Sector Servicios subió de 56.2 registrado en abril a 56.9 en mayo, indicando el crecimiento más fuerte desde abril de 2023.
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptxmarisela352444
Proyecto de PNF Contaduria de Diseño de herramientas en excel para mejorar el control de los registros contables de todas las operaciones relacionadas con las empresas
Antes de iniciar el contenido técnico de lo acontecido en materia tributaria estos últimos días de mayo; quisiera referirme a la importancia de una expresión tan sabia aplicable a tantas situaciones de la vida, y hoy, meritoria de considerar en el prefacio del presente análisis -
"no se extraña lo que nunca se ha tenido".
Con esta frase me quiero referir a las empresas que funcionan en las zonas de Iquique y Punta Arenas, acogidas a los beneficios de las zonas francas, y que, por ende, no pagan impuesto de primera categoría. En palabras técnicas estas empresas no mantienen saldos en sus registros SAC, y por ello, este nuevo Impuesto Sustitutivo, sin duda, es una tremenda y gran noticia.
Lo mismo se puede extender a las empresas que por haber aplicado beneficios de reinversión sumado a las ventajas transitorias de la menor tasa de primera categoría pagada; me refiero a las pymes en su mayoría. Han acumulado un monto de créditos menor en su registro SAC.
En estos casos, no es mucho lo que se tiene que perder.
Lo interesante, es que este ISRAI nace desde un pago efectivo de recursos, lo que exigirá a las empresas evaluar muy bien desde su posición financiera actual, y la planificación de esta, en un horizonte de corto plazo, considerar las alternativas que se disponen.
El 15 de mayo de 2024, el Congreso aprobó el proyecto de ley que “crea un Fondo de Emergencia Transitorio por incendios y establece otras medidas para la reconstrucción”, el cual se encuentra en las últimas etapas previo a su publicación y posterior entrada en vigencia.
Este proyecto tiene por objetivo establecer un marco institucional para organizar los esfuerzos públicos, con miras a solventar los gastos de reconstrucción y otras medidas de recuperación que se implementarán en la Región de Valparaíso a raíz de los incendios ocurridos en febrero de 2024.
Dentro del marco de “otras medidas de reconstrucción”, el proyecto crea un régimen opcional de impuesto sustitutivo de los impuestos finales (denominado también ISRAI), con distintas modalidades para sociedades bajo el régimen general de tributación (artículo 14 A de la ley sobre Impuesto a la Renta) y bajo el Régimen Pyme (artículo 14 D N° 3 de la ley sobre Impuesto a la Renta).
Para conocer detalles revisa nuestro artículo completo aquí BBSC® Impuesto Sustitutivo 2024.
Por Claudia Valdés Muñoz cvaldes@bbsc.cl +56981393599
El crédito y los seguros como parte de la educación financieraMarcoMolina87
El crédito y los seguros, son temas importantes para desarrollar en la ciudadanía capacidades que le permita identificar su capacidad de endeudamiento, los derechos y las obligaciones que adquiere al obtener un crédito y conocer cuáles son las formas de asegurar su inversión.
“La teoría de la producción sostiene que en un proceso productivo que se caracteriza por tener factores fijos (corto plazo), al aumentar el uso del factor variable, a partir de cierta tasa de producción
2. Extensiones Multinomiales
• Una extensión natural de los modelos binarios es
considerando que la variable endógena tenga más de dos
categorías.
• Ejemplos:
2
3. Extensiones Multinomiales
• Sin orden en las categorías: En la elección del medio de
transporte:
3
Medio de transporte
Auto particular
Taxi
Bus
Bicicleta
A pie
5. Extensiones Multinomiales
• Orden jerárquico en las categorías. Ejm: Nivel educativo
alcanzado
5
Nivel Educativo
Alcanzado
Sin instrucción
Primaria
Secundaria
Superior
6. Panorama general
• Caso I: Categorías no ordenadas
– Modelo Logit Multinomial
– Modelo Logit Condicional (Random Utility Model)
– Modelo Probit Multinomial
• Caso III: Categorías agrupadas
– Modelo Logit Anidado (Random Utility Model)
• Caso II: Categorías jerárquicas
– Modelo Logit Ordenado
– Modelo Probit Ordenado
6
8. Caso I: No ordenado Logit Multinomial
• Logit Multinomial
• Supongamos que la variable endógena tiene m
categorías.
• Sean 𝑃1, 𝑃2, … , 𝑃𝑚 las probabilidades de escoger o caer
en alguna de estas categorías.
• Generalizando el caso logit, la probabilidad de que el
individuo i elija la alternativa j es:
8
9. Caso I: No ordenado Logit Multinomial
𝑃𝑗𝑖 =
exp( 𝒙 𝑖 𝜷 𝑗)
1+ exp( 𝒙 𝑖 𝜷 𝑘)𝑚−1
𝑘=1
𝑗 = 1, … , 𝑚 − 1
𝑃 𝑚𝑖 =
1
1+ exp( 𝒙 𝑖 𝜷 𝑘)𝑚−1
𝑘=1
• La categoría m es la “categoría base”.
• La decisión por alguna de las alternativas depende de las
características 𝒙𝑖.
• Esto es una generalización del logit binomial. Por
ejemplo, en el caso m=2,
9
11. Caso I: No ordenado Logit Multinomial
• Nótese que en el caso m = 2, solo se estima un vector de
parámetros 𝜷 𝟏.
• Si m=3, se estiman 2 vectores de parámetros 𝜷 𝟏 y 𝜷 𝟐. En
general se estimarán 𝑚 − 1 vectores de parámetros.
• Para estimar estos parámetros, se define la función de
verosimilitud apropiada.
11
12. Caso I: No ordenado Logit Multinomial
• Definamos las dummies 𝑌𝑖𝑗 = 1 si individuo i escoge o
cae en la categoría j, y 𝑌𝑖𝑗 = 0 de otro modo.
• Luego, se estiman los 𝑚 − 1 vectores de parámetros,
𝜷 𝟏, 𝜷 𝟐, … , 𝜷 𝒎−𝟏, maximizando la verosimilitud
𝐿 = 𝑃𝑖1
𝑌 𝑖1
𝑃𝑖2
𝑌 𝑖2
… 𝑃𝑖𝑚
𝑌 𝑖𝑚
𝑛
𝑖=1
12
13. Caso I: No ordenado Logit Multinomial
• Tomando logaritmos:
𝑙𝑛𝐿 = 𝑌𝑖𝑗 𝑙𝑛𝑃𝑖𝑗
𝑚
𝑗=1
𝑛
𝑖=1
• Maximizando esta función se obtienen los estimadores
𝜷 𝟏, 𝜷 𝟐, … , 𝜷 𝒎−𝟏
13
14. Caso I: No ordenado Logit Multinomial
• Interpretación de los 𝜷 en logit multinomial:
• A diferencia del logit simple con m = 2, a partir de m=3
en adelante los coeficientes y signos de los 𝛽 tienen una
interpretación más compleja.
• Recordemos que en el caso logit binomial (m=2), se
cumple que
𝑝𝑖 =
exp( 𝒙 𝑖 𝜷)
1+exp( 𝒙 𝑖 𝜷)
y 1 − 𝑝𝑖 =
1
1+exp( 𝒙 𝑖 𝜷)
14
15. Caso I: No ordenado Logit Multinomial
• Dividiendo tenemos
𝑝 𝑖
1−𝑝 𝑖
= exp( 𝒙𝑖 𝜷)
• Tomando logaritmo ln
𝑝 𝑖
1−𝑝 𝑖
= 𝒙𝑖 𝜷
• Es decir, los 𝜷 en el logit son el impacto de X sobre el
logaritmo de la razón de probabilidades (relative risk
ratio).
• Por ejemplo, si 𝑝𝑖 es la prob de tener crédito y
(1 − 𝑝𝑖) la prob de no tenerlo, 𝑝𝑖 1 − 𝑝𝑖 = 4
indica que es 4 veces más probable tener crédito a
no tenerlo.
15
16. Caso I: No ordenado Logit Multinomial
• Intentaremos dar una interpretación similar para m>2.
• Ejemplo: m = 3
• Medio de Transporte
• Categoría base: Bus.
1. Auto
Particular
2. Taxi
3. Bus
16
20. Caso I: No ordenado Logit Multinomial
• En la ecuación (4), los betas mide el efecto de cambios en
𝒙𝑖 sobre el ln de la razón de probabilidades (Relative
Risk Ratio – RRR) de elegir un auto propio respecto a
viajar en bus.
• En la (5) es lo mismo solo que entre taxi y bus.
• El signo esperado de 𝛽2
1
es positivo, pues si aumentan los
ingresos, es más probable que una persona viaje en auto
particular en lugar de bus.
20
21. Caso I: No ordenado Logit Multinomial
• Similarmente, en (5), 𝛽2
2
mide el efecto de cambios en el
ingreso sobre el ln de la razón de probabilidades de elegir
un taxi respecto a viajar en bus.
• Si, por ejemplo, 𝛽2
2
> 0, es más probable que las
personas de ingresos más altos prefieran viajar en taxi en
vez de bus.
• Observar que el análisis se limita a comparar solo pares
de alternativas, similarmente al logit simple.
21
22. Caso I: No ordenado Logit Multinomial
• Si queremos ver el efecto de un cambio en el ingreso
sobre la propensión a usar auto en vez de taxi, el efecto
es 𝛽2
1
− 𝛽2
2
. Si es positivo, entonces 𝛽2
1
> 𝛽2
2
.
• ¿Cómo cambia el análisis si cambiamos la base?
• Ahora la base es: taxi.
22
23. Caso I: No ordenado Logit Multinomial
𝑃1𝑖 =
exp( 𝒙 𝑖 𝜶 𝟏)
1+exp 𝒙 𝑖 𝜶 𝟏 +exp( 𝒙 𝑖 𝜶3)
(7)
𝑃2𝑖 =
1
1+exp 𝒙 𝑖 𝜶 𝟏 +exp( 𝒙 𝑖 𝜶3)
(8)
𝑃3𝑖 =
exp( 𝒙 𝑖 𝜶 𝟑)
1+exp 𝒙 𝑖 𝜶 𝟏 +exp( 𝒙 𝑖 𝜶 𝟑)
(9)
• Notar que solo hay los vectores 𝜶 𝟏 y 𝜶 𝟑.
23
26. Caso I: No ordenado Logit Multinomial
• El cambio de base no debería alterar las conclusiones del
modelo. Solo hay que tener cuidado con la interpretación
de los coeficientes nuevos.
• De hecho se cumplirá que:
𝛼2
1
= 𝛽2
1
− 𝛽2
2
𝛼2
1
− 𝛼2
3
= 𝛽2
1
−𝛼2
3
= 𝛽2
2
26
27. Caso I: No ordenado Logit Multinomial
• Efectos Marginales en logit multinomial
• Entrega el efecto de un cambio en la variable sobre la
probabilidad absoluta de caer en una de las alternativas.
• A diferencia de los betas, su interpretación no es relativa
(en comparación con una alternativa base) sino absoluta:
el impacto sobre la probabilidad de estar en una
categoría.
• Por ello, los efectos marginales no se alteran si se cambia
de base.
27
28. Caso I: No ordenado Logit Multinomial
• Siguiendo con el ejemplo en el caso m = 3, deseamos
calcular el efecto marginal de un cambio en el ingreso
sobre las probabilidades de que el individuo i caiga en las
opciones 1 (auto) o 2 (taxi), 𝑃2𝑖.
• Luego de cálculos algebraicos se llega a
28
29. Caso I: No ordenado Logit Multinomial
•
𝜕𝑃 𝑖1
𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑖
= 𝑃𝑖1 ∙ (𝛽2
1
− 𝑃𝑖2 𝛽2
2
− 𝑃𝑖1 𝛽2
1
)
•
𝜕𝑃 𝑖2
𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑖
= 𝑃𝑖2 ∙ (𝛽2
2
− 𝑃𝑖1 𝛽2
1
− 𝑃𝑖2 𝛽2
2
)
• Notar que el superíndice de los betas indica el vector.
29
30. Caso I: No ordenado Logit Multinomial
• El efecto marginal de la opción 1 no solo depende de los
betas de vector 𝜷 𝟏 sino también de 𝜷 𝟐. El efecto sobre
𝑃𝑖2 también depende de ambos vectores.
• Es evidente que la interpretación del efecto marginal no
es comparable con aquella sobre los betas. Miden cosas
distintas.
30
31. Caso I: No ordenado Logit Multinomial
• Adicionalmente, el signo del efecto marginal puede ser
distinto al del parámetro. Es decir podría ocurrir que
𝑠𝑖𝑔𝑛𝑜(𝛽2
1
) ≠ 𝑠𝑖𝑔𝑛𝑜(𝑃𝑖1 ∙ 𝛽2
1
− 𝑃𝑖2 𝛽2
2
− 𝑃𝑖1 𝛽2
1
)
• Esto no ocurría en el logit binomial en donde los dos
signos siempre coinciden.
31
32. Caso I: No ordenado Logit Multinomial
• Esto no debería ser sorprendente. Por ejemplo, si al
aumentar el ingreso resulta que Pr(auto) sube, y Pr(taxi)
cae y Pr(bus) cae. Si Pr(taxi) cae menos que la Pr(bus),
entonces el parámetro 𝛽2
2
> 0, pero
𝜕 Pr(𝑡𝑎𝑥𝑖)
𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜
< 0.
32
33. Caso I: No ordenado Logit Multinomial
• Independencia de Alternativas Irrelevantes (IIA)
• Nótese que, dado un par de alternativas, digamos la 1
(auto) y la 3 (bus), el análisis no involucra a la restante
opción (taxi).
• Si por ejemplo elimináramos la posibilidad de transporte
en taxi (opción 2), redefinimos las probabilidades
restantes como 𝑃𝑖1
∗
=
𝑃 𝑖1
𝑃 𝑖1+𝑃 𝑖3
y 𝑃𝑖3
∗
=
𝑃 𝑖3
𝑃 𝑖1+𝑃 𝑖3
33
34. Caso I: No ordenado Logit Multinomial
• Luego, 𝑙𝑛
𝑃𝑖1
∗
𝑃𝑖3
∗ = 𝒙𝑖 𝜷1
• Que es lo mismo que la ecuación (4) pues
𝑃𝑖1
∗
𝑃𝑖3
∗ =
𝑃𝑖1
𝑃𝑖3
• Esta propiedad se llama “independencia de alternativas
irrelevantes”, e indica que si agregamos o quitamos
alternativas, las razones de probabilidad entre
alternativas 𝑃𝑗/𝑃ℎ no se alteran.
• Esta propiedad no es muy realista.
34
35. Caso I: No ordenado Logit Multinomial
• Si tuviéramos solamente {auto, bus}, supongamos que las
probabilidades son 𝑃𝑎𝑢𝑡𝑜 = 0.3 y 𝑃𝑏𝑢𝑠 = 0.7. La razón de
probabilidades es 0.3 0.7 = 0.4285.
• Supongamos que agregamos la alternativa {taxi}, que es
un sustituto cercano del auto particular.
• Imaginemos que las nuevas probabilidades son:
𝑃𝑎𝑢𝑡𝑜 = 0.10, 𝑃𝑡𝑎𝑥𝑖 = 0.20 y 𝑃𝑏𝑢𝑠 = 0.7
• Luego, la razón de probabilidades de auto con bus
cambia a 0.10 0.7 = 0.1428.
• Con el logit multinomial, tal razón de probabilidades no
cambia.
35
36. Caso I: No ordenado Logit Multinomial
• Deficiencias del Logit Multinomial:
– Independencia de alternativas irrelevantes
– Solo incluye como regresores a las características de los
individuos 𝒙𝑖.
36
37. Caso I: No ordenado Logit Condicional
• Generalización: Modelo Logit Condicional
• Este modelos permite introducir regresores que reflejen
los atributos o características de las categorías, tal como
las percibe el individuo i.
• En el ejemplo del transporte, algunas de estas variables
son: calidad del servicio, precios, distancia, etc.
• Se utiliza el modelo de variables latentes llamado
“Random Utility Model”.
37
38. Caso I: No ordenado Logit Condicional
• Por fines didácticos, empezaremos con el modelo más
simple binomial.
• Hay dos categorías o alternativas, 𝑗 = 1𝑜2.
• Sea 𝑌𝑖𝑗
∗
=Nivel de utilidad de individuo 𝑖 escogiendo la
alternativa 𝑗.
• Ocurrirá que un individuo 𝑖 elige 𝑗 si:
𝑌ij
∗
= max{ 𝑌𝑖1
∗
, 𝑌𝑖2
∗
}
con lo cual se observará 𝑌𝑖𝑗 = 1 y 𝑌𝑖𝑘 = 0 ∀𝑘 ≠ 𝑗.
38
39. Caso I: No ordenado Logit Condicional
• Modelando las utilidades en función de las características
del individuo i
𝑌𝑖1
∗
= 𝒙𝑖 𝜷 𝟏 + 𝜀𝑖1 Utilidad si elige la opción 1 (Ejem:
participa en el mercado laboral)
𝑌𝑖2
∗
= 𝒙𝑖 𝜷 𝟐 + 𝜀𝑖2 Utilidad si elige la opción 2 (Ejem: no
participa en el mercado laboral)
𝜀𝑖𝑗~𝑉𝑎𝑙𝑜𝑟𝐸𝑥𝑡𝑟𝑒𝑚𝑜, 𝐹 𝜀𝑖𝑗 = exp(−𝑒−𝜀 𝑖𝑗)
𝑓 𝜀𝑖𝑗 = exp −𝜀𝑖𝑗 − exp −𝜀𝑖𝑗
• Se observará que 𝑌𝑖1 = 1 si 𝑌𝑖1
∗
> 𝑌𝑖2
∗
.
39
40. Caso I: No ordenado Logit Condicional
• Restando:
𝑌𝑖1
∗
− 𝑌𝑖2
∗
= 𝒙𝑖 𝜷1 − 𝜷2 + (𝜀𝑖1 − 𝜀𝑖2)
𝑌𝑖
∗
= 𝒙𝑖 𝜷 + 𝑢𝑖
donde esta probado que 𝑢𝑖 = 𝜀𝑖1 − 𝜀𝑖2 se distribuye como
una logística. Luego se tiene el modelo logit.
• La alternativa 2 es la base.
• El vector 𝜷 estimado por logit es la resta de los vectores
𝜷1 y 𝜷2, por eso se interpreta la alternativa 1 en
comparación con la base (alternativa 2).
40
41. Caso I: No ordenado Logit Condicional
• Las probabilidades de las alternativas 1 y 2 según este
enfoque son:
𝑃𝑖1 =
𝑒 𝒙 𝑖 𝜷1
𝑒 𝒙 𝑖 𝜷1+𝑒 𝒙 𝑖 𝜷2
𝑃𝑖2 =
𝑒 𝒙 𝑖 𝜷 𝟐
𝑒 𝒙 𝑖 𝜷1+𝑒 𝒙 𝑖 𝜷2
Las cuales son equivalentes a las que vimos en el logit
binomial (haciendo 𝛽 = 𝛽1 − 𝛽2)
𝑃𝑖1 =
𝑒 𝒙 𝑖 𝜷
𝑒 𝒙 𝑖 𝜷+1
𝑃𝑖2 =
1
𝑒 𝒙 𝑖 𝜷+1
41
42. Caso I: No ordenado Logit Condicional
• Similarmente el modelo logit multinomial con 𝑚 categorías se
puede presentar con el modelo RUM como
𝑌𝑖𝑗
∗
= 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗
• Ocurrirá que un individuo 𝑖 elige 𝑗 si:
𝑌𝑖𝑗
∗
= max{ 𝑌𝑖1
∗
, 𝑌𝑖2
∗
, … , 𝑌𝑖𝑚
∗
}
con lo cual se observará 𝑌𝑖𝑗 = 1 y 𝑌𝑖𝑘 = 0 ∀𝑘 ≠ 𝑗. También, la
probabilidad de que 𝑖 elija 𝑗 es
𝑃𝑖𝑗 =
𝑒 𝒙 𝑖 𝜷 𝑗
𝑒 𝒙 𝑖 𝜷 𝑘𝑚
𝑘=1
42
43. Caso I: No ordenado Logit Condicional
Tomando como base a la categoría m,
𝑃𝑖𝑗 =
𝑒 𝒙 𝑖 𝜷
1+ 𝑒 𝒙 𝑖 𝜷 𝑘𝑚−1
𝑘=1
y 𝑃𝑖𝑚 =
1
1+ 𝑒 𝒙 𝑖 𝜷 𝑘𝑚−1
𝑘=1
• Ahora extendemos el modelo agregando más regresores.
• Sea:
• 𝒛𝑖𝑗 = Vector de atributos de categoría 𝑗 tal como los
percibe individuo 𝑖 (p.ej.: comodidad, distancia, precio)
43
44. Caso I: No ordenado Logit Condicional
• Luego
𝑌𝑖𝑗
∗
= 𝒛𝑖𝑗 𝜶 + 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗
donde 𝜶, 𝜷son vectores de parámetros, y
𝜀𝑖𝑗~𝑉𝑎𝑙𝑜𝑟𝐸𝑥𝑡𝑟𝑒𝑚𝑜
𝐹 𝜀𝑖𝑗 = exp(−𝑒−𝜀 𝑖𝑗)
𝑓 𝜀𝑖𝑗 = exp −𝜀𝑖𝑗 − exp −𝜀𝑖𝑗
44
45. Caso I: No ordenado Logit Condicional
• Se puede demostrar que:
𝑃𝑖𝑗 =
𝑒 𝒛𝑖𝑗 𝜶+𝒙 𝑖 𝜷 𝑗
𝑒 𝒛 𝑖𝑘 𝜶+𝒙 𝑖 𝜷 𝑘𝑚
𝑘=1
• Con estas probabilidades se puede construir la función
de verosimilitud, la cual se maximiza con respecto a
𝜶, 𝜷 𝟏, … , 𝜷 𝒎.
• Para facilitar la interpretación se puede elegir una
alternativa base, digamos la “m”. Entonces se estima el
vector 𝜶 y los 𝑚 − 1 vectores 𝜷.
45
46. Caso I: No ordenado Logit Condicional
• Ventajas del logit condicional
– Permite la inclusión de variables propias de las alternativas
o categorías.
• Desventajas del logit condicional
– Aún se cumple la Independencia de Alternativas
irrelevantes (poco realista).
– Requiere una base de datos muy especial (datos de cada
categoría para cada individuo). Por ejemplo, en la elección
del transporte, para la variable tiempo de espera se
necesita el tiempo de espera de la persona 𝑖 de cada una
de las alternativas.
46
47. Ejemplo: Logit Multinomial
• Se pretende estimar los determinantes de la decisión de
estudiar, trabajar o hacer ambas cosas.
• Se usa la base de datos de ENAHO 2012.
• Se regresionan las cuatro posibilidades (1=no hacer
nada, 2= solo estudiar, 3=solo trabajar, 4= estudiar y
trabajar), contra algunas variables como sexo, edad e
ingresos familiares.
47
52. Ejemplo: Logit Condicional
• Elección del medio de transporte:
• Se permite que haya características de los individuos y
características de las categorías (medios de transporte)
• La base de datos se ve así:
52
53. ttme = Tiempo en el terminal
(cero para carros)
hinc = ingreso del hogar
gc = costo generalizado
mode = La elección de la persona
53
54. _cons -.3249561 .5763335 -0.56 0.573 -1.454549 .8046369
hinc -.0511884 .0147352 -3.47 0.001 -.0800689 -.0223079
Train
_cons -5.874813 .8020903 -7.32 0.000 -7.446882 -4.302745
hinc .0053735 .0115294 0.47 0.641 -.0172237 .0279707
Car
_cons -1.744529 .6775004 -2.57 0.010 -3.072406 -.4166531
hinc -.0232107 .0162306 -1.43 0.153 -.055022 .0086006
Bus
Air (base alternative)
gc -.0109274 .0045878 -2.38 0.017 -.0199192 -.0019355
ttme -.0954606 .0104732 -9.11 0.000 -.1159876 -.0749335
transport
mode Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -189.52515 Prob > chi2 = 0.0000
Wald chi2(5) = 105.78
max = 4
avg = 4.0
Alternative variable: transport Alts per case: min = 4
Case variable: id Number of cases = 210
Alternative-specific conditional logit Number of obs = 840
Iteration 4: log likelihood = -189.52515
Iteration 3: log likelihood = -189.52515
Iteration 2: log likelihood = -189.52526
Iteration 1: log likelihood = -189.64056
Iteration 0: log likelihood = -195.52759
. asclogit mode ttme gc, casevars(hinc) case(id) alternatives(transport)
54
56. Caso II: Categorías Agrupadas Logit Anidado
• Consideremos un caso similar al Logit Condicional en
donde algunas de las categorías son muy “próximas” o
similares.
• Estas categorías similares pueden formar un subgrupo o
rama de categorías.
• Conviene pensar en un modelo en donde las decisiones
se hacen en forma secuencial: primero se decide sobre
las “ramas” o “grupos”, y luego por las categorías o
alternativas en ellos.
Luis García - PUCP (c) 56
57. Caso II: Categorías Agrupadas Logit Anidado
• Ejemplo: Elección del medio de transporte: {auto propio,
taxi, bus}
Bus Auto
propio
Taxi
Auto
Luis García - PUCP (c) 57
58. Caso II: Categorías Agrupadas Logit Anidado
• La decisión inicial es entre movilizarse en Bus o en un
auto. Si se elige auto hay dos opciones, taxi o auto
propio.
• En este escenario, la probabilidad de elegir un taxi
depende de que previamente se haya elegido la opción
bus.
Luis García - PUCP (c) 58
60. Caso II: Categorías Agrupadas Logit Anidado
• Logit Anidado (nested logit)
• Generalizamos para el caso de random utility model
(RUM).
• Según el modelo, la utilidad del individuo i por elegir la
alternativa j es:
𝑈𝑖𝑗
∗
= 𝒛𝑖𝑗 𝜶 + 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗
Luis García - PUCP (c) 60
61. Caso II: Categorías Agrupadas Logit Anidado
• Donde al igual que antes,
𝒛𝑖𝑗 = Vector de atributos de categoría 𝑗 tal como los
percibe individuo 𝑖 (p.ej.: comodidad, distancia, tiempo),
𝒙𝑖 = Vector de características del individuo 𝑖 (p.ej.: edad,
sexo, nivel educativo, ingresos).
Luis García - PUCP (c) 61
62. Caso II: Categorías Agrupadas Logit Anidado
• Por simplicidad en la notación omitiremos el subíndice 𝑖.
Entonces,
𝑈𝑗
∗
= 𝒛𝑗 𝜶 + 𝒙𝜷 𝑗 + 𝜀𝑗
• Llamaremos 𝑉𝑗 = 𝒛 𝑗 𝜶 + 𝒙𝜷 𝑗.
• Se asume que 𝜀𝑗 se distribuye como valor extremo.
Luis García - PUCP (c) 62
63. Caso II: Categorías Agrupadas Logit Anidado
• Asumamos que hay en total 𝐽 alternativas o categorías,
las cuales han sido agrupadas en 𝐿 ramas, 𝑙 = 1,2, … , 𝐿.
Cada rama tiene 𝐽𝑙 categorías., donde
𝐽1 + 𝐽2 + ⋯ + 𝐽𝐿 = 𝐽
• La probabilidad de caer en la categoría 𝑗 ∈ 𝑙 se
descompone en:
Pr 𝑗 = Pr( 𝑗|𝑙) ∙ Pr( 𝑙)
Luis García - PUCP (c) 63
64. Caso II: Categorías Agrupadas Logit Anidado
• Bajo los supuestos mencionados se puede comprobar
que:
Pr 𝑗 𝑙 =
exp
1
𝜏𝑙
𝑉𝑗
exp
1
𝜏𝑙
𝑉𝑘𝑘∈𝐽 𝑙
• Se define el “valor inclusivo” de la rama 𝑚 como
𝐼𝑉𝑚 = 𝑙𝑛 exp
1
𝜏 𝑚
𝑉𝑘
𝑘∈𝐽 𝑚
Luis García - PUCP (c) 64
65. Caso II: Categorías Agrupadas Logit Anidado
• El valor inclusivo 𝐼𝑉𝑚 es una suerte de utilidad de la rama
“𝑚”.
• El parámetro 𝜏𝑙 es nuevo y debe ser estimado.
• Por otra parte, la probabilidad de caer en la rama 𝑙 es:
Pr 𝑙 =
exp( 𝜏𝑙 𝐼𝑉𝑙)
exp( 𝜏 𝑚 𝐼𝑉𝑚)𝑚
Luis García - PUCP (c) 65
66. Caso II: Categorías Agrupadas Logit Anidado
• Luego, la probabilidad de caer en la alternativa 𝑗 es
Pr 𝑗 =
exp
1
𝜏𝑙
𝑉𝑗
exp
1
𝜏𝑙
𝑉𝑘𝑘∈𝐽 𝑙
∙
exp( 𝜏𝑙 𝐼𝑉𝑙)
exp( 𝜏 𝑚 𝐼𝑉𝑚)𝑚
• Si 𝜏𝑙 = 1, entonces el modelo se resume al caso de Logit
Condicional, y por lo tanto las ramas podría
desagregarse.
Luis García - PUCP (c) 66
67. Caso II: Categorías Agrupadas Logit Anidado
• Normalmente se espera que 𝜏𝑙 se encuentre en el
intervalo unitario (0, 1]
• Si 𝜏𝑙 < 0, un incremento en la utilidad de una alternativa
𝑗 de 𝑙 reduciría la probabilidad de elegir a la alternativa 𝑙.
(No tiene sentido)
• Si 𝜏𝑙 = 0, un incremento en la utilidad en una alternativa
𝑗 de 𝑙 no incrementaría la probabilidad de elegir a la
rama 𝑙 (no tiene sentido).
Luis García - PUCP (c) 67
68. Caso II: Categorías Agrupadas Logit Anidado
• Si 𝜏𝑙 > 1, tal incremento en la utilidad de 𝑗 elevaría no
solo la probabilidad de elegir 𝑗 sino también de las demás
alternativas en la rama 𝑙. (Podría generar un espiral
explosivo).
Luis García - PUCP (c) 68
69. Caso II: Categorías Agrupadas Logit Anidado
• Por último, el modelo puede ser estimado por máxima
verosimilitud, en donde los parámetros 𝜷 𝑗 se estiman
para cada alternativa menos una (la base, similar al logit
multinomial), y los parámetros 𝜶 son generales para
todas las ramas.
• La función de verosimilitud que se maximiza es:
𝑙𝑛𝐿 = 𝑌𝑖𝑗𝑙ln[Pr 𝑗 𝑙 𝑃𝑟 𝑙 ]
𝑗∈𝐽 𝑙
𝐿
𝑙=1
𝑛
𝑖=1
Luis García - PUCP (c) 69
70. Ejemplo: Logit anidado
• Usando los mismos datos de elección del medio de
transporte, vamos a definir las siguientes ramas:
Luis García - PUCP (c) 70
Aéreo Carro Bus Tren
Transporte
Público
Otro
71. Ejemplo: Logit anidado
• Se utilizarán las mismas variables del ejemplo de Logit
Condicional.
– gc = costo generalizado del transporte
– gtme = tiempo en el terminal
– hinc = Ingreso del hogar.
• En términos de los vectores, será:
𝑧𝑖𝑗 = [𝑡𝑡𝑚𝑒𝑔𝑐] 𝑥𝑖 = [ℎ𝑖𝑛𝑐]
Luis García - PUCP (c) 71
72. Ejemplo: Logit anidado
• Usaremos el comando nlogitrum, que es consistente
con el modelo RUM que estamos desarrollando.
(buscarlo con findit nlogitrum).
Luis García - PUCP (c) 72
73. Ejemplo: Logit anidado
Luis García - PUCP (c) 73
N = number of observations at each level
k = number of times alternative is chosen
total 840 210
Train 210 63
Public 420 Bus 210 30
Car 210 59
Other 420 Air 210 58
type N transport N k
tree structure specified for the nested logit model
. nlogittree transport type, choice(mode)
. nlogitgen type = transport(Other: Air | Car, Public: Train | Bus)
74. Luis García - PUCP (c) 74
gen travel = 1 if transport=="Air"
replace travel = 2 if transport=="Train"
replace travel = 3 if transport=="Bus"
replace travel = 4 if transport=="Car"
label define travel 1 "air" 2 "train" 3 "bus" 4 "car", replace
tab transport, gen(c_) /*en nlogitrum hay que introducir las ctes para
cada categoría manualmente como dummies*/
rename c_1 c_air
rename c_2 c_bus
rename c_3 c_car
rename c_4 c_train
gen hinc_air=hinc*c_air /*para el ingreso es igual, sino entiende que es
constante para cada categoría*/
gen hinc_bus=hinc*c_bus
gen hinc_car=hinc*c_car
gen hinc_train=hinc*c_train