SlideShare una empresa de Scribd logo
Extensiones Multinomiales
Prof. Luis García Núñez
PUCP
Extensiones Multinomiales
• Una extensión natural de los modelos binarios es
considerando que la variable endógena tenga más de dos
categorías.
• Ejemplos:
2
Extensiones Multinomiales
• Sin orden en las categorías: En la elección del medio de
transporte:
3
Medio de transporte
Auto particular
Taxi
Bus
Bicicleta
A pie
Extensiones Multinomiales
• Agrupamiento en categorías:
4
Medio de transporte
Interestatal o
internacional
Auto particular
Tren
Bus
Terrestre
Avión
Aéreo
Extensiones Multinomiales
• Orden jerárquico en las categorías. Ejm: Nivel educativo
alcanzado
5
Nivel Educativo
Alcanzado
Sin instrucción
Primaria
Secundaria
Superior
Panorama general
• Caso I: Categorías no ordenadas
– Modelo Logit Multinomial
– Modelo Logit Condicional (Random Utility Model)
– Modelo Probit Multinomial
• Caso III: Categorías agrupadas
– Modelo Logit Anidado (Random Utility Model)
• Caso II: Categorías jerárquicas
– Modelo Logit Ordenado
– Modelo Probit Ordenado
6
CASO I: NO ORDENADO
7
Caso I: No ordenado Logit Multinomial
• Logit Multinomial
• Supongamos que la variable endógena tiene m
categorías.
• Sean 𝑃1, 𝑃2, … , 𝑃𝑚 las probabilidades de escoger o caer
en alguna de estas categorías.
• Generalizando el caso logit, la probabilidad de que el
individuo i elija la alternativa j es:
8
Caso I: No ordenado Logit Multinomial
𝑃𝑗𝑖 =
exp⁡( 𝒙 𝑖 𝜷 𝑗)
1+ exp⁡( 𝒙 𝑖 𝜷 𝑘)𝑚−1
𝑘=1
𝑗 = 1, … , 𝑚 − 1
𝑃 𝑚𝑖 =
1
1+ exp⁡( 𝒙 𝑖 𝜷 𝑘)𝑚−1
𝑘=1
• La categoría m es la “categoría base”.
• La decisión por alguna de las alternativas depende de las
características 𝒙𝑖.
• Esto es una generalización del logit binomial. Por
ejemplo, en el caso m=2,
9
Caso I: No ordenado Logit Multinomial
𝑃1𝑖 =⁡
exp⁡( 𝒙 𝑖 𝜷 𝟏)
1+exp⁡( 𝒙 𝑖 𝜷 𝟏)
y 𝑃2𝑖 =⁡
1
1+exp⁡( 𝒙 𝑖 𝜷 𝟏)
• En el caso m = 3,
𝑃1𝑖 =
exp⁡( 𝒙 𝑖 𝜷 𝟏)
1+exp 𝒙 𝑖 𝜷 𝟏 +exp⁡( 𝒙 𝑖 𝜷 𝟐)
(1)
𝑃2𝑖 =
exp⁡( 𝒙 𝑖 𝜷 𝟐)
1+exp 𝒙 𝑖 𝜷 𝟏 +exp⁡( 𝒙 𝑖 𝜷 𝟐)
(2)
𝑃3𝑖 =
1
1+exp 𝒙 𝑖 𝜷 𝟏 +exp⁡( 𝒙 𝑖 𝜷 𝟐)
(3)
10
Caso I: No ordenado Logit Multinomial
• Nótese que en el caso m = 2, solo se estima un vector de
parámetros 𝜷 𝟏.
• Si m=3, se estiman 2 vectores de parámetros 𝜷 𝟏 y 𝜷 𝟐. En
general se estimarán 𝑚 − 1 vectores de parámetros.
• Para estimar estos parámetros, se define la función de
verosimilitud apropiada.
11
Caso I: No ordenado Logit Multinomial
• Definamos las dummies 𝑌𝑖𝑗 = 1 si individuo i escoge o
cae en la categoría j, y 𝑌𝑖𝑗 = 0 de otro modo.
• Luego, se estiman los 𝑚 − 1 vectores de parámetros,
𝜷 𝟏, 𝜷 𝟐, … , 𝜷 𝒎−𝟏, maximizando la verosimilitud
𝐿 = 𝑃𝑖1
𝑌 𝑖1
𝑃𝑖2
𝑌 𝑖2
… 𝑃𝑖𝑚
𝑌 𝑖𝑚
𝑛
𝑖=1
12
Caso I: No ordenado Logit Multinomial
• Tomando logaritmos:
𝑙𝑛𝐿 = 𝑌𝑖𝑗 𝑙𝑛𝑃𝑖𝑗
𝑚
𝑗=1
𝑛
𝑖=1
• Maximizando esta función se obtienen los estimadores
𝜷 𝟏, 𝜷 𝟐, … , 𝜷 𝒎−𝟏
13
Caso I: No ordenado Logit Multinomial
• Interpretación de los 𝜷 en logit multinomial:
• A diferencia del logit simple con m = 2, a partir de m=3
en adelante los coeficientes y signos de los 𝛽 tienen una
interpretación más compleja.
• Recordemos que en el caso logit binomial (m=2), se
cumple que
𝑝𝑖 =
exp⁡( 𝒙 𝑖 𝜷)
1+exp⁡( 𝒙 𝑖 𝜷)
y 1 − 𝑝𝑖 =
1
1+exp⁡( 𝒙 𝑖 𝜷)
14
Caso I: No ordenado Logit Multinomial
• Dividiendo tenemos
𝑝 𝑖
1−𝑝 𝑖
= exp⁡( 𝒙𝑖 𝜷)
• Tomando logaritmo ⁡ln
𝑝 𝑖
1−𝑝 𝑖
= 𝒙𝑖 𝜷
• Es decir, los 𝜷 en el logit son el impacto de X sobre el
logaritmo de la razón de probabilidades (relative risk
ratio).
• Por ejemplo, si 𝑝𝑖 es la prob de tener crédito y
(1 − 𝑝𝑖) la prob de no tenerlo, 𝑝𝑖 1 − 𝑝𝑖 = 4
indica que es 4 veces más probable tener crédito a
no tenerlo.
15
Caso I: No ordenado Logit Multinomial
• Intentaremos dar una interpretación similar para m>2.
• Ejemplo: m = 3
• Medio de Transporte
• Categoría base: Bus.
1. Auto
Particular
2. Taxi
3. Bus
16
Caso I: No ordenado Logit Multinomial
• De las ecuaciones (1)-(3),
𝑃1𝑖
𝑃3𝑖
= exp 𝒙𝑖 𝜷1
𝑃2𝑖
𝑃3𝑖
= exp 𝒙𝑖 𝜷2
𝑃1𝑖
𝑃2𝑖
=
exp 𝒙𝒊 𝜷 𝟏
exp 𝒙𝒊 𝜷 𝟐
= exp 𝒙𝑖 𝜷1 − 𝜷 𝟐
• Tomando logaritmos,
17
Caso I: No ordenado Logit Multinomial
• Se cumple que
𝑙𝑛
𝑃𝑖1
𝑃𝑖3
= 𝒙𝑖 𝜷 𝟏 ⁡⁡⁡⁡⁡⁡…⁡⁡(4)
𝑙𝑛
𝑃𝑖2
𝑃𝑖3
= 𝒙𝑖 𝜷 𝟐 ⁡⁡⁡⁡⁡⁡…⁡⁡⁡(5)
𝑙𝑛
𝑃𝑖1
𝑃𝑖2
= 𝒙𝑖 𝜷1 − 𝜷2 ⁡… (6)
18
Caso I: No ordenado Logit Multinomial
• Supongamos que 𝑥𝑖 = [1⁡𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖⁡𝐸𝑑𝑎𝑑𝑖]
• Podemos escribir a (4), (5) y (6) como:
(4) 𝑙𝑛
𝑃 𝑖1
𝑃 𝑖3
= 𝛽1
1
+ 𝛽2
1
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛽3
1
𝐸𝑑𝑎𝑑𝑖
(5) 𝑙𝑛
𝑃 𝑖2
𝑃 𝑖3
= 𝛽1
2
+ 𝛽2
2
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛽3
2
𝐸𝑑𝑎𝑑𝑖
(6) 𝑙𝑛
𝑃 𝑖1
𝑃 𝑖2
= 𝛽1
1
− 𝛽1
2
+ 𝛽2
1
− 𝛽2
2
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 +
(𝛽3
1
− 𝛽3
2
)𝐸𝑑𝑎𝑑𝑖
19
Caso I: No ordenado Logit Multinomial
• En la ecuación (4), los betas mide el efecto de cambios en
𝒙𝑖 sobre el ln de la razón de probabilidades (Relative
Risk Ratio – RRR) de elegir un auto propio respecto a
viajar en bus.
• En la (5) es lo mismo solo que entre taxi y bus.
• El signo esperado de 𝛽2
1
es positivo, pues si aumentan los
ingresos, es más probable que una persona viaje en auto
particular en lugar de bus.
20
Caso I: No ordenado Logit Multinomial
• Similarmente, en (5), 𝛽2
2
mide el efecto de cambios en el
ingreso sobre el ln de la razón de probabilidades de elegir
un taxi respecto a viajar en bus.
• Si, por ejemplo, 𝛽2
2
> 0, es más probable que las
personas de ingresos más altos prefieran viajar en taxi en
vez de bus.
• Observar que el análisis se limita a comparar solo pares
de alternativas, similarmente al logit simple.
21
Caso I: No ordenado Logit Multinomial
• Si queremos ver el efecto de un cambio en el ingreso
sobre la propensión a usar auto en vez de taxi, el efecto
es 𝛽2
1
− 𝛽2
2
. Si es positivo, entonces 𝛽2
1
> 𝛽2
2
.
• ¿Cómo cambia el análisis si cambiamos la base?
• Ahora la base es: taxi.
22
Caso I: No ordenado Logit Multinomial
𝑃1𝑖 =
exp⁡( 𝒙 𝑖 𝜶 𝟏)
1+exp 𝒙 𝑖 𝜶 𝟏 +exp⁡( 𝒙 𝑖 𝜶3)
(7)
𝑃2𝑖 =
1
1+exp 𝒙 𝑖 𝜶 𝟏 +exp⁡( 𝒙 𝑖 𝜶3)
(8)
𝑃3𝑖 =
exp⁡( 𝒙 𝑖 𝜶 𝟑)
1+exp 𝒙 𝑖 𝜶 𝟏 +exp⁡( 𝒙 𝑖 𝜶 𝟑)
(9)
• Notar que solo hay los vectores 𝜶 𝟏 y 𝜶 𝟑.
23
Caso I: No ordenado Logit Multinomial
• Calculando los ratios y tomando log
𝑙𝑛
𝑃1𝑖
𝑃2𝑖
= 𝒙𝑖 𝜶 𝟏 ⁡⁡⁡⁡⁡⁡…⁡⁡(10)
𝑙𝑛
𝑃3𝑖
𝑃2𝑖
= 𝒙𝑖 𝜶 𝟑 ⁡⁡⁡⁡⁡⁡…⁡⁡⁡(11)
𝑙𝑛
𝑃𝑖1
𝑃𝑖3
= 𝒙𝑖 𝜶1 − 𝜶3 ⁡… (12)
24
Caso I: No ordenado Logit Multinomial
• Siguiendo con el ejemplo, las ecuaciones (10) -(12) se
pueden escribir como:
𝑙𝑛
𝑃𝑖1
𝑃𝑖2
= 𝛼1
1
+ 𝛼2
1
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛼3
1
𝐸𝑑𝑎𝑑𝑖
𝑙𝑛
𝑃𝑖3
𝑃𝑖2
= 𝛼1
3
+ 𝛼2
3
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛼3
3
𝐸𝑑𝑎𝑑𝑖
𝑙𝑛
𝑃𝑖1
𝑃𝑖3
= 𝛼1
1
− 𝛼1
3
+ (𝛼2
1
− 𝛼2
3
)𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖
+(𝛼3
1
− 𝛼3
3
)𝐸𝑑𝑎𝑑𝑖
25
Caso I: No ordenado Logit Multinomial
• El cambio de base no debería alterar las conclusiones del
modelo. Solo hay que tener cuidado con la interpretación
de los coeficientes nuevos.
• De hecho se cumplirá que:
𝛼2
1
= 𝛽2
1
− 𝛽2
2
𝛼2
1
− 𝛼2
3
= 𝛽2
1
−𝛼2
3
= 𝛽2
2
26
Caso I: No ordenado Logit Multinomial
• Efectos Marginales en logit multinomial
• Entrega el efecto de un cambio en la variable sobre la
probabilidad absoluta de caer en una de las alternativas.
• A diferencia de los betas, su interpretación no es relativa
(en comparación con una alternativa base) sino absoluta:
el impacto sobre la probabilidad de estar en una
categoría.
• Por ello, los efectos marginales no se alteran si se cambia
de base.
27
Caso I: No ordenado Logit Multinomial
• Siguiendo con el ejemplo en el caso m = 3, deseamos
calcular el efecto marginal de un cambio en el ingreso
sobre las probabilidades de que el individuo i caiga en las
opciones 1 (auto) o 2 (taxi), 𝑃2𝑖.
• Luego de cálculos algebraicos se llega a
28
Caso I: No ordenado Logit Multinomial
•
𝜕𝑃 𝑖1
𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑖
= 𝑃𝑖1 ∙ (𝛽2
1
− 𝑃𝑖2 𝛽2
2
− 𝑃𝑖1 𝛽2
1
)
•
𝜕𝑃 𝑖2
𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑖
= 𝑃𝑖2 ∙ (𝛽2
2
− 𝑃𝑖1 𝛽2
1
− 𝑃𝑖2 𝛽2
2
)
• Notar que el superíndice de los betas indica el vector.
29
Caso I: No ordenado Logit Multinomial
• El efecto marginal de la opción 1 no solo depende de los
betas de vector 𝜷 𝟏 sino también de 𝜷 𝟐. El efecto sobre
𝑃𝑖2 también depende de ambos vectores.
• Es evidente que la interpretación del efecto marginal no
es comparable con aquella sobre los betas. Miden cosas
distintas.
30
Caso I: No ordenado Logit Multinomial
• Adicionalmente, el signo del efecto marginal puede ser
distinto al del parámetro. Es decir podría ocurrir que
𝑠𝑖𝑔𝑛𝑜(𝛽2
1
) ≠ 𝑠𝑖𝑔𝑛𝑜(𝑃𝑖1 ∙ 𝛽2
1
− 𝑃𝑖2 𝛽2
2
− 𝑃𝑖1 𝛽2
1
)
• Esto no ocurría en el logit binomial en donde los dos
signos siempre coinciden.
31
Caso I: No ordenado Logit Multinomial
• Esto no debería ser sorprendente. Por ejemplo, si al
aumentar el ingreso resulta que Pr(auto) sube, y Pr(taxi)
cae y Pr(bus) cae. Si Pr(taxi) cae menos que la Pr(bus),
entonces el parámetro 𝛽2
2
> 0, pero
𝜕 Pr(𝑡𝑎𝑥𝑖)
𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜
< 0.
32
Caso I: No ordenado Logit Multinomial
• Independencia de Alternativas Irrelevantes (IIA)
• Nótese que, dado un par de alternativas, digamos la 1
(auto) y la 3 (bus), el análisis no involucra a la restante
opción (taxi).
• Si por ejemplo elimináramos la posibilidad de transporte
en taxi (opción 2), redefinimos las probabilidades
restantes como 𝑃𝑖1
∗
=
𝑃 𝑖1
𝑃 𝑖1+𝑃 𝑖3
y 𝑃𝑖3
∗
=
𝑃 𝑖3
𝑃 𝑖1+𝑃 𝑖3
33
Caso I: No ordenado Logit Multinomial
• Luego, 𝑙𝑛
𝑃𝑖1
∗
𝑃𝑖3
∗ = 𝒙𝑖 𝜷1
• Que es lo mismo que la ecuación (4) pues
⁡
𝑃𝑖1
∗
𝑃𝑖3
∗ =
𝑃𝑖1
𝑃𝑖3
• Esta propiedad se llama “independencia de alternativas
irrelevantes”, e indica que si agregamos o quitamos
alternativas, las razones de probabilidad entre
alternativas 𝑃𝑗/𝑃ℎ no se alteran.
• Esta propiedad no es muy realista.
34
Caso I: No ordenado Logit Multinomial
• Si tuviéramos solamente {auto, bus}, supongamos que las
probabilidades son 𝑃𝑎𝑢𝑡𝑜 = 0.3 y 𝑃𝑏𝑢𝑠 = 0.7. La razón de
probabilidades es 0.3 0.7 = 0.4285.
• Supongamos que agregamos la alternativa {taxi}, que es
un sustituto cercano del auto particular.
• Imaginemos que las nuevas probabilidades son:
𝑃𝑎𝑢𝑡𝑜 = 0.10, 𝑃𝑡𝑎𝑥𝑖 = 0.20 y 𝑃𝑏𝑢𝑠 = 0.7
• Luego, la razón de probabilidades de auto con bus
cambia a 0.10 0.7 = 0.1428.
• Con el logit multinomial, tal razón de probabilidades no
cambia.
35
Caso I: No ordenado Logit Multinomial
• Deficiencias del Logit Multinomial:
– Independencia de alternativas irrelevantes
– Solo incluye como regresores a las características de los
individuos 𝒙𝑖.
36
Caso I: No ordenado Logit Condicional
• Generalización: Modelo Logit Condicional
• Este modelos permite introducir regresores que reflejen
los atributos o características de las categorías, tal como
las percibe el individuo i.
• En el ejemplo del transporte, algunas de estas variables
son: calidad del servicio, precios, distancia, etc.
• Se utiliza el modelo de variables latentes llamado
“Random Utility Model”.
37
Caso I: No ordenado Logit Condicional
• Por fines didácticos, empezaremos con el modelo más
simple binomial.
• Hay dos categorías o alternativas, 𝑗 = 1⁡𝑜⁡2.
• Sea 𝑌𝑖𝑗
∗
=⁡Nivel de utilidad de individuo 𝑖 escogiendo la
alternativa 𝑗.
• Ocurrirá que un individuo 𝑖 elige 𝑗 si:
𝑌ij
∗
= max⁡{ 𝑌𝑖1
∗
, 𝑌𝑖2
∗
}
con lo cual se observará 𝑌𝑖𝑗 = 1 y 𝑌𝑖𝑘 = 0 ∀𝑘 ≠ 𝑗.
38
Caso I: No ordenado Logit Condicional
• Modelando las utilidades en función de las características
del individuo i
𝑌𝑖1
∗
= 𝒙𝑖 𝜷 𝟏 + 𝜀𝑖1 Utilidad si elige la opción 1 (Ejem:
participa en el mercado laboral)
𝑌𝑖2
∗
= 𝒙𝑖 𝜷 𝟐 + 𝜀𝑖2 Utilidad si elige la opción 2 (Ejem: no
participa en el mercado laboral)
𝜀𝑖𝑗~𝑉𝑎𝑙𝑜𝑟⁡𝐸𝑥𝑡𝑟𝑒𝑚𝑜, 𝐹 𝜀𝑖𝑗 = exp⁡(−𝑒−𝜀 𝑖𝑗)
𝑓 𝜀𝑖𝑗 = exp⁡ −𝜀𝑖𝑗 − exp −𝜀𝑖𝑗
• Se observará que 𝑌𝑖1 = 1 si 𝑌𝑖1
∗
> 𝑌𝑖2
∗
.
39
Caso I: No ordenado Logit Condicional
• Restando:
𝑌𝑖1
∗
− 𝑌𝑖2
∗
= 𝒙𝑖 𝜷1 − 𝜷2 + (𝜀𝑖1 − 𝜀𝑖2)
𝑌𝑖
∗
= 𝒙𝑖 𝜷 + 𝑢𝑖
donde esta probado que 𝑢𝑖 = 𝜀𝑖1 − 𝜀𝑖2 se distribuye como
una logística. Luego se tiene el modelo logit.
• La alternativa 2 es la base.
• El vector 𝜷 estimado por logit es la resta de los vectores
𝜷1 y 𝜷2, por eso se interpreta la alternativa 1 en
comparación con la base (alternativa 2).
40
Caso I: No ordenado Logit Condicional
• Las probabilidades de las alternativas 1 y 2 según este
enfoque son:
𝑃𝑖1 =
𝑒 𝒙 𝑖 𝜷1
𝑒 𝒙 𝑖 𝜷1+𝑒 𝒙 𝑖 𝜷2
𝑃𝑖2 =
𝑒 𝒙 𝑖 𝜷 𝟐
𝑒 𝒙 𝑖 𝜷1+𝑒 𝒙 𝑖 𝜷2
Las cuales son equivalentes a las que vimos en el logit
binomial (haciendo 𝛽 = 𝛽1 − 𝛽2)
𝑃𝑖1 =
𝑒 𝒙 𝑖 𝜷
𝑒 𝒙 𝑖 𝜷+1
𝑃𝑖2 =
1
𝑒 𝒙 𝑖 𝜷+1
41
Caso I: No ordenado Logit Condicional
• Similarmente el modelo logit multinomial con 𝑚 categorías se
puede presentar con el modelo RUM como
𝑌𝑖𝑗
∗
= 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗
• Ocurrirá que un individuo 𝑖 elige 𝑗 si:
𝑌𝑖𝑗
∗
= max⁡{ 𝑌𝑖1
∗
, 𝑌𝑖2
∗
, … , 𝑌𝑖𝑚
∗
}
con lo cual se observará 𝑌𝑖𝑗 = 1 y 𝑌𝑖𝑘 = 0 ∀𝑘 ≠ 𝑗. También, la
probabilidad de que 𝑖 elija 𝑗 es
𝑃𝑖𝑗 =
𝑒 𝒙 𝑖 𝜷 𝑗
𝑒 𝒙 𝑖 𝜷 𝑘𝑚
𝑘=1
42
Caso I: No ordenado Logit Condicional
Tomando como base a la categoría m,
𝑃𝑖𝑗 =
𝑒 𝒙 𝑖 𝜷
1+ 𝑒 𝒙 𝑖 𝜷 𝑘𝑚−1
𝑘=1
y 𝑃𝑖𝑚 =
1
1+ 𝑒 𝒙 𝑖 𝜷 𝑘𝑚−1
𝑘=1
• Ahora extendemos el modelo agregando más regresores.
• Sea:
• 𝒛𝑖𝑗 = Vector de atributos de categoría 𝑗 tal como los
percibe individuo 𝑖 (p.ej.: comodidad, distancia, precio)
43
Caso I: No ordenado Logit Condicional
• Luego
𝑌𝑖𝑗
∗
= 𝒛𝑖𝑗 𝜶 + 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗
donde 𝜶, 𝜷⁡son vectores de parámetros, y
𝜀𝑖𝑗~𝑉𝑎𝑙𝑜𝑟⁡𝐸𝑥𝑡𝑟𝑒𝑚𝑜
𝐹 𝜀𝑖𝑗 = exp⁡(−𝑒−𝜀 𝑖𝑗)
𝑓 𝜀𝑖𝑗 = exp⁡ −𝜀𝑖𝑗 − exp −𝜀𝑖𝑗
44
Caso I: No ordenado Logit Condicional
• Se puede demostrar que:
𝑃𝑖𝑗 =
𝑒 𝒛𝑖𝑗 𝜶+𝒙 𝑖 𝜷 𝑗
𝑒 𝒛 𝑖𝑘 𝜶+𝒙 𝑖 𝜷 𝑘𝑚
𝑘=1
• Con estas probabilidades se puede construir la función
de verosimilitud, la cual se maximiza con respecto a
𝜶, 𝜷 𝟏, … , 𝜷 𝒎.
• Para facilitar la interpretación se puede elegir una
alternativa base, digamos la “m”. Entonces se estima el
vector 𝜶 y los 𝑚 − 1 vectores 𝜷.
45
Caso I: No ordenado Logit Condicional
• Ventajas del logit condicional
– Permite la inclusión de variables propias de las alternativas
o categorías.
• Desventajas del logit condicional
– Aún se cumple la Independencia de Alternativas
irrelevantes (poco realista).
– Requiere una base de datos muy especial (datos de cada
categoría para cada individuo). Por ejemplo, en la elección
del transporte, para la variable tiempo de espera se
necesita el tiempo de espera de la persona 𝑖 de cada una
de las alternativas.
46
Ejemplo: Logit Multinomial
• Se pretende estimar los determinantes de la decisión de
estudiar, trabajar o hacer ambas cosas.
• Se usa la base de datos de ENAHO 2012.
• Se regresionan las cuatro posibilidades (1=no hacer
nada, 2= solo estudiar, 3=solo trabajar, 4= estudiar y
trabajar), contra algunas variables como sexo, edad e
ingresos familiares.
47
Ejemplo: Logit Multinomial
Total 18,508 100.00
4 3,604 19.47 100.00
3 7,750 41.87 80.53
2 4,335 23.42 38.65
1 2,819 15.23 15.23
dedica Freq. Percent Cum.
. tab dedica if P208A>14 & P208A<25
Total 16,090 2,418 18,508
4 3,505 99 3,604
3 6,173 1,577 7,750
2 4,264 71 4,335
1 2,148 671 2,819
dedica 0 1 Total
convcas
. tab dedica convcas if P208A>14 & P208A<25
Nada
Estudia
Trabaja
Estudia y Trabaja
Nada
Estudia
Trabaja
Estudia y Trabaja
48
_cons 1.254727 .1877319 6.68 0.000 .886779 1.622674
GASHOG2D 7.84e-06 1.54e-06 5.08 0.000 4.81e-06 .0000109
convcas -2.099632 .1139519 -18.43 0.000 -2.322973 -1.87629
P208A -.0691895 .010161 -6.81 0.000 -.0891048 -.0492743
P207 .6141879 .0529173 11.61 0.000 .510472 .7179039
4
_cons -2.620248 .1678923 -15.61 0.000 -2.949311 -2.291185
GASHOG2D -8.03e-06 1.43e-06 -5.60 0.000 -.0000108 -5.22e-06
convcas -.3608565 .0584973 -6.17 0.000 -.4755091 -.246204
P208A .1778496 .0087947 20.22 0.000 .1606123 .1950869
P207 .8952164 .0469898 19.05 0.000 .803118 .9873148
3
_cons 3.599426 .1871194 19.24 0.000 3.232678 3.966173
GASHOG2D .0000168 1.47e-06 11.43 0.000 .0000139 .0000197
convcas -2.464972 .1308225 -18.84 0.000 -2.721379 -2.208565
P208A -.1931568 .0103402 -18.68 0.000 -.2134232 -.1728905
P207 .2414731 .0517325 4.67 0.000 .1400792 .3428671
2
1 (base outcome)
dedica Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -21786.497 Pseudo R2 = 0.1012
Prob > chi2 = 0.0000
LR chi2(12) = 4907.40
Multinomial logistic regression Number of obs = 18508
Iteration 5: log likelihood = -21786.497
Iteration 4: log likelihood = -21786.497
Iteration 3: log likelihood = -21786.509
Iteration 2: log likelihood = -21789.671
Iteration 1: log likelihood = -21886.288
Iteration 0: log likelihood = -24240.195
. mlogit dedica P207 P208A convcas GASHOG2D if P208A>14 & P208A<25, b(1)
nada
Estudia
Trabaja
Estudia
y
Trabaja
49
_cons -2.344699 .1707189 -13.73 0.000 -2.679302 -2.010096
GASHOG2D -8.95e-06 1.20e-06 -7.44 0.000 -.0000113 -6.59e-06
convcas .3653404 .1596006 2.29 0.022 .0525289 .6781519
P208A .1239673 .0095442 12.99 0.000 .105261 .1426736
P207 .3727148 .0457605 8.14 0.000 .2830259 .4624037
4
_cons -6.219674 .1598 -38.92 0.000 -6.532876 -5.906472
GASHOG2D -.0000248 1.24e-06 -20.09 0.000 -.0000272 -.0000224
convcas 2.104115 .1273818 16.52 0.000 1.854452 2.353779
P208A .3710064 .0087445 42.43 0.000 .3538676 .3881452
P207 .6537433 .04254 15.37 0.000 .5703664 .7371201
3
2 (base outcome)
_cons -3.599426 .1871194 -19.24 0.000 -3.966173 -3.232678
GASHOG2D -.0000168 1.47e-06 -11.43 0.000 -.0000197 -.0000139
convcas 2.464972 .1308225 18.84 0.000 2.208565 2.721379
P208A .1931568 .0103402 18.68 0.000 .1728905 .2134232
P207 -.2414731 .0517325 -4.67 0.000 -.3428671 -.1400792
1
dedica Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -21786.497 Pseudo R2 = 0.1012
Prob > chi2 = 0.0000
LR chi2(12) = 4907.40
Multinomial logistic regression Number of obs = 18508
Iteration 5: log likelihood = -21786.497
Iteration 4: log likelihood = -21786.497
Iteration 3: log likelihood = -21786.509
Iteration 2: log likelihood = -21789.671
Iteration 1: log likelihood = -21886.288
Iteration 0: log likelihood = -24240.195
. mlogit dedica P207 P208A convcas GASHOG2D if P208A>14 & P208A<25, b(2)
nada
Estudia
Trabaja
Estudia
y
Trabaja
50
GASHOG2D 8.33e-07 1.59e-07 5.25 0.000 5.22e-07 1.14e-06
convcas -.1581544 .0169366 -9.34 0.000 -.1913496 -.1249593
P208A -.0123815 .0010203 -12.14 0.000 -.0143812 -.0103818
P207 .0171736 .0056589 3.03 0.002 .0060824 .0282648
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
Delta-method
dy/dx w.r.t. : P207 P208A convcas GASHOG2D
Expression : Pr(dedica==4), predict(out(4))
Model VCE : OIM
Average marginal effects Number of obs = 18508
. margins, dydx(*) pr(out(4))
51
Ejemplo: Logit Condicional
• Elección del medio de transporte:
• Se permite que haya características de los individuos y
características de las categorías (medios de transporte)
• La base de datos se ve así:
52
ttme = Tiempo en el terminal
(cero para carros)
hinc = ingreso del hogar
gc = costo generalizado
mode = La elección de la persona
53
_cons -.3249561 .5763335 -0.56 0.573 -1.454549 .8046369
hinc -.0511884 .0147352 -3.47 0.001 -.0800689 -.0223079
Train
_cons -5.874813 .8020903 -7.32 0.000 -7.446882 -4.302745
hinc .0053735 .0115294 0.47 0.641 -.0172237 .0279707
Car
_cons -1.744529 .6775004 -2.57 0.010 -3.072406 -.4166531
hinc -.0232107 .0162306 -1.43 0.153 -.055022 .0086006
Bus
Air (base alternative)
gc -.0109274 .0045878 -2.38 0.017 -.0199192 -.0019355
ttme -.0954606 .0104732 -9.11 0.000 -.1159876 -.0749335
transport
mode Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -189.52515 Prob > chi2 = 0.0000
Wald chi2(5) = 105.78
max = 4
avg = 4.0
Alternative variable: transport Alts per case: min = 4
Case variable: id Number of cases = 210
Alternative-specific conditional logit Number of obs = 840
Iteration 4: log likelihood = -189.52515
Iteration 3: log likelihood = -189.52515
Iteration 2: log likelihood = -189.52526
Iteration 1: log likelihood = -189.64056
Iteration 0: log likelihood = -195.52759
. asclogit mode ttme gc, casevars(hinc) case(id) alternatives(transport)
54
CASO II: CATEGORÍAS AGRUPADAS
55
Caso II: Categorías Agrupadas Logit Anidado
• Consideremos un caso similar al Logit Condicional en
donde algunas de las categorías son muy “próximas” o
similares.
• Estas categorías similares pueden formar un subgrupo o
rama de categorías.
• Conviene pensar en un modelo en donde las decisiones
se hacen en forma secuencial: primero se decide sobre
las “ramas” o “grupos”, y luego por las categorías o
alternativas en ellos.
Luis García - PUCP (c) 56
Caso II: Categorías Agrupadas Logit Anidado
• Ejemplo: Elección del medio de transporte: {auto propio,
taxi, bus}
Bus Auto
propio
Taxi
Auto
Luis García - PUCP (c) 57
Caso II: Categorías Agrupadas Logit Anidado
• La decisión inicial es entre movilizarse en Bus o en un
auto. Si se elige auto hay dos opciones, taxi o auto
propio.
• En este escenario, la probabilidad de elegir un taxi
depende de que previamente se haya elegido la opción
bus.
Luis García - PUCP (c) 58
Caso II: Categorías Agrupadas Logit Anidado
Pr 𝑡𝑎𝑥𝑖 = Pr 𝑡𝑎𝑥𝑖 𝑎𝑢𝑡𝑜 ∗ Pr⁡( 𝑎𝑢𝑡𝑜)
Pr 𝐴𝑢𝑡𝑜⁡𝑃𝑟𝑜𝑝𝑖𝑜 = Pr 𝐴𝑢𝑡𝑜⁡𝑃𝑟𝑜𝑝𝑖𝑜⁡ 𝐴𝑢𝑡𝑜) ∗ Pr 𝐴𝑢𝑡𝑜
Luis García - PUCP (c) 59
Caso II: Categorías Agrupadas Logit Anidado
• Logit Anidado (nested logit)
• Generalizamos para el caso de random utility model
(RUM).
• Según el modelo, la utilidad del individuo i por elegir la
alternativa j es:
𝑈𝑖𝑗
∗
= 𝒛𝑖𝑗 𝜶 + 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗
Luis García - PUCP (c) 60
Caso II: Categorías Agrupadas Logit Anidado
• Donde al igual que antes,
𝒛𝑖𝑗 = Vector de atributos de categoría 𝑗 tal como los
percibe individuo 𝑖 (p.ej.: comodidad, distancia, tiempo),
𝒙𝑖 = Vector de características del individuo 𝑖 (p.ej.: edad,
sexo, nivel educativo, ingresos).
Luis García - PUCP (c) 61
Caso II: Categorías Agrupadas Logit Anidado
• Por simplicidad en la notación omitiremos el subíndice 𝑖.
Entonces,
𝑈𝑗
∗
= 𝒛𝑗 𝜶 + 𝒙𝜷 𝑗 + 𝜀𝑗
• Llamaremos 𝑉𝑗 = 𝒛 𝑗 𝜶 + 𝒙𝜷 𝑗.
• Se asume que 𝜀𝑗 se distribuye como valor extremo.
Luis García - PUCP (c) 62
Caso II: Categorías Agrupadas Logit Anidado
• Asumamos que hay en total 𝐽 alternativas o categorías,
las cuales han sido agrupadas en 𝐿 ramas, 𝑙 = 1,2, … , 𝐿.
Cada rama tiene 𝐽𝑙 categorías., donde
𝐽1 + 𝐽2 + ⋯ + 𝐽𝐿 = 𝐽
• La probabilidad de caer en la categoría 𝑗 ∈ 𝑙 se
descompone en:
Pr 𝑗 = Pr⁡( 𝑗|𝑙) ∙ Pr⁡( 𝑙)
Luis García - PUCP (c) 63
Caso II: Categorías Agrupadas Logit Anidado
• Bajo los supuestos mencionados se puede comprobar
que:
Pr 𝑗 𝑙 =
exp
1
𝜏𝑙
𝑉𝑗
exp
1
𝜏𝑙
𝑉𝑘𝑘∈𝐽 𝑙
• Se define el “valor inclusivo” de la rama 𝑚 como
𝐼𝑉𝑚 = 𝑙𝑛 exp
1
𝜏 𝑚
𝑉𝑘
𝑘∈𝐽 𝑚
Luis García - PUCP (c) 64
Caso II: Categorías Agrupadas Logit Anidado
• El valor inclusivo 𝐼𝑉𝑚 es una suerte de utilidad de la rama
“𝑚”.
• El parámetro 𝜏𝑙 es nuevo y debe ser estimado.
• Por otra parte, la probabilidad de caer en la rama 𝑙 es:
Pr 𝑙 =
exp⁡( 𝜏𝑙 𝐼𝑉𝑙)
exp⁡( 𝜏 𝑚 𝐼𝑉𝑚)𝑚
Luis García - PUCP (c) 65
Caso II: Categorías Agrupadas Logit Anidado
• Luego, la probabilidad de caer en la alternativa 𝑗 es
Pr 𝑗 =
exp
1
𝜏𝑙
𝑉𝑗
exp
1
𝜏𝑙
𝑉𝑘𝑘∈𝐽 𝑙
∙
exp⁡( 𝜏𝑙 𝐼𝑉𝑙)
exp⁡( 𝜏 𝑚 𝐼𝑉𝑚)𝑚
• Si 𝜏𝑙 = 1, entonces el modelo se resume al caso de Logit
Condicional, y por lo tanto las ramas podría
desagregarse.
Luis García - PUCP (c) 66
Caso II: Categorías Agrupadas Logit Anidado
• Normalmente se espera que 𝜏𝑙 se encuentre en el
intervalo unitario (0, 1]
• Si 𝜏𝑙 < 0, un incremento en la utilidad de una alternativa
𝑗 de 𝑙 reduciría la probabilidad de elegir a la alternativa 𝑙.
(No tiene sentido)
• Si 𝜏𝑙 = 0, un incremento en la utilidad en una alternativa
𝑗 de 𝑙 no incrementaría la probabilidad de elegir a la
rama 𝑙 (no tiene sentido).
Luis García - PUCP (c) 67
Caso II: Categorías Agrupadas Logit Anidado
• Si 𝜏𝑙 > 1, tal incremento en la utilidad de 𝑗 elevaría no
solo la probabilidad de elegir 𝑗 sino también de las demás
alternativas en la rama 𝑙. (Podría generar un espiral
explosivo).
Luis García - PUCP (c) 68
Caso II: Categorías Agrupadas Logit Anidado
• Por último, el modelo puede ser estimado por máxima
verosimilitud, en donde los parámetros 𝜷 𝑗 se estiman
para cada alternativa menos una (la base, similar al logit
multinomial), y los parámetros 𝜶 son generales para
todas las ramas.
• La función de verosimilitud que se maximiza es:
𝑙𝑛𝐿 = 𝑌𝑖𝑗𝑙ln⁡[Pr 𝑗 𝑙 𝑃𝑟 𝑙 ]
𝑗∈𝐽 𝑙
𝐿
𝑙=1
𝑛
𝑖=1
Luis García - PUCP (c) 69
Ejemplo: Logit anidado
• Usando los mismos datos de elección del medio de
transporte, vamos a definir las siguientes ramas:
Luis García - PUCP (c) 70
Aéreo Carro Bus Tren
Transporte
Público
Otro
Ejemplo: Logit anidado
• Se utilizarán las mismas variables del ejemplo de Logit
Condicional.
– gc = costo generalizado del transporte
– gtme = tiempo en el terminal
– hinc = Ingreso del hogar.
• En términos de los vectores, será:
𝑧𝑖𝑗 = [𝑡𝑡𝑚𝑒⁡𝑔𝑐] 𝑥𝑖 = [ℎ𝑖𝑛𝑐]
Luis García - PUCP (c) 71
Ejemplo: Logit anidado
• Usaremos el comando nlogitrum, que es consistente
con el modelo RUM que estamos desarrollando.
(buscarlo con findit nlogitrum).
Luis García - PUCP (c) 72
Ejemplo: Logit anidado
Luis García - PUCP (c) 73
N = number of observations at each level
k = number of times alternative is chosen
total 840 210
Train 210 63
Public 420 Bus 210 30
Car 210 59
Other 420 Air 210 58
type N transport N k
tree structure specified for the nested logit model
. nlogittree transport type, choice(mode)
. nlogitgen type = transport(Other: Air | Car, Public: Train | Bus)
Luis García - PUCP (c) 74
gen travel = 1 if transport=="Air"
replace travel = 2 if transport=="Train"
replace travel = 3 if transport=="Bus"
replace travel = 4 if transport=="Car"
label define travel 1 "air" 2 "train" 3 "bus" 4 "car", replace
tab transport, gen(c_) /*en nlogitrum hay que introducir las ctes para
cada categoría manualmente como dummies*/
rename c_1 c_air
rename c_2 c_bus
rename c_3 c_car
rename c_4 c_train
gen hinc_air=hinc*c_air /*para el ingreso es igual, sino entiende que es
constante para cada categoría*/
gen hinc_bus=hinc*c_bus
gen hinc_car=hinc*c_car
gen hinc_train=hinc*c_train
LR test of homoskedasticity (iv = 1): chi2(2)= 4.99 Prob > chi2 = 0.0827
/Public .8827306 .2207062 4.00 0.000 .4501543 1.315307
/Other 1.638208 .4323238 3.79 0.000 .7908685 2.485547
type
IV params:
c_train .1287731 .7574739 0.17 0.865 -1.355849 1.613395
hinc_train -.0490925 .0165844 -2.96 0.003 -.0815973 -.0165877
c_car -6.210651 1.180069 -5.26 0.000 -8.523543 -3.897759
hinc_car .0055489 .0168452 0.33 0.742 -.027467 .0385649
c_bus -1.355943 .8589491 -1.58 0.114 -3.039452 .3275666
hinc_bus -.0220306 .0177663 -1.24 0.215 -.0568519 .0127908
gc -.0178538 .0065678 -2.72 0.007 -.0307264 -.0049811
ttme -.103126 .016843 -6.12 0.000 -.1361377 -.0701143
travel
mode Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -187.03247 Prob > chi2 = 0.0000
Dependent variable = mode LR chi2(10) = 208.1787
Levels = 2 Number of obs = 840
Nested logit, RUM consistent
Luis García - PUCP (c) 75
nlogitrum mode ttme gc hinc_bus c_bus hinc_car c_car hinc_train c_train,
group(id) nests(travel type)

Más contenido relacionado

La actualidad más candente

Consumo intertemporal
Consumo intertemporalConsumo intertemporal
Consumo intertemporal
Mauro Gutierrez
 
Incidencia de los impuestos
Incidencia de los impuestosIncidencia de los impuestos
Incidencia de los impuestosNatali Sanchez
 
Trabajo de micro modificadoii[1][1]
Trabajo de micro modificadoii[1][1]Trabajo de micro modificadoii[1][1]
Trabajo de micro modificadoii[1][1]
Guillermo Pereyra
 
Logit
LogitLogit
Propiedades mco
Propiedades mcoPropiedades mco
Propiedades mco
jecuy
 
ECON (II) EL CONSUMO.pptx
ECON (II) EL CONSUMO.pptxECON (II) EL CONSUMO.pptx
ECON (II) EL CONSUMO.pptx
Jose Bellodas Cubas
 
Elasticidad de la demanda y la oferta
Elasticidad de la demanda y la ofertaElasticidad de la demanda y la oferta
Elasticidad de la demanda y la ofertacatalinap9302
 
Diapositivas Mochon
Diapositivas Mochon Diapositivas Mochon
Diapositivas Mochon
www.pablomoscoso.com
 
Indice de precios al consumidor
Indice de precios al consumidorIndice de precios al consumidor
Indice de precios al consumidorVivianaBelenBotia
 
Ineficiencia en los monopolios
Ineficiencia en los monopoliosIneficiencia en los monopolios
Ineficiencia en los monopolios
Mauro Gutierrez
 
Curso de Microeconomía
Curso de MicroeconomíaCurso de Microeconomía
Curso de Microeconomía
FREDDY LUIS VILLAR CASTILLO
 
Los Mercados Los Controles De Precios
Los Mercados  Los Controles De PreciosLos Mercados  Los Controles De Precios
Los Mercados Los Controles De Precios
Logos Academy
 
Fundamentos de Computación Cuántica
Fundamentos de Computación CuánticaFundamentos de Computación Cuántica
Fundamentos de Computación Cuánticanuestrocanto
 
Cadenas de Markov - Estados absorbentes y de tiempo continuo
Cadenas de Markov - Estados absorbentes y de tiempo continuoCadenas de Markov - Estados absorbentes y de tiempo continuo
Cadenas de Markov - Estados absorbentes y de tiempo continuoAlberto Carranza Garcia
 
Presentacion elasticidad de la oferta y demanda
Presentacion elasticidad de la oferta y demandaPresentacion elasticidad de la oferta y demanda
Presentacion elasticidad de la oferta y demandaVideoconferencias UTPL
 
Variables instrumentales
Variables instrumentalesVariables instrumentales
Variables instrumentales
Freddy Nogales Zambrana
 
Principio de economia de mercado 02
Principio de economia de mercado 02Principio de economia de mercado 02
Principio de economia de mercado 02
Manuel Vásquez Concha
 
Ejercicios Microeconomia
Ejercicios MicroeconomiaEjercicios Microeconomia
Ejercicios Microeconomia
Isabel Beas Reátegui
 

La actualidad más candente (20)

Consumo intertemporal
Consumo intertemporalConsumo intertemporal
Consumo intertemporal
 
Incidencia de los impuestos
Incidencia de los impuestosIncidencia de los impuestos
Incidencia de los impuestos
 
Trabajo de micro modificadoii[1][1]
Trabajo de micro modificadoii[1][1]Trabajo de micro modificadoii[1][1]
Trabajo de micro modificadoii[1][1]
 
Logit
LogitLogit
Logit
 
Propiedades mco
Propiedades mcoPropiedades mco
Propiedades mco
 
ECON (II) EL CONSUMO.pptx
ECON (II) EL CONSUMO.pptxECON (II) EL CONSUMO.pptx
ECON (II) EL CONSUMO.pptx
 
Elasticidad de la demanda y la oferta
Elasticidad de la demanda y la ofertaElasticidad de la demanda y la oferta
Elasticidad de la demanda y la oferta
 
Diapositivas Mochon
Diapositivas Mochon Diapositivas Mochon
Diapositivas Mochon
 
Indice de precios al consumidor
Indice de precios al consumidorIndice de precios al consumidor
Indice de precios al consumidor
 
Ineficiencia en los monopolios
Ineficiencia en los monopoliosIneficiencia en los monopolios
Ineficiencia en los monopolios
 
Tema 8. los indicadores económicos
Tema 8. los indicadores económicos Tema 8. los indicadores económicos
Tema 8. los indicadores económicos
 
Curso de Microeconomía
Curso de MicroeconomíaCurso de Microeconomía
Curso de Microeconomía
 
Los Mercados Los Controles De Precios
Los Mercados  Los Controles De PreciosLos Mercados  Los Controles De Precios
Los Mercados Los Controles De Precios
 
Fundamentos de Computación Cuántica
Fundamentos de Computación CuánticaFundamentos de Computación Cuántica
Fundamentos de Computación Cuántica
 
Cadenas de Markov - Estados absorbentes y de tiempo continuo
Cadenas de Markov - Estados absorbentes y de tiempo continuoCadenas de Markov - Estados absorbentes y de tiempo continuo
Cadenas de Markov - Estados absorbentes y de tiempo continuo
 
Presentacion elasticidad de la oferta y demanda
Presentacion elasticidad de la oferta y demandaPresentacion elasticidad de la oferta y demanda
Presentacion elasticidad de la oferta y demanda
 
Variables instrumentales
Variables instrumentalesVariables instrumentales
Variables instrumentales
 
Principio de economia de mercado 02
Principio de economia de mercado 02Principio de economia de mercado 02
Principio de economia de mercado 02
 
Utilidad marginal
Utilidad marginalUtilidad marginal
Utilidad marginal
 
Ejercicios Microeconomia
Ejercicios MicroeconomiaEjercicios Microeconomia
Ejercicios Microeconomia
 

Similar a Extensiones multinomiales parte i

Optimizacion métodos
Optimizacion métodos Optimizacion métodos
Optimizacion métodos
Carlos Elias Perez Fermin
 
Optimización de sistemas y funciones
Optimización de sistemas y funcionesOptimización de sistemas y funciones
Optimización de sistemas y funciones
josealexanderlopez
 
Modelo transporte
Modelo transporteModelo transporte
Modelo transporte
puracastillo
 
Metodo de la grange
Metodo de la grangeMetodo de la grange
Metodo de la grange
Carlos Guerrero
 
Integ by part frac01
Integ by part frac01Integ by part frac01
Integ by part frac01
Edgar Mata
 
El Problema del Agente Viajero_f.pptx
El Problema del Agente Viajero_f.pptxEl Problema del Agente Viajero_f.pptx
El Problema del Agente Viajero_f.pptx
CarlosTarquiGuillen
 
Universidad_Autonoma_de_Queretaro_IMPLEM.pdf
Universidad_Autonoma_de_Queretaro_IMPLEM.pdfUniversidad_Autonoma_de_Queretaro_IMPLEM.pdf
Universidad_Autonoma_de_Queretaro_IMPLEM.pdf
arturoruizlopez1
 
Introducción al álgebra: Factorización
Introducción al álgebra: FactorizaciónIntroducción al álgebra: Factorización
Introducción al álgebra: Factorización
Fernando Felix Solis Cortes
 
Clase 6 - Ejercitación Logaritmos para paes
Clase 6 - Ejercitación Logaritmos para paesClase 6 - Ejercitación Logaritmos para paes
Clase 6 - Ejercitación Logaritmos para paes
csjmate
 
Informe sobre función logarítmica-Dominguez Gimena
Informe sobre función logarítmica-Dominguez GimenaInforme sobre función logarítmica-Dominguez Gimena
Informe sobre función logarítmica-Dominguez Gimena
Gimena Dominguez
 
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)
Álvaro Fierro
 
Pasos necesarios para crear pseudocódigo y un algoritmo
Pasos necesarios para crear pseudocódigo y un algoritmoPasos necesarios para crear pseudocódigo y un algoritmo
Pasos necesarios para crear pseudocódigo y un algoritmojairofr97
 
Mi 03 partial fractions integration 01
Mi 03 partial fractions integration 01Mi 03 partial fractions integration 01
Mi 03 partial fractions integration 01
Edgar Mata
 
Memmetpp
MemmetppMemmetpp
Memmetpp
kenetmtz
 
Mi 03 integration by partial fractions
Mi 03   integration by partial fractionsMi 03   integration by partial fractions
Mi 03 integration by partial fractions
Edgar Mata
 
Mi 03 integración por fracciones parciales
Mi 03   integración por fracciones parcialesMi 03   integración por fracciones parciales
Mi 03 integración por fracciones parciales
Edgar Mata
 
Modelos Ocultos De Markov
Modelos Ocultos De MarkovModelos Ocultos De Markov
Modelos Ocultos De Markov
Marcela Gomez
 
EXPRESIONES ALGEBRAICAS.pptx
EXPRESIONES ALGEBRAICAS.pptxEXPRESIONES ALGEBRAICAS.pptx
EXPRESIONES ALGEBRAICAS.pptx
nelalejo1994
 

Similar a Extensiones multinomiales parte i (20)

Optimizacion métodos
Optimizacion métodos Optimizacion métodos
Optimizacion métodos
 
Optimización de sistemas y funciones
Optimización de sistemas y funcionesOptimización de sistemas y funciones
Optimización de sistemas y funciones
 
Modelo transporte
Modelo transporteModelo transporte
Modelo transporte
 
Metodo de la grange
Metodo de la grangeMetodo de la grange
Metodo de la grange
 
Integ by part frac01
Integ by part frac01Integ by part frac01
Integ by part frac01
 
El Problema del Agente Viajero_f.pptx
El Problema del Agente Viajero_f.pptxEl Problema del Agente Viajero_f.pptx
El Problema del Agente Viajero_f.pptx
 
Guia taller de econometria
Guia taller de econometriaGuia taller de econometria
Guia taller de econometria
 
Guia taller de econometria
Guia taller de econometriaGuia taller de econometria
Guia taller de econometria
 
Universidad_Autonoma_de_Queretaro_IMPLEM.pdf
Universidad_Autonoma_de_Queretaro_IMPLEM.pdfUniversidad_Autonoma_de_Queretaro_IMPLEM.pdf
Universidad_Autonoma_de_Queretaro_IMPLEM.pdf
 
Introducción al álgebra: Factorización
Introducción al álgebra: FactorizaciónIntroducción al álgebra: Factorización
Introducción al álgebra: Factorización
 
Clase 6 - Ejercitación Logaritmos para paes
Clase 6 - Ejercitación Logaritmos para paesClase 6 - Ejercitación Logaritmos para paes
Clase 6 - Ejercitación Logaritmos para paes
 
Informe sobre función logarítmica-Dominguez Gimena
Informe sobre función logarítmica-Dominguez GimenaInforme sobre función logarítmica-Dominguez Gimena
Informe sobre función logarítmica-Dominguez Gimena
 
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)
Qué puede aportar la econometría a mi estrategia de marketing online (parte 1)
 
Pasos necesarios para crear pseudocódigo y un algoritmo
Pasos necesarios para crear pseudocódigo y un algoritmoPasos necesarios para crear pseudocódigo y un algoritmo
Pasos necesarios para crear pseudocódigo y un algoritmo
 
Mi 03 partial fractions integration 01
Mi 03 partial fractions integration 01Mi 03 partial fractions integration 01
Mi 03 partial fractions integration 01
 
Memmetpp
MemmetppMemmetpp
Memmetpp
 
Mi 03 integration by partial fractions
Mi 03   integration by partial fractionsMi 03   integration by partial fractions
Mi 03 integration by partial fractions
 
Mi 03 integración por fracciones parciales
Mi 03   integración por fracciones parcialesMi 03   integración por fracciones parciales
Mi 03 integración por fracciones parciales
 
Modelos Ocultos De Markov
Modelos Ocultos De MarkovModelos Ocultos De Markov
Modelos Ocultos De Markov
 
EXPRESIONES ALGEBRAICAS.pptx
EXPRESIONES ALGEBRAICAS.pptxEXPRESIONES ALGEBRAICAS.pptx
EXPRESIONES ALGEBRAICAS.pptx
 

Último

Documentación comercial y contable para contadores
Documentación comercial y contable para contadoresDocumentación comercial y contable para contadores
Documentación comercial y contable para contadores
JeanpaulFredyChavezM
 
CIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptx
CIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptxCIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptx
CIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptx
NatyOrtiz16
 
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.
ManfredNolte
 
TRABAJO DE EXPOSICIÓN CASO URUBO GUENDAA
TRABAJO DE EXPOSICIÓN CASO URUBO GUENDAATRABAJO DE EXPOSICIÓN CASO URUBO GUENDAA
TRABAJO DE EXPOSICIÓN CASO URUBO GUENDAA
AnglicaDuranRueda
 
Tratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdfTratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdf
ClaudioFerreyra8
 
Unidad I Generalidades de la Contabilidad.pdf
Unidad I Generalidades de la Contabilidad.pdfUnidad I Generalidades de la Contabilidad.pdf
Unidad I Generalidades de la Contabilidad.pdf
TatianaPoveda12
 
PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024
LuisdelBarri
 
La ejecución forzosa en especie (o en forma específica).pptx
La ejecución forzosa en especie (o en forma específica).pptxLa ejecución forzosa en especie (o en forma específica).pptx
La ejecución forzosa en especie (o en forma específica).pptx
AnaGarcia748312
 
CUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdf
CUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdfCUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdf
CUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdf
jotacf
 
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptx
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptxpablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptx
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptx
marisela352444
 
Economía Informal en el Perú:Situación actual y perspectivas .pdf
Economía Informal en el Perú:Situación actual y perspectivas .pdfEconomía Informal en el Perú:Situación actual y perspectivas .pdf
Economía Informal en el Perú:Situación actual y perspectivas .pdf
nelllalita3
 
CODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADO
CODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADOCODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADO
CODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADO
ARACELYMUOZ14
 
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de EmergenciaBBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
Claudia Valdés Muñoz
 
El crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financieraEl crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financiera
MarcoMolina87
 
anualidades anticipadas y diferidas .pptx
anualidades anticipadas y diferidas .pptxanualidades anticipadas y diferidas .pptx
anualidades anticipadas y diferidas .pptx
J. ALFREDO TORRES G
 
Rice & Jello Delights de yonhalberth cayama
Rice & Jello Delights de yonhalberth cayamaRice & Jello Delights de yonhalberth cayama
Rice & Jello Delights de yonhalberth cayama
haimaralinarez7
 
Planificación de Ecuador y sus respectivas zonas
Planificación de Ecuador y sus respectivas zonasPlanificación de Ecuador y sus respectivas zonas
Planificación de Ecuador y sus respectivas zonas
MarioBenedetti13
 
GARANTIAS Y SEGUROS de legal civ civil.pptx
GARANTIAS Y SEGUROS de legal civ civil.pptxGARANTIAS Y SEGUROS de legal civ civil.pptx
GARANTIAS Y SEGUROS de legal civ civil.pptx
MaraCalaniGonzalez
 
Teoria de la produccion, conceptos generales
Teoria de la produccion, conceptos generalesTeoria de la produccion, conceptos generales
Teoria de la produccion, conceptos generales
JimenaRamirez69
 
Presentacion Crown. Finanzas sanas de Reino
Presentacion Crown. Finanzas sanas de ReinoPresentacion Crown. Finanzas sanas de Reino
Presentacion Crown. Finanzas sanas de Reino
AleOsorio14
 

Último (20)

Documentación comercial y contable para contadores
Documentación comercial y contable para contadoresDocumentación comercial y contable para contadores
Documentación comercial y contable para contadores
 
CIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptx
CIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptxCIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptx
CIRCULACIÓN DE LOS TÍTULOS DE CRÉDITO.pptx
 
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.
EL MERCADO LABORAL EN EL SEMESTRE EUROPEO. COMPARATIVA.
 
TRABAJO DE EXPOSICIÓN CASO URUBO GUENDAA
TRABAJO DE EXPOSICIÓN CASO URUBO GUENDAATRABAJO DE EXPOSICIÓN CASO URUBO GUENDAA
TRABAJO DE EXPOSICIÓN CASO URUBO GUENDAA
 
Tratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdfTratado sobre el dinero, John Maynard Keynes.pdf
Tratado sobre el dinero, John Maynard Keynes.pdf
 
Unidad I Generalidades de la Contabilidad.pdf
Unidad I Generalidades de la Contabilidad.pdfUnidad I Generalidades de la Contabilidad.pdf
Unidad I Generalidades de la Contabilidad.pdf
 
PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024PMI sector servicios España mes de mayo 2024
PMI sector servicios España mes de mayo 2024
 
La ejecución forzosa en especie (o en forma específica).pptx
La ejecución forzosa en especie (o en forma específica).pptxLa ejecución forzosa en especie (o en forma específica).pptx
La ejecución forzosa en especie (o en forma específica).pptx
 
CUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdf
CUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdfCUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdf
CUENTAS POR COBRAR DIVERSAS – TERCEROS+.pdf
 
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptx
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptxpablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptx
pablo LAMINAS A EXPONER PROYECTO FINAL 2023 sabado 28.10.23.pptx
 
Economía Informal en el Perú:Situación actual y perspectivas .pdf
Economía Informal en el Perú:Situación actual y perspectivas .pdfEconomía Informal en el Perú:Situación actual y perspectivas .pdf
Economía Informal en el Perú:Situación actual y perspectivas .pdf
 
CODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADO
CODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADOCODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADO
CODIGO FISCAL DE LA FEDERACION 2024 ACTUALIZADO
 
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de EmergenciaBBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
BBSC® Impuesto Sustitutivo 2024 Ley de Emergencia
 
El crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financieraEl crédito y los seguros como parte de la educación financiera
El crédito y los seguros como parte de la educación financiera
 
anualidades anticipadas y diferidas .pptx
anualidades anticipadas y diferidas .pptxanualidades anticipadas y diferidas .pptx
anualidades anticipadas y diferidas .pptx
 
Rice & Jello Delights de yonhalberth cayama
Rice & Jello Delights de yonhalberth cayamaRice & Jello Delights de yonhalberth cayama
Rice & Jello Delights de yonhalberth cayama
 
Planificación de Ecuador y sus respectivas zonas
Planificación de Ecuador y sus respectivas zonasPlanificación de Ecuador y sus respectivas zonas
Planificación de Ecuador y sus respectivas zonas
 
GARANTIAS Y SEGUROS de legal civ civil.pptx
GARANTIAS Y SEGUROS de legal civ civil.pptxGARANTIAS Y SEGUROS de legal civ civil.pptx
GARANTIAS Y SEGUROS de legal civ civil.pptx
 
Teoria de la produccion, conceptos generales
Teoria de la produccion, conceptos generalesTeoria de la produccion, conceptos generales
Teoria de la produccion, conceptos generales
 
Presentacion Crown. Finanzas sanas de Reino
Presentacion Crown. Finanzas sanas de ReinoPresentacion Crown. Finanzas sanas de Reino
Presentacion Crown. Finanzas sanas de Reino
 

Extensiones multinomiales parte i

  • 2. Extensiones Multinomiales • Una extensión natural de los modelos binarios es considerando que la variable endógena tenga más de dos categorías. • Ejemplos: 2
  • 3. Extensiones Multinomiales • Sin orden en las categorías: En la elección del medio de transporte: 3 Medio de transporte Auto particular Taxi Bus Bicicleta A pie
  • 4. Extensiones Multinomiales • Agrupamiento en categorías: 4 Medio de transporte Interestatal o internacional Auto particular Tren Bus Terrestre Avión Aéreo
  • 5. Extensiones Multinomiales • Orden jerárquico en las categorías. Ejm: Nivel educativo alcanzado 5 Nivel Educativo Alcanzado Sin instrucción Primaria Secundaria Superior
  • 6. Panorama general • Caso I: Categorías no ordenadas – Modelo Logit Multinomial – Modelo Logit Condicional (Random Utility Model) – Modelo Probit Multinomial • Caso III: Categorías agrupadas – Modelo Logit Anidado (Random Utility Model) • Caso II: Categorías jerárquicas – Modelo Logit Ordenado – Modelo Probit Ordenado 6
  • 7. CASO I: NO ORDENADO 7
  • 8. Caso I: No ordenado Logit Multinomial • Logit Multinomial • Supongamos que la variable endógena tiene m categorías. • Sean 𝑃1, 𝑃2, … , 𝑃𝑚 las probabilidades de escoger o caer en alguna de estas categorías. • Generalizando el caso logit, la probabilidad de que el individuo i elija la alternativa j es: 8
  • 9. Caso I: No ordenado Logit Multinomial 𝑃𝑗𝑖 = exp⁡( 𝒙 𝑖 𝜷 𝑗) 1+ exp⁡( 𝒙 𝑖 𝜷 𝑘)𝑚−1 𝑘=1 𝑗 = 1, … , 𝑚 − 1 𝑃 𝑚𝑖 = 1 1+ exp⁡( 𝒙 𝑖 𝜷 𝑘)𝑚−1 𝑘=1 • La categoría m es la “categoría base”. • La decisión por alguna de las alternativas depende de las características 𝒙𝑖. • Esto es una generalización del logit binomial. Por ejemplo, en el caso m=2, 9
  • 10. Caso I: No ordenado Logit Multinomial 𝑃1𝑖 =⁡ exp⁡( 𝒙 𝑖 𝜷 𝟏) 1+exp⁡( 𝒙 𝑖 𝜷 𝟏) y 𝑃2𝑖 =⁡ 1 1+exp⁡( 𝒙 𝑖 𝜷 𝟏) • En el caso m = 3, 𝑃1𝑖 = exp⁡( 𝒙 𝑖 𝜷 𝟏) 1+exp 𝒙 𝑖 𝜷 𝟏 +exp⁡( 𝒙 𝑖 𝜷 𝟐) (1) 𝑃2𝑖 = exp⁡( 𝒙 𝑖 𝜷 𝟐) 1+exp 𝒙 𝑖 𝜷 𝟏 +exp⁡( 𝒙 𝑖 𝜷 𝟐) (2) 𝑃3𝑖 = 1 1+exp 𝒙 𝑖 𝜷 𝟏 +exp⁡( 𝒙 𝑖 𝜷 𝟐) (3) 10
  • 11. Caso I: No ordenado Logit Multinomial • Nótese que en el caso m = 2, solo se estima un vector de parámetros 𝜷 𝟏. • Si m=3, se estiman 2 vectores de parámetros 𝜷 𝟏 y 𝜷 𝟐. En general se estimarán 𝑚 − 1 vectores de parámetros. • Para estimar estos parámetros, se define la función de verosimilitud apropiada. 11
  • 12. Caso I: No ordenado Logit Multinomial • Definamos las dummies 𝑌𝑖𝑗 = 1 si individuo i escoge o cae en la categoría j, y 𝑌𝑖𝑗 = 0 de otro modo. • Luego, se estiman los 𝑚 − 1 vectores de parámetros, 𝜷 𝟏, 𝜷 𝟐, … , 𝜷 𝒎−𝟏, maximizando la verosimilitud 𝐿 = 𝑃𝑖1 𝑌 𝑖1 𝑃𝑖2 𝑌 𝑖2 … 𝑃𝑖𝑚 𝑌 𝑖𝑚 𝑛 𝑖=1 12
  • 13. Caso I: No ordenado Logit Multinomial • Tomando logaritmos: 𝑙𝑛𝐿 = 𝑌𝑖𝑗 𝑙𝑛𝑃𝑖𝑗 𝑚 𝑗=1 𝑛 𝑖=1 • Maximizando esta función se obtienen los estimadores 𝜷 𝟏, 𝜷 𝟐, … , 𝜷 𝒎−𝟏 13
  • 14. Caso I: No ordenado Logit Multinomial • Interpretación de los 𝜷 en logit multinomial: • A diferencia del logit simple con m = 2, a partir de m=3 en adelante los coeficientes y signos de los 𝛽 tienen una interpretación más compleja. • Recordemos que en el caso logit binomial (m=2), se cumple que 𝑝𝑖 = exp⁡( 𝒙 𝑖 𝜷) 1+exp⁡( 𝒙 𝑖 𝜷) y 1 − 𝑝𝑖 = 1 1+exp⁡( 𝒙 𝑖 𝜷) 14
  • 15. Caso I: No ordenado Logit Multinomial • Dividiendo tenemos 𝑝 𝑖 1−𝑝 𝑖 = exp⁡( 𝒙𝑖 𝜷) • Tomando logaritmo ⁡ln 𝑝 𝑖 1−𝑝 𝑖 = 𝒙𝑖 𝜷 • Es decir, los 𝜷 en el logit son el impacto de X sobre el logaritmo de la razón de probabilidades (relative risk ratio). • Por ejemplo, si 𝑝𝑖 es la prob de tener crédito y (1 − 𝑝𝑖) la prob de no tenerlo, 𝑝𝑖 1 − 𝑝𝑖 = 4 indica que es 4 veces más probable tener crédito a no tenerlo. 15
  • 16. Caso I: No ordenado Logit Multinomial • Intentaremos dar una interpretación similar para m>2. • Ejemplo: m = 3 • Medio de Transporte • Categoría base: Bus. 1. Auto Particular 2. Taxi 3. Bus 16
  • 17. Caso I: No ordenado Logit Multinomial • De las ecuaciones (1)-(3), 𝑃1𝑖 𝑃3𝑖 = exp 𝒙𝑖 𝜷1 𝑃2𝑖 𝑃3𝑖 = exp 𝒙𝑖 𝜷2 𝑃1𝑖 𝑃2𝑖 = exp 𝒙𝒊 𝜷 𝟏 exp 𝒙𝒊 𝜷 𝟐 = exp 𝒙𝑖 𝜷1 − 𝜷 𝟐 • Tomando logaritmos, 17
  • 18. Caso I: No ordenado Logit Multinomial • Se cumple que 𝑙𝑛 𝑃𝑖1 𝑃𝑖3 = 𝒙𝑖 𝜷 𝟏 ⁡⁡⁡⁡⁡⁡…⁡⁡(4) 𝑙𝑛 𝑃𝑖2 𝑃𝑖3 = 𝒙𝑖 𝜷 𝟐 ⁡⁡⁡⁡⁡⁡…⁡⁡⁡(5) 𝑙𝑛 𝑃𝑖1 𝑃𝑖2 = 𝒙𝑖 𝜷1 − 𝜷2 ⁡… (6) 18
  • 19. Caso I: No ordenado Logit Multinomial • Supongamos que 𝑥𝑖 = [1⁡𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖⁡𝐸𝑑𝑎𝑑𝑖] • Podemos escribir a (4), (5) y (6) como: (4) 𝑙𝑛 𝑃 𝑖1 𝑃 𝑖3 = 𝛽1 1 + 𝛽2 1 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛽3 1 𝐸𝑑𝑎𝑑𝑖 (5) 𝑙𝑛 𝑃 𝑖2 𝑃 𝑖3 = 𝛽1 2 + 𝛽2 2 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛽3 2 𝐸𝑑𝑎𝑑𝑖 (6) 𝑙𝑛 𝑃 𝑖1 𝑃 𝑖2 = 𝛽1 1 − 𝛽1 2 + 𝛽2 1 − 𝛽2 2 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + (𝛽3 1 − 𝛽3 2 )𝐸𝑑𝑎𝑑𝑖 19
  • 20. Caso I: No ordenado Logit Multinomial • En la ecuación (4), los betas mide el efecto de cambios en 𝒙𝑖 sobre el ln de la razón de probabilidades (Relative Risk Ratio – RRR) de elegir un auto propio respecto a viajar en bus. • En la (5) es lo mismo solo que entre taxi y bus. • El signo esperado de 𝛽2 1 es positivo, pues si aumentan los ingresos, es más probable que una persona viaje en auto particular en lugar de bus. 20
  • 21. Caso I: No ordenado Logit Multinomial • Similarmente, en (5), 𝛽2 2 mide el efecto de cambios en el ingreso sobre el ln de la razón de probabilidades de elegir un taxi respecto a viajar en bus. • Si, por ejemplo, 𝛽2 2 > 0, es más probable que las personas de ingresos más altos prefieran viajar en taxi en vez de bus. • Observar que el análisis se limita a comparar solo pares de alternativas, similarmente al logit simple. 21
  • 22. Caso I: No ordenado Logit Multinomial • Si queremos ver el efecto de un cambio en el ingreso sobre la propensión a usar auto en vez de taxi, el efecto es 𝛽2 1 − 𝛽2 2 . Si es positivo, entonces 𝛽2 1 > 𝛽2 2 . • ¿Cómo cambia el análisis si cambiamos la base? • Ahora la base es: taxi. 22
  • 23. Caso I: No ordenado Logit Multinomial 𝑃1𝑖 = exp⁡( 𝒙 𝑖 𝜶 𝟏) 1+exp 𝒙 𝑖 𝜶 𝟏 +exp⁡( 𝒙 𝑖 𝜶3) (7) 𝑃2𝑖 = 1 1+exp 𝒙 𝑖 𝜶 𝟏 +exp⁡( 𝒙 𝑖 𝜶3) (8) 𝑃3𝑖 = exp⁡( 𝒙 𝑖 𝜶 𝟑) 1+exp 𝒙 𝑖 𝜶 𝟏 +exp⁡( 𝒙 𝑖 𝜶 𝟑) (9) • Notar que solo hay los vectores 𝜶 𝟏 y 𝜶 𝟑. 23
  • 24. Caso I: No ordenado Logit Multinomial • Calculando los ratios y tomando log 𝑙𝑛 𝑃1𝑖 𝑃2𝑖 = 𝒙𝑖 𝜶 𝟏 ⁡⁡⁡⁡⁡⁡…⁡⁡(10) 𝑙𝑛 𝑃3𝑖 𝑃2𝑖 = 𝒙𝑖 𝜶 𝟑 ⁡⁡⁡⁡⁡⁡…⁡⁡⁡(11) 𝑙𝑛 𝑃𝑖1 𝑃𝑖3 = 𝒙𝑖 𝜶1 − 𝜶3 ⁡… (12) 24
  • 25. Caso I: No ordenado Logit Multinomial • Siguiendo con el ejemplo, las ecuaciones (10) -(12) se pueden escribir como: 𝑙𝑛 𝑃𝑖1 𝑃𝑖2 = 𝛼1 1 + 𝛼2 1 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛼3 1 𝐸𝑑𝑎𝑑𝑖 𝑙𝑛 𝑃𝑖3 𝑃𝑖2 = 𝛼1 3 + 𝛼2 3 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 + 𝛼3 3 𝐸𝑑𝑎𝑑𝑖 𝑙𝑛 𝑃𝑖1 𝑃𝑖3 = 𝛼1 1 − 𝛼1 3 + (𝛼2 1 − 𝛼2 3 )𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑖 +(𝛼3 1 − 𝛼3 3 )𝐸𝑑𝑎𝑑𝑖 25
  • 26. Caso I: No ordenado Logit Multinomial • El cambio de base no debería alterar las conclusiones del modelo. Solo hay que tener cuidado con la interpretación de los coeficientes nuevos. • De hecho se cumplirá que: 𝛼2 1 = 𝛽2 1 − 𝛽2 2 𝛼2 1 − 𝛼2 3 = 𝛽2 1 −𝛼2 3 = 𝛽2 2 26
  • 27. Caso I: No ordenado Logit Multinomial • Efectos Marginales en logit multinomial • Entrega el efecto de un cambio en la variable sobre la probabilidad absoluta de caer en una de las alternativas. • A diferencia de los betas, su interpretación no es relativa (en comparación con una alternativa base) sino absoluta: el impacto sobre la probabilidad de estar en una categoría. • Por ello, los efectos marginales no se alteran si se cambia de base. 27
  • 28. Caso I: No ordenado Logit Multinomial • Siguiendo con el ejemplo en el caso m = 3, deseamos calcular el efecto marginal de un cambio en el ingreso sobre las probabilidades de que el individuo i caiga en las opciones 1 (auto) o 2 (taxi), 𝑃2𝑖. • Luego de cálculos algebraicos se llega a 28
  • 29. Caso I: No ordenado Logit Multinomial • 𝜕𝑃 𝑖1 𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑖 = 𝑃𝑖1 ∙ (𝛽2 1 − 𝑃𝑖2 𝛽2 2 − 𝑃𝑖1 𝛽2 1 ) • 𝜕𝑃 𝑖2 𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑖 = 𝑃𝑖2 ∙ (𝛽2 2 − 𝑃𝑖1 𝛽2 1 − 𝑃𝑖2 𝛽2 2 ) • Notar que el superíndice de los betas indica el vector. 29
  • 30. Caso I: No ordenado Logit Multinomial • El efecto marginal de la opción 1 no solo depende de los betas de vector 𝜷 𝟏 sino también de 𝜷 𝟐. El efecto sobre 𝑃𝑖2 también depende de ambos vectores. • Es evidente que la interpretación del efecto marginal no es comparable con aquella sobre los betas. Miden cosas distintas. 30
  • 31. Caso I: No ordenado Logit Multinomial • Adicionalmente, el signo del efecto marginal puede ser distinto al del parámetro. Es decir podría ocurrir que 𝑠𝑖𝑔𝑛𝑜(𝛽2 1 ) ≠ 𝑠𝑖𝑔𝑛𝑜(𝑃𝑖1 ∙ 𝛽2 1 − 𝑃𝑖2 𝛽2 2 − 𝑃𝑖1 𝛽2 1 ) • Esto no ocurría en el logit binomial en donde los dos signos siempre coinciden. 31
  • 32. Caso I: No ordenado Logit Multinomial • Esto no debería ser sorprendente. Por ejemplo, si al aumentar el ingreso resulta que Pr(auto) sube, y Pr(taxi) cae y Pr(bus) cae. Si Pr(taxi) cae menos que la Pr(bus), entonces el parámetro 𝛽2 2 > 0, pero 𝜕 Pr(𝑡𝑎𝑥𝑖) 𝜕𝐼𝑛𝑔𝑟𝑒𝑠𝑜 < 0. 32
  • 33. Caso I: No ordenado Logit Multinomial • Independencia de Alternativas Irrelevantes (IIA) • Nótese que, dado un par de alternativas, digamos la 1 (auto) y la 3 (bus), el análisis no involucra a la restante opción (taxi). • Si por ejemplo elimináramos la posibilidad de transporte en taxi (opción 2), redefinimos las probabilidades restantes como 𝑃𝑖1 ∗ = 𝑃 𝑖1 𝑃 𝑖1+𝑃 𝑖3 y 𝑃𝑖3 ∗ = 𝑃 𝑖3 𝑃 𝑖1+𝑃 𝑖3 33
  • 34. Caso I: No ordenado Logit Multinomial • Luego, 𝑙𝑛 𝑃𝑖1 ∗ 𝑃𝑖3 ∗ = 𝒙𝑖 𝜷1 • Que es lo mismo que la ecuación (4) pues ⁡ 𝑃𝑖1 ∗ 𝑃𝑖3 ∗ = 𝑃𝑖1 𝑃𝑖3 • Esta propiedad se llama “independencia de alternativas irrelevantes”, e indica que si agregamos o quitamos alternativas, las razones de probabilidad entre alternativas 𝑃𝑗/𝑃ℎ no se alteran. • Esta propiedad no es muy realista. 34
  • 35. Caso I: No ordenado Logit Multinomial • Si tuviéramos solamente {auto, bus}, supongamos que las probabilidades son 𝑃𝑎𝑢𝑡𝑜 = 0.3 y 𝑃𝑏𝑢𝑠 = 0.7. La razón de probabilidades es 0.3 0.7 = 0.4285. • Supongamos que agregamos la alternativa {taxi}, que es un sustituto cercano del auto particular. • Imaginemos que las nuevas probabilidades son: 𝑃𝑎𝑢𝑡𝑜 = 0.10, 𝑃𝑡𝑎𝑥𝑖 = 0.20 y 𝑃𝑏𝑢𝑠 = 0.7 • Luego, la razón de probabilidades de auto con bus cambia a 0.10 0.7 = 0.1428. • Con el logit multinomial, tal razón de probabilidades no cambia. 35
  • 36. Caso I: No ordenado Logit Multinomial • Deficiencias del Logit Multinomial: – Independencia de alternativas irrelevantes – Solo incluye como regresores a las características de los individuos 𝒙𝑖. 36
  • 37. Caso I: No ordenado Logit Condicional • Generalización: Modelo Logit Condicional • Este modelos permite introducir regresores que reflejen los atributos o características de las categorías, tal como las percibe el individuo i. • En el ejemplo del transporte, algunas de estas variables son: calidad del servicio, precios, distancia, etc. • Se utiliza el modelo de variables latentes llamado “Random Utility Model”. 37
  • 38. Caso I: No ordenado Logit Condicional • Por fines didácticos, empezaremos con el modelo más simple binomial. • Hay dos categorías o alternativas, 𝑗 = 1⁡𝑜⁡2. • Sea 𝑌𝑖𝑗 ∗ =⁡Nivel de utilidad de individuo 𝑖 escogiendo la alternativa 𝑗. • Ocurrirá que un individuo 𝑖 elige 𝑗 si: 𝑌ij ∗ = max⁡{ 𝑌𝑖1 ∗ , 𝑌𝑖2 ∗ } con lo cual se observará 𝑌𝑖𝑗 = 1 y 𝑌𝑖𝑘 = 0 ∀𝑘 ≠ 𝑗. 38
  • 39. Caso I: No ordenado Logit Condicional • Modelando las utilidades en función de las características del individuo i 𝑌𝑖1 ∗ = 𝒙𝑖 𝜷 𝟏 + 𝜀𝑖1 Utilidad si elige la opción 1 (Ejem: participa en el mercado laboral) 𝑌𝑖2 ∗ = 𝒙𝑖 𝜷 𝟐 + 𝜀𝑖2 Utilidad si elige la opción 2 (Ejem: no participa en el mercado laboral) 𝜀𝑖𝑗~𝑉𝑎𝑙𝑜𝑟⁡𝐸𝑥𝑡𝑟𝑒𝑚𝑜, 𝐹 𝜀𝑖𝑗 = exp⁡(−𝑒−𝜀 𝑖𝑗) 𝑓 𝜀𝑖𝑗 = exp⁡ −𝜀𝑖𝑗 − exp −𝜀𝑖𝑗 • Se observará que 𝑌𝑖1 = 1 si 𝑌𝑖1 ∗ > 𝑌𝑖2 ∗ . 39
  • 40. Caso I: No ordenado Logit Condicional • Restando: 𝑌𝑖1 ∗ − 𝑌𝑖2 ∗ = 𝒙𝑖 𝜷1 − 𝜷2 + (𝜀𝑖1 − 𝜀𝑖2) 𝑌𝑖 ∗ = 𝒙𝑖 𝜷 + 𝑢𝑖 donde esta probado que 𝑢𝑖 = 𝜀𝑖1 − 𝜀𝑖2 se distribuye como una logística. Luego se tiene el modelo logit. • La alternativa 2 es la base. • El vector 𝜷 estimado por logit es la resta de los vectores 𝜷1 y 𝜷2, por eso se interpreta la alternativa 1 en comparación con la base (alternativa 2). 40
  • 41. Caso I: No ordenado Logit Condicional • Las probabilidades de las alternativas 1 y 2 según este enfoque son: 𝑃𝑖1 = 𝑒 𝒙 𝑖 𝜷1 𝑒 𝒙 𝑖 𝜷1+𝑒 𝒙 𝑖 𝜷2 𝑃𝑖2 = 𝑒 𝒙 𝑖 𝜷 𝟐 𝑒 𝒙 𝑖 𝜷1+𝑒 𝒙 𝑖 𝜷2 Las cuales son equivalentes a las que vimos en el logit binomial (haciendo 𝛽 = 𝛽1 − 𝛽2) 𝑃𝑖1 = 𝑒 𝒙 𝑖 𝜷 𝑒 𝒙 𝑖 𝜷+1 𝑃𝑖2 = 1 𝑒 𝒙 𝑖 𝜷+1 41
  • 42. Caso I: No ordenado Logit Condicional • Similarmente el modelo logit multinomial con 𝑚 categorías se puede presentar con el modelo RUM como 𝑌𝑖𝑗 ∗ = 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗 • Ocurrirá que un individuo 𝑖 elige 𝑗 si: 𝑌𝑖𝑗 ∗ = max⁡{ 𝑌𝑖1 ∗ , 𝑌𝑖2 ∗ , … , 𝑌𝑖𝑚 ∗ } con lo cual se observará 𝑌𝑖𝑗 = 1 y 𝑌𝑖𝑘 = 0 ∀𝑘 ≠ 𝑗. También, la probabilidad de que 𝑖 elija 𝑗 es 𝑃𝑖𝑗 = 𝑒 𝒙 𝑖 𝜷 𝑗 𝑒 𝒙 𝑖 𝜷 𝑘𝑚 𝑘=1 42
  • 43. Caso I: No ordenado Logit Condicional Tomando como base a la categoría m, 𝑃𝑖𝑗 = 𝑒 𝒙 𝑖 𝜷 1+ 𝑒 𝒙 𝑖 𝜷 𝑘𝑚−1 𝑘=1 y 𝑃𝑖𝑚 = 1 1+ 𝑒 𝒙 𝑖 𝜷 𝑘𝑚−1 𝑘=1 • Ahora extendemos el modelo agregando más regresores. • Sea: • 𝒛𝑖𝑗 = Vector de atributos de categoría 𝑗 tal como los percibe individuo 𝑖 (p.ej.: comodidad, distancia, precio) 43
  • 44. Caso I: No ordenado Logit Condicional • Luego 𝑌𝑖𝑗 ∗ = 𝒛𝑖𝑗 𝜶 + 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗 donde 𝜶, 𝜷⁡son vectores de parámetros, y 𝜀𝑖𝑗~𝑉𝑎𝑙𝑜𝑟⁡𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝐹 𝜀𝑖𝑗 = exp⁡(−𝑒−𝜀 𝑖𝑗) 𝑓 𝜀𝑖𝑗 = exp⁡ −𝜀𝑖𝑗 − exp −𝜀𝑖𝑗 44
  • 45. Caso I: No ordenado Logit Condicional • Se puede demostrar que: 𝑃𝑖𝑗 = 𝑒 𝒛𝑖𝑗 𝜶+𝒙 𝑖 𝜷 𝑗 𝑒 𝒛 𝑖𝑘 𝜶+𝒙 𝑖 𝜷 𝑘𝑚 𝑘=1 • Con estas probabilidades se puede construir la función de verosimilitud, la cual se maximiza con respecto a 𝜶, 𝜷 𝟏, … , 𝜷 𝒎. • Para facilitar la interpretación se puede elegir una alternativa base, digamos la “m”. Entonces se estima el vector 𝜶 y los 𝑚 − 1 vectores 𝜷. 45
  • 46. Caso I: No ordenado Logit Condicional • Ventajas del logit condicional – Permite la inclusión de variables propias de las alternativas o categorías. • Desventajas del logit condicional – Aún se cumple la Independencia de Alternativas irrelevantes (poco realista). – Requiere una base de datos muy especial (datos de cada categoría para cada individuo). Por ejemplo, en la elección del transporte, para la variable tiempo de espera se necesita el tiempo de espera de la persona 𝑖 de cada una de las alternativas. 46
  • 47. Ejemplo: Logit Multinomial • Se pretende estimar los determinantes de la decisión de estudiar, trabajar o hacer ambas cosas. • Se usa la base de datos de ENAHO 2012. • Se regresionan las cuatro posibilidades (1=no hacer nada, 2= solo estudiar, 3=solo trabajar, 4= estudiar y trabajar), contra algunas variables como sexo, edad e ingresos familiares. 47
  • 48. Ejemplo: Logit Multinomial Total 18,508 100.00 4 3,604 19.47 100.00 3 7,750 41.87 80.53 2 4,335 23.42 38.65 1 2,819 15.23 15.23 dedica Freq. Percent Cum. . tab dedica if P208A>14 & P208A<25 Total 16,090 2,418 18,508 4 3,505 99 3,604 3 6,173 1,577 7,750 2 4,264 71 4,335 1 2,148 671 2,819 dedica 0 1 Total convcas . tab dedica convcas if P208A>14 & P208A<25 Nada Estudia Trabaja Estudia y Trabaja Nada Estudia Trabaja Estudia y Trabaja 48
  • 49. _cons 1.254727 .1877319 6.68 0.000 .886779 1.622674 GASHOG2D 7.84e-06 1.54e-06 5.08 0.000 4.81e-06 .0000109 convcas -2.099632 .1139519 -18.43 0.000 -2.322973 -1.87629 P208A -.0691895 .010161 -6.81 0.000 -.0891048 -.0492743 P207 .6141879 .0529173 11.61 0.000 .510472 .7179039 4 _cons -2.620248 .1678923 -15.61 0.000 -2.949311 -2.291185 GASHOG2D -8.03e-06 1.43e-06 -5.60 0.000 -.0000108 -5.22e-06 convcas -.3608565 .0584973 -6.17 0.000 -.4755091 -.246204 P208A .1778496 .0087947 20.22 0.000 .1606123 .1950869 P207 .8952164 .0469898 19.05 0.000 .803118 .9873148 3 _cons 3.599426 .1871194 19.24 0.000 3.232678 3.966173 GASHOG2D .0000168 1.47e-06 11.43 0.000 .0000139 .0000197 convcas -2.464972 .1308225 -18.84 0.000 -2.721379 -2.208565 P208A -.1931568 .0103402 -18.68 0.000 -.2134232 -.1728905 P207 .2414731 .0517325 4.67 0.000 .1400792 .3428671 2 1 (base outcome) dedica Coef. Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -21786.497 Pseudo R2 = 0.1012 Prob > chi2 = 0.0000 LR chi2(12) = 4907.40 Multinomial logistic regression Number of obs = 18508 Iteration 5: log likelihood = -21786.497 Iteration 4: log likelihood = -21786.497 Iteration 3: log likelihood = -21786.509 Iteration 2: log likelihood = -21789.671 Iteration 1: log likelihood = -21886.288 Iteration 0: log likelihood = -24240.195 . mlogit dedica P207 P208A convcas GASHOG2D if P208A>14 & P208A<25, b(1) nada Estudia Trabaja Estudia y Trabaja 49
  • 50. _cons -2.344699 .1707189 -13.73 0.000 -2.679302 -2.010096 GASHOG2D -8.95e-06 1.20e-06 -7.44 0.000 -.0000113 -6.59e-06 convcas .3653404 .1596006 2.29 0.022 .0525289 .6781519 P208A .1239673 .0095442 12.99 0.000 .105261 .1426736 P207 .3727148 .0457605 8.14 0.000 .2830259 .4624037 4 _cons -6.219674 .1598 -38.92 0.000 -6.532876 -5.906472 GASHOG2D -.0000248 1.24e-06 -20.09 0.000 -.0000272 -.0000224 convcas 2.104115 .1273818 16.52 0.000 1.854452 2.353779 P208A .3710064 .0087445 42.43 0.000 .3538676 .3881452 P207 .6537433 .04254 15.37 0.000 .5703664 .7371201 3 2 (base outcome) _cons -3.599426 .1871194 -19.24 0.000 -3.966173 -3.232678 GASHOG2D -.0000168 1.47e-06 -11.43 0.000 -.0000197 -.0000139 convcas 2.464972 .1308225 18.84 0.000 2.208565 2.721379 P208A .1931568 .0103402 18.68 0.000 .1728905 .2134232 P207 -.2414731 .0517325 -4.67 0.000 -.3428671 -.1400792 1 dedica Coef. Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -21786.497 Pseudo R2 = 0.1012 Prob > chi2 = 0.0000 LR chi2(12) = 4907.40 Multinomial logistic regression Number of obs = 18508 Iteration 5: log likelihood = -21786.497 Iteration 4: log likelihood = -21786.497 Iteration 3: log likelihood = -21786.509 Iteration 2: log likelihood = -21789.671 Iteration 1: log likelihood = -21886.288 Iteration 0: log likelihood = -24240.195 . mlogit dedica P207 P208A convcas GASHOG2D if P208A>14 & P208A<25, b(2) nada Estudia Trabaja Estudia y Trabaja 50
  • 51. GASHOG2D 8.33e-07 1.59e-07 5.25 0.000 5.22e-07 1.14e-06 convcas -.1581544 .0169366 -9.34 0.000 -.1913496 -.1249593 P208A -.0123815 .0010203 -12.14 0.000 -.0143812 -.0103818 P207 .0171736 .0056589 3.03 0.002 .0060824 .0282648 dy/dx Std. Err. z P>|z| [95% Conf. Interval] Delta-method dy/dx w.r.t. : P207 P208A convcas GASHOG2D Expression : Pr(dedica==4), predict(out(4)) Model VCE : OIM Average marginal effects Number of obs = 18508 . margins, dydx(*) pr(out(4)) 51
  • 52. Ejemplo: Logit Condicional • Elección del medio de transporte: • Se permite que haya características de los individuos y características de las categorías (medios de transporte) • La base de datos se ve así: 52
  • 53. ttme = Tiempo en el terminal (cero para carros) hinc = ingreso del hogar gc = costo generalizado mode = La elección de la persona 53
  • 54. _cons -.3249561 .5763335 -0.56 0.573 -1.454549 .8046369 hinc -.0511884 .0147352 -3.47 0.001 -.0800689 -.0223079 Train _cons -5.874813 .8020903 -7.32 0.000 -7.446882 -4.302745 hinc .0053735 .0115294 0.47 0.641 -.0172237 .0279707 Car _cons -1.744529 .6775004 -2.57 0.010 -3.072406 -.4166531 hinc -.0232107 .0162306 -1.43 0.153 -.055022 .0086006 Bus Air (base alternative) gc -.0109274 .0045878 -2.38 0.017 -.0199192 -.0019355 ttme -.0954606 .0104732 -9.11 0.000 -.1159876 -.0749335 transport mode Coef. Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -189.52515 Prob > chi2 = 0.0000 Wald chi2(5) = 105.78 max = 4 avg = 4.0 Alternative variable: transport Alts per case: min = 4 Case variable: id Number of cases = 210 Alternative-specific conditional logit Number of obs = 840 Iteration 4: log likelihood = -189.52515 Iteration 3: log likelihood = -189.52515 Iteration 2: log likelihood = -189.52526 Iteration 1: log likelihood = -189.64056 Iteration 0: log likelihood = -195.52759 . asclogit mode ttme gc, casevars(hinc) case(id) alternatives(transport) 54
  • 55. CASO II: CATEGORÍAS AGRUPADAS 55
  • 56. Caso II: Categorías Agrupadas Logit Anidado • Consideremos un caso similar al Logit Condicional en donde algunas de las categorías son muy “próximas” o similares. • Estas categorías similares pueden formar un subgrupo o rama de categorías. • Conviene pensar en un modelo en donde las decisiones se hacen en forma secuencial: primero se decide sobre las “ramas” o “grupos”, y luego por las categorías o alternativas en ellos. Luis García - PUCP (c) 56
  • 57. Caso II: Categorías Agrupadas Logit Anidado • Ejemplo: Elección del medio de transporte: {auto propio, taxi, bus} Bus Auto propio Taxi Auto Luis García - PUCP (c) 57
  • 58. Caso II: Categorías Agrupadas Logit Anidado • La decisión inicial es entre movilizarse en Bus o en un auto. Si se elige auto hay dos opciones, taxi o auto propio. • En este escenario, la probabilidad de elegir un taxi depende de que previamente se haya elegido la opción bus. Luis García - PUCP (c) 58
  • 59. Caso II: Categorías Agrupadas Logit Anidado Pr 𝑡𝑎𝑥𝑖 = Pr 𝑡𝑎𝑥𝑖 𝑎𝑢𝑡𝑜 ∗ Pr⁡( 𝑎𝑢𝑡𝑜) Pr 𝐴𝑢𝑡𝑜⁡𝑃𝑟𝑜𝑝𝑖𝑜 = Pr 𝐴𝑢𝑡𝑜⁡𝑃𝑟𝑜𝑝𝑖𝑜⁡ 𝐴𝑢𝑡𝑜) ∗ Pr 𝐴𝑢𝑡𝑜 Luis García - PUCP (c) 59
  • 60. Caso II: Categorías Agrupadas Logit Anidado • Logit Anidado (nested logit) • Generalizamos para el caso de random utility model (RUM). • Según el modelo, la utilidad del individuo i por elegir la alternativa j es: 𝑈𝑖𝑗 ∗ = 𝒛𝑖𝑗 𝜶 + 𝒙𝑖 𝜷 𝑗 + 𝜀𝑖𝑗 Luis García - PUCP (c) 60
  • 61. Caso II: Categorías Agrupadas Logit Anidado • Donde al igual que antes, 𝒛𝑖𝑗 = Vector de atributos de categoría 𝑗 tal como los percibe individuo 𝑖 (p.ej.: comodidad, distancia, tiempo), 𝒙𝑖 = Vector de características del individuo 𝑖 (p.ej.: edad, sexo, nivel educativo, ingresos). Luis García - PUCP (c) 61
  • 62. Caso II: Categorías Agrupadas Logit Anidado • Por simplicidad en la notación omitiremos el subíndice 𝑖. Entonces, 𝑈𝑗 ∗ = 𝒛𝑗 𝜶 + 𝒙𝜷 𝑗 + 𝜀𝑗 • Llamaremos 𝑉𝑗 = 𝒛 𝑗 𝜶 + 𝒙𝜷 𝑗. • Se asume que 𝜀𝑗 se distribuye como valor extremo. Luis García - PUCP (c) 62
  • 63. Caso II: Categorías Agrupadas Logit Anidado • Asumamos que hay en total 𝐽 alternativas o categorías, las cuales han sido agrupadas en 𝐿 ramas, 𝑙 = 1,2, … , 𝐿. Cada rama tiene 𝐽𝑙 categorías., donde 𝐽1 + 𝐽2 + ⋯ + 𝐽𝐿 = 𝐽 • La probabilidad de caer en la categoría 𝑗 ∈ 𝑙 se descompone en: Pr 𝑗 = Pr⁡( 𝑗|𝑙) ∙ Pr⁡( 𝑙) Luis García - PUCP (c) 63
  • 64. Caso II: Categorías Agrupadas Logit Anidado • Bajo los supuestos mencionados se puede comprobar que: Pr 𝑗 𝑙 = exp 1 𝜏𝑙 𝑉𝑗 exp 1 𝜏𝑙 𝑉𝑘𝑘∈𝐽 𝑙 • Se define el “valor inclusivo” de la rama 𝑚 como 𝐼𝑉𝑚 = 𝑙𝑛 exp 1 𝜏 𝑚 𝑉𝑘 𝑘∈𝐽 𝑚 Luis García - PUCP (c) 64
  • 65. Caso II: Categorías Agrupadas Logit Anidado • El valor inclusivo 𝐼𝑉𝑚 es una suerte de utilidad de la rama “𝑚”. • El parámetro 𝜏𝑙 es nuevo y debe ser estimado. • Por otra parte, la probabilidad de caer en la rama 𝑙 es: Pr 𝑙 = exp⁡( 𝜏𝑙 𝐼𝑉𝑙) exp⁡( 𝜏 𝑚 𝐼𝑉𝑚)𝑚 Luis García - PUCP (c) 65
  • 66. Caso II: Categorías Agrupadas Logit Anidado • Luego, la probabilidad de caer en la alternativa 𝑗 es Pr 𝑗 = exp 1 𝜏𝑙 𝑉𝑗 exp 1 𝜏𝑙 𝑉𝑘𝑘∈𝐽 𝑙 ∙ exp⁡( 𝜏𝑙 𝐼𝑉𝑙) exp⁡( 𝜏 𝑚 𝐼𝑉𝑚)𝑚 • Si 𝜏𝑙 = 1, entonces el modelo se resume al caso de Logit Condicional, y por lo tanto las ramas podría desagregarse. Luis García - PUCP (c) 66
  • 67. Caso II: Categorías Agrupadas Logit Anidado • Normalmente se espera que 𝜏𝑙 se encuentre en el intervalo unitario (0, 1] • Si 𝜏𝑙 < 0, un incremento en la utilidad de una alternativa 𝑗 de 𝑙 reduciría la probabilidad de elegir a la alternativa 𝑙. (No tiene sentido) • Si 𝜏𝑙 = 0, un incremento en la utilidad en una alternativa 𝑗 de 𝑙 no incrementaría la probabilidad de elegir a la rama 𝑙 (no tiene sentido). Luis García - PUCP (c) 67
  • 68. Caso II: Categorías Agrupadas Logit Anidado • Si 𝜏𝑙 > 1, tal incremento en la utilidad de 𝑗 elevaría no solo la probabilidad de elegir 𝑗 sino también de las demás alternativas en la rama 𝑙. (Podría generar un espiral explosivo). Luis García - PUCP (c) 68
  • 69. Caso II: Categorías Agrupadas Logit Anidado • Por último, el modelo puede ser estimado por máxima verosimilitud, en donde los parámetros 𝜷 𝑗 se estiman para cada alternativa menos una (la base, similar al logit multinomial), y los parámetros 𝜶 son generales para todas las ramas. • La función de verosimilitud que se maximiza es: 𝑙𝑛𝐿 = 𝑌𝑖𝑗𝑙ln⁡[Pr 𝑗 𝑙 𝑃𝑟 𝑙 ] 𝑗∈𝐽 𝑙 𝐿 𝑙=1 𝑛 𝑖=1 Luis García - PUCP (c) 69
  • 70. Ejemplo: Logit anidado • Usando los mismos datos de elección del medio de transporte, vamos a definir las siguientes ramas: Luis García - PUCP (c) 70 Aéreo Carro Bus Tren Transporte Público Otro
  • 71. Ejemplo: Logit anidado • Se utilizarán las mismas variables del ejemplo de Logit Condicional. – gc = costo generalizado del transporte – gtme = tiempo en el terminal – hinc = Ingreso del hogar. • En términos de los vectores, será: 𝑧𝑖𝑗 = [𝑡𝑡𝑚𝑒⁡𝑔𝑐] 𝑥𝑖 = [ℎ𝑖𝑛𝑐] Luis García - PUCP (c) 71
  • 72. Ejemplo: Logit anidado • Usaremos el comando nlogitrum, que es consistente con el modelo RUM que estamos desarrollando. (buscarlo con findit nlogitrum). Luis García - PUCP (c) 72
  • 73. Ejemplo: Logit anidado Luis García - PUCP (c) 73 N = number of observations at each level k = number of times alternative is chosen total 840 210 Train 210 63 Public 420 Bus 210 30 Car 210 59 Other 420 Air 210 58 type N transport N k tree structure specified for the nested logit model . nlogittree transport type, choice(mode) . nlogitgen type = transport(Other: Air | Car, Public: Train | Bus)
  • 74. Luis García - PUCP (c) 74 gen travel = 1 if transport=="Air" replace travel = 2 if transport=="Train" replace travel = 3 if transport=="Bus" replace travel = 4 if transport=="Car" label define travel 1 "air" 2 "train" 3 "bus" 4 "car", replace tab transport, gen(c_) /*en nlogitrum hay que introducir las ctes para cada categoría manualmente como dummies*/ rename c_1 c_air rename c_2 c_bus rename c_3 c_car rename c_4 c_train gen hinc_air=hinc*c_air /*para el ingreso es igual, sino entiende que es constante para cada categoría*/ gen hinc_bus=hinc*c_bus gen hinc_car=hinc*c_car gen hinc_train=hinc*c_train
  • 75. LR test of homoskedasticity (iv = 1): chi2(2)= 4.99 Prob > chi2 = 0.0827 /Public .8827306 .2207062 4.00 0.000 .4501543 1.315307 /Other 1.638208 .4323238 3.79 0.000 .7908685 2.485547 type IV params: c_train .1287731 .7574739 0.17 0.865 -1.355849 1.613395 hinc_train -.0490925 .0165844 -2.96 0.003 -.0815973 -.0165877 c_car -6.210651 1.180069 -5.26 0.000 -8.523543 -3.897759 hinc_car .0055489 .0168452 0.33 0.742 -.027467 .0385649 c_bus -1.355943 .8589491 -1.58 0.114 -3.039452 .3275666 hinc_bus -.0220306 .0177663 -1.24 0.215 -.0568519 .0127908 gc -.0178538 .0065678 -2.72 0.007 -.0307264 -.0049811 ttme -.103126 .016843 -6.12 0.000 -.1361377 -.0701143 travel mode Coef. Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -187.03247 Prob > chi2 = 0.0000 Dependent variable = mode LR chi2(10) = 208.1787 Levels = 2 Number of obs = 840 Nested logit, RUM consistent Luis García - PUCP (c) 75 nlogitrum mode ttme gc hinc_bus c_bus hinc_car c_car hinc_train c_train, group(id) nests(travel type)