La Teoría del Consumidor parte del supuesto de que los individuos tienen preferencias (gustos) sobre los bienes
Problema: las preferencias no son observables. No obstante, podemos inferir los gustos a partir de lo que los individuos eligen
Si eliges A cuando B también era posible, debe ser que te gusta más A que B
La teoría del consumidor es una rama de la microeconomía, que estudia el comportamiento de un agente económico en su carácter de consumidor de bienes y de servicios encaminada a la obtención de la curva de demanda del consumidor para los distintos bienes, llegando al concepto de utilidad marginal. Esta teoría relaciona las preferencias, las curvas de indiferencia y las restricciones presupuestarias a las curvas de demanda del consumidor.
El primer intento teórico encaminado a proporcionar una explicación válida de la formación de la demanda del consumidor es la teoría de la utilidad. Su fundamento básico se encuentra en el concepto de utilidad, entendida como la capacidad de un bien para satisfacer una necesidad humana.
1. MODELOS DE ELECCIÓN DISCRETA II
Julio Cesar Lavado Yarasca
Ing. Civil (Universidad Nacional de Ingeniería)
Mg. Economía (Universidad del Pacifico)
2. TEORIA DEL CONSUMIDOR
• La Teoría del Consumidor parte del supuesto de
que los individuos tienen preferencias (gustos)
sobre los bienes
• Problema: las preferencias no son observables. No
obstante, podemos inferir los gustos a partir de lo
que los individuos eligen
• Si eliges A cuando B también era posible, debe ser
que te gusta más A que B
Estudiamos la elección óptima del consumidor en
tres etapas:
1) Las preferencias del consumidor.
2) La restricción presupuestaria.
3) La elección del consumidor.
La teoría del consumidor es una rama de
la microeconomía, que estudia el comportamiento de
un agente económico en su carácter
de consumidor de bienes y de servicios encaminada a
la obtención de la curva de demanda del consumidor
para los distintos bienes, llegando al concepto de
utilidad marginal. Esta teoría relaciona
las preferencias, las curvas de indiferencia y
las restricciones presupuestarias a las curvas
de demanda del consumidor.
El primer intento teórico encaminado a proporcionar una
explicación válida de la formación de la demanda del consumidor
es la teoría de la utilidad. Su fundamento básico se encuentra en el
concepto de utilidad, entendida como la capacidad de un bien para
satisfacer una necesidad humana.
Gran parte de la economía del comportamiento surge
del hecho de que las personas tienen un lado emocional
e irracional que los modelos económicos tradicionales
no logran incorporar.
3. Modelos de elección discreta
La probabilidad
Ejemplo - Elección considerando la probabilidad
3. The LOGIT Model
The Independece of Irrelevant Alternatives IIA
Elasticities of choice
4. Sequencing Stochastic Choice
5. Choice Functions and Demand Functions
6. Calibration of Choice Models
Introducción
Multinomial Disaggregate Models
Binomial Disaggregate Models
Multinomial Aggregate Models
Binomial Aggregate Models
ANEXOS
1. Demostración del desarrollo de las ecuaciones de probabilidad
2. Ejemplo distribución multinomial
4. 𝑝𝑖=prob 𝑈𝑖 > 𝑈𝑗
𝑝𝑖=prob 𝑉𝑖 + 𝜀𝑖 > 𝑉
𝑗 + 𝜀𝑗
𝑝𝑖=prob 𝜀𝑗 < 𝑉𝑖 − 𝑉
𝑗 + 𝜀𝑖 ó 𝑝𝑖=prob 𝜀𝑗 < 𝜀 atribuimos en esta ecuación como si toda la información fuera NO observada
𝑝𝑖= 𝑓 𝜀 𝑑(𝜀) se conoce que la función f(𝜀) = 𝑓 𝜀1, 𝜀2, … , 𝜀𝑖−1, 𝜀𝑖, 𝜀𝑖+1, … , 𝜀𝐽−1, 𝜀𝐽
= 𝑓 𝜀1 . 𝑓 𝜀2 … 𝑓 𝜀𝑖−1 𝑓 𝜀𝑖 𝑓 𝜀𝑖+1 … 𝑓 𝜀𝐽−1 𝑓 𝜀𝐽
= 𝐽 𝑓(𝜀𝐽)
MODELOS DE ELECCION DISCRETA
Probabilidad
Los errores 𝜀𝑖 y 𝜀𝑗 son los máximos de varios variables aleatorias, los cuales capturan los atributos no
observables como el estado de ánimo, experiencia, errores de medición y errores de especificación
The Extreme Value distribution EV(𝜂, 𝜇) [Gumbel = EV Tipo I]
𝑓 𝑡 = 𝜇𝑒−𝜇(𝑡−𝜂)𝑒−𝑒−𝜇(𝑡−𝜂)
𝑝 𝜀 ≤ 𝑐 = 𝐹 𝑐 =
−∞
𝑐
𝑓 𝑡 𝑑𝑡
= 𝑒−𝑒−𝜇(𝑐−𝜂)
Probability density
function (pdf)
Cumulative distribution
function (cdf)
𝑈𝑖 = 𝑉𝑖 + 𝜀𝑖
Credit: Getty
Images/iStockph
oto
Copyright:
chege011
5. 𝑝𝑖=prob 𝑈𝑖 > 𝑈𝑗
𝑝𝑖=prob 𝑉𝑖 + 𝜀𝑖 > 𝑉
𝑗 + 𝜀𝑗
𝑝𝑖=prob 𝜀𝑗 < 𝑉𝑖 − 𝑉
𝑗 + 𝜀𝑖 ó 𝑝𝑖=prob 𝜀𝑗 < 𝜀 atribuimos en esta ecuación como si toda la información fuera NO observada
𝑝𝑖= 𝑓 𝜀 𝑑(𝜀) se conoce que la función f(𝜀) = 𝑓 𝜀1, 𝜀2, … , 𝜀𝑖−1, 𝜀𝑖, 𝜀𝑖+1, … , 𝜀𝐽−1, 𝜀𝐽
= 𝑓 𝜀1 . 𝑓 𝜀2 … 𝑓 𝜀𝑖−1 𝑓 𝜀𝑖 𝑓 𝜀𝑖+1 … 𝑓 𝜀𝐽−1 𝑓 𝜀𝐽
= 𝐽 𝑓(𝜀𝐽)
MODELOS DE ELECCION DISCRETA
Probabilidad
Los errores 𝜀𝑖 y 𝜀𝑗 son los máximos de varios variables aleatorias, los cuales capturan los atributos no
observables como el estado de ánimo, experiencia, errores de medición y errores de especificación
The Extreme Value distribution EV(𝜂, 𝜇) [Gumbel = EV Tipo I]
𝑓 𝑡 = 𝜇𝑒−𝜇(𝑡−𝜂)𝑒−𝑒−𝜇(𝑡−𝜂)
𝑝 𝜀 ≤ 𝑐 = 𝐹 𝑐 =
−∞
𝑐
𝑓 𝑡 𝑑𝑡
= 𝑒−𝑒−𝜇(𝑐−𝜂)
Probability density
function (pdf)
Cumulative distribution
function (cdf)
16. 𝐹(𝑥) = 𝑒−𝜃𝑒−𝑥
(cumulative function)
𝑓(𝑥) = 𝜃𝑒−𝑥
𝑒−𝜃𝑒−𝑥
(density function)
𝑝𝑖= 𝜀𝑖=−∞
+∞
𝑓 𝜀𝑖 𝑖≠𝑗 𝐹𝜀𝑗
𝑑 𝜀𝑖
𝑝𝑖=
𝜀𝑖=−∞
+∞
𝜃𝑒−𝜀𝑖𝑒−𝜃𝑒−𝜀𝑖
𝑖≠𝑗
𝑒−𝜃𝑒
−(𝑉𝑖−𝑉𝑗+𝜀𝑖)
𝑑 𝜀𝑖
MODELOS DE ELECCION DISCRETA - LOGIT
Este modelo se deriva asumiendo una distribución Gumbel (ó doble exponencial ó extreme value type
1 (EV1) distribution) de 𝜀𝑗 además de ser IID (Independiente e idénticamente distribuido)
𝑓(𝑥) =
𝜕𝐹(𝑥)
𝜕𝑥
𝑝𝑖=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
LOGIT
𝑝𝑖=
𝑒𝑉𝑖
𝑒𝑉𝑖 + 𝑒𝑉𝑗
LOGIT BINOMIAL
LOGIT MULTINOMIAL
17. Utilidad aleatoria:
Este concepto es fundamental para la modelación de la demanda de viajes, el siguiente ejemplo
ilustra una caso especifico.
La clave en las estimaciones de las probabilidades es asumir asunciones respecto a la función
distribución de la probabilidad del termino aleatorio 𝜀𝑖𝑗
Asumiendo para el ejemplo dos opciones j=1 y 2
Ejemplo - Elección considerando la probabilidad
𝑉1 = 𝑈1 + 𝜀1
𝑉2 = 𝑈2 + 𝜀2
𝑉1 = 3 + 𝜀1
𝑉2 = 2.75 + 𝜀2
𝜀𝑖𝑗 : Se encuentra distribuido de acuerdo a la probabilidad de Bernoulli y se cumple su
independencia
𝑃(𝜀1=0.5) = 0.6
𝑃(𝜀2=0.5) = 0.6
𝑃(𝜀1=−0.5) = 0.4
𝑃(𝜀2=−0.5) = 0.4
𝑃 : Es la probabilidad de elección de un individuo, por lo qu ela elección de la primera alternativa será
𝑃(𝑉1 > 𝑉2)
𝑃(𝑉1 > 𝑉2) =𝑃 3 + 𝜀1 > 2.75 + 𝜀2
𝑃(𝑉1 > 𝑉2) =𝑃 𝜀2 − 𝜀1 < 0.25
18. 𝑉1 = 3 + 𝜀1
𝑉2 = 2.75 + 𝜀2
𝑃(𝜀1=0.5) = 0.6
𝑃(𝜀2=0.5) = 0.6
𝑃(𝜀1=−0.5) =
0.4
𝑃(𝜀2=−0.5) =
0.4
𝑃(𝑉1 > 𝑉2) =𝑃 𝜀2 − 𝜀1 < 0.25
• Esta probabilidad es posible determinarla
analíticamente para este caso, existiendo 4
combinaciones para los valores posibles de de
𝜀2 𝑦 𝜀1, de forma grafica se presenta dichas
posibilidades en el siguiente gráfico:
𝜀1
𝜀2
𝜀2 = 0.25 + 𝜀1
𝐵
𝐷
𝐴
𝐶
-0.5
-0.5
0.5
0.5
𝑃 𝐴 = 𝑃 𝜀1 = 0.5 𝑃 𝜀2 = 0.5 = 0.6 0.6 =0.36
𝑃 𝐵 = 𝑃 𝜀1 = −0.5 𝑃 𝜀2 = 0.5 = 0.4 0.6 =0.24
𝑃 𝐶 = 𝑃 𝜀1 = 0.5 𝑃 𝜀2 = −0.5 = 0.6 0.4 =0.24
𝑃 𝐷 = 𝑃 𝜀1 = −0.5 𝑃 𝜀2 = −0.5 = 0.4 0.4 =0.16
• Donde la condición 𝜀2 − 𝜀1 < 0.25, se cumple solo para los puntos A, C y D. Por lo tanto se cumple
que:
𝑃1 = 𝑃(𝑉1 > 𝑉2) =𝑃 𝜀2 − 𝜀1 < 0.25 = 𝑃 𝐴 + 𝑃 𝐷 + 𝑃 𝐶 = 0.36 + 0.16 + 0.24 = 0.76
𝑃2 = 1 − 0.76 = 0.24
• Lográndose así una atracción de la alternativa 1, superior a la alternativa 2, pero no en su totalidad
como si sucede en el caso de una asignación “todo o nada”.
Ejemplo - Elección considerando la probabilidad
19. 𝑉1 = 3 + 𝜀1
𝑉2 = 2.75 + 𝜀2
𝑃(𝑉1 > 𝑉2) =𝑃 𝜀2 − 𝜀1 < 0.25
𝑃2
(𝑈2 − 𝑈1)
𝑈2 > 𝑈1
𝑈1 > 𝑈2 𝑈1 = 𝑈2
Sin embargo, a medida que 𝑈2- 𝑈1 se vuelve
infinitamente grande, la alternativa 2
debería atraer una fracción cada vez mayor
de la demanda total.
Además, dado que se supone que 𝜀 se
distribuyen de forma idéntica e
independiente, cuando 𝑈2 = 𝑈1 las
respectivas probabilidades de que se elijan
las dos alternativas deben ser iguales. y por
lo tanto igual a 0,5 cada uno.
Deterministic all-or-
nothing
Stochatic Logit
(𝑈2 − 𝑈1)
𝑃𝑖
Ejemplo - Elección considerando la probabilidad
20. 𝑉1 = 𝑈1 + 𝜀1
𝑉2 = 𝑈2 + 𝜀2
𝑉3 = 𝑈3 + 𝜀3
𝜀
Distribución
normal
Distribución Doble
exponencial
Probit
Logit
𝑃1 = 0.15
𝑃2 = 0.81
𝑃3 = 0.05
𝑆𝑖: 𝑉𝑖 = [−12, −10, −15]
𝑝𝑖=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝑝1=
𝑒−10
𝑒−12 + 𝑒−10 + 𝑒−15
= 0.12
𝑝2=
𝑒−10
𝑒−12 + 𝑒−10 + 𝑒−15
= 0.875
𝑝3=
𝑒−15
𝑒−12 + 𝑒−10 + 𝑒−15
= 0.005
Estos números son aproximadamente similares a los obtenidos del modelo PROBIT. Las diferencias
entre ellos ilustran una característica común al comparar los resultados de estos modelos.
El modelo logit resultante tiene la tendencia a reducir la elección del V (·) relativamente bajo como
con p (3) y aumentarlo con el V (·) relativamente alto como con p (2), en comparación con el modelo
PROBIT.
En numerosas aplicaciones, se encuentra que cuando se asume la independencia de las utilidades,
- Specify i.i.d. Gumbel distribution for f(ε) => Logit
Model.
3. The LOGIT Model
21. La elección entre estos dos
modelos debe hacerse
siempre sobre la base de si
el supuesto de
independencia puede
hacerse o no.
Esto, en general, está
relacionado con la
naturaleza del proceso de
elección en cuestión. Si hay
alternativas con atributos
similares, o con
componentes superpuestos,
como cuando las rutas
alternativas se superponen
en algunos enlaces,
entonces no se puede
asumir la independencia y el
PROBIT podría ser un mejor
modelo de elección.
En contraposición puede
considerarse una mejor
Para ilustrar la importancia de la superposición entre las
alternativas y los efectos del supuesto de independencia, se da el
siguiente ejemplo común.
I
II
III
I: Transporte privado usando una
vía de alta velocidad
II: Transporte público + Caminata
III: Transporte público + Car
(colectivo)
Si los viajeros perciben los atributos de estas tres
opciones de forma aleatoria de modo que e (i)
representa las diferencias entre los atributos reales y
percibidos de cada alternativa, entonces es poco
probable que las diferencias entre los valores
percibidos y reales de las alternativas II y III sería
independiente.
Esto se debe a que estas dos alternativas se
superponen en su mayor parte
3. The LOGIT Model
22. Si x= 0 entonces existe una superposición total entre II y III, generándose así solo dos alternativas
I y III
I
II
II
I
I: Transporte privado usando una
vía de alta velocidad
II: Transporte público + Caminata
III: Transporte público + Car
(colectivo)
A B
C
x
Si x= 1 entonces existe tres alternativas I, II y III mutuamente independientes
Si consideramos los valores de V(.) iguales para todos los casos se observa que:
Si x= 0
Si x=1
𝑝𝑖=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝑝𝐼 = 𝑝𝐼𝐼𝐼=
𝑒𝑉
𝑒𝑉 + 𝑒𝑉
= 0.5
𝑝𝐼 = 𝑝𝐼𝐼= 𝑝𝐼𝐼𝐼 =
𝑒𝑉
𝑒𝑉 + 𝑒𝑉 + 𝑒𝑉 = 0.33
Si consideramos como “x” una medición de la superposición entre II y III, se puede calcular las
probabilidades de cada opción para un caso de independencia (X=1) y una carencia de la misma
(x=0), por lo que es sencillo notar que se tendría un valor diferente a 0.33 al tener una perdida
de independencia, es decir aplicar un modelo con dependencia nos podría dar un resultado mas
realista que 0.33 (x=1), Daganzo y sheffi (1977) demostró esta variación de las probabilidad el
3. The LOGIT Model
23. Esto no significa que no pueda aplicarse un modelo de elección simplificado por el supuesto de
independencia, como el modelo Logit.
Cuando x es bajo, por ejemplo, se puede considerar no especificar II y III como alternativas distintas.
Cuando x es grande, una buena aproximación sería anidar las opciones y considerar primero la
elección entre alternativas cercanas como II y III y luego proceder a considerar la elección entre I por
un lado y II o III por el otro. (Opcion I: Transporte publico, Opción II: Transporte privado )
El enfoque da como resultado modelos que se
denominan de diversas formas modelo de elección
anidada (Nested choice models) o modelo de elección
en cascada (Cascading choice model).
En las aplicaciones de elección de ruta, es probable
que la superposición sea extensa y sustancial, ya que
es probable que muchos puntos de conexión
silenciosos en una red de transporte urbano
compartan enlaces. En tales aplicaciones, un modelo
de elección probit multinomial con dependencia
entre las funciones de elección es un modelo de
elección más adecuado.
3. The LOGIT Model
24. Esto indica que las probabilidades relativas entre dos alternativas
son solo una función de los atributos de estas dos y son
independientes de cualquier otra alternativa que pueda estar
disponible.
Esta propiedad de los modelos de elección se conoce como la
independencia de las alternativas irrelevantes y se considera una
debilidad de los modelos que la tienen, como el modelo logit
Por ejemplo, si se trata de opciones de modo urbano, esta
propiedad podría implicar que las probabilidades relativas de
tomar un automóvil en lugar de tomar un autobús son
independientes de si hay servicio de tren al mismo destino. Esto
no es probable, ya que es probable que la presencia de un tren
como tercera alternativa afecte la probabilidad de elegir el
autobús más que la de elegir el automóvil y, por lo tanto,
probablemente cambie sus probabilidades relativas.
𝑝𝑖=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝑝𝑗=
𝑒𝑉𝑗
∀𝑗 𝑒𝑉𝑗
𝑝𝑖
𝑝𝑗
=
𝑒𝑉𝑖
𝑒𝑉𝑗
3. The LOGIT Model
The Independece of Irrelevant Alternatives IIA
25. También es interesante notar que esta propiedad conduce a una
simplificación que hace que el modelo logit sea bastante sencillo
e intrínsecamente lineal.
Dado que la mayoría de las funciones V (·) se especifican como
función lineal, está claro que la ecuación. (5.22) representa una
gran simplificación. Por ejemplo, los parámetros del modelo logit
cuando se transforman en Eq. (5. 22) puede estimarse mediante
regresión lineal, aunque las estimaciones así obtenidas pueden
no ser eficientes.
Es posible realizar modificaciones en la formulación del modelo
logit para
superar esta debilidad. Pero, siempre que existan alternativas
similares de modo que la independencia de la alternativa
irrelevante sea limitante, entonces se debe utilizar el modelo
probit, que no tiene esta propiedad. De hecho, en tales casos, la
independencia entre las funciones de elección no puede asumirse
de todos modos.
ln
𝑝𝑖
𝑝𝑗
= ln
𝑒𝑉𝑖
𝑒𝑉𝑗
ln
𝑝𝑖
𝑝𝑗
=𝑉𝑖 − 𝑉
𝑗
𝑝𝑖
𝑝𝑗
=
𝑒𝑉𝑖
𝑒𝑉𝑗
3. The LOGIT Model
The Independece of Irrelevant Alternatives IIA
26. En algunos análisis de políticas que utilizan modelos de elección, uno
podría estar interesado en evaluar la sensibilidad de la elección de una
alternativa particular a los cambios en algunos de los atributos en la función
V (·) de la alternativa misma o de algunas de las otras alternativas.
𝑒𝑐 𝑆𝑖𝑘 = 𝑆𝑖𝑘 𝜃𝑖𝑘[1- 𝑝(𝑖)]
𝑒𝑐 𝑆𝑖𝑘 =
𝑆𝑖𝑘
𝑝(𝑖)
.
𝜕𝑝(𝑖)
𝜕𝑆𝑖𝑘
𝑉(𝑚,𝑗) = −0.2𝑡(𝑚,𝑗) − 0.1𝑐(𝑚,𝑗) 𝑝(𝑚,𝑗)=
𝑒𝑉(𝑚,𝑗)
∀𝑚 𝑒𝑉(𝑚,𝑗)
𝑒𝑐 𝑡𝑚 = 𝑡𝑚 𝜃𝑖𝑘[1- 𝑝(𝑖)]
𝜃𝑖𝑘=
𝜕𝑉(𝑖)
𝜕𝑆𝑖𝑘
𝜃𝑡=
𝜕𝑉(𝑖)
𝜕𝑡𝑚
Estas elasticidades indican la alta sensibilidad de cambio
modal cuando la elección probabilidad es pequeña como el
caso de p(2|3) y p(1|2)
3. The LOGIT Model
Elasticities of choice
27. En muchas aplicaciones, es necesario considerar el rango de elección de acuerdo con alguna secuencia.
Esto ocurre en el transporte urbano cuando se postula una secuencia en la que se asegura que las
opciones de modo, destino y ruta seguirán alguna secuencia.
También ocurre cuando se hace una elección entre grupos de alternativas y luego se sigue una elección
dentro del grupo elegido. Por ejemplo, se puede postular una jerarquía de opciones de nodo donde un
viajero puede decidir entre transporte público y privado y, en el caso de que se elija el primero, se
puede elegir entre los modos públicos que pueden estar disponibles.
En tal caso, la elección del transporte público dependería del valor esperado de la utilidad de sus
modos, tal como lo percibe el viajero. Asimismo, si la elección de un nodo se produce después de la
elección del destino en un proceso secuenciado, entonces la elección de cada destino se basará
básicamente en los atributos de suministro esperados de todos los nodos que sirven al destino, de
nuevo según la percepción del usuario.
Puede recordarse del capítulo anterior que la elección secuenciada en el caso determinista se basó en el
promedio ponderado de los atributos de oferta en cada nivel de la jerarquía de elección.
Este promedio ponderado es análogo al valor esperado de los atributos reales representados por las
funciones V (·) en una función de elección estocástica.
4. Sequencing Stochastic Choice
28. El valor esperado de la función de elección
𝑈𝑖 = 𝑉𝑖 + 𝜀𝑖
𝑝𝑖 𝑖 = 1,2,3 … 𝑛
𝑉 = 𝑖 𝑝𝑖 𝑉𝑖
Sin embargo, estrictamente, esta no es la
medida correcta de las utilidades
esperadas que se utilizarán para predecir
la elección en la siguiente jerarquía de
elección. Sólo es correcto en el caso de la
elección determinista, y sólo una
aproximación en el caso de la elección
estocástica. En este último caso, es el
valor esperado de los atributos
percibidos lo que es relevante.
Esto se puede calcular encontrando el
valor esperado 𝑉 de la utilidad U de la
alternativa elegida.
4. Sequencing Stochastic Choice
29. 𝑉 = 𝐸[max
𝑖
𝑈𝑖]
Donde f(.) es la función de densidad conjunta dado por el componente aleatorio. Daganzo y Sheffi
(1977), demostraron que al considerar que no hay relación entre “V” y el termino “e”, se deduce que:
𝑉 = 1 2
… 𝑛
[max
𝑖
𝑈𝑖]𝑓 𝑈1, 𝑈2, … , 𝑈𝑛 𝑑𝑈1.d 𝑈2, … , 𝑑𝑈𝑛
𝑈𝑖 = 𝑉𝑖 + 𝜀𝑖
𝑉 = 1 2
… 𝑛
[max
𝑖
𝑉𝑖 + 𝜀𝑖]𝑓 𝜀1, 𝜀2, … , 𝜀𝑛 𝑑𝜀1.d𝜀2, … , 𝑑𝜀𝑛
𝜕𝑉
𝜕𝑉𝑖
= 𝑝𝑖
𝑝𝑖=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝜕𝑉
𝜕𝑉𝑖
=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝑉 =
𝑉𝑖
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝑉 = ln
∀𝑗
𝑒𝑉𝑗
c
v
c
v
De manera similar, el valor esperado percibido de cualquier atributo en una
función lineal V(.), digamos Xk, se puede obtener como:
𝜃𝑘=
𝜕𝑉(𝑖)
𝜕𝑋𝑘
𝑋𝑘 =
1
𝜃𝑘
ln
∀𝑗
𝑒𝑉𝑗
4. Sequencing Stochastic Choice
30. La diferencia entre 𝑉 y 𝑉 es que el primero es el valor esperado del máximo de un conjunto de
variables aleatorias, mientras que el segundo es un valor ponderado promedio de los valores
esperados de estas variables aleatorias.
Incluso usar Vmax como una medida de la utilidad de una elección no es correcto, ya que reflejará el
máximo de los valores esperados, que no es el mismo que el valor esperado de la máximo. El uso de
𝑉 o Vmax para la elección de secuenciación debe reconocerse como una aproximación que no debe
hacerse cuando se usa el modelo logit ya que la ecuación, es bastante fácil de usar.
Ejemplo
𝑉(𝑚,𝑗) = −0.2𝑡(𝑚,𝑗)
𝑡𝑚𝑗 =
𝑟
𝑡𝑚𝑗𝑟.𝑝 𝑟 𝑚, 𝑗
𝑝(𝑚|𝑗)=
𝑒𝑉(𝑚,𝑗)
∀𝑚 𝑒𝑉(𝑚,𝑗)
4. Sequencing Stochastic Choice
31. Podemos calcular los valores reales esperados 𝑉
𝑗 o 𝑡𝑗 para cada destino utilizando los promedios
ponderados por las probabilidades de elección condicionales. Dado que 𝑉 = −0.2𝑡, podemos limitar
nuestras comparaciones a 𝑡𝑗 y compararlo con 𝑡𝑗
𝑡𝑗 = 𝑡1𝑗 𝑝(1|𝑗) + 𝑡2𝑗 𝑝(2|𝑗)
𝑡𝑗 = 20 x 0.73 + 25 x 0.27 ; 30 x 0.88 + 40 x 0.12
𝑡𝑗 = 21.34 ; 31.19
𝑉 = 𝑖 𝑝𝑖 𝑉𝑖
𝑋𝑘 =
1
𝜃𝑘
ln
∀𝑗
𝑒𝑉𝑗 𝑡𝑗 =
1
−0.2
[ln( 𝑒−0.2𝑡𝑗11 + 𝑒−0.2𝑡𝑗12); ln( 𝑒−0.2𝑡𝑗21 + 𝑒−0.2𝑡𝑗22)]
𝑡𝑗 = [18.43 ; 29.37]
𝑡𝑗 =
1
−0.2
[ln( 𝑒−0.2(20)
+ 𝑒−0.2(25)
); ln( 𝑒−0.2(30)
+ 𝑒−0.2(40)
)]
Los valores de 𝑡𝑗 son más
apropiados para su inclusión
en el modelo de elección de
destino que 𝑡𝑗 ya que
representan los valores
percibidos sobre la base de
los cuales presumiblemente
se hacen las elecciones. No
debe sorprendernos que los
valores de 𝑡𝑗 sean inferiores
a los valores mínimos de 𝑡𝑚𝑗
para cada 𝑗, ya que
representan el resultado de
un proceso de percepción
estocástica.
Cuando se postula un proceso de elección secuenciado y se utiliza un enfoque
de elección estocástica, es aconsejable · utilizar un modelo logit y calcular 𝑉
para la secuenciación.
Al postular un modelo determinista de elección, entonces 𝑉 es válido para la
secuenciación.
Cuando la secuenciación es necesaria por alternativas agrupadas debido a la
superposición de atributos, entonces es mejor utilizar un modelo probit con una
4. Sequencing Stochastic Choice
32. En la mayoría de los casos, no es suficiente conocer las probabilidades de elección; es necesario estimar
el volumen de usuarios en cualquier sistema de transporte. Para ello, se debe explorar la relación entre
los modelos de elección y los modelos de demanda.
en general, si se sabe que N personas están haciendo un viaje y que cierta proporción de ellas está
eligiendo ciertos modos, rutas o destinos, entonces es posible estimar los volúmenes de tráfico
específicos involucrados. En el caso determinista, esto se hace simplemente multiplicando N con las
proporciones de elección,
𝑝(𝑚,𝑗,𝑟) = [0.12 , 0.875 , 0.005]
1,000 viajes distribuidos en los tres modos
𝑋𝑚𝑗𝑟 = 𝑁 𝑝(𝑚,𝑗,𝑟)
𝑋𝑚𝑗𝑟 = 1,000 [0.12 , 0.875 , 0.005]
Varianza
𝑉𝐴𝑅(𝑋𝑚𝑗𝑟) = 1,000 [0.12*0.88; 0.875*0.125;
0.005*0.995]
= [105.6 ; 109.4 ; 4.975]
Cuando el modelo de elección utilizado es estocástico, entonces el número de viajes será una variable
aleatoria con una distribución multinomial y con un valor esperado
𝐸(𝑋𝑚𝑗𝑟) = 𝑁 𝑝(𝑚,𝑗,𝑟)
𝑉𝐴𝑅(𝑋𝑚𝑗𝑟) = 𝑁 𝑝(𝑚,𝑗,𝑟)[1 − 𝑝(𝑚,𝑗,𝑟)]
𝑋𝑚𝑗𝑟 = 𝑁 𝑝(𝑚,𝑗,𝑟)
5. Choice Functions and Demand Functions
35. El proceso de calibración de los modelos de elección consiste en estimar los valores de los parámetros,
evaluar la significancia estadística de las estimaciones y luego validar el modelo comparando su
predicción con el comportamiento observado.
Los dos primeros pasos generalmente se llevan a cabo simultáneamente como un proceso estadístico de
estimación. El tercero requiere que las predicciones del modelo se comparen con datos reales,
preferiblemente distintos de los utilizados para estimar los parámetros. (70 – 30%)
Dado que la mayoría de los modelos de elección son no lineales, su estimación suele ser más complejo
que el de los modelos de demanda simples que se pueden linealizar. Las técnicas de regresión y los
métodos de estimación de mínimos cuadrados tienen aquí aplicaciones bastante limitadas, ya que estas
técnicas no son adecuadas para modelos no lineales. La única excepción es cuando se utiliza un modelo
logit binario, con datos de elección de mercado agregados. En tal caso, se puede obtener una forma
lineal simple, como en la Ecuacion , siempre que las funciones de elección V (·) sean
lineales, que casi siempre es el caso. Esta función lineal se puede estimar con análisis de regresión.
Ejemplo
10
Encuestados
4
6
𝑡𝑏𝑢𝑠 = 47 𝑚𝑖𝑛
𝑡𝑐𝑎𝑟 = 38 𝑚𝑖𝑛
𝑈𝑖 = 𝛼𝑇𝑖 + 𝜀𝑖
𝑈𝑏𝑢𝑠 = 𝛼𝑇𝑏𝑢𝑠 + 𝜀𝑏𝑢𝑠
𝑈𝑐𝑎𝑟 = 𝛼𝑇𝑐𝑎𝑟 + 𝜀𝑐𝑎𝑟
6. Calibration of Choice Models
Introducción
36. Ejemplo
10
Encuestados
4
6
𝑡𝑏𝑢𝑠 = 47 𝑚𝑖𝑛
𝑡𝑐𝑎𝑟 = 38 𝑚𝑖𝑛
𝑈𝑖 = 𝛼𝑇𝑖 + 𝜀𝑖
𝑈𝑏𝑢𝑠 = 𝛼𝑇𝑏𝑢𝑠 + 𝜀𝑏𝑢𝑠
𝑈𝑐𝑎𝑟 = 𝛼𝑇𝑐𝑎𝑟 + 𝜀𝑐𝑎𝑟
𝑝𝑖=
𝑒𝑉𝑖
∀𝑗 𝑒𝑉𝑗
𝑝𝑏𝑢𝑠=
𝑒𝛼𝑇𝑏𝑢𝑠
𝑒𝛼𝑇𝑏𝑢𝑠 + 𝑒𝛼𝑇𝑐𝑎𝑟
𝑝𝑐𝑎𝑟=
𝑒𝛼𝑇𝑐𝑎𝑟
𝑒𝛼𝑇𝑏𝑢𝑠 + 𝑒𝛼𝑇𝑐𝑎𝑟
𝑝𝑐𝑎𝑟
𝑝𝑏𝑢𝑠
=
𝑒𝛼𝑇𝑐𝑎𝑟
𝑒𝛼𝑇𝑏𝑢𝑠
𝑝𝑐𝑎𝑟
𝑝𝑏𝑢𝑠
=𝑒𝛼(𝑇𝑐𝑎𝑟−𝑇𝑏𝑢𝑠)
6
10
4
10
=𝑒𝛼(38−47)
3
2
=𝑒𝛼(−9)
ln
3
2
−9
= 𝛼
𝛼=-0.045
Si la función V (·) hubiera contenido más variables que en
este caso, entonces podría usarse una regresión simple para
estimar los parámetros.
Tenga en cuenta que en este caso simple, solo se podría
estimar un parámetro, ya que efectivamente hay una pieza
de información, a saber, 𝑝𝑐𝑎𝑟 = 0.6 y 𝑝𝑏𝑢𝑠 = 1 − 0.6 , Para
estimar un mayor número de parámetros se requeriría un
mayor número de observaciones en forma de probabilidades
de elección para otros grupos que enfrentan diferentes
valores de 𝑇𝑐𝑎𝑟 y 𝑇𝑏𝑢𝑠.
En general, los parámetros de un modelo de elección modal
6. Calibration of Choice Models
Introducción
40. El modelo de elección se puede escribir
como:
𝑝𝑛𝑘 = 𝑓𝑘(𝑉(𝑛,𝑘)) 𝑑𝑜𝑛𝑑𝑒:
Para estimar los parámetros del modelo 𝑎𝑖𝑘, observamos un número
de individuos N y tomamos nota de la elección de cada individuo, al
mismo tiempo, observamos los valores de 𝑥𝑖𝑛𝑘.
Para construir la función de verosimilitud de las elecciones
observadas, definimos la siguiente variable aleatoria:
𝑉(𝑛,𝑘) = 𝑎𝑖𝑘𝑥𝑖𝑛𝑘
𝑌𝑛𝑘=
1 𝑠𝑖 𝑒𝑙 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜 𝑛 𝑒𝑙𝑖𝑔𝑒 𝑙𝑎 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎 𝑘
0 𝑒𝑛 𝑙𝑜𝑠 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
𝑁𝑘= 𝑛=1
𝑁
𝑌𝑛𝑘
𝑁𝑘 se convierte en el número de individuos que eligen la
alternativa k en la muestra observada.
Ahora dividimos la muestra N en K subconjuntos 𝑆𝑘, cada uno de
los cuales contiene los 𝑁𝑘 individuos que seleccionan la
alternativa k.
𝑌_𝑛𝑘 Bus Car Train
1 0 1 0
2 1 0 0
3 0 1 0
4 1 0 0
5 0 0 1
6 0 0 1
7 1 0 0
8 1 0 0
9 0 0 1
10 1 0 0
11 1 0 0
12 0 0 1
13 1 0 0
14 0 1 0
15 0 0 1
16 0 1 0
17 0 1 0
18 0 0 1
19 0 0 1
20 0 0 1
N_k 7 5 8 20
Calibration of Choice Models
Multinomial Disaggregate Models
41. El modelo de elección se puede
escribir como:
𝑝𝑛𝑘 = 𝑓𝑘(𝑉(𝑛,𝑘)) 𝑑𝑜𝑛𝑑𝑒: 𝑉(𝑛,𝑘) = 𝑎𝑖𝑘𝑥𝑖𝑛𝑘
Suponiendo que los valores de Ynk representan los resultados de
los ensayos independientes de Bemoulli, es decir, asumiendo que
las elecciones de diferentes individuos son independientes,
entonces la probabilidad de 𝑁𝑘 individuales en cada subconjunto
𝑆𝑘 viene dada por la distribución multinomial.
Por tanto, la probabilidad de la muestra observada viene dada por:
𝑌_𝑛𝑘 Bus Car Train
1 0 1 0
2 1 0 0
3 0 1 0
4 1 0 0
5 0 0 1
6 0 0 1
7 1 0 0
8 1 0 0
9 0 0 1
10 1 0 0
11 1 0 0
12 0 0 1
13 1 0 0
14 0 1 0
15 0 0 1
16 0 1 0
17 0 1 0
18 0 0 1
19 0 0 1
20 0 0 1
N_k 7 5 8 20
𝑆𝑐𝑎𝑟 = 1,3,14,16,17 𝑁𝑐𝑎𝑟 = 5
𝑆𝑏𝑢𝑠 = 2,4,7,8,10,11,13 𝑁𝑏𝑢𝑠 = 7
𝑆𝑡𝑟𝑎𝑖𝑛 = 5,6,9,12,15,18,19,20 𝑁𝑡𝑟𝑎𝑖𝑛 = 8
Λ = 𝑝 𝑁1, 𝑁2, … , 𝑁𝑘 𝐴
Λ =
𝑁!
𝑁1!.𝑁2!. … .𝑁𝑘! 𝑘 𝑛∈𝑆𝑘
𝑝𝑛𝑘
Calibration of Choice Models
Multinomial Disaggregate Models
42. 𝑝𝑛𝑘 = 𝑓𝑘(𝑉(𝑛,𝑘)) 𝑑𝑜𝑛𝑑𝑒: 𝑉(𝑛,𝑘) = 𝑎𝑖𝑘𝑥𝑖𝑛𝑘
𝑌_𝑛𝑘 Bus Car Train
1 0 1 0
2 1 0 0
3 0 1 0
4 1 0 0
5 0 0 1
6 0 0 1
7 1 0 0
8 1 0 0
9 0 0 1
10 1 0 0
11 1 0 0
12 0 0 1
13 1 0 0
14 0 1 0
15 0 0 1
16 0 1 0
17 0 1 0
18 0 0 1
19 0 0 1
20 0 0 1
N_k 7 5 8 20
Λ = 𝑝 𝑁1, 𝑁2, … , 𝑁𝑘 𝐴
Λ =
𝑁!
𝑁1!.𝑁2!. … .𝑁𝑘! 𝑘 𝑛∈𝑆𝑘
𝑝𝑛𝑘
Tomando logaritmos y
eliminando el factor
constante para la
maximización de la
verosimilitud
Λ∗
=
𝑘 𝑛∈𝑆𝑘
𝑝𝑛𝑘
𝜕Λ∗
𝜕𝑎𝑖𝑘
= 0 ∀𝑖
Asintóticamente eficiente,
consistente y
normalmente distribuido
Para estimar y evaluar los valores de los parámetros de una
elección depende de la forma del modelo en sí. El modelo
Logit, por ejemplo, se presta a una estimación relativamente
sencilla. El modelo Probit, por otro lado, requiere
procedimientos computacionales que son bastante complejos
Calibration of Choice Models
Multinomial Disaggregate Models
43. 𝑉(𝑛,𝑘) = 𝑎𝑖𝑘𝑥𝑖𝑛𝑘
Cabe señalar que la especificación del modelo implica a través de los
parámetros 𝑎𝑖𝑘 que la elección es especificada por alternativa más que
específica del atributo. Esto se debe a que los parámetros 𝑎𝑖𝑘 pueden diferir
para cualquier variable i de una alternativa k.
Un caso especial de esto es cuando 𝑎𝑖𝑘 = 𝑎𝑖 lo que significa que los atributos
tienen el mismo efecto en la elección independientemente de la alternativa que
describieron.
El modelo entonces presentado contiene un mayor número de parámetros y
requiere más datos para su calibración. Tiene la ventaja potencial de capturar
los efectos de factores que son específicos de las alternativas. Su desventaja es
que no es tan susceptible de análisis de políticas como la opción de atributo
específico porque no puede predecir las probabilidades de elección de
alternativas nuevas, ya que no existirán valores de parámetro para ellas.
Λ = 𝑝 𝑁1, 𝑁2, … , 𝑁𝑘 𝐴
Λ =
𝑁!
𝑁1!.𝑁2!. … .𝑁𝑘! 𝑘 𝑛∈𝑆𝑘
𝑒
𝑉(𝑛,𝑘)
𝑘 𝑒
𝑉(𝑛,𝑘)
Calibration of Choice Models
Multinomial Disaggregate Models
45. 𝜕Λ∗
𝜕𝑎𝑖𝑘
= 𝑘 𝑛∈𝑆𝑘
𝑥𝑖𝑛𝑘 − 𝑘 𝑛∈𝑆𝑘
𝑥𝑖𝑛𝑘
𝑒
𝑉(𝑛,𝑘)
𝑘 𝑒
𝑉(𝑛,𝑘)
=0
Λ =
𝑛∈𝑆1
𝑉(𝑛,1) +
𝑛∈𝑆1
𝑉(𝑛,2) −
𝑛
ln(𝑒𝑉 𝑛,1 + 𝑒𝑉(𝑛,2))
El lado derecho es específico de cada individuo y, por lo
tanto, no es posible obtener diferentes observaciones
para p (1) / p (2) para calibrar sus parámetros. La
linealización de la ecuación. (5.52) y el uso de regresión
para la estimación de los parámetros solo se puede
hacer en el caso agregado.
Es bastante engorroso ilustrar la estimación del modelo
desagregado con un ejemplo numérico, ya que el
número de probabilidades que se necesita calcular es
bastante grande e igual al producto del número de
individuos de la muestra por el número de alternativas.
Sin embargo, podemos ilustrar la construcción de la
función de verosimilitud, por ejemplo, con un tamaño de
muestra pequeño y un modelo de elección muy simple.
Calibration of Choice Models
Multinomial Disaggregate Models
49. Λ =
𝑁!
𝑁1!.𝑁2!. … .𝑁𝑘! 𝑘 𝑝𝑛𝑘
𝑁𝑘
Tomando logaritmos y
eliminando el factor
constante para la
maximización de la
verosimilitud (𝑉(𝑘) = 𝑎𝑖𝑥𝑖𝑘)
Λ∗
=
𝑘
𝑁𝑘𝑝𝑘
En el modelo de elección agregada, se supone
que las variables de la función de elección son
las mismas para todos los individuos de una
muestra, es decir, 𝑥𝑖𝑘𝑛 = 𝑥𝑖𝑘.
Esto significa que hay un valor único de la
función de elección medida para cada
alternativa y que las probabilidades de
elección también son las mismas para los
individuos de cada subconjunto Si. es decir,
𝑘 = 1, 2, 3 (𝑐𝑎𝑟, 𝑏𝑢𝑠, 𝑡𝑟𝑎𝑖𝑛)
𝑉(𝑘) = 𝑎𝑖𝑥𝑖𝑘
𝑉(𝑐𝑎𝑟) = 𝑎1,𝑡𝑐𝑎𝑟 + 𝑎2,𝑐𝑐𝑎𝑟
𝑉(𝑏𝑢𝑠) = 𝑎1,𝑡𝑏𝑢𝑠 + 𝑎2,𝑐𝑏𝑢𝑠
𝑉(𝑡𝑟𝑎𝑖𝑛) = 𝑎1,𝑡𝑡𝑟𝑎𝑖𝑛 + 𝑎2,𝑐𝑡𝑟𝑎𝑖𝑛
𝑥𝑖𝑘= 𝑡1,𝑐𝑎𝑟, 𝑡1,𝑏𝑢𝑠, 𝑡1,𝑡𝑟𝑎𝑖𝑛, 𝑐2,𝑐𝑎𝑟, 𝑐2,𝑏𝑢𝑠, 𝑐2,𝑡𝑟𝑎𝑖𝑛
𝑎𝑖= {𝑎1,, 𝑎2}
K t_k c_k
car 15 3
bus 10 4
train 20 7
Suponga que de 100 personas encuestadas, se
encontró que 50 usaron el primer modo auto, 40 el
modo bus y el resto el modo ferroviario
En otras palabras, Pk = (0.5, 0.4, 0.10).
Se postula un modelo logit de la siguiente forma
para este problema:
Calibration of Choice Models
Binomial Disaggregate Models
51. 𝑉(𝑐𝑎𝑟) = -0.028 𝑡𝑐𝑎𝑟− 0.366𝑐𝑐𝑎𝑟
𝑉(𝑏𝑢𝑠) = -0.028 𝑡𝑏𝑢𝑠 −0.366𝑐𝑏𝑢𝑠
𝑉(𝑡𝑟𝑎𝑖𝑛) = -0.028 𝑡𝑡𝑟𝑎𝑖𝑛−0.366𝑐𝑡𝑟𝑎𝑖𝑛
Λ∗
=50(15 𝑎1 +3 𝑎2)+40(10 𝑎1 +4 𝑎2) 10(20 𝑎1 +7 𝑎2)-100ln 𝑌
𝑌 = 𝑒15 𝑎1 +3 𝑎2 + 𝑒10 𝑎1 +4 𝑎2+ 𝑒20 𝑎1 +7 𝑎2
𝑎 ~
𝜕Λ∗
𝜕𝑎1
= 0 𝑏 ~
𝜕Λ∗
𝜕𝑎2
= 0
50%
40%
10%
Car
Bus
Train
k Tiempo Costo
Car 15 3
Bus 10 4
Train 20 7
𝑉(𝑐𝑎𝑟) = -0.028 𝑡𝑐𝑎𝑟− 0.366𝑐𝑐𝑎𝑟
𝑉(𝑏𝑢𝑠) = -0.028 𝑡𝑏𝑢𝑠 −0.366𝑐𝑏𝑢𝑠
𝑉(𝑡𝑟𝑎𝑖𝑛) = -0.028 𝑡𝑡𝑟𝑎𝑖𝑛−0.366𝑐𝑡𝑟𝑎𝑖𝑛
𝑉(𝑚𝑒𝑡𝑟𝑜) = -0.028 𝑡𝑚𝑒𝑡𝑟𝑜−0.366𝑐𝑚𝑒𝑡𝑟𝑜
k Tiempo Costo
Car 15 3
Bus 10 4
Train 20 7
Metro 5 12
49%
39%
10% 2%
Car
Bus
Train
Metro
k Tiempo Costo
Car 15 3
Bus 10 4
Train 20 7
Metro 5 5
38%
30%
8%
24% Car
Bus
Train
Metro
Calibration of Choice Models
Multinomial Disaggregate Models
52. Observe que si el modelo hubiera incluido parámetros específicos por cada modo de elección 𝑎𝑖𝑘 ,
entonces este tipo de predicción al introducir un nuevo modo no sería posible, ya que los valores
𝑎𝑖𝑚𝑒𝑡𝑟𝑜 noestarían disponibles.
También serían necesarios datos de elección adicionales para estimar el modelo con parámetros
específicos de elección.
El ejemplo discutido aquí representa una situación extrema donde toda la población encuestada
se agrega en un grupo. El otro extremo es el modelo totalmente desagregado en el que cada
individuo se considera por separado con una probabilidad individual sobre la base de valores de
tiempo y costo medidos individualmente.
Es prácticamente seguro que en realidad el modelo totalmente agregado no es exacto, ya que es
poco probable que todos los individuos de la población de la encuesta experimenten exactamente
los mismos valores de tk y ci. Dada la disponibilidad de datos, siempre es preferible utilizar un
modelo desagregado al estimar los parámetros.
Cuando no se dispone de datos desagregados, el analista debe tener cuidado al agregar los datos
para evitar sesgos en la estimación de los parámetros. El efecto de los diferentes niveles de
agregación sobre los resultados dependerá, por supuesto, de cómo varían las variables del
Calibration of Choice Models
Multinomial Disaggregate Models