Similar a 1. Solucion Evaluación 1_ Introducción a Estadística, Probabilidad y Simulación en Transporte 2024 1 UNIVERSIDAD NACIONAL DE INGENIERÍA.docx (20)
1. Solucion Evaluación 1_ Introducción a Estadística, Probabilidad y Simulación en Transporte 2024 1 UNIVERSIDAD NACIONAL DE INGENIERÍA.docx
1. UNIVERSIDAD NACIONAL DE INGENIERÍA
Facultad de Ingeniería Civil
Maestría en Ciencias con mención en Ingeniería del Transporte
Pre Maestría
Introducción a Estadística, Probabilidad y Simulación en
Transporte 2024
Introducción a Estadística, Probabilidad y Simulación en Transporte 2024-1
MSc Rafael Caparó
Pautas: Subir al aula virtual el documento, todos los miembros del curso, enviar un
backup al correo del profesor, rcaparoc@uni.edu.pe, solo se sube y se envia el link de
la carpeta drive o OneDrive que contiene todos los archivos utilizados, la carpeta drive
o OneDrive debe de tener permiso de editor para el correo del profesor.
Evaluación 1
Preguntas conceptuales
Desarrolle los siguientes conceptos y realice dos ejemplos, de ser posible relacionados
al curso.
1. Variable aleatoria
Es una variable cuyo valor está determinado por el resultado de un experimento al
azar se denomina variable aleatoria (va). Las variables aleatorias se denotan
usualmente por las letras mayúsculas X, Y, Z, y así sucesivamente, y los valores que
toman se denotan por letras minúsculas, x, y, z, etcétera.
En simulación de transportes, una variable aleatoria podría ser la cantidad de tiempo
que un vehículo se detiene en un semáforo o el número de pasajeros que abordan un
autobús en una parada específica.
Ejemplos:
Variable Aleatoria 1: La cantidad de tiempo que un vehículo se detiene en un
semáforo.
Variable Aleatoria 2: El número de pasajeros que abordan un autobús en una parada.
2. Probabilidad
2. La probabilidad en simulación de transportes puede aplicarse para modelar la
posibilidad de eventos como la congestión del tráfico, el tiempo de espera en una
parada, etc.
Ejemplos:
Probabilidad 1: La probabilidad de que un vehículo llegue a tiempo a su destino
considerando las condiciones de tráfico.
Probabilidad 2: La probabilidad de que el tiempo de espera en una parada de autobús
sea superior a 10 minutos.
3. Función de densidad de probabilidades
En simulación de transportes, la función de densidad de probabilidades puede
describir la probabilidad de que un vehículo llegue a un destino en un tiempo
específico.
Ejemplos:
Función de Densidad de Probabilidades 1: La probabilidad de que un vehículo llegue a
su destino en un tiempo t específico.
Función de Densidad de Probabilidades 2: La probabilidad de que el tiempo de viaje
de un vehículo esté en un rango específico.
4. Funciones de densidad de probabilidad conjunta
Si se están simulando múltiples variables aleatorias en el contexto del transporte, como
el tiempo de espera en una parada y el tiempo de viaje, la función de densidad de
probabilidad conjunta podría describir la probabilidad de eventos simultáneos.
Ejemplos:
Función de Densidad de Probabilidad Conjunta 1: La probabilidad de que un vehículo
tenga un tiempo de espera corto y un tiempo de viaje largo.
Función de Densidad de Probabilidad Conjunta 2: La probabilidad de que dos
vehículos se detengan simultáneamente en una intersección.
5. Independencia estadística
La independencia estadística en simulación de transportes podría referirse a la falta de
influencia entre diferentes eventos, como la independencia entre el flujo de vehículos en
diferentes secciones de una red de carreteras.
3. Ejemplos:
Independencia Estadística 1: La independencia entre el tráfico en dos calles diferentes
de una ciudad.
Independencia Estadística 2: La independencia entre el tiempo de espera en una parada
y el tiempo de viaje de un vehículo.
6. Valor esperado y varianza
En simulación de transportes, el valor esperado puede representar la media de los
tiempos de viaje esperados, mientras que la varianza puede indicar la dispersión o
variabilidad de estos tiempos.
Ejemplos:
Valor Esperado 1: El tiempo promedio de viaje esperado para un autobús desde la
estación A hasta la estación B.
Varianza 1: La variabilidad en los tiempos de llegada de vehículos a una parada
específica durante la hora pico.
Estos ejemplos ilustran cómo estos conceptos pueden aplicarse específicamente en el
contexto de simulación en transportes.
Valor Esperado 2: Supongamos que, basándonos en datos históricos y condiciones de
tráfico actuales, el tiempo promedio de llegada de un autobús a la parada es de 8
minutos. El valor esperado (o media) de la variable aleatoria X sería entonces 8 minutos.
Varianza 2: Ahora, supongamos que la varianza de esta variable es 4 minutos^2. Esto
indica que, en promedio, el tiempo de llegada de los autobuses se desvía en alrededor
de 4 minutos de la media. Cuanto mayor sea la varianza, mayor será la dispersión de
los tiempos de llegada alrededor de la media.
Preguntas de análisis
1. Realizar una comparación entre dos funciones de distribución continuas.
¿Cómo nos ayudan a simular?
A continuación, se presenta una descripción de dos funciones de distribución continuas,
la distribución Normal y la distribución exponencial.
1. Distribución Normal (Gaussiana):
Fórmula:
4. 𝑓(𝑥) =
1
𝜎√2𝜋
∗ 𝑒−
1
2
∗(
𝑥−𝑢
𝜎
)2
Parámetros:
• μ - Media
• σ - Desviación estándar
Relación entre parámetros: La media determina la posición central de la
distribución, y la desviación estándar controla la dispersión.
Aplicación en transportes: Puede utilizarse para modelar tiempos de viaje,
velocidades de vehículos o cualquier otra variable continua.
2. Distribución Exponencial:
Fórmula: 𝑓(𝑥) = 𝜆𝑒−𝜆𝑥
Parámetros:
• λ - Tasa de llegada o tasa de falla
Relación entre parámetros: A medida que λ aumenta, la tasa de decaimiento
de la función también aumenta.
Aplicación en transportes: Puede modelar el tiempo entre llegadas sucesivas
de vehículos o eventos, como el tiempo entre arribos a una parada de autobús.
Tabla comparativa entre la Distribución Normal (Gaussiana) y la Distribución
Exponencial, junto con una explicación de cómo pueden ayudar en la simulación de
transportes:
COMPARACIÓN
Característica Distribución Normal (Gaussiana) Distribución Exponencial
Forma de la
Distribución
Simétrica y centrada en la media. Asimétrica y sesgada a la derecha.
Parámetros Principales
Media (μ) y Desviación Estándar
(σ).
Tasa de ocurrencia (λ), inversa del
tiempo medio entre eventos.
Rango de Valores
Posibles
(-∞, ∞). (0, ∞).
Aplicaciones Comunes
en Transportes
Modelado de tiempos de viaje,
tiempos de espera y otros aspectos
donde la variabilidad es inherente.
Modelado de tiempos entre
eventos, como intervalos entre
llegadas de vehículos o tiempo
entre fallas en un sistema de
transporte.
Efecto de Outliers
Sensible a outliers debido a la
media y desviación estándar.
Menos sensible a outliers, ya que la
mayoría de los eventos tienden a
ocurrir en un corto periodo, pero
eventos inusuales pueden ocurrir
en cualquier momento.
5. Relación con otras
Distribuciones
Teorema del Límite Central: La
suma de variables aleatorias
independientes y suficientemente
numerosas converge a una
distribución normal.
La distribución exponencial es
relacionada con la distribución de
Poisson, que modela la ocurrencia
de eventos discretos en un
intervalo fijo de tiempo o espacio.
Simulación en
Transportes
Puede ser utilizada para modelar
variabilidad en tiempos de viaje,
tiempos de espera en tráfico, entre
otros.
Útil para modelar el tiempo entre
llegadas de vehículos, la duración
de intervalos entre eventos, o el
tiempo hasta la próxima falla en un
sistema de transporte.
En simulación de transportes, la Distribución Normal puede ser útil para modelar
variables que tienen una distribución simétrica y están influenciadas por múltiples
factores, como el tiempo de viaje. La Distribución Exponencial, por otro lado, es útil para
modelar el tiempo entre eventos, como llegada de vehículos, ya que captura la
propiedad de falta de memoria, lo que significa que el tiempo entre eventos futuros no
está influenciado por el pasado.
2. Realizar una comparación entre función de distribución normal y lognormal y t-
student.
I. Distribución Normal (Gaussiana):
Fórmula:
𝑓(𝑥) =
1
𝜎√2𝜋
∗ 𝑒−
1
2
∗(
𝑥−𝑢
𝜎
)2
Parámetros:
• μ - Media
• σ - Desviación estándar
Relación entre parámetros: La media determina la posición central de la
distribución, y la desviación estándar controla la dispersión.
Aplicación en transportes: Puede utilizarse para modelar tiempos de viaje,
velocidades de vehículos o cualquier otra variable continua.
II. Distribución Log-Normal:
Fórmula:
𝒇(𝒙; 𝝁, 𝝈) =
𝟏
𝒙𝝈√𝟐𝝅
∗ 𝒆
−
(𝒍𝒏(𝒙)−𝝁)𝟐
𝟐𝝈𝟐
Parámetros:
μ - Media del logaritmo
σ - Desviación estándar del logaritmo
6. Aplicación en transportes: Puede utilizarse para modelar variables que son el
logaritmo de una distribución normal, como los precios de los combustibles.
III. Distribución t de Student:
Fórmula: 𝑓(𝑥; 𝑣) =
Γ(
𝑣+1
2
)
√𝑣𝜋 Γ(
𝑣
2
)
∗ (1 +
𝑥2
𝑣
)−
𝑣+1
2
Parámetros:
• ν - Grados de libertad
Relación entre parámetros: A medida que ν aumenta, la distribución t se
aproxima a la distribución normal.
Aplicación en transportes: Puede utilizarse para modelar la incertidumbre en
estimaciones de parámetros, como la variabilidad en las mediciones de
velocidad de vehículos.
Tabla de comparación
Característica
Distribución
Normal
Distribución
Lognormal
Distribución t de
Student
Forma de la
Distribución
Simétrica y
centrada en la
media
Asimétrica y sesgada a la
derecha
Simétrica y con colas más
pesadas en comparación
con la normal para
grados bajos de libertad
Parámetros
Principales
Media (μ) y
Desviación
Estándar (σ)
Media (μ) y Desviación
Estándar (σ) en escala
logarítmica
Media (μ) y Grados de
Libertad (ν)
Rango de Valores
Posibles
(-∞, ∞) (0, ∞)
(-∞, ∞) para grados de
libertad ≥ 3, pero más
concentrada en el centro
para grados de libertad
bajos
Aplicaciones
Comunes
Modelado de
fenómenos
simétricos
Modelado de activos
financieros, como
precios de acciones
Análisis de muestras
pequeñas y estimación
de intervalos de
confianza
Efecto de Outliers
Sensible a outliers
debido a la media
y desviación
estándar
Menos sensible a
outliers debido a la
escala logarítmica
Menos sensible a outliers
debido a las colas
pesadas
7. Relación con otras
Distribuciones
Es la base de
muchas otras
distribuciones. La
suma de variables
aleatorias
independientes y
suficientemente
numerosas
converge a una
distribución
normal por el
teorema del límite
central.
La distribución
lognormal es la
distribución de una
variable aleatoria cuyo
logaritmo es
normalmente
distribuido.
Se aproxima a la
distribución normal
cuando los grados de
libertad son altos.
Teorema
Asintótico
Teorema del
Límite Central
No aplica
Teorema de la t de
Student
Preguntas de participación en clase:
Elija una función de distribución de probabilidades que se aplique en la simulación de
transporte (sistemas de transporte, por ejemplo) y presente:
1. Las fórmulas de la función de distribución de probabilidades (la de densidad y
la acumulativa).
Función de distribución de probabilidad Weibull.
Función de Densidad de Probabilidad (pdf):
La función de densidad de probabilidad Weibull se define como:
Fórmula: 𝑓(𝑥; 𝑘, 𝜆) =
𝑘
𝜆
∗ (
𝑥
𝜆
)
𝑘−1
∗ 𝑒−(
𝑥
𝜆
)𝑘
Donde:
x es la variable aleatoria.
λ es el parámetro de escala.
k es el parámetro de forma.
Función de Distribución Acumulativa (CDF):
La función de distribución acumulativa Weibull se define como la integral de la función
de densidad de probabilidad:
8. 𝑓(𝑥; 𝜆, 𝑘) = 1 − 𝑒
−(
𝑥
𝜆
)
𝑘
Donde:
x es la variable aleatoria.
λ es el parámetro de escala.
k es el parámetro de forma.
La distribución Weibull puede tener diferentes formas según el valor del parámetro de
forma k:
Si k>1, la distribución es creciente y se asemeja a una distribución exponencial.
Si k<1, la distribución es decreciente y se asemeja a una distribución de Rayleigh.
Si k=1, la distribución es exponencial.
2. Presentar una breve descripción de sus parámetros
Parámetro de Escala (λ):
Definición: El parámetro de escala, denotado como λ, determina la "anchura"
de la distribución. A medida que λ aumenta, la distribución se alarga, y a
medida que disminuye, la distribución se contrae.
Influencia en la Distribución: Valores mayores de λ indican una mayor
dispersión de los datos y un tiempo de vida esperado más largo en el contexto
de confiabilidad. Valores más pequeños de λ indican una menor dispersión y
un tiempo de vida esperado más corto.
Parámetro de Forma (k):
Definición: El parámetro de forma, denotado como k, determina la forma de la
distribución Weibull.
Influencia en la Distribución:
Si k>1, la distribución es creciente y se asemeja a una distribución
exponencial. En este caso, la tasa de fallos aumenta con el tiempo.
Si k<1, la distribución es decreciente y se asemeja a una distribución de
Rayleigh. En este caso, la tasa de fallos disminuye con el tiempo.
Si k=1, la distribución es exponencial, y la tasa de fallos es constante con el
tiempo.
9. Finalmente, el parámetro de escala λ afecta la dispersión de la distribución, mientras
que el parámetro de forma k determina la forma específica de la distribución Weibull.
Juntos, estos parámetros permiten modelar una variedad de comportamientos en datos
relacionados con tiempos de vida y confiabilidad.
3. Hacer un pequeño resumen de como entiende la relación entre los parámetros
y la fórmula del paso 1
A modo de resumen se sintetiza la información de los parámetros en la siguiente tabla.
Característica Parámetro de Escala (λ)
Parámetro de Forma
(k)
Definición
Determina la "anchura" de la
distribución.
Define la forma
específica de la
distribución.
Interpretación en
Simulación en Transportes
Puede representar la escala temporal
asociada con los tiempos de viaje o
eventos.
Influencia la variabilidad
y forma de los tiempos
de viaje o eventos.
Valores Grandes de λ Mayor dispersión, tiempos más largos.
Mayor variabilidad en
los eventos simulados.
Valores Pequeños de λ Menor dispersión, tiempos más cortos.
Menor variabilidad en
los eventos simulados.
k>1
Distribución creciente, variabilidad
creciente.
Posible presencia de
eventos inesperados.
k<1
Distribución decreciente, variabilidad
decreciente.
Posible mayor
previsibilidad y
consistencia.
k=1 Distribución exponencial, tasa constante.
Eventos con tasa de
ocurrencia constante.
Al utilizar la distribución Weibull en simulación en transportes, ajustar los parámetros
λ y k puede ayudar a capturar la variabilidad y la forma específica de los tiempos de
viaje o eventos relevantes.
4. Presentar una aplicación o utilización de cada función
Imaginemos un escenario en el que queremos modelar la distribución de tiempos de
vida de ciertos componentes en una flota de vehículos. Supongamos que hemos
recopilado datos de la vida útil de los componentes y que queremos utilizar la
distribución Weibull para realizar predicciones y análisis de confiabilidad.
10. Datos Hipotéticos:
Hemos recopilado datos de tiempos de vida de un componente, como la bomba
de agua de un vehículo.
Los datos muestran una variabilidad significativa en los tiempos de vida, lo que
sugiere que la distribución Weibull podría ser apropiada.
Pasos:
a. Ajuste de la Distribución Weibull:
Utilizamos los datos recopilados para ajustar la distribución Weibull y estimar los
parámetros λ y k.
b. Función de Densidad de Probabilidad (pdf):
Utilizamos la función de densidad de probabilidad Weibull para modelar la probabilidad
de que un componente tenga una vida útil específica. La función de densidad de
probabilidad es:
𝑓(𝑥; 𝑘, 𝜆) =
𝑘
𝜆
∗ (
𝑥
𝜆
)
𝑘−1
∗ 𝑒
−(
𝑥
𝜆
)𝑘
Podemos utilizar esta función para calcular la probabilidad de que un componente dure
un tiempo específico x.
c. Función de Distribución Acumulativa (CDF):
Utilizamos la función de distribución acumulativa Weibull para modelar la probabilidad
de que un componente falle antes de un tiempo específico.
La función de distribución acumulativa es:
𝑓(𝑥; 𝜆, 𝑘) = 1 − 𝑒
−(
𝑥
𝜆
)
𝑘
Podemos utilizar esta función para calcular la probabilidad acumulativa de que un
componente falle antes de un tiempo x.
d. Aplicación Práctica:
Con los resultados obtenidos, podemos responder preguntas como:
• ¿Cuál es la probabilidad de que un componente dure al menos t unidades de tiempo?
• ¿Cuál es la probabilidad de que un componente falle antes de t unidades de tiempo?
11. • ¿Cuál es la vida útil esperada de los componentes?
En este escenario hipotético, la distribución Weibull y sus funciones asociadas nos
permiten modelar y comprender la variabilidad en los tiempos de vida de los
componentes de la flota de vehículos, proporcionando información valiosa para la
gestión de activos y la planificación de mantenimiento.
El ejemplo anterior tomando datos hipotéticos, podría quedar de la siguiente manera:
Se visualiza el histograma junto con la función de densidad de probabilidad (PDF) y la
función de distribución acumulativa (CDF) estimadas.
12. Laboratorio
Indicaciones: La presente evaluación permite reforzar lo aprendido considerando una
base de datos real, se le pide al grupo analizar la base de datos haciendo un énfasis en
la descripción de los mismos y detallando cualquier instrumento estadístico utilizado, así
como redactando críticamente cada uno de los gráficos, tablas o estadísticos.
Bases de datos 1:
Datos 1: Estudiantes y evaluaciones:
https://docs.google.com/spreadsheets/d/1WYdLFmYnlK-
Z_NegXAKQjZBXEApySDDo/edit?usp=sharing&ouid=11350981463609172
2213&rtpof=true&sd=true
Bases de datos 2:
Datos 2: Tiempo de viaje
https://docs.google.com/spreadsheets/d/1WYdLFmYnlK-
Z_NegXAKQjZBXEApySDDo/edit?usp=sharing&ouid=11350981463609172
2213&rtpof=true&sd=true
Considera la base de datos 2 y luego de hacer el análisis estadístico descriptivo
con la media, varianza, desviación estandar realice el calculo de la correlación y
muestre que tipo de correlación tienen las variables, ademas defina si estas son
asimétricas o simétricas.
NOTA : Se adjuntan 2 hojas de Excel de cada base (base
1 y base 2 en el presente correo)