Este documento presenta un estudio estadístico sobre los pronósticos de víctimas fatales por accidentes de tránsito en la provincia de Chiclayo entre 2002 y 2010. El objetivo es determinar el mejor modelo de series de tiempo para predecir el número de víctimas en los meses siguientes. Se aplican y comparan modelos como promedios móviles, suavización exponencial simple y doble, Holt y Winters. Los resultados muestran que el modelo de Winters es el que mejor se ajusta a los datos históricos.
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
Series (1)(1)
1. UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
FACULTAD DE CIENCIAS FISICAS Y
MATEMATICAS
ESTADISTICA
INTEGRANTES:
SANAVIA RAMIREZ CLARA
SECLEN FARFÁN MELIZA
PROFESOR:
ALFONSO TESEN ARROYO
LAMBAYEQUE ,DICIEMBRE 2011
2. Introducción
En nuestro país la principal causa de muerte violenta
está relacionada a los accidentes de tránsito y en la
última década han muerto más personas por
accidentes que los que murieron en la década de los
80 por la guerra entre el Estado y Sendero
Luminoso. Se estima que en el Perú mueren 6,000
personas al año, tres mil en las pistas y otros tres mil
en las unidades de urgencia. Los recursos que se
aportan al Consejo de Seguridad Vial, al Programa
de Tolerancia Cero y las Policías de Carreteras y de
Tránsito son muy escasos.
3. Formulación Del
Problema
¿Cuales son los modelos de series de
tiempo que determinan los pronósticos
de víctimas fatales por accidentes de
tránsito en la provincia de Chiclayo
(periodo 2002 – 2010), con el fin de
saber el número de víctimas en los
siguientes meses?
4. Objetivo General
Determinar cuál es el modelo de
series de tiempo óptimo para los
pronósticos de víctimas fatales por
accidentes de tránsito en la
provincia de Chiclayo.
5. Justificación e Importancia
Es importante porque gracias a la construcción
de un modelo de serie de tiempo adecuado nos
permitirá conocer el número de víctimas por
accidente de tránsito en los meses
venideros, contando con esta información será
de gran ayuda para las diversas organizaciones
que requieren conocer el comportamiento futuro
con el fin de planificar, prevenir y poder así
tomar las decisiones adecuadas.
6. METODOLOGIA DE LA
INVESTIGACION
Tipo de Investigación:
Descriptivo
Población de Estudio:
Constituida por todos las personas que fallecieron
por accidentes de transito registradas en la
DITERPOL en la provincia de Chiclayo desde el
año 2002 hasta el año 2010.
| Muestra de Estudio:
Conformada por los registros desde el mes de
enero del año 2002 hasta el año 2010.
Análisis Estadístico de Estudio:
El análisis se realizara haciendo uso de técnicas
de series de tiempo.
7. MODELOS APLICADOS
Promedios Móviles
Suavización Exponencial Simple
Suavización Exponencial Doble o De
Brown
Método de Holt
Modelo de Winters.
Metodología de Box y Jenkins o ARIMA
8. Grafico N° 14: Víctimas Fatales Según Clases De Accidentes
De Tránsito En La Provincia De Chiclayo (Periodo 2002 –
60.00 2010)
ATROPELLO
50.00 46.27 S
47.65
42.03 41.73 CHOQUES
40.00 38.30
VOLCADURA
39.44 38.06 39.57 S
37.04
DESPISTES
30.00
CAIDA
PASAJEROS
20.00
FUGAS
ATROPELLO
S
10.00 FUGAS
CHOQUES
Análisis E 0.00
2002 2003 2004 2005 2006 2007 2008 2009 2010
Interpretación
De Resultados
9. Gráfico Nº 01: Víctimas Fatales De Accidentes
De Tránsito En La Provincia De Chiclayo
(Periodo 2002 – 2010)
25
20
15
10
5
0
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
ENE.
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
2002 2003 2004 2005 2006 2007 2008 2009 2010
VICTIMAS Linear (VICTIMAS)
FUENTE: DITERPOL CHICLAYO
10. Grafico Nº 02: Victimas Fatales De Accidentes De
Transito En La Provincia De Chiclayo (Periodo 2002 –
2010)
25
20
15
10
5
0
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
ENE.
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
2002 2003 2004 2005 2006 2007 2008 2009 2010
Yt PROM. MOVIL DE ORDEN 3 PROM. MOVIL DE ORDEN 5
FUENTE: DITERPOL CHICLAYO
11. ENERO 15.33 13.8
FEBRERO 14.67 12.8
P MARZO 10.33 12.4
R
ABRIL 9.67 10
O
N MAYO 8.67 9.6
O JUNIO 10 9
S 2011
JULIO 9 9.6
T
I AGOSTO 9.67 9.4
C
SEPTIEMBRE 9.33 10.6
O
S OCTUBRE 11.33 12
NOVIEMBRE 14
DICIEMBRE
13. Tabla Nº 03: Victimas Fatales De Accidentes De
Transito En La Provincia De Chiclayo Durante Los
Años 2002 – 2010, Con = 0.1
25
20
15
10
5
0
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
ENE.
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
VICTIMAS VALOR SUAVIZADO
FUENTE: DITERPOL CHICLAYO
15. Grafico Nº 05: Victimas Fatales De Accidentes De
Transito En La Provincia De Chiclayo Durante Los Años
2002 – 2010
25
20
15
10
5
0
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
JUL
ENE.
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
OCT
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
ABR
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
VICTIMAS Valor Suavizado
FUENTE: DITERPOL CHICLAYO
17. Grafico Nº 06: Pronostico De Victimas Fatales De
Accidentes De Transito En La Provincia De Chiclayo En
Los Años 2002 – 2010 Utilizando el Método el Método
de Holt
25
20
15
10
5
0
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
ENE
JUL
SEP
JUL
SEP
JUL
SEP
JUL
SEP
JUL
SEP
JUL
SEP
JUL
SEP
JUL
SEP
JUL
SEP
ENE.
NOV
NOV
NOV
NOV
NOV
NOV
NOV
NOV
NOV
MAY
MAY
MAY
MAY
MAY
MAY
MAY
MAY
MAY
MAR
MAR
MAR
MAR
MAR
MAR
MAR
MAR
MAR
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
VICTIMAS SUAVISACIÓN DE HOLT
FUENTE: DITERPOL CHICLAYO
18. Yˆt p ( At pT t ) S t L p
MODELO DE WINTERS
19. Grafico Nº 07: Victimas Fatales De Accidentes De
Transito En La Provincia De Chiclayo En Los Años 2002
– 2010
α =0.4 β=0.1 =0.3 L=4 P=1
50
45
40
35
30
25
20
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
VALOR ORIGINAL PRONOSTICO MEDIANTE WINTER
FUENTE: DITERPOL CHICLAYO
22. TABLA Nº 07 : CUADRO QUE REPRESENTA LA DESESTACIONALIDAD
DE LOS DATOS DE PRONOSTICO TRIMESTAL DE VICTIMAS DE LA
PROVINCIA DE CHICLAYO EN LOS MESES DE ENERO – DICIEMBRE
DE LOS AÑOS 2002 – 2010
TRIMEST Suma p.m índice
AÑO VICTIMAS promedio
RES total centrado estacional
I 24 119 29.75 30.63 78
I 38
II 34 142 35.50 II 28 108 27.00 28.38 99
2002 2007
III 35 149 37.25 36.38 96 III 24 124 31.00 29.00 83
IV 35 151 37.75 37.50 93 IV 32 120 30.00 30.50 105
I 45 151 37.75 37.75 119
I 40 136 34.00 32.00 125
II 36 149 37.25 37.50 96
2003 II 24 139 34.75 34.38 70
III 35 144 36.00 36.63 96 2008
IV 33 135 33.75 34.88 95 III 40 139 34.75 34.75 115
I 40 130 32.50 33.13 121 IV 35 139 34.75 34.75 101
II 27 134 33.50 33.00 82 I 40 126 31.50 33.13 121
2004
III 30 128 32.00 32.75 92 24 127 31.75 31.63 76
II
IV 37 131 32.75 32.38 114 2009
III 27 131 32.75 32.25 84
I 34 135 33.75 33.25 102
IV 36 133 33.25 33.00 109
II 30 134 33.50 33.63 89
2005
III 34 133 33.25 33.38 102 I 44 135 33.75 33.50 131
IV 36 134 33.50 33.38 108 II 26 141 35.25 34.50 75
2010
I 33 131 32.75 33.13 100 III 29
II 31 138 34.50 33.63 92
2006 IV 42
III 31 129 32.25 33.38 93
IV 43 126 31.50 31.88 135 FUENTE: DITERPOL CHICLAYO
23. VALORES DE LOS INDICES
INDICE
I 112.31
II 84.99
III 95.09
IV 107.61
24. TABLA Nº 08: CUADRO QUE REPRESENTA LA
DESESTACIONALIDAD DE LOS DATOS DE PRONOSTICO
TRIMESTAL DE VICTIMAS DE LA PROVINCIA DE CHICLAYO EN
LOS MESES DE ENERO – DICIEMBRE DE LOS AÑOS 2002 –
2010
y(serie
TRIME VICTIM índice
AÑO t desestaciona
STRES AS estacional
lisada)
I 1 38 112.31 33.83
I 21 24 112.31 21.37
II 2 34 84.99 40.01
2002 II 22 28 84.99 32.95
III 3 35 95.09 36.81 2007
IV 4 35 107.61 32.52 III 23 24 95.09 25.24
I 5 45 112.31 40.07 IV 24 32 107.61 29.74
II 6 36 84.99 42.36 I 25 40 112.31 35.62
2003
III 7 35 95.09 36.81 II 26 24 84.99 28.24
IV 8 33 107.61 30.67 2008
III 27 40 95.09 42.06
I 9 40 112.31 35.62
IV 28 35 107.61 32.52
II 10 27 84.99 31.77
2004 I 29 40 112.31 35.62
III 11 30 95.09 31.55
IV 12 37 107.61 34.38 II 30 24 84.99 28.24
2009
I 13 34 112.31 30.27 III 31 27 95.09 28.39
II 14 30 84.99 35.30 IV 32 36 107.61 33.45
2005
III 15 34 95.09 35.75 I 33 44 112.31 39.18
IV 16 36 107.61 33.45 II 26 84.99
34 30.59
I 17 33 112.31 29.38 2010
III 35 29 95.09 30.50
II 18 31 84.99 36.48
2006 IV 36 42 107.61 39.03
III 19 31 95.09 32.60
IV 20 43 107.61 39.96
25. Ecuación
Coeficientes
y = -0.105x + 35.62 B0 35.62
B1 -0.105
índice
t Y' PRONOSTICO
estacional
I 37 31.74 112.31 35.64
II 38 31.63 84.99 26.88
2011
III 39 31.53 95.09 29.98
IV 40 31.42 107.61 33.81
26. Gráfico 2:
Grafico N°08: Modelo De Descomposición Aplicado A
Los Datos Trimestrales De Victimas De La Provincia
De Chiclayo En Los Meses De Enero – Diciembre De
Los Años 2002 – 2010
45.00
40.00
35.00
Victimas
30.00
Desc.
25.00
20.00
15.00
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Trimestre
FUENTE: DITERPOL CHICLAYO
27. METODO ARIMA
La principal ventaja de esta metodología es que proporciona
predicciones óptimas en el plazo inmediato y en el corto
plazo. Esto se debe a que la metodología Box-Jenkins nos
permite elegir entre un amplio rango de distintos modelos
según represente mejor el comportamiento de los datos.
El objetivo que se persigue con el análisis de la serie
temporal es predecir el número de victimas por accidente de
tránsito en los trimestres del 2011. Para ello se tratará de
construir un modelo que no solo se ajuste bien a los datos
observados sino que asegure además que las predicciones
se ajustaran bien a las observaciones futuras.
28. GRAFICO N° 09: Transformación Logarítmica y la
Diferenciación (2); de las Victimas Fatales por Accidentes
De Transito En La Provincia De Chiclayo En Los Años 2002
– 2010
29. GRAFICO: N°10
Función de Correlación simple para la serie temporal
transformada logarítmica y Diferencia de orden 2 para las
víctimas mortales por accidentes de tránsito en la ciudad de
Chiclayo 2002 - 2010
30. GRAFICO:N°11
Función de Correlación parcial para la serie temporal
transformada logarítmica y Diferencia de orden 2 para las
víctimas mortales por accidentes de tránsito en la ciudad
de Chiclayo 2002 - 2010
31. ESTIMACIÓN DE LOS
COEFICIENTES DEL MODELO
Estimamos que los coeficientes de nuestro
modelo representan a un ARIMA (0;2;2). La
estimación de los coeficientes se determino
Teniendo en cuenta el numero de correlogramas
significativos en la función de correlación simple
(ACF) y teniendo en cuenta además el numero
de diferenciaciones que se realizo para volver
estacionario la serie temporal.
32. CONTRASTE Y VALIDEZ DEL
MODELO EN CONJUNTO
Tabla Nº 09: Parámetros del Modelo ARIMA De Victimas
Fatales De Accidentes De Tránsito En La Provincia De
Chiclayo Durante Los Años 2002 – 2010
Parámetros del modelo ARIMA
Estimación ET t Sig.
Constante ,141 ,115 1,229 ,223
Diferenciación
2
estacional
Retardo 1 1,465 ,704 2,079 ,041
MA
Retardo 2 -,534 ,231 -2.312 ,023
33. Según la Tabla N° 09 Se observa que el
modelo de predicción es:
Y t = 1.465 Et-1-0.534 Et-2 + E
Ambos coeficientes son estadísticamente
significativos a excepción de la constante
por la que no aparece en el modelo final.
34. ANALISIS DE LOS ERRORES
Para que el modelo estimado sea valido, Los errores
deben seguir un comportamiento de ruido blanco, es
decir presentar normalidad con media cero.
Verificación De Normalidad
Prueba de Kolmogorov-Smirnov para una muestra
Ruido residual de
VICTIMAS-
Modelo_1
N 84
Parámetros normalesa,b Media -,39
Desviación típica 4,815
Diferencias más extremas Absoluta ,063
Positiva ,051
Negativa -,063
Z de Kolmogorov-Smirnov ,575
Sig. asintót. (bilateral) ,895
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.
Si es normal dado que Sig. > 0.05.
35. Verificación de
μ=0
Prueba para una muestra
Valor de prueba = 0
95% Intervalo de
confianza para la
diferencia
Sig. Diferencia
t gl (bilateral) de medias Inferior Superior
Ruido residual de -,743 83 ,459 -,391 -1,44 ,65
VICTIMAS-
Modelo_1
Dado que Sig. = 0.459 y por ende superior a 0.05 entonces no
rechazamos la Ho y se concluye de que efectivamente la media del error
si es igual a cero.
Dado que se cumple la normalidad y la media igual a cero se concluye
que el modelo es valido.
Otra forma de corroborar la validez del modelo es verificando que las
funciones de correlación simple y parcial del error no sean significativas
36. GRAFICO: N°13
Funciones De Correlación Simple Y Parcial De Victimas
Fatales De Accidentes De Transito En La Provincia De
Chiclayo
Dado que ningún correlograma sobrepasa los limites se concluye que no son
significativos lo que es otro fundamento para concluir con la validación del modelo.
37. Pronósticos de Victimas Fatales De Accidentes De
Transito En La Provincia De Chiclayo
Años Meses N° de Victimas
enero 21
febrero 13
marzo 9
abril 7
mayo 9
junio 9
2011
julio 11
agosto 10
septiembre 11
octubre 12
noviembre 14
diciembre 17
39. Conclusiones
Las series de tiempo pueden servir para predecir acontecimientos
futuros a ciertos comportamientos de determinadas variables.
Mediante el método de promedios móviles con orden 3, se concluye
que el número de víctimas fatales por accidentes de tránsito para el
Mes de Enero del año 2011 será de 14 víctimas.
Mediante el Método de Suavización Exponencial Simple, se concluye
que el número de víctimas fatales por accidentes de tránsito para el
Mes de Enero del año 2011 será de aproximadamente de 12 víctimas.
Mediante el Método de Suavización Exponencial Doble, se concluye
que el número de víctimas fatales por accidentes de tránsito para el
Mes de Enero del año 2011 será de aproximadamente de 19 víctimas.
Mediante el Método de Suavización Exponencial Holt, se concluye
que el número de víctimas fatales por accidentes de tránsito para el
Mes de Enero del año 2011 será de aproximadamente de 14 víctimas.
40. Mediante el modelo de descomposición estacional se concluye
que el número de víctimas fatales por accidentes de tránsito
será mayor con 35.64 en el I trimestre del año 2011.
Aplicando el modelo de Arima
El modelo que se hallo para hacer pronósticos número de
victimas promedio es:
Para la parte estacionaria es un modelo:
AR (p, d, q) = (0,2,2)
ECUACION:
En su forma más general el modelo MA (q) se podría escribirse
como:
Y t=1.465 Et-1-0.534 Et-2 + E
Se recomienda que para pronosticar el número de victimas por
accidente de tránsito se utilice el método Arima ya que
comprobándolo hemos obtenido menor error cuadrático
ajustándose mejor a este tipo de proyecto.