2. Guayaquil, mayo de 2015
Datos centrados, estandarizados y
winzorizados
Estadística para Ingenierías2
Datos Centrados:
Dada una Muestra XT = (X1, X2, …, Xn) se dice que
los datos han sido centrados si
Siendo
xXY ii
0y
3. Guayaquil, mayo de 2015
Datos centrados, estandarizados y
winzorizados
Estadística para Ingenierías3
Datos Estandarizados:
“Estandarizar” una Muestra significa definir una
nueva variable Y, en términos de los valores
observados X, de tal manera que
Siendo
s
xX
Y i
i
1sy0y 2
4. Guayaquil, mayo de 2015
Datos centrados, estandarizados y
winzorizados
Estadística para Ingenierías4
Datos Winzorizados:
“Winzorizar” una Muestra consiste en sustituir un
porcentaje previamente fijado de datos por los
valores menor y mayor que quedan en la Muestra.
Ejemplo: sea xT = (3 4 4 5 5 6 7 8 9 11), si se desea
winzorizar el 20% de los datos de ésta Muestra,
equivaldría a sustituir los valores 3 y 11 por los
valores 4 y 9, obteniéndose lo siguiente
xT = (4 4 4 5 5 6 7 8 9 9)
5. Guayaquil, mayo de 2015
Datos centrados, estandarizados y
winzorizados: ejemplo
Estadística para Ingenierías5
En un laboratorio de Química Analítica se determina el
número de partes por millón de un metal pesado que se
encuentra disuelto en las aguas de un río del Litoral
Ecuatoriano. Luego de efectuar veinte observaciones se
obtiene la siguiente Muestra.
xT = (1 3 3 4 4 4 4 4 6 6 7 7 7 7 9 9 9 10 11 12)
Calcular la Media Aritmética.
Centrar y estandarizar los datos y calcular la Media
Aritmética.
Winzorizar el 20% de los datos y calcular la Media
Winzorizada. Compare los resultados obtenidos.
6. Guayaquil, mayo de 2015
SeriesTemporales y Filtros
Estadística para Ingenierías6
Cada vez es más frecuente hacer mediciones de una
Variable Aleatoria X con igual espaciamiento en el tiempo
t, durante un período finito T o un lapso abierto.
Todos podemos observar el valor X(t) que toma la
“cantidad de Kilovatios hora que consumimos cada mes”
en nuestro hogar o la “cantidad de dólares que
mensualmente ganamos”, por citar algunos ejemplos.
7. Guayaquil, mayo de 2015
SeriesTemporales y Filtros
Estadística para Ingenierías7
Serie de Tiempo (t, X(t)), que representa la serie semanal del número de
“robos agravados” denunciados en el Ministerio Público de Guayaquil, durante
el año 2008.
81
98101
120
82
61
70
114
86
93
85
102
95
96
96
74
88
83
80
68
78
96
81
84
92
82
116
91
96
90
104
75
92
73
90
80
110
90
93
75
10298
85
74
103
89
79
92
115
92
106
89
79
0
20
40
60
80
100
120
140
29Dic-4Ene
12Ene-18Ene
26Ene-1Feb
9Feb-15Feb
23Feb-29Feb
8Mzo-14Mzo
22Mzo-28Mzo
5Ab-11Ab
19Ab-25Ab
3My-9My
17My-23My
31My-6Jun
14Jun-20Jun
28Jun-4Jul
12Jul-18Jul
26Jul-1Ag
9Ag-15Ag
23Ag-29Ag
6Sep-12Sep
20Sep-26Sep
4Oct-10Oct
18Oct-24Oct
1Nov-7Nov
15Nov-21Nov
29Nov-5Dic
13Dic-19Dic
27Dic-2Ene
8. Guayaquil, mayo de 2015
SeriesTemporales y Filtros
Estadística para Ingenierías8
Lo primero que se trata de descubrir en una serie temporal
es si es “estacionaria” esto es si se estabiliza en algún valor o
si no es estacionaria pero tiene tendencia a crecer o
decrecer a partir de determinado valor en el tiempo.
Si bien el análisis de una Serie Temporal es motivo de cursos
especializados; para efectos de este curso nos
concentraremos en la presencia de perturbaciones no
controladas dentro del proceso, también denominadas Ruido
o Causas Especiales; una forma de reducir este ruido es
mediante la construcción de filtros supresores de
oscilaciones extremas.
9. Guayaquil, mayo de 2015
SeriesTemporales y Filtros
Estadística para Ingenierías9
Varias son las técnicas de “filtrado” que pueden utilizarse,
pero una muy particular y ampliamente utilizada por su
simplicidad y eficiencia es la de Filtros de Medias
Móviles, que consiste en reemplazar cada observación X(t)
por el promedio de ese valor y los (k – 1) valores
previamente observados, éste es un Filtro de Medias
Móviles de k-términos.
)]1kt(X...)2t(X)1t(X)t(X[
k
1
)t(Y
10. Guayaquil, mayo de 2015
SeriesTemporales y Filtros
Estadística para Ingenierías10
Diseñe un filtro de Medias Móviles de 4 términos para la
serie semanal de “robos agravados” y grafique la serie
suavizada.
Resolución
Y(1) = X(1) = 81
Y(2) = [X(2) + X(1)]/2 = (98+81)/2 = 89.50
Y(3) = [X(3)+X(2)+X(1)]/3 = (101+98+81)/3 = 93.33
Y(4) = [X(4)+X(3)+X(2)+X(1)]/4 = (120+101+98+81)/4 = 100
Y(5) = [X(5)+X(4)+X(3)+X(2)]/4 = (82+120+101+98)/4 = 100.25
Y(6) = [X(6)+X(5)+X(4)+X(3)]/4 = (61+82+120+101)/4 = 91
12. Guayaquil, mayo de 2015
Referencias
Estadística para Ingenierías12
Zurita, G. (2010), “Probabilidad y Estadística:
Fundamentos y Aplicaciones”, Segunda Edición,
Escuela Superior Politécnica del Litoral, Instituto de
Ciencias Matemáticas, Guayaquil-Ecuador.