Este documento describe series cronológicas y el análisis de varianza de un factor (ANOVA). Define series cronológicas como conjuntos de observaciones de una o más variables a través del tiempo. Explica que las series cronológicas tienen cuatro componentes: tendencia, variaciones estacionales, cíclicas y aleatorias. Luego, describe los supuestos y cálculos del ANOVA para comparar las medias de K poblaciones, incluyendo la suma de cuadrados total, intragrupos e intergrupos. Proporciona un ejemplo numérico para ilustr
1. SERIES BIDIMENSIONALES Y
CRONOLOGICAS
Cabrera Enis C.I. V- 6.090.682
Molleja Josefa C.I. V- 12.940.440
Ríos Yohana C.I. V-16.576.882
Participantes:Facilitador (a):
Yelitza Rodriguez
2. Series Bidimensionales y Cronológicas
Definición de Series Bidimensionales y Cronológicas
Ejemplo de series cronológicas
Las series cronológicas, son un caso particular de las distribuciones
bidimensionales donde una variable es necesariamente el tiempo que puede ser
medido en años, meses, días, etc.
Las series cronológicas, llamadas también
series temporales o históricas son un
conjunto de observaciones de una o más
variables observadas a través del tiempo.
Algunos ejemplos de series cronológicas son la
tasa de inflación, tasa de devaluación,
exportaciones, importaciones, producto interno
bruto, las ventas anuales de empresa, etc., que
son variables normalmente observadas a
través del tiempo.
3. Componentes de una serie Cronológica
Las series cronológicas están influidas por un conjunto de fuerzas que determinan
el comportamiento de la variable observada. Estas fuerzas más conocidas como
componentes de una serie cronológica están resumidas en cuatro grupos que
son:
Grupos
Tendencia
Secular o
Variaciones
irregulares
La tendencia secular, es el comportamiento promedio de la serie cronológica a
través del tiempo. Es decir es un movimiento sistemático no periódico que se
manifiesta de manera suave y constante en un periodo relativamente largo.
Variaciones
Estacionales
Variaciones
Cíclicas
Variaciones
Aleatorias
Son movimientos regulares sistemáticos repetidos de manera periódica en
lapsos cortos de tiempos, normalmente menor a un año.
Son movimientos sistemáticos que se manifiestan a lo largo del tiempo y que
se los observa normalmente en periodos de 10 a 15 años. Como por ejemplo
series como el crecimiento, exportaciones, etc.
Las variaciones aleatorias llamadas también accidentales o estocásticas, son
movimientos no sistemáticos que se manifiestan de manera aleatoria en la
serie cronológica y no son controlables. Estas variaciones son el resultado de
fenómenos naturales, políticos y sociales, etc.
4. ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K
poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las
poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental
en el análisis de resultados experimentales, en los que interesa comparar los resultados de K
'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.
EL ANOVA REQUIERE EL CUMPLIMIENTO DE LOS SIGUIENTES SUPUESTOS:
Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son
normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homoscedasticidad).
El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la media global (SCT),
que bajo el supuesto de que H0 es cierta es una estimación de obtenida a partir de toda la información muestral,
en dos partes:
Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los valores de cada muestra
con respecto a sus correspondientes medias.
Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias de las muestras con
respecto a la media global.
5. LAS EXPRESIONES PARA EL CÁLCULO DE LOS ELEMENTOS QUE
INTERVIENEN EN EL ANOVA SON LAS SIGUIENTES:
Media Global:
Variación Total:
Variación Intra – grupos:
Variación Inter – grupos
Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media.
6. EJEMPLO DE VARIANZA CON UN FACTOR ANOVA
En un experimento se compararon tres métodos de enseñar un idioma extranjero; para evaluar la instrucción, se
administró una prueba de vocabulario de 50 preguntas a los 24 estudiantes del experimento repartidos de a ocho por
grupo. a) ¿Cuál es la variable respuesta y la explicativa en este estudio?
Respuesta: La variable respuesta es el puntaje en la prueba de vocabulario La variable explicativa son los métodos
de enseñanza (auditivo, traducción y combinado). Es un factor con 3 niveles.
b) Complete la tabla de ANOVA:
Tabla de análisis de varianza (ANOVA)
Suma de
cuadrados
Gl Media
cuadrática
F Sig.
Inter-grupos
Intra-grupos
Total 1460.958
21
323.792 .002
7. EJEMPLO DE VARIANZA CON UN FACTOR ANOVA
Respuesta:
Tabla de ANOVA
Pasos para completar la tabla:
1) calculo los grados de libertad, en el total son n-1 y n=24, por lo tanto son 23. Los grupos a comparar son 3 por lo tanto los gl Inter son 2,
verifico que (2+21) son los 23 del total.
2) La suma de cuadrados Inter se obtiene multiplicando la media cuadrática por los gl, i.e. 323.792*2=647.584
3) Teniendo la SC Inter, saco la SC Intra restando 1460.958-647.584=813.374
4) Con la SC Intra y los gl calculo la media cuadrática Intra =813.374/21=38.732
5) Por último con las dos MC calculo el test F=323.792/38.732=8.360
c) Qué supuestos debería verificar el investigador, escriba las hipótesis asociadas a ellos.
Respuesta: El investigador antes de comparar las medias, debe verificar los supuestos de Normalidad y de Homogeneidad de las varianzas
(el supuesto de independencia se comprueba en el diseño, dividió a 8 estudiantes por cada método).
Suma de
cuadrados
gl Media
cuadrática
F Sig.
Inter-
grupos
Intra-
grupos
Total
647.584
813.374
1460.958
2
21
23
323.792
38.732
8.360 .002
8. ANALISIS DE VARIANZA DE UN FACTOR:
Permite comparar entre sí dos o más medias, a diferencia de la prueba t.
EJEMPLO:
Se está estudiando la relación entre el método de enseñanza y el aprendizaje de una materia. Se aplican tres métodos a tres grupos de
sujetos diferentes: enseñanza presencial, enseñanza por internet y autodidacta.
Se calcula la nota media en el examen de cada grupo.
VI: Método: presencial, internet, autodidacta
VD: Puntuación del examen
¿Son iguales las tres medias poblacionales?
Efectos fijos: Los niveles de la VI los establece el experimentador.
Ejemplo: Efecto del ruido sobre el rendimiento. Fijar 10, 50 y 70 decibelios.
Efectos aleatorios: Los niveles de la VI se toman al azar.
Ejemplo: Efecto del ruido sobre el rendimiento. Tomar tres niveles entre 10 y 100 db. al azar.
Completamente aleatorizado: Los sujetos se asignan al azar, y son distintos en cada grupo de la variable independiente.
Medidas repetidas: Los mismos sujetos pasan por todas las condiciones (niveles de la VI o tratamientos).
ANOVA efectos fijos, completamente aleatorizado (A-EF-CA)
•Se forman J grupos con diferentes sujetos en cada uno.
1. Hipótesis:
•H0: µ1 = µ2 =...= µJ (todas las µ j son iguales)
•H1: µ j ≠ µ j' (alguna µ j es distinta a las otras)
2. Supuestos
• Independencia
• Normalidad
•Homocedasticidad
3. Estadístico de contraste
• Estructura de los datos:
•J: Número de niveles del factor (o VI).
•nj : Nº de observaciones en el nivel j del factor.
•N: nº total de observaciones (si todas las nj son iguales: N = J x n)
9. ANALISIS DE VARIANZA DE UN FACTOR:
i : Sujeto
j : Nivel de la V.I.
Niveles del factor(VI) Observaciones: (VD) Totales Tj
A 1
A 2
A j
A J
Y11 Y21 . . . Yi1 . . . Yn1
Y12 Y22 . . . Yi2 . . . Yn2
Y1j Y2j . . . Yij . . . Ynj
Y1J Y2J . . . YiJ . . . YnJ
T1
T2
Tj
TJ
T
10. METODO REDUCIDO PARA EL ANALISIS DE UN FACTOR
En primer lugar calculamos los siguientes estadísticos a partir de la tabla de las observaciones en cada nivel:
Niveles Observaciones de X Cálculos al margen
Nivel 1 x11 x12 x1n1 n1
Nivel 2 x21 x22 x2n2 n2
... ... ... ...
Nivel t xt1 xt2 xtnt nt
N B A
11. METODO REDUCIDO PARA EL ANALISIS DE UN FACTOR
Entonces las siguientes cantidades admiten una expresión muy sencilla:
Calculamos:
Y dado el nivel de significación buscamos en la tabla de la distribución F de Snedecor el valor
rechazando H0 si Fexp>Fteo,
13. REGION CRITICA EN UN CONTRASTE ANOVA
Ejemplo
Se aplican 4 tratamientos distintos a 4 grupos de 5 pacientes, obteniéndose los resultados de la tabla que se adjunta.
Queremos saber si se puede concluir que todos los tratamientos tienen el mismo efecto. Para ello vamos a suponer que
estamos en condiciones de aplicar el modelo de un factor.
Tratamientos Observaciones ni
Tratamiento
1
-1 1 2 0 -1 5 1 1/5 7
Tratamiento
2
-2 -4 -5 -4 -7 5 -22 484/5 110
Tratamiento
3
0 -1 -2 -4 -1 5 -8 64/5 22
Tratamiento
4
1 4 6 3 8 5 22 484/5 126
N=20 A=265
14. REGION CRITICA EN UN CONTRASTE ANOVA
Fuente de grados de Suma cuadrados Cuasivarianzas Estadístico
variación libertad
Entre t-1=3 = B-C Fexp
tratamien
tos
=204,15 =68,167 =18,676
Dentro de
los
N-t=16 = A-B Fteo = Ft-1,N-t
tratamien
tos
=58,4 =3,65 =3,24
Se rechaza la hipótesis de que los tratamientos tienen el mismo efecto en los tres grupos.
15. REGION CRITICA EN UN CONTRASTE ANOVA
En conclusión, Fexp>Fteo, como se observa en la Figura, por tanto se ha de rechazar la igualdad de efectos de los
tratamientos.
En la Figura se representan las observaciones de cada nivel de tratamiento mediante una curva normal cuyos
parámetros se han estimado puntualmente a partir de las observaciones. Obsérvese que las diferencias más
importantes se encuentran entre Los tratamientos 2 y 4. Esto motiva los contrastes de comparaciones múltiples (dos
a dos), para que, en el caso en que la igualdad de medias sea rechazada, se pueda establecer qué niveles tuvieron
mayor influencia en esta decisión.
Las diferencias más importantes se encuentran entre los niveles 2 y 4.