Regresión Lineal Múltiple

      Supuesto de Homocedasticidad
Para cada valor de la variable independiente (o
combinación de valores de las variables
independientes), la varianza de los residuos es
constante.
Homocedasticidad
Si la varianza de los errores no es constante a lo largo
de las observaciones, la regresión es heterocedastica.
En este caso, VAR ( i / xi )   i2 , i  1,2,..., n.
Asumiendo que los errores están incorrelacionados
dos a dos. Por tanto,
                             12 0 0 ... 0
                             0  2 0 ... 0
                                  2
          E    2  
                                      
                             0   0 0 ...  n
                                           2
Homocedasticidad
                               i2   2i
Resultará a veces útil escribir
En cualquier caso, ésta es una escala arbitraria.
                                              n

  Así usaremos la normalización tr ()     n
                                             i 1
                                                    i


 Esto hace el modelo clásico de regresión con
  errores homocedásticos un simple caso
  especial con i  1
Contrastes de Heterocedasticidad
•   El contraste de Goldfeld y Quand
•   El contraste de Breusch y Pagan
•   El contraste de Glesjer
•   El contraste de Harvey
•   El contraste de White
•   El contraste de Spearman
Heterocedasticidad
• El contraste de Breusch y Pagan
  Breusch y Pagan han ideado un contraste de
   multiplicadores de Lagrange para la hipótesis
   nula  i2   2 f (0   zi ),
Donde zi                    es un vector de variables
   independientes. El modelo es Homocedastico
   si   0
El contraste puede llevarse a cabo mediante una
Heterocedasticidad
una sencilla regresión:
LM=1/2 de la suma de cuadrados explicada en la
  regresión de  ei2 /(ee / n) en z i
Para propósitos de calculo, sea Z la matriz n   p  1
De observaciones de 1, z , y sea g el vector de
                               i


  observaciones de            gi  ei2 /(ee / n). . Entonces
    1
    2
                1
                          
LM  g Z Z Z  Z g  n .
Heterocedasticidad
Bajo la hipótesis nula de homocedasticidad,
LM se distribuye asintóticamente como una
chicuadrado con grados de libertad iguales al
numero de variables en zi
Este contraste es bastante sensible al supuesto
de normalidad.
Como se obtiene en R?
• En R Commander nos vamos a modelos,
  diagnósticos numéricos y seleccionamos Test
  de Breusch-Pagan para heteroscedasticidad.

• Por ejemplo
Detección Grafica de la
            Heterocedasticidad
                    > cr.plots(RegModel.2)
  Gráfica del error a través de las distintas
  observaciones del modelo
• Dado que las series económicas presentan casi siempre
  una tendencia definida (positiva o negativa), la simple
  gráfica de error puede servir para conocer
  intuitivamente si el transcurso del tiempo da lugar a un
  incremento o decremento del error, lo que sería
  significativo de una relación entre la evolución de las
  variables del modelo y los valores cada vez mayores o
  cada vez menores de éste.
Heterocedasticidad
• Gráficos del error sintomáticos de presencia
  de heterocedasticidad

      10                                                  6
                                                          4
       5                                                  2
       0                                                  0
                                                         -2
       -5                                                -4
      -10                                                -6

                                                              1

                                                                  3

                                                                      5
                                                                          7

                                                                              9

                                                                                  11

                                                                                       13

                                                                                            15

                                                                                                 17

                                                                                                      19
            1
                3
                    5
                        7
                            9
                                11
                                     13
                                          15
                                               17
                                                    19
Heterocedasticidad
• En ambos, la evolución del tiempo está correlacionada
  con valores cada vez mayores (izquierda) del error o
  cada vez menores (derecha), con lo que el cálculo de la
  varianza     por    subperíodos     arrojaría     valores
  significativamente diferentes; es decir la serie del error
  sería heterocedástica. Evidentemente, este tipo de
  gráficos solo tiene sentido si el modelo es temporal ya
  que, en el caso del modelo transversal, la ordenación
  de valores del eje “X” dependerá del criterio elegido
  para ordenar la muestra, un criterio que puede no
  coincidir con el patrón de crecimiento o decrecimiento
  de la varianza.
Heterocedasticidad
  Gráfica del valor cuadrático del error y los valores de Y y X
• La representación de los valores del error al cuadrado y la
  variable explicada o cada una de las variables explicativas
  puede revelar la existencia de algún patrón sistemático en
  la varianza del error (se entiende que el error al cuadrado
  se asocia con la dispersión del error). Este tipo de gráfico,
  no sólo permite obtener una idea preliminar de si existe o
  no heterocedasticidad sino también de la o las variables
  que pudieran estar conectadas con la misma.
• Eventualmente podrían también realizarse los gráficos con
  valores absolutos del residuo.
Como corregir la heterocedasticidad?
Puede utilizarse una transformación de la
variable dependiente para resolver el
problema (tal como una transformación
logarítmica o una transformación raíz
cuadrada. No, obstante, al utilizar una
transformación de la variable dependiente, no
debe     descuidarse    el    problema     de
interpretación que añade el cambio de escala

Heterocedasticidad

  • 1.
    Regresión Lineal Múltiple Supuesto de Homocedasticidad Para cada valor de la variable independiente (o combinación de valores de las variables independientes), la varianza de los residuos es constante.
  • 2.
    Homocedasticidad Si la varianzade los errores no es constante a lo largo de las observaciones, la regresión es heterocedastica. En este caso, VAR ( i / xi )   i2 , i  1,2,..., n. Asumiendo que los errores están incorrelacionados dos a dos. Por tanto,  12 0 0 ... 0 0  2 0 ... 0 2 E    2    0 0 0 ...  n 2
  • 3.
    Homocedasticidad  i2   2i Resultará a veces útil escribir En cualquier caso, ésta es una escala arbitraria. n Así usaremos la normalización tr ()     n i 1 i Esto hace el modelo clásico de regresión con errores homocedásticos un simple caso especial con i  1
  • 4.
    Contrastes de Heterocedasticidad • El contraste de Goldfeld y Quand • El contraste de Breusch y Pagan • El contraste de Glesjer • El contraste de Harvey • El contraste de White • El contraste de Spearman
  • 5.
    Heterocedasticidad • El contrastede Breusch y Pagan Breusch y Pagan han ideado un contraste de multiplicadores de Lagrange para la hipótesis nula  i2   2 f (0   zi ), Donde zi es un vector de variables independientes. El modelo es Homocedastico si   0 El contraste puede llevarse a cabo mediante una
  • 6.
    Heterocedasticidad una sencilla regresión: LM=1/2de la suma de cuadrados explicada en la regresión de ei2 /(ee / n) en z i Para propósitos de calculo, sea Z la matriz n   p  1 De observaciones de 1, z , y sea g el vector de i observaciones de gi  ei2 /(ee / n). . Entonces 1 2  1  LM  g Z Z Z  Z g  n .
  • 7.
    Heterocedasticidad Bajo la hipótesisnula de homocedasticidad, LM se distribuye asintóticamente como una chicuadrado con grados de libertad iguales al numero de variables en zi Este contraste es bastante sensible al supuesto de normalidad.
  • 8.
    Como se obtieneen R? • En R Commander nos vamos a modelos, diagnósticos numéricos y seleccionamos Test de Breusch-Pagan para heteroscedasticidad. • Por ejemplo
  • 9.
    Detección Grafica dela Heterocedasticidad > cr.plots(RegModel.2) Gráfica del error a través de las distintas observaciones del modelo • Dado que las series económicas presentan casi siempre una tendencia definida (positiva o negativa), la simple gráfica de error puede servir para conocer intuitivamente si el transcurso del tiempo da lugar a un incremento o decremento del error, lo que sería significativo de una relación entre la evolución de las variables del modelo y los valores cada vez mayores o cada vez menores de éste.
  • 10.
    Heterocedasticidad • Gráficos delerror sintomáticos de presencia de heterocedasticidad 10 6 4 5 2 0 0 -2 -5 -4 -10 -6 1 3 5 7 9 11 13 15 17 19 1 3 5 7 9 11 13 15 17 19
  • 11.
    Heterocedasticidad • En ambos,la evolución del tiempo está correlacionada con valores cada vez mayores (izquierda) del error o cada vez menores (derecha), con lo que el cálculo de la varianza por subperíodos arrojaría valores significativamente diferentes; es decir la serie del error sería heterocedástica. Evidentemente, este tipo de gráficos solo tiene sentido si el modelo es temporal ya que, en el caso del modelo transversal, la ordenación de valores del eje “X” dependerá del criterio elegido para ordenar la muestra, un criterio que puede no coincidir con el patrón de crecimiento o decrecimiento de la varianza.
  • 12.
    Heterocedasticidad Gráficadel valor cuadrático del error y los valores de Y y X • La representación de los valores del error al cuadrado y la variable explicada o cada una de las variables explicativas puede revelar la existencia de algún patrón sistemático en la varianza del error (se entiende que el error al cuadrado se asocia con la dispersión del error). Este tipo de gráfico, no sólo permite obtener una idea preliminar de si existe o no heterocedasticidad sino también de la o las variables que pudieran estar conectadas con la misma. • Eventualmente podrían también realizarse los gráficos con valores absolutos del residuo.
  • 13.
    Como corregir laheterocedasticidad? Puede utilizarse una transformación de la variable dependiente para resolver el problema (tal como una transformación logarítmica o una transformación raíz cuadrada. No, obstante, al utilizar una transformación de la variable dependiente, no debe descuidarse el problema de interpretación que añade el cambio de escala