1. DIPLOMADO EN INVESTIGACION TECNOLOGICA
INTRODUCCIÓN A LOS MODELOS DE
REGRESION APLICADO A LA
INVESTIGACION
Elias Torrez F.
2. OBJETIVO GENERAL
Estimular las
aptitudes del
estudiante para
aprender las técnicas
de los modelos de
regresión aplicados a
los problemas de
investigación
1.- Especificación
de los modelos
2.- Construcción
de una base
empírica
3.- Hipótesis
sobre el
comportamiento
de los términos
aleatorios del
modelo
4.- Contrastación
de los supuestos y
las proposiciones
de la teoría.
5.- Uso del
modelo con fines
de predicción
6.- Manejo de
EVIEWS, SPSS
!!!!Denme una buena base de datos y les dare una tesis doctoral!!!!
3. INTRODUCCIÓN GENERALA LOS MODELOS DE
PREDICCION
• Un MODELO es una representación simplificada de la realidad.
• En sentido amplio puede decirse que los modelos de
REGRESION se ocupa de desarrollar medios a través de los
cuales puedan VERIFICARSE HIPÓTESIS de diferentes áreas
de investigación.
• En este proceso intervienen como instrumentos la estadística y las
matemáticas.
• MATEMÁTICAS: soporte lingüístico
• ESTADÍSTICA: técnicas de estimación y contraste
4. TIPOS DE DATOS Y SU ANALISIS
METODOS DE ANALISIS DE DATOS
No
Existen variables
explicativas y
explicadas?
Si
TECNICAS DE
INTERDEPENDENCIA
TECNICAS DE
DEPENDENCIA
Las variables son
cuantitativas
Si No
CORRESPONDENCIAS
SON ORDINALES?
Clasificacion
Analisis cluster
Ambos
Si No
ESCALONAMIENTO OPTIMO
Y MULTIDIMENSIONAL
ANALISIS FACTORIAL
Y C. PRINCIPALES
REDUCCION DE DIMENSIONES
5. SITUACIÓN DENTRO DE LOS MÉTODOS GENERALES DE PREDICCIÓN
ENCUESTAS
DELFOS
BRAINSTORMING
MODELOS DE INFORMACIÓN SUBJETIVA
MODELOS DE DESCOMPOSICIÓN
MODELOS DE ALISADO
MODELOS ARIMA
MODELOS DE SERIES TEMPORALES
MODELOS DE REGRESION
MODELOS INPUT-OUTPUT
DINÁMICA DE SISTEMAS
MODELOS CAUSALES
MÉTODOS DE PREDICCIÓN
Simple, multiples, logit, probit
6. TIPOS DE DATOS Y SU ANALISIS
METODOS DE ANALISIS DE
DATOS
No
Existen variables
explicativas y
explicadas?
Si
TECNICAS DE
INTERDEPENDENCIA
TECNICAS DE
DEPENDENCIA
Cuantas variables se
explican?
una Varias
Es cuantitativa?
Si No
Variables explicativas
cuantitativas?
Si No
REGRESION
ANALISIS DE
VARIANZA
Variables explicativas
cuantitativas?
Si No
ANALISIS
CONJUNTO
ANALISIS
DISCRIMINATE
ANALISIS
CANONICO
7. Dibujar el diagrama de dispersion
Lineal? Realizar
tranformacion
No
Estimar la funcion de
respuesta
Si
Observaciones
repetidas?
Construir la prueba
de ajuste
Estimar el error
estandar
Encuentre la correcta
transformacion
Pruebas de
ajuste
significativas?
Condiciones
de los residuos
adecuados?
Construir ANOVA y
Prueba T
Compare el
modelo con otros
modelos y
seleccione el
mejor
SI
SI
NO
NO
SI
NO
PASOS EN EL PROCESO DE ANALISIS DE REGRESION
9. ESQUEMA GENERAL DE ELABORACIÓN DE UN
MODELO DE PREDICCION
1. Especificar un modelo inicial
2. Obtención y tratamiento de datos
3. Estimación del modelo
4. Validación del modelo
5. Reespecificación del modelo a raíz de la validación
6. Analizar las diferentes alternativas y seleccionar
7. Predicción, simulación o descripción.
10. FINALIDAD DE LOS MODELOS DE PREDICCION
• Análisis estructural o descriptivo cuantificación de la relación
que durante el periodo analizado ha existido entre las variables
implicadas. El conocimiento del signo y valor de los parámetros del
modelo, suministra una base importante para la comprensión del
fenómeno en estudio.
• Predicción o establecimiento de los valores futuros, de una cierta
variable que tratamos de explicar, dados unos hipotéticos valores
futuros para los factores que la condicionan.
• Evaluación de políticas o simulación de los efectos que tienen
sobre la variable a explicar, diferentes estrategias que afectan a las
variables explicativas
11. REQUISITOS PREVIOS A LA ELABORACIÓN DE
MODELOS
• Adecuada formación teórica del fenómeno objeto de estudio.
• Conocimiento suficientemente preciso de la realidad a describir
• Análisis previo de modelos de regresión similares
• Conocimiento a priori de las limitaciones y posibilidades de la
información estadística disponible
• Principio de parsimonia: un modelo nunca puede llegar a ser una
descripción completamente exacta de la realidad, porque para ello se
tendría que desarrollar un modelo tan complejo que no sería útil en la
práctica
CONCLUSIÓN:
“Sólo se puede hacer un buen modelo de aquello
que se conoce con suficiente profundidad”
12. ESPECIFICACIÓN DEL MODELO
• Es de las etapas más complicadas dado que al inicio no hay nada
acerca de las variables explicativas a introducir.
• Especificar las relaciones de causalidad
• Comenzar con modelos sencillos
• Determinar la forma funcional:
- Modelo lineal
- Modelo no lineal
• Especificar el tipo de modelo y el tipo de variables: consideración
de aspectos cualitativos
• Consideración de modelos alternativos
• Especificar alguna restricción sobre los parámetros.
13. TIPOS DE MODELOS DE PREDICCION
• Por el número de ecuaciones
Uniecuacionales y multiecuacionales
• Por la inclusión o no de variables retardadas:
Estáticos y dinámicos
• Por el tipo de datos que utilice:
Temporales y transversales
• Por la forma funcional de las ecuaciones
Lineales y no lineales
14. TIPOS DE VARIABLES QUE INTERVIENEN EN LOS
MODELOS
1) ENDÓGENAS : aquellas cuyos valores se determinan por el modelo. Se
consideran estocásticas
2) PREDETERMINADAS : aquellas cuyos valores se determinan fuera del
modelo.
Se consideran no estocásticas o fijas en el muestreo.
2.1) Exógenas corrientes: si hacen referencia al periodo de tiempo
actual
2.2) Exógenas retardadas: referidas a un periodo de tiempo diferente al
actual
2.3) Endógenas retardadas: referidas a un periodo de tiempo diferente
del actual
Pero ¿cómo decidir el carácter endógeno o
predeterminado de las variables?
15. LA CAUSALIDAD EN LOS MODELOS
• “x causa y si variaciones en x provocan variaciones en y”
• Las relaciones de causa efecto pueden ser simultáneas o
desfasadas en el tiempo.
• La clasificación de las variables debe estar fundamentada en
consideraciones teóricas y conocimientos a priori sobre el
fenómeno objeto de estudio
• Concepto de causalidad propuesto por Granger: “una
variable x sólo puede ser causa de y si mejora la explicación que
puede tenerse de y en función de sus propios valores anteriores”
• Hay veces que la causalidad se produce en los dos
sentidos: necesidad de utilizar modelos multiecuacionales donde
se determinan simultáneamente varias variables endógenas
16. LA CAUSALIDAD (Cont.)
La existencia de correlación
estadística entre dos variables
¿Implica la existencia de una
relación causal entre ellas?
El rechazo de un variable
regresora como válida en los
contrastes de hipótesis
¿Implica que no existe
relación entre la variable
explicativa y la explicada?
LA EXISTENCIA DE CAUSALIDAD IMPLICA LA
EXISTENCIA DE CORRELACIÓN PERO NO AL
REVÉS
EN LOS CONTRASTES ESTADÍSTICOS TIENE
MÁS FUERZA EL RECHAZO QUE LA ACPTACIÓN
17. OBTENCIÓN Y TRATAMIENTO DE DATOS
• Adecuación de la variable teórica con las estadísticas
disponibles: necesidad, a veces, de utilizar variables “proxy”
• Utilización de datos temporales o transversales (o ambos)
• Número de datos suficiente
• Observar variaciones bruscas, cambios de tendencia u
otras irregularidades e indagar sus causas
• Introducción de datos cualitativos a través de variables
ficticias
18. Yi= ß1X1i+ ß2X2 i+ ß3X3 i+ . . . + ßkXki +i
• Y: variable endógena o a explicar...
• X1, X2,X3, . . .,Xk: variables predeterminadas o que explican(1)
• ß1, ß2, ß3, . . ., ßk: parámetros a estimar.
• : Perturbación aleatoria.
(1) X1= 1, cuando el hiperplano tenga ordenada en el origen.
FORMULACIÓN ESTADÍSTICA DEL MODELO
20. LA PERTURBACIÓN ALEATORIA
• Recoge todas las demás variables que inciden en Y, incluida una
cierta aleatoriedad, pero que por su supuesta insignificancia no
explicitamos en el modelo.
• De esta manera estamos suponiendo que la relación entre Y y X es
estocástica y no determinista, es decir, a cada valor de X
corresponderá no un único valor de Y sino, por la influencia de la
perturbación aleatoria, un conjunto de valores, unos más probables
que otros.
• OBJETIVO : estimar para cada valor de X un valor promedio o
representativo de Y. Estimar la RECTA DE REGRESIÓN
POBLACIONAL
21. ESTIMACIÓN DEL MODELO
• Estimar la RECTA DE REGRESIÓN POBLACIONAL
• En base a la información proporcionada por una muestra de datos
de las variables (nube de puntos) obtenemos la RECTA DE
REGRESIÓN MUESTRAL
• Método de estimación: MÍNIMOS CUADRADOS ORDINARIOS
• Una vez estimados los parámetros del modelo, éste proporciona
unos valores estimados para la variable endógena.
• RESIDUO: Valor real de Y - Valor estimado de Y
22. MÉTODO DE LOS MÍNIMOS CUADRADOS
ORDINARIOS (MCO)
• Básicamente se trata de obtener la mejor recta (o
hiperplano) que se ajuste a la nube de puntos
• Pero por un conjunto de puntos pueden pasar múltiples
rectas, cada una de ellas basadas en un método o estimador
diferente.
• Se comprueba que el estimador MCO disfruta de las
propiedades deseables que se le exigen a un buen
estimador (insesgadez, eficiencia, consistencia) si se
cumplen una serie de hipótesis
• Consiste en minimizar la suma de los errores al cuadrado
23.
24.
25. HIPÓTESIS BÁSICAS DEL MODELO LINEAL
GENERAL
A) HIPÓTESIS REFERIDAS A LA PERTURBACIÓN:
1) Distribución normal, justificada por el teorema central del límite
2) Media nula, es decir, los efectos individuales de las variables contenidas en
la perturbación tienden a compensarse en términos medios.
3) Homocedasticidad o varianza constante .
4) No autocorrelación: esta hipótesis se justifica por el hecho de que si
hubiese alguna correlación en la perturbación, esto vendría a decirnos que
existiría algún patron sistemático de comportamiento, es decir algo no
aleatorio, que no se ha explicitado en el modelo y convendría explicitarlo. Se
incurriría, por tanto en un error de especificación del modelo.
B) HIPÓTESIS SOBRE LAS VARIABLES EXPLICATIVAS
(REGRESORES):
1) Los regresores son fijos, es decir no se consideran aleatorios, tomarían los
mismos valores para muestras distintas.
2) No colinealidad, o no relación lineal entre los regresores del modelo.
26. INERPRETACIÓN DE LOS PARÁMETROS
ESTIMADOS
• MODELOS LINEALES
Término constante: valor estimado de la endógena cuando todos los
regresores se anulan
Coeficientes de pendiente ( i ):
• MODELOS NO LINEALES
• Modelo potencial: el coeficiente de pendiente representa la
elasticidad
• Modelo exponencial: el coeficiente de pendiente representa la tasa de
crecimiento
Variación absoluta estimada de Y cuando X
se incrementa en una unidad y el resto de las
variables permanecen constantes
27. MODELO LINALIZACIÓN â INTERPRETACIÓN
(en términos medios)
t
t
t X
Y
t
t
t X
Y
t
t
dX
dY Variación absoluta de Y ante
incrementos unitarios de X
Modelo
potencial
t
e
X
e
Y t
t
t
t
t LnX
LnY
t
t
t
t
X
dX
Y
dY
/
Elasticidad
Variación porcentual de Y
ante incrementos porcentua-
les unitarios de X
Modelo
exponencial
t
t
e
e
Y X
t
t
t
t X
LnY
t
t
t
dX
Y
dY
/ Variación relativa de Y ante
incrementos absolutos unita-
rios de X.
Si X fuese la variable tiempo
podriamos interpretarlo co-
mo la tasa de crecimiento
de Y
Para expresarlo en porcentaje
habría que multiplicar por
100
INTERPRETACIÓN DE LOS MODELOS NO LINEALES
28. INTRODUCCIÓN DE VARIABLES FICTICIAS EN EL
MODELO
FORMA DE
CUANTIFICARLA
Si sólo tiene dos modalidades
daremos el valor 1 a la presencia de
una de ellas y cero en otro caso
FINALIDAD Introducción de información cualitativa
FORMAS DE
INTRODUCIRLA EN EL
MODELO
Afectando al término independiente
Afectando a la pendiente
Afectando a ambos términos
REGLA
PRÁCTICA
Introducir tantas variables como
modalidades presente el atributo
menos una
29. EJEMPLO 1: INTRODUCCIÓN DE UNA VAR. FICTICIA CON DOS MODALIDADES
Modelo que explica el salario anual de un profesor universitario (Y) en
función de: años de experiencia (X) y sexo (D)
D
= 1 si el profesor es hombre
= 0 si el profesor es mujer
CASO 1.1: Afectando al término independiente: i
i
X
i
2
1
i D
α
α
Y
Salarios promedios i
i
i X
D
X
1
i α
)
0
,
/
E(Y
i
i
i X
D
X
)
α
(
)
1
,
/
E(Y 2
1
i
2
Variación que sufre el salario al pasar de mujer a hombre
independientemente de los años de experiencia
En este caso la variación del salario ante cambios
unitarios de los años de experiencia sería la misma para
ambos sexos.
1
Salario anual medio de una profesora universitaria sin años
de experiencia
Interpretación de los parámetros (en términos medios)
30. CASO 1.2: Afectando al término independiente y a la pendiente
i
i
i
i X
X
D
3
i
2
1
i D
α
α
Y
Salarios promedios
i
i
i X
D
X
1
i α
)
0
,
/
E(Y
i
i
i X
D
X )
(
)
α
(
)
1
,
/
E(Y 3
2
1
i
Variable cruzada
1
Salario anual medio de una profesora universitaria sin años
de experiencia
2
Variación que sufre el salario al pasar de mujer a hombre
independientemente de los años de experiencia
3
Variación que sufre la tasa de variación de los salarios al
pasar de una profesora a un profesor universitario.
Interpretación de los parámetros
Tasa de variación del salario de una profesora
universitaria.
(en términos medios)
31. EJEMPLO 2: INTRODUCCIÓN DE UNA VARIABLE FICTICIA CON 3 MODALIDADES
Modelo que explica el gasto anual en salud (Y) en función de: ingreso anual
(X) y educación
i
i
X
3i
3
2i
2
1
i D
α
D
α
α
Y
Educación
Primaria
Secundaria
Universitaria
Necesito introducir dos
variables ficticias
D2
= 1 si la ed. es secundaria
= 0 en otro caso
D3
= 1 si ed. universitaria
= 0 en otro caso
Cuando D2 y D3 son iguales a cero Educación primaria
Introducción en el modelo
32. Interpretación de los parámetros
1
Gasto en salud autónomo cuando la educación es primaria
2
Variación que sufre el gasto en salud autónomo al pasar de
una educación primaria a otra secundaria
3
Variación que sufre el gasto en salud autónomo al pasar de
una educación primaria a otra universitaria
Tasa de variación del gasto en salud respecto del
ingreso anual. En esta caso se considera que es la
misma independientemente del nivel educativo
(en términos medios)
Gasto promedio
i
i X
D
D
X
1
3
2
i α
)
0
0
,
/
E(Y
i
i X
D
D
X
)
α
(
)
0
1
,
/
E(Y 2
1
3
2
i
i
i X
D
D
X
)
α
(
)
1
0
,
/
E(Y 3
1
3
2
i
33. EJEMPLO 3: INTRODUCCIÓN DE DOS VARIABLES FICTICIAS
Modelo que explica el gasto anual en vestuario (Y) en función de:
ingreso (X), sexo(D2) y situación de empleo o no empleo (D3)
i
i
i
i
i ε
X
β
D
D
α
D
α
D
α
α
Y
3
2
4
3
3
2
2
1
Gasto promedio
i
i X
D
D
X
1
3
2
i α
)
0
0
,
/
E(Y
i
i X
D
D
X
)
α
(
)
0
1
,
/
E(Y 2
1
3
2
i
Introducción en el modelo
i
i X
D
D
X
)
α
(
)
1
0
,
/
E(Y 3
1
3
2
i
D2
= 1 si es mujer
= 0 si es hombre
D3
= 1 si trabaja
= 0 si no trabaja
Situación laboral
Sexo
i
i X
D
D
X
)
α
(
)
1
1
,
/
E(Y 4
3
2
1
3
2
i
34. Interpretación de los parámetros (en términos medios)
1
Gasto en vestuario de un hombre sin trabajo
2
Efecto diferencial en el gasto al pasar de hombre a mujer
3
Efecto diferencial en el gasto al pasar a una situación de trabajo
Tasa de variación del gasto en salud respecto del
ingreso anual. En esta caso se considera que es la
misma independientemente del nivel educativo
4
EFECTO INTERACCIÓN O MULTIPLICATIVO
El efecto sobre el gasto de una mujer trabajadora es
mayor que la suma de los efectos individuales
35. VALIDACIÓN DEL MODELO
• Los signos de los coeficientes deben ser los esperados
• MEDIDA DE BONDAD DE AJUSTE: coeficiente de determinación
“porcentaje de variación de Y explicada por el modelo”
• Contrastes de significatividad:
– De los parámetros: posibilidad de anulación de algún coeficiente
– Del modelo en su conjunto: anulación de todos los coeficientes
– Valor p o valor de probabilidad: nivel de significación más bajo al cual se
puede rechazar la hipótesis nula
• Constancia estructural: Test de Chow
• Capacidad predictiva postmuestral
• El modelo debe satisfacer las hipótesis de partida.
36. EL COEFICIENTE DE DETERMINACIÓN (R2)
INTERPRETACIÓN Proporción de varianza explicada por el modelo
• Es una medida de bondad de ajuste del modelo
• Se obtiene a partir del análisis de la varianza
• ¡Cuidado con las correlaciones espúreas!
• Varía entre 0 y 1 exigiéndose valores no menores a un 90%
• Alcanzará valores elevados mientras más fácil de interpretar sea el
comportamiento descrito por los datos (evoluciones regulares, sin
cambios de tendencia, sin alteraciones en el ritmo de crecimiento
• Para comparar la bondad de ajuste de dos modelos debemos tener
la misma variable endógena
37. CONTRASTE DE SIGNIFICATIVIDAD INDIVIDUAL
DE LOS PARÁMETROS
•Nos preguntamos si podemos aceptar como válida (en un sentido
estadístico) las variables regresoras introducidas en el modelo
•Este contraste se realiza mediante la prueba t
0
:
0
i
H
0
:
1
i
H )
(
)
β̂
.(
.
β
β̂
)
β̂
.(
.
β̂
)
β
(
t
i
i
i
i
i
i
exp k
n
t
e
e
t
siendo
e
e
Regla de decisión: rechazar H0 si
2
/
exp
t
t
Siendo el nivel de
significación
38. CONTRASTE DE SIGNIFICATIVIDAD CONJUNTA
DEL MODELO
• Nos preguntamos si podemos aceptar como válido (en un sentido
estadístico) que las variables regresoras (sin considerar el término
independiente) consideradas conjuntamente son buenas para
explicar la endógena
• Este contraste se realiza mediante la prueba F
0
....β
β
β
: k
3
2
0
H
caso
otro
H :
1
)
,
1
(
)
/(
)
1
(
)
1
/(
R
2
2
exp k
n
k
F
F
siendo
k
n
R
k
F
Regla de decisión: rechazar H0 si
F
F
exp
Siendo el nivel de
significación
39. LA MULTICOLINEALIDAD
Se presenta cuando algunas de las variables regresoras están
correlacionadas, incumpliendo una de las hipótesis de partida
En la práctica siempre existe, en mayor o menor grado, una
multicolinealidad aproximada. Por ello se dice que la
multicolinealidad es una cuestión de grado no de existencia
¿Cuándo deja esta correlación de ser normal y pasa a ser
perjudicial para la correcta interpretación del modelo?
Se supone que es un problema de la muestra y no de la población
Existen muchos métodos para detectarla pero es aún un problema
no resuelto en la econometría
Si el modelo se utiliza de cara a la predicción no será un problema
importante si asumimos que la correlación entre las variables se
mantiene en el futuro
40. CONSECUENCIAS DE LA MULTICOLINEALIDAD
• Los estimadores MCO son insesgados consistentes y
eficientes pero:
• Intervalos de confianzas amplios
• El modelo suele ser sigificativo pero la mayoría de las
variables individualmente no lo son
• Dificultad en la interpretación de los parámetros
TIENEN VARIANZAS MUY GRANDES
41. FORMAS DE DETECTAR LA
MULTICOLINEALIDAD: reglas prácticas
• Coeficiente de correlación simple
• R2 elevado y pocas t significativas
• Correlaciones parciales
• Regresiones auxiliares: la multicolinealidad puede ser
un problema complicado si el R2 de una regresión
auxiliar es mayor que el R2 global
42. SOLUCIONES A LA MULTICOLINEALIDAD
CAMBIAR DE
MODELO
•Eliminar la variable menos significativa
•Eliminación de tendencias
AMPLIAR LA
INFORMACIÓN
•Ampliar la muestra
•Utilización de datos mixtos
•Información inicial de algún parámetro
OTROS MÉTODOS
DE ESTIMACIÓN
•Interés relativo.
•Componentes principales
•Regresión Cresta
ACEPTAR LA
MULTICOLINEALIDAD Y
VIGILAR SUS CONSECUENCIAS
SOLUCIÓN HABITUAL
43. LAAUTOCORRELACIÓN
CAUSAS
• Naturaleza de los datos
• Sesgo de especificación
• Existencia de variables endógenas retardadas
• Manipulación de los datos
• Suele ser un problema cuando se utilizan datos
temporales
CONSECUENCIAS
• Los estimadores son insesgados
• Los estimadores son ineficientes
• Es más fácil aceptar la hipótesis de que
algún parámetro es igual a 0
MÉTODOS PARA
DETECTARLA
• Método gráfico
• Contraste de Durbin-Watson
SOLUCIÓN
Transformar el modelo hasta que cumpla
las hipótesis
44. LAAUTOCORRELACIÓN: CONTRASTE DE DURBIN-WATSON
SUPUESTOS DE PARTIDA
• La perturbación se genera mediante un
AR(1)
• No se incluye como regresor a la v ariable
dependiente retardada
APLICACIÓN DEL
CONTRASTE
1. Obtener los residuos del modelo
2. Calcular el estadístico d
3. Buscar en la tabla los valores dL y du para un n
y un nº de varaiables explicativas determinado
REGLA DE
DECISIÓN
Rechazar H0 si:
d< dL o’
d> 4-du
ación
autocorrel
no
H
0
ación
autocorrel
H
1 )
ˆ
1
(
2
)
(
2
2
2
2
1
ρ
e
e
e
d n
t
t
t
n
t
t
t
t
blanco
ruido
iable
una
siendo
t
t
t ρu
u var
1
45. LA HETEROCEDASTICIDAD
CAUSAS
• Sesgo de especificación
• Existencia de variables endógenas retardadas
• Manipulación de los datos
• Suele ser un problema cuando se utilizan datos
transversales
CONSECUENCIAS
• Los estimadores son insesgados
• Los estimadores son ineficientes
• Es más fácil aceptar la hipótesis de que
algún parámetro es igual a 0
MÉTODOS PARA
DETECTARLA
•Método gráfico
•Contraste de Goldfeld-Quandt
•Pruebas de Glejser
SOLUCIÓN
Transformar el modelo hasta
que cumpla las hipótesis
MÍNIMOS
CUADRADOS
PONDERADOS
Transformación logarítmica
46. ERRORES DE ESPECIFICACIÓN
TIPOS DE
ERRORES
1. Omisión de una variable relevante
2. Inclusión de una variable innecesaria
3. Forma funcional equivocada
4. Errores de medición
CONSECUENCIAS DE
LA OMISIÓN DE
VARIABLES
• Estimadores sesgados e inconsistentes
• Varianzas de los estimadores sesgadas
• Conclusiones equivocadas en relación a
los contrastes de significatividad
CONSECUENCIAS DE
LA INCLUSIÓN DE
VARIABLES
IRRELEVANTES
• Estimadores insesgados y consistentes
• Estimadores ineficientes
47. PREDICCIÓN Y SIMULACIÓN
Para la predicción es preciso disponer de los valores de futuro de
las variables exógenas:
Generación automática: el tiempo o variables ficticias
Decisión libre de la institución que realiza la predicción: precios de
venta de una empresa, gastos de publicidad
Variables exógenas simuladas de acuerdo a ciertas hipótesis de
evolución
Causas de los errores de predicción:
1) Proceso de estimación
2) Mala especificación del modelo o a una información estadística
defectuosa
3) Equivocada asignación de valores a las variables exógenas
4) Comportamiento no nulo de los residuos (por ejemplo residuos
autorregresivos)
48. SITUACIONES DE PREDICCIÓN FAVORABLES AL
EMPLEO DE MODELOS
• Predicciones a medio y largo plazo
• Datos anuales para evitar la estacionalidad
• Información estadística suficiente de las variables
• Constancia estructural
• Proceso permanente de revisión de predicciones
49. PRECAUCIONES EN LAAPLICACIÓN DE MODELOS
PARA LA CONSTRACTACIÓN DE TEORÍAS
Las teorías no son leyes universales: la contrastación de una teoría queda limitada
al marco de referencia para el que ha sido concebida
La confrontación con los datos puede realizarse mediante modelos de
predicción diferentes
La confrontación puede realizarse con datos temporal y espacialmente
diferentes: la contrastación empírica suele ser parcial e incompleta
Los resultados del contraste deberán hacerse siempre en términos de
probabilidad: no podemos afirmar de un modelo que sea verdadero o falso sino más
probable o menos probable
La evidencia empírica permite refutar pero no verificar
Conclusión:
Los modelos no pueden, por sí solos, ni crear teoría ni
tan siquiera confirmarla o refutarla . Su misión se
limita a señalar ciertos caminos de investigación que
parecen, en ese momento, más seguros
50. LOS MODELOS DINÁMICOS
RAZONES PARA
INCLUIR
RETARDOS
•Sicológicas: inercia en los hábitos
•Tecnológicas
•Institucionales
TIPOS DE
MODELOS
DINÁMICOS
1. Modelo de retardos distribuidos
2. Modelo autorregresivo
t
t
t
t
t X
X
X
Y
2
2
1
1
0
t
t
t
t
t
t Y
Y
X
X
Y
2
2
1
1
1
1
0
• Permiten dinamizar la teoría
• Permiten evaluar los efectos a corto y a largo plazo en la variable
endógena
SI APLICAMOS MCO
Problemas de
MULTICOLINEALIDAD
51. LOS MODELOS DINÁMICOS: INTERPRETACIÓN
t
K
t
K
t
t
t
t X
X
X
X
Y
...
2
2
1
1
0
0
MULTIPLICADOR DE CORTO
PLAZO O DE IMPACTO
Variación media de Y
ante un cambio unitario
de X en el mismo
periodo de tiempo
1
0
MULTIPLICADORES
INTERMEDIOS
2
1
0
.......
Variación media de Y
ante un cambio unitario
de X en los periodos
sucesivos
k
o
i
i
MULTIPLICADOR DE LARGO
PLAZO O TOTAL
52.
53. BIBLIOGRAFÍA
• GUJARATI, D. N. (1994): Econometría. Mc. Graw Hill
• PULIDO A. PEREZ J. Modelos econometricos (2001) “ Guia para la elaboracion de modelo econometricos
con Eviews”
• I GUSTI NGURAH AGUNG (2009) “Time series data analysis using eviews”
• MADDALA, G., S. (1996) Introducción a la econometría. Prencice-Hall.
• NOVALES, A. (1993): Econometría. Mc. Graw Hill.
• OTERO, J. M. (1989): Modelos económetricos y predicción de series temporales. Editorial AC.
• PINDYCK, R. Y RUBINFELD., D. (1991): Econometric models and econometric forecast. Mc. Graw- Hill.
• URIEL, E. Y RAIMOND, J. L. (1987): Investigación econométrica aplicada: un caso de estudio. Editorial
AC.