2. • MCO , ,
• MCRL , , -- > MELI
• ¿Qué tan cerca están los estimadores de los verdaderos parámetros?
• , , variables aleatorias; Por tanto es necesario conocer sus
distribuciones para sacar conclusiones
Teoría clásica
Estimación
Prueba de hipótesis
3. Distribución de probabilidad de las pertubaciones
= = , (1) siempre que =
Pero como
= + + :
= ( + + ) (2)
Por tanto es una función de y dependerá de su supuesto
• como se requiere conocer las distribuciones de probabilidad de los
estimadores de MCO, la naturaleza de la distribución de probabilidad
de ui desempeña un papel importante en las pruebas de hipótesis
4. ¿Qué sabemos de ?
• Sabemos poco de ¿Su distribución
probabilística?
• Debemos suponer que las u siguen una determinada
distribución de probabilidad
• Suponemos que tiene la distribución de
probabilidad Normal
• Modelo clásico de regresión lineal normal (MCRLN).
5. Supuesto de normalidad de
• El modelo clásico de regresión lineal normal supone que cada ui está
normalmente distribuida con:
7. Razón # 1
Se espera que la influencia de las variables omitidas o descartadas sea
pequeña y, en el mejor de los casos, aleatoria
• Teorema central del límite (TCL) Si existe un gran número de
variables aleatorias independientes con idéntica distribución,
entonces, con pocas excepciones, la distribución de su suma tiende a
ser normal a medida que se incrementa al infinito el número de tales
variables
• Aunque el número de variables no sea muy grande, o si estas
variables no son estrictamente independientes, su suma puede estar
aún normalmente distribuida
8. Razón # 2
• Se derivan con facilidad las distribuciones de probabilidad de los
estimadores de MCO:
• Una propiedad de la distribución normal es que cualquier función
lineal de variables normalmente distribuidas estará también
normalmente distribuida.
• Como ya analizamos, los estimadores de MCO y son funciones
lineales de . Por consiguiente, si está normalmente distribuida,
también lo están y , lo cual hace que la tarea de probar
hipótesis sea muy fácil.
9. Razón #3
• La distribución normal es una distribución comparativamente sencilla
y requiere sólo dos parámetros (la media y la varianza);
• al parecer muchos fenómenos se rigen por la distribución normal.
10. Razón # 4
• Se permite utilizar las pruebas estadísticas t, F y χ2 para los modelos
de regresión
• las pruebas t y F que se basan en el supuesto de que el término de
error está distribuido normalmente pueden seguir aplicándose con
validez
12. • Si suponemos que
Los estimadores MCO tienen las siguientes propiedades:
1. Son insesgados
2. Tienen varianza mínima. En combinación con 1, esto significa que
son estimadores insesgados con varianza mínima, o eficientes
3. Presentan consistencia; es decir, a medida que el tamaño de la
muestra aumenta indefinidamente, los estimadores convergen
hacia sus verdaderos valores poblacionales.
13. 4. al ser una función lineal de , está normalmente distribuída:
14. 5. (al ser una función lineal de ui) está normalmente distribuida
con
15. 6. (n − 2)( / ) está distribuida como la distribución χ2 (ji cuadrada),
con (n − 2) gl.
• (Saber esto ayuda a hacer inferencias respecto de la verdadera a
partir de la estimada)
7. ( , ) se distribuyen de manera independiente respecto de
8. y tiene las varianzas mínimas entre todas las clases de
estimadores insesgados lineales y no lineales. mejores estimadores
insesgados (MEI)
16. Resumiendo lo importante
• El supuesto de normalidad permite derivar las distribuciones de
probabilidad, o muestrales, de y (ambas normales), y de
(relacionada con ji cuadrada).
• si suponemos que N(0, ), Yi, al ser una función lineal de ,
posee también una distribución normal con una media y una varianza
dadas por
17. Regresión con dos variables:
estimación por intervalos y pruebas de hipótesis
18.
19.
20.
21.
22. Estimación por intervalos
• es de 0.7240, que constituye una cifra estimada (puntual) del valor
poblacional desconocido
• ¿Qué tan confiable es esta estimación? En muestreos repetidos
E(
• En estadística, la confiabilidad de un estimador puntual se mide por
su error estándar.
• Por tanto, en lugar de depender de un solo estimador puntual, se
puede construir un intervalo alrededor del estimador puntual; por
ejemplo, dentro de dos o tres errores estándar a cada lado del
estimador puntual, tal que este intervalo tenga, por ejemplo, 95% de
probabilidad de incluir al verdadero valor del parámetro.
23. ¿Qué tan cerca está de ?
• Intervalo de confianza
• 1 – α coeficiente de confianza
• α nivel de significancia 0 < α < 1
• ( - δ) y ( + δ) Límites de confianza o valores críticos
24. A tener en cuenta
• No se afirma que la probabilidad de que se encuentre entre los
límites dados sea 1 − α.
• Como se supone que , aunque se desconoce, es un número fijo,
se dice que está o no está dentro del intervalo.
• Se establece que, al utilizar el método, la probabilidad de construir
un intervalo que contenga es 1 − α.
• El intervalo a construir es aleatorio, porque se basa en , que
también es aleatorio
• si se construyen muchos intervalos de confianza como el anterior
con base probabilís ca de 1 − α, a la larga, en promedio, tales
intervalos contendrán, en 1 − α de los casos, el valor verdadero del
parámetro.
25. • El intervalo es aleatorio siempre y cuando sea
desconocido, una vez que se conoce ya no podemos
afirmar que la probabilidad de que el intervalo fijo dado incluye
al verdadero sea 1- . Cuando lo encontramos y calculamos,
afirmamos que: la probabilidad de que el verdadro B esté en el
intervalo ( o fuera )de él es de 0 ó 1
26. Intervalos de confianza para los coeficientes
de regresión y
• Demostramos que con el supuesto de normalidad de , los
estimadores de MCO y son en sí mismos normalmente
distribuidos con medias y varianzas allí establecidas.
• Por consiguiente, por ejemplo, la variable
•
Si Z
27. • Si se conoce , una propiedad importante de una variable
normalmente distribuida con media µ y varianza es que el área bajo la
curva normal entre µ ± σ es cercana a 68%, que entre µ ± 2σ es alrededor
de 95%, y que entre los límites µ ± 3σ el área es cercana a 99.7%.
• Pero pocas veces se conoce 𝟐 y, en la práctica, está determinada por el
estimador insesgado 𝟐
28. la variable t, así definida, sigue la distribución t con n − 2 gl
29. Por consiguiente, en lugar de utilizar la distribución normal, se puede
utilizar la distribución t para construir un intervalo de confianza para β2 de
la siguiente forma:
Pr (− ≤t ≤ ) =1−α
30. • De vuelta al ejemplo de regresión del salario promedio por hora (Y) y
el nivel de escolaridad (X):
• Datos:
• = 0.7240; = -0.01445
• ee( )=0.0700; ee( )= 0.9317359
• 13 observaciones 11 gl
• Suponemos
•
• ∝/ = 2.201
𝟐
𝟏
0,57 0,88
31.
32. • La interpretación de este intervalo de confianza es:
• Dado el coeficiente de confianza de 95%, en 95 de cada 100 casos,
los intervalos como la ecuación (1) contendrán al verdadero valor de
β2.
• por consiguiente, β2 se encontrará o no dentro de él: la probabilidad
de que el intervalo fijo específico incluya al verdadero valor de β2 es
por consiguiente 1 o 0.
33. Intervalo de confianza para
Por tanto, con la distribución χ2 se establece el intervalo de confianza
para :
∝/ ∝/
34. • = 21.9200 y = 3.8157
• (13 – 2)
• 0.4484
• La interpretación de este intervalo es la siguiente: Si establecemos
límites de confianza a 95% sobre , se puede afirmar que en
muestras repetidas, entre estos límites caerá el verdadero ,
39. • En nuestro ejemplo, ¿Es = 0.724 consistente con la hipótesis
planteada? De ser así , NO rechazaremos la hipótesis, de lo contrario
tendremos que rechazar.
• Hipótesis nula ; Hipótesis alterna (Ej. )
• puede ser simple o compuesta
¿Es compatible o no lo es una observación o un hallazgo,
según algunas hipótesis planteadas?
40. ¿En qué consiste la prueba de hipótesis?
Reglas que
Permitan
aceptar o
Rechazar Ho
intervalo de confianza
prueba de significancia
42. Prueba bilateral o de dos colas
• En nuestro ejemplo, el coeficiente de pendiente es 0.7240.
Supongamos que se postula que:
• ¿Es = 0.724 compatible con la hipótesis planteada?
• Sabemos que los intervalos como (0.5700, 0.8780) contendrán al
verdadero β2 con una probabilidad de 95%.
• Por consiguiente, si el β2 en Ho se encuentra dentro del intervalo de
confianza 100(1 − α)%, no se rechaza la hipótesis nula; si se encuentra
por fuera del intervalo, se puede rechazar.
Hipótesis bilateral
(H1 puede ser > ó >)
43.
44. • ¿Y en nuestro ejemplo?
• (0.5700 0.8780)
• Hallazgo estadísticamente significativo cuando se rechaza la
hipótesis nula
• Hallazgo NO es estadísticamente significativo Cuando No se
rechaza la hipótesis nula
45. Prueba unilateral o de una cola
• Existen expectativas de que la hipótesis alternativa es unilateral o
unidireccional, por lo que, por ejemplo podemos plantear:
48. Prueba de significancia de los coeficientes de
regresión: la prueba t
• Se utiliza los resultados muestrales para verificar la verdad o falsedad
de una hipótesis nula
• Utilizamos un estadístico de prueba (un estimador) y su distribución
muestral según la hipótesis nula para aceptar o no la Ho.
• El procedimiento consiste en utilizar la distribución t como este
estadístico de prueba
50. Ojo con la diferencia
• Intervalo de confianza Establecer un rango o intervalo que tenga
una probabilidad determinada de contener al verdadero aunque
desconocido β2,
• Prueba de significancia Someter a hipótesis algún valor de y se
ve si el calculado se encuentra dentro de límites (de confianza)
razonables alrededor del valor sometido a hipótesis
51. En nuestro ejemplo:
• = 0.724 ; 13 observaciones 11 gl; ee( ) = 0.700
• Si / = 2.201
= ∗
= 0.5 y :
52.
53. Otra forma:
un valor “grande” de |t| será evidencia en contra de la hipótesis nula
54.
55. • Un estadístico es estadísticamente significativo si el valor del
estadístico de prueba cae en la región crítica. En este caso, se rechaza
la hipótesis nula.
• Una prueba no es estadísticamente significativa si el valor del
estadístico de prueba cae en la región de aceptación. No se rechaza la
hipótesis nula
56. En una sola cola
• Supongamos que la experiencia
indica que la pendiente es mayor
que 0.5
57. La prueba t de significancia: reglas de decisión
58. Prueba de significancia de : la prueba χ2
Ejercicio: Encontrar el valor de y los valores críticos suponiendo que
59.
60. Resultados del ejercicio de la prueba de significancia ji cuadrada
• Con = 16.3845
• Los valores críticos son: 3.8157 y 21.9200
Como el valor
calculado cae dentro
de estos límites, los
datos apoyan la
Hipótesis nula y no la
rechazamos
62. Significado de “aceptar” o “rechazar” una hipótesis
• Si, con base en una prueba de significancia, decidimos “aceptar” la hipótesis nula, no se sostiene
que la hipótesis nula sea verdadera con absoluta certeza, solamente: No existe razón para
rechazarla.
• Al “aceptar” una hipótesis nula siempre se debe tener presente que puede existir otra hipótesis
nula igualmente compatible con los datos
• Ejemplo:
• Teníamos: : = 0.70 Y = 0.7241; ee ( ) = 0.0701
¿Cuál de estas dos hipótesis nulas es la “verdadera”?
Es preferible, por tanto, decir que se puede aceptar la hipótesis nula en lugar de decir que la aceptamos
63. Hipótesis nula “cero” y regla práctica “2t”
• La Hipótesis nula de “cero” es un mecanismo para establecer si Y
tiene relación con X, la variable explicativa
• REGLA 2t práctica:
• Si el número de grados de libertad es 20 o más, y si α, el nivel de
significancia, se fija en 0.05, se rechaza la hipótesis nula = 0 si el
valor de t [ = /ee( ) ]es superior a 2 en valor absoluto
64.
65.
66. ¿Cómo se formulan las Hipótesis nula y alternativa?
• No existen reglas específicas, el fenómeno en estudio sugerirá la
forma de las hipótesis nula y alternativa
• Ejemplo: Se pide estimar la Línea del Mercado de Captiales (LCM) de
la teoría de portafolios: = + , donde:}
• = rendimiento esperado del portafolio y = desviación estándar
del rendimiento, una medida de riesgo.
• : = 0 , entonces
67. Selección del nivel de significancia α
• Errores tipo I y tipo II Esquemáticamente, tenemos
• Lo ideal sería reducir los errores tipo I y tipo II
• Se supone que la probabilidad de que un error tipo I es más grave en la
práctica que un error tipo II.
• tratar de mantener la probabilidad de cometer un error tipo I en un nivel
relativamente bajo, como 0.01 o 0.05, y luego tratar de reducir al máximo
la probabilidad de incurrir en un error tipo II.
• la probabilidad de un error tipo I se representa con α y se denomina nivel
de significancia, y la probabilidad de un error tipo II se representa con β.
68. • ¿por qué α se fija generalmente en los niveles de 1, 5 o, cuanto
mucho, 10%?
• para un tamaño de muestra dada, si tratamos de reducir un error
tipo I, aumenta un error tipo II, y viceversa
• Tamaño de la muestra Compensación
• pocas veces se conocen los costos de cometer los dos tipos de error
69. Nivel exacto de significancia: Valor p
• Probabilidad exacta de cometer un error tipo I.
• Más técnicamente, el valor p se define como nivel de significancia
más bajo al cual puede rechazarse una hipótesis nula
• ¿por qué no tan sólo consultar la tabla estadística y encontrar la
probabilidad real de obtener un valor del estadístico de prueba tan
grande o mayor que el obtenido en el ejemplo?
• Ejemplo: Con : = 0.5 y hallamos t=3.2
¿Cuál es el valor p de obtener un valor t igual o superior
a 3.2?
70.
71. • Con Gretl, se calcula que el valor p de obtener un valor t igual o
mayor que 3.2 es de 0.00001
• Este nivel exacto de significancia del estadístico t es mucho menor
que el nivel de significancia que se fija de manera convencional y
arbitraria, como 1, 5 o 10%.
• si se utilizara el valor p recién calculado y se rechazara la hipótesis
nula de que el verdadero coefi ciente de escolaridad es 0.5, la
probabilidad de cometer un error tipo I sería más o menos de sólo 1
en 100 000.
• a medida que aumenta |t|, el valor p se reduce y, por consiguiente,
se rechaza la hipótesis nula con mayor confi anza