3. Análisis de Regresión Lineal:
Realizar la Regresión del PIB del Ejercicio Análisis de Datos,
con los siguientes datos de salida:
4. Análisis de Regresión Lineal:
Gráfico de Regresión Ajustada: Muestra en rojo el valor en “y”
que los puntos deberían tener si se encuentran sobre la línea. Y
en azul los puntos originales.
Es decir, se visualizan los valores estimados de la Ecuación y los
valores muestrales. Los puntos tocan a la línea, lo que indica el
alto grado de correlación que tienen las dos variables.
Correlación positiva
0.00
2,000,000.00
4,000,000.00
6,000,000.00
8,000,000.00
10,000,000.00
12,000,000.00
14,000,000.00
16,000,000.00
0 5 10 15
PIB
x
x Curva de regresión ajustada
PIB
Pronóstico PIB
6. Análisis de Regresión Lineal:
Gráfico de Residuales: Se muestran los datos positivos y
negativos. Los datos no están dispersos y permanecen cerca del
cero. Siguen una tendencia
-1,000,000.00
-500,000.00
0.00
500,000.00
0 2 4 6 8 10 12
Residuos
x
x Gráfico de los residuales
8. Análisis de Regresión Lineal:
Estadísticas de la Regresión:
Observaciones: Hay 11 datos
Coeficiente de correlación múltiple: también llamando “r” o “R”,
coeficiente de Pearson (indica la relación entre dos variables)
Coeficiente de determinación R^2: el cuadrado “R”
La variación que se observa en los datos: 90% de ellos es
explicable con la recta de regresión lineal. Y el otro 10% se
explica por errores aleatorios.
9. Análisis de Regresión Lineal:
Estadísticas de la Regresión:
Error Típico: Varianza de los residuos.
R^2 ajustado: depende del número de observaciones, de
coeficientes en la regresión. Se acerca al coeficiente de
determinación R^2
10. Análisis de Regresión Lineal:
Análisis de la varianza:
Por lo que la, la variabilidad que se observa de los datos en el
eje “y” (total, la diferencia de cada dato “y”, y la media de los
datos en “y”, es decir la variación vertical de cada uno de los
datos con respecto a la media, al cuadrado), es explicable con la
suma de dos variabilidades:
La que es explicable por la recta (regresión, la diferencia de las
coordenadas “y” que están sobre la recta y la media, al
cuadrado) y la que es explicable por la aleatoriedad (residuos, la
variación que hay entre cada dato y la recta, al cuadrado, es
decir, es la suma de los residuos al cuadrado).
11. Análisis de Regresión Lineal:
Análisis de la varianza:
Grados de libertad: Una cantidad que permite introducir una
corrección matemática en los cálculos estadísticos.
Suma de cuadrados:
1. Regresión: Suma de los errores debido a la regresión.
2. Residuos: Suma del cuadrado de los errores debido a la
aleatoriedad (restos de los residuos).
3. Total: Suma total de la variación de los datos.
12. Análisis de Regresión Lineal:
Análisis de la varianza:
Interpretación: El modelo se explica más por la regresión.
1. En la medida, que la variación total se explique más por la
regresión: se dice que los errores son pequeños con
respecto a la línea, por lo tanto los puntos están cercanos a
la línea.
2. En la medida que el dato de los residuos sea grande con
respecto a la regresión o es cercano al total: los puntos
estarán bastante separados de la línea, por lo tanto la
variabilidad observada no es explicada con la regresión sino
que es explicada con errores aleatorios
13. Análisis de Regresión Lineal:
Análisis de la varianza:
Promedio de los cuadrados: es el cociente, de la suma de los
cuadrados entre los grados de libertad.
Interpretación: El modelo es explicable por la regresión.
1. Si el promedio de los cuadrados de la regresión es mayor
que el promedio de los cuadrados de los residuos: la mayoría
de la variabilidad es explicable por la regresión, los puntos
se concentran cerca de la línea.
14. Análisis de Regresión Lineal:
Análisis de la varianza:
Lo anterior se confirma con:
Estadístico “F”: es el cociente, del promedio de los cuadrados
de la regresión y el promedio de los cuadrados de los residuos.
Es una comparación de la variabilidad dada por la regresión y la
variabilidad explicada por los errores aleatorios.
Interpretación: Se correlaciona de manera lineal
1. Si F, es mayor (muy alto), al valor crítico de F: los puntos se
correlacionan de una manera lineal.
15. Análisis de Regresión Lineal:
Análisis de los coeficientes:
Coeficientes:
1. Intercepto (a, α). Independiente
2. X (b, β)
Lo que nos permite definir la Ecuación de Regresión:
y= 11,004,640.55 +261,140.44 x
16. Análisis de Regresión Lineal:
Análisis de los coeficientes:
Error típico: Es el error de los coeficientes, es decir, la
varianza de a y b al cuadrado.
Estadístico t (student): es el cociente del coeficiente y el error
típico. Se utiliza para determinar si hay una diferencia
significativa entre dos medias de dos grupos, es decir, se utiliza
cuando se desea comparar dos medias.
Se tiene el supuesto de los coeficientes son cero.
17. Análisis de Regresión Lineal:
Análisis de los coeficientes:
Probabilidad:
Interpretación: Hay correlación entre las dos variables
Si esta es pequeña en comparación con el estadístico, indica que
hay correlación entre las dos variables, y los coeficientes α y β,
no son cero.
18. Análisis de Regresión Lineal:
Análisis de los coeficientes:
Intervalo de Confianza: Rango de valores, derivado de los
estadísticos de la muestra, en el cual se encuentra el verdadero
valor del parámetro.
El nivel de confianza indica qué tan probable es que el parámetro de
población, como por ejemplo la media, esté dentro del intervalo de
confianza.
19. Análisis de Regresión Lineal:
Análisis de los coeficientes:
Interpretación: Los coeficientes no son cero
Para un valor del coeficiente a o α (11,004,640.55 ), se tiene un
intervalo de confianza que va desde 10,583,692.35 a
11,425,588.74
Para un valor del coeficiente a o α (261,140.44 ), se tiene un
intervalo de confianza que va desde 199,075.02 a 323,205.87
Ambos Intervalos están a la derecha del cero, por lo que se
confirma que los coeficientes no son cero.
20. Análisis de Regresión Lineal:
Análisis de los residuales:
Se tienen las observaciones, los pronósticos y los residuos.
Varianza: media aritmética del cuadrado de las desviaciones respecto a la media de una distribución.
Media aritmética: promedio de los datos
Desviaciones: raíz cuadrada de la varianza.
http://www.vitutor.com/estadistica/descriptiva/a_15.html
https://www.youtube.com/watch?v=yTC4mfHSzHY
Varianza: media aritmética del cuadrado de las desviaciones respecto a la media de una distribución.
Media aritmética: promedio de los datos
Desviaciones: raíz cuadrada de la varianza.
http://www.vitutor.com/estadistica/descriptiva/a_15.html
https://www.youtube.com/watch?v=yTC4mfHSzHY
Varianza: media aritmética del cuadrado de las desviaciones respecto a la media de una distribución.
Media aritmética: promedio de los datos
Desviaciones: raíz cuadrada de la varianza.
http://www.vitutor.com/estadistica/descriptiva/a_15.html
https://www.youtube.com/watch?v=yTC4mfHSzHY
Varianza: media aritmética del cuadrado de las desviaciones respecto a la media de una distribución.
Media aritmética: promedio de los datos
Desviaciones: raíz cuadrada de la varianza.
http://www.vitutor.com/estadistica/descriptiva/a_15.html
https://www.youtube.com/watch?v=yTC4mfHSzHY
Varianza: media aritmética del cuadrado de las desviaciones respecto a la media de una distribución.
Media aritmética: promedio de los datos
Desviaciones: raíz cuadrada de la varianza.
http://www.vitutor.com/estadistica/descriptiva/a_15.html
https://www.youtube.com/watch?v=yTC4mfHSzHY