Este documento describe los conceptos de regresión y correlación lineal. La regresión lineal analiza la relación entre una variable dependiente (Y) y una independiente (X) mediante una línea recta. La correlación mide la fuerza de esta relación entre -1 y 1. Se provee un ejemplo con datos de tiempo y número de servicios donde se calcula la ecuación de regresión, el coeficiente de correlación r=0.98 y coeficiente de determinación r2=0.96, lo que indica una fuerte relación positiva entre las variables.
Regresión por Mínimos Cuadrados: Ajuste de un modelo matemático por medio de la suma de los cuadrados de las diferencias entre los valores reales y los valores estimados para obtener una suma de los cuadrados de los errores.
Este tutorial permite conocer con detalle, usando la hoja de cálculo Excel 2007, la construcción de un diagrama de dispersión y el ajuste de una recta. Además, se realiza un ejercicio econométrico de estimación del modelo de regresión lineal simple para saber si los coeficientes estimados son estadísticamente significativos y evaluar la bondad del ajuste.
Regresión por Mínimos Cuadrados: Ajuste de un modelo matemático por medio de la suma de los cuadrados de las diferencias entre los valores reales y los valores estimados para obtener una suma de los cuadrados de los errores.
Este tutorial permite conocer con detalle, usando la hoja de cálculo Excel 2007, la construcción de un diagrama de dispersión y el ajuste de una recta. Además, se realiza un ejercicio econométrico de estimación del modelo de regresión lineal simple para saber si los coeficientes estimados son estadísticamente significativos y evaluar la bondad del ajuste.
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...JAVIER SOLIS NOYOLA
El Mtro. JAVIER SOLIS NOYOLA crea y desarrolla el “ROMPECABEZAS DE ECUACIONES DE 1ER. GRADO OLIMPIADA DE PARÍS 2024”. Esta actividad de aprendizaje propone retos de cálculo algebraico mediante ecuaciones de 1er. grado, y viso-espacialidad, lo cual dará la oportunidad de formar un rompecabezas. La intención didáctica de esta actividad de aprendizaje es, promover los pensamientos lógicos (convergente) y creativo (divergente o lateral), mediante modelos mentales de: atención, memoria, imaginación, percepción (Geométrica y conceptual), perspicacia, inferencia, viso-espacialidad. Esta actividad de aprendizaje es de enfoques lúdico y transversal, ya que integra diversas áreas del conocimiento, entre ellas: matemático, artístico, lenguaje, historia, y las neurociencias.
Un libro sin recetas, para la maestra y el maestro Fase 3.pdfsandradianelly
Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestr
Instrucciones del procedimiento para la oferta y la gestión conjunta del proceso de admisión a los centros públicos de primer ciclo de educación infantil de Pamplona para el curso 2024-2025.
2. Página 2 de 12
REGRESIÓN Y CORRELACIÓN LINEAL1
Son dos herramientas para investigar la dependencia de una variable dependiente Y en función de
una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, también se llama regresar o respuesta
X = Variable independiente, también se llama variable explicativa, regresar o predictor
Regresión lineal - La relación entre X e Y se representa por medio de una línea recta
Regresión curvilínea - La relación entre X e Y se representa por medio de una curva.
Y * *
** * * * *
* * * *
* b1 * * * *
* * * *
* * * * * *
b0
Correlación positiva Correlación negativa X
Sin correlación
La ecuación de la recta es la siguiente:
El término de error es la diferencia entre los valores reales observados Yi y los valores estimados
por la ecuación de la recta. Se trata de que estos sean mínimos, para lo cual se utiliza el método de
mínimos cuadrados.
1
Elfego Alarcon
estimadaregresióndeModeloXbbY
muestraladedatosenbaseConeXbbY
poblaciónlaenbaseConXY
...................
.................
.............
10
´*
10
10
+=
++=
++= εββ
3. Página 3 de 12
Y
*
*
X
Se trata de minimizar la suma de todos los errores o residuos:
Las fórmulas resultado de la minimización de lo cuadrados del error se aplicarán en el siguiente
ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresión poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X (Homocedasticidad)
en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algún patrón definido.
El coeficiente de Correlación r desarrollado por Carl Pearson es un indicador de la fuerza de la
relación entre las variables X e Y, puede asumir valores entre -1 y 1 para correlación negativa y
positiva perfecta respectivamente. Por ejemplo, si se encuentra que la variable presión tiene una
correlación positiva con el rendimiento de una caldera, se deben buscar soluciones al problema
mediante acciones asociadas con la variable presión; de lo contrario, sería necesario buscar la
solución por otro lado.
*
)(Re YiYisiduoError −==
4. Página 4 de 12
Se identifican tres medidas de desviación como sigue:
Y
Yest = 4.4 + 1.08 X
Yi = 23 * Desviación no explicada
Error = (Yi - Yest) = 1.32
Variación total
(Yi-Ymedia)=5.13 Desviación explicada
(Yest-Ymedia) = 3.81
Ymedia =17.87
X = 16 X
Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo está
relacionado con su número. Calcular el coeficiente de correlación y graficar. Los datos de tiempo
tomados para n = 25 servicios se muestran a continuación:
X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X)2
(Yi-Y)2
Yest Error
2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
5. Página 5 de 12
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447 220.0926
ΣX ΣY Sxy Sxx Syy = SST SSE
X promedio Y Promedio Σ(Xi-X)*(Yi-Y) Σ(Xi-X)^2 Σ(Yi-Y)^2
Sxy Sxx Syy
Si todos los puntos estuvieran completamente sobre la recta la ecuación lineal sería
y = a + bx. Como la correlación no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los cálculos tomando las sumas de cuadrados
siguientes se muestran a continuación:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
Las ecuaciones para el cálculo manual son las siguientes:
XX
XY
S
S
XXi
YYiXXi
b =
−
−−
==
∑
∑
211
)(
))((
ˆβ = 2.902704421
XY
n
XY
b
ii
β
β
β ˆ
ˆ
ˆ 1
00 −=
−
==
∑ ∑ = 5.114515575
6. Página 6 de 12
Las sumas de cuadrados son:
∑ =−= 2
)( YYSST i 6,105.9447
∑∑ =+−=−= 22
))*1(()ˆ( iiii XbboYYYSSE 220.0926
=−= SSESSTSSR 5,885.8521
El coeficiente de determinación r2 y el coeficiente de correlación r se calculan a continuación:
SST
SSR
SST
SSESST
SST
SSE
r =
−
=−=
)(
12
= 0.9639
El coeficiente de determinación indica el porcentaje de la variación total que es explicada por la
regresión.
2
rr = = 0.9816
El coeficiente de correlación proporciona el nivel de ajuste que tienen los puntos a la línea recta
indicando el nivel de influencia de una variable en la otra. El factor de correlación r es un número
entre –1 (correlación negativa evidente) y +1 (correlación positiva evidente), y r = 0 indicaría
correlación nula.
El coeficiente de correlación r = 0.98 por lo cual tenemos suficiente evidencia estadística para
afirmar que el tiempo de atención esta relacionado con el número de servicios atendidos.
USO DE EXCEL
1. En el menú Herramientas seleccione la opción Análisis de datos. Datos de ejemplo 6.
2. Seleccione la opción Regresión.
3. Seleccione el rango de entrada, estos corresponden a los datos numéricos de la tabla.
7. Página 7 de 12
4. Seleccione Resumen de estadísticas.
5. En opciones de salida seleccione en Rango de salida, una celda de la hoja de calculo que
este en blanco ( a partir de está celda serán insertados los resultados).
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.981811778
Coeficiente de determinación R^2 0.963954368
R^2 ajustado 0.962387167
Error típico 3.093419627
Observaciones 25
ANÁLISIS DE VARIANZA Suma de Promedio de
Grados de
libertad Cuadrados cuadrados F
Valor crítico de
F
Regresión 1 5885.852069 5885.852069 615.0800898 4.24118E-18
Residuos 23 220.0926348 9.569244992
Total 24 6105.944704
Coeficientes Error típico Estadístico t Probabilidad Inferior 95%
Intercepción 5.114515575 1.145804127 4.463691004 0.000177215 2.744239161
XServicios 2.902704421 0.117040719 24.80080825 4.24118E-18 2.660587249
X Servicios Curva de regresión ajustada
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
0 5 10 15 20 25
X Servicios
YTiempo
YTiempo
Pronóstico Y Tiempo
Lineal (Pronóstico Y
Tiempo)
8. Página 8 de 12
En la gráfica observamos que al aumentar el número de servicios el tiempo de atención aumenta.
.
Los intervalos de confianza para la media y el intervalo de predicción para un punto específico X
son los siguientes:
tSyiestYYxparaIP
SCx
XXi
n
SeSyi
±=
−
++=
*
2
..
)(1
1
tSyestYparaIC
SCx
XXi
n
SeSy
xy ±=
−
+=
*
!
2
..
)(1
µ
9. Página 9 de 12
EJERCICIOS:
1. La energía consumida en un proceso depende del ajuste de máquinas que se
realice, realizar una regresión cuadrática con los datos siguientes y responder las preguntas.
Cons_energía
Ajuste
Máq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.7
36.2 29.1
a) Trazar un diagrama de dispersión
b) Obtener la ecuación de regresión lineal y cuadrática y comparar
c) Estimar el consumo de energía para un ajuste de máquina de 20 con regresión cuadrática
d) Obtener los intervalos de predicción y de confianza para
un ajuste de máquina de 20
e) Obtener el coeficiente de correlación y de determinación
2. En base al porcentaje de puntualidad se trata de ver si hay correlación con las quejas en una línea
aérea. Las quejas son por cada 100000 pasajeros.
%puntos Quejas
Aerolinea X Y
A 81.8 0.21
10. Página 10 de 12
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22
a) Trazar un diagrama de dispersión
b) Obtener la ecuación de regresión lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%
d) Obtener los intervalos de predicción y de confianza para una altura de 63"
e) Obtener el coeficiente de correlación y de determinación
Ejercicio de aplicación pecuaria.
1) Un veterinario en una granja utilizo 6 niveles de vitamina A(gramos) en borregos para
determinar si existe correlación entre cada uno de los niveles de vitamina sumistrados, los
resultados se encuentran en la siguiente tabla aplicando el método de regresión y
correlación concluya
Vitamina A (g) Peso (kg)
18 12.0
21 14.0
25 16.6
30 16.5
32 18.0
36 20.0
2) Se cree que cierto tipo de antibiótico incluido en la dieta para pollos parrillero tiene un efecto
positivo sobre el peso final sin que tenga efecto residual en la carne, los datos de la
siguiente tabla es una muestra aleatoria, realice los cálculos necesarios y compruebe si
dicha hipótesis es verdadera.
11. Página 3 de 12
Y
*
*
X
Se trata de minimizar la suma de todos los errores o residuos:
Las fórmulas resultado de la minimización de lo cuadrados del error se aplicarán en el siguiente
ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresión poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X (Homocedasticidad)
en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algún patrón definido.
El coeficiente de Correlación r desarrollado por Carl Pearson es un indicador de la fuerza de la
relación entre las variables X e Y, puede asumir valores entre -1 y 1 para correlación negativa y
positiva perfecta respectivamente. Por ejemplo, si se encuentra que la variable presión tiene una
correlación positiva con el rendimiento de una caldera, se deben buscar soluciones al problema
mediante acciones asociadas con la variable presión; de lo contrario, sería necesario buscar la
solución por otro lado.
*
)(Re YiYisiduoError −==