SlideShare una empresa de Scribd logo
1 de 44
Descargar para leer sin conexión
Mgs. Mario Suárez Correlación y Regresión 1
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL Y GRAPH
1) ANÁLISIS DE CORRELACIÓN
Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el
valor de la otra variable.
1.1) DIAGRAMA DE DISPERSIÓN
Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos correspondientes a
los pares ordenados (X,Y) de los valores de las variables.
1.2) CLASIFICACIÓN DE LA CORRELACIÓN
1.2.1) Según la relación entre variables
- Correlación lineal: Se representa mediante una línea recta.
- Correlación no lineal: Se representa con una línea curva.
1.2.2) Según el número de variables
- Correlación simple: La variable dependiente actúa sobre la variable independiente.
- Correlación múltiple: Cuando la variable dependiente actúa sobre varias variables independientes.
- Correlación parcial: Cuando la relación que existe entre una variable dependiente y una
independiente es de tal forma que los demás factores permanezcan constantes.
1.2.3) Según el valor cuantitativo
- Correlación perfecta: El valor del coeficiente de correlación es 1
- Correlación imperfecta: El coeficiente de correlación es menor a 1 sea en sentido positivo o
negativo.
- Correlación nula: El coeficiente de correlación es 0. No existe correlación entre las variables.
Ejemplo: Número de calzado de una persona y su cociente intelectual.
1.2.4) Según el signo
- Correlación positiva.- Dos variables tiene correlación positiva cuando al aumentar o disminuir el
valor de una de ellas entonces el valor correspondiente a la otra aumentará o disminuirá
respectivamente, es decir, cuando las dos variables aumentan en el mismo sentido. Ejemplo: Peso de
una persona y su talla.
- Correlación negativa.- Dos variables tiene correlación negativa cuando al aumentar o disminuir el
valor de una de ellas entonces el valor de la otra disminuirá o aumentará respectivamente, es decir, una
variable aumenta y otra disminuye o viceversa. Ejemplo: Número de partidos ganados por un equipo en
una temporada y su posición final en la tabla.
Mgs. Mario Suárez Correlación y Regresión 2
1.3) COEFICIENTES DE CORRELACIÓN
Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos
respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación
existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites
+1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no
existe relación entre las variables; los valores  1 son indicadores de una correlación perfecta positiva
(al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
No hay correlación
Correlación Positiva
Correlación Negativa
Mgs. Mario Suárez Correlación y Regresión 3
Para interpretar el coeficiente de correlación utilizamos la siguiente escala:
Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
1.3.1) COEFICIENTE DE CORRELACIÓN DE KARL PEARSON
Llamando también coeficiente de correlación producto-momento.
Se calcula aplicando la siguiente ecuación:
∑
√(∑ )(∑ )
r = Coeficiente producto-momento de correlación lineal
XXx  ; YYy 
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de
correlación que existe entre ellas mediante el coeficiente de PEARSON.
X 18 17 15 16 14 12 9 15 16 14 16 18 ΣX =180
Y 13 15 14 13 9 10 8 13 12 13 10 8 ΣY= 138
Solución:
Se calcula la media aritmética
̅
∑
Para X:
̅
Para Y:
̅
Mgs. Mario Suárez Correlación y Regresión 4
Se llena la siguiente tabla:
X Y x = X- 𝑿̅ y = Y- 𝒀̅ x2
xy y2
18 13 3 1,5 9 4,5 2,25
17 15 2 3,5 4 7 12,25
15 14 0 2,5 0 0 6,25
16 13 1 1,5 1 1,5 2,25
14 9 -1 -2,5 1 2,5 6,25
12 10 -3 -1,5 9 4,5 2,25
9 8 -6 -3,5 36 21 12,25
15 13 0 1,5 0 0 2,25
16 12 1 0,5 1 0,5 0,25
14 13 -1 1,5 1 -1,5 2,25
16 10 1 -1,5 1 -1,5 2,25
18 8 3 -3,5 9 -10,5 12,25
Σ =180 Σ= 138 72 28 63
Se aplica la fórmula:
∑
√(∑ )(∑ ) √( )( )
Existe una correlación moderada
En Excel se calcula de la siguiente manera:
Mgs. Mario Suárez Correlación y Regresión 5
El diagrama de dispersión en Excel:
El diagrama de dispersión en el programa Graph:
Mgs. Mario Suárez Correlación y Regresión 6
TAREA DE INTERAPRENDIZAJE
1) Elabore un organizador gráfico de los tipos de correlación.
2) Con los datos de la siguiente tabla sobre las temperaturas del día X y del día Y en determinadas
horas en una ciudad
X 9 10 12 14 16 18 20 22 24 26 28 30
Y 12 14 15 16 17 20 22 23 26 28 31 32
2.1) Calcule el coeficiente de correlación de Pearson empleando la fórmula y mediante Excel.
0,99
2.2) Elabore el diagrama de dispersión de manera manual.
2.3) Elabore el diagrama de dispersión empleando Excel.
2.4) Elabore el diagrama de dispersión empleando el programa Graph.
3) Cree y resuelva un ejercicio similar al anterior.
4) Consulte y presente un ejemplo resuelto del coeficiente de correlación de Pearson para datos
agrupados en intervalos en http://www.monografias.com/trabajos85/coeficiente-correlacion-karl-
pearson/coeficiente-correlacion-karl-pearson.shtml
1.3.2) COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es
decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera
y peso de los atletas.
Se calcula aplicando la siguiente ecuación:
∑
( )
sr = Coeficiente de correlación por rangos de Spearman
d = Diferencia entre los rangos ( X menos Y)
n = Número de datos
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más elevados le asignamos
el rango 1 al siguiente el rango 2 y así sucesivamente. Si se repiten dos puntajes o más se calculan las
medias aritméticas.
Ejemplo ilustrativo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluación
(X) y el rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la
asignatura de Estadística. Realizar el diagrama de dispersión y calcular el coeficiente de correlación por
rangos de Spearman.
Estudiante X Y
Dyana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Mathías 5 6
Josué 6 2
Anita 7 8
Lucía 8 7
Mgs. Mario Suárez Correlación y Regresión 7
Solución:
El diagrama de dispersión hecho en Excel se muestra en la siguiente figura:
Para calcular el coeficiente de correlación por rangos de Spearman de se llena la siguiente tabla:
Estudiante X Y d= X-Y d2
=(X-Y)2
Dyana 1 3 -2 4
Elizabeth 2 4 -2 4
Mario 3 1 2 4
Orlando 4 5 -1 1
Mathías 5 6 -1 1
Josué 6 2 4 16
Anita 7 8 -1 1
Lucía 8 7 1 1
Σ d2
= 32
Se aplica la fórmula:
∑
( ) ( )
Por lo tanto existe una correlación positiva moderada entre la primera y segunda evaluación de los 8
estudiantes.
Mgs. Mario Suárez Correlación y Regresión 8
En Excel se calcula de la siguiente manera:
TAREA DE INTERAPRENDIZAJE
1) Consulte sobre la biografía de Spearman y realice un organizador gráfico de la misma.
2) La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o
puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de
Matemática.
X Y
1 4
2 5
3 6
4 8
5 3
6 2
7 1
8 7
2.1) Realice el diagrama de dispersión en forma manual.
2.2) Realice el diagrama de dispersión empleando Excel.
2.3) Realice el diagrama de dispersión empleando el programa Graph.
2.4) Calcule el coeficiente de correlación por rangos de Spearman empleando la ecuación.
-0,19
2.5) Calcule el coeficiente de correlación empleando Excel.
-0,1905
3) Cree y resuelva un ejercicio similar al anterior.
Mgs. Mario Suárez Correlación y Regresión 9
4) La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las asignaturas de
Matemática y Estadística. Calcular el coeficiente de correlación por rangos de Spearman y realizar el
diagrama de dispersión.
N° Estudiante Matemática Estadística
1 Dyana 10 8
2 Elizabeth 9 6
3 Mario 8 10
4 Orlando 7 9
5 Mathías 7 8
6 Josué 6 7
7 Anita 6 6
8 Lucía 4 9
Consulte la solución de este ejercicio en http://www.monografias.com/trabajos85/coeficiente-
correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml
5) Cree y resuelva un ejercicio similar al anterior.
1.4) COEFICIENTE DE DETERMINACIÓN
Revela qué porcentaje del cambio en Y se explica por un cambio en X. Se calcula elevando al cuadrado
el coeficiente de correlación.
∑
√(∑ )(∑ )
XXx 
YYy 
r = Coeficiente de correlación de Pearson
Coeficiente de determinación
La ecuación del coeficiente producto-momento (Coeficiente de Pearson)
∑
√(∑ )(∑ )
puede
escribirse en la forma equivalente:
∑ (∑ )(∑ )
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
De donde coeficiente de determinación = ( )
Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre las temperaturas, calcular el coeficiente de determinación
empleando la ecuación obtenida de la forma equivalente del coeficiente de Pearson.
X 18 17 15 16 14 12 9 15 16 14 16 18
Y 13 15 14 13 9 10 8 13 12 13 10 8
Mgs. Mario Suárez Correlación y Regresión 10
Solución:
Se calcula el coeficiente de Pearson llenando la siguiente tabla:
X Y XY X2
Y2
18 13 234 324 169
17 15 255 289 225
15 14 210 225 196
16 13 208 256 169
14 9 126 196 81
12 10 120 144 100
9 8 72 81 64
15 13 195 225 169
16 12 192 256 144
14 13 182 196 169
16 10 160 256 100
18 8 144 324 64
Σ X=180 Σ Y =138 Σ XY=2098 Σ X2
= 2772 Σ X2
=1650
Se aplica la ecuación para calcular el coeficiente de Pearson.
∑ (∑ )(∑ )
√[ ∑ (∑ ) ][ ∑ (∑ ) ] √[ ( ) ][ ( ) ]
√[ ][ ] √[ ][ ] √
Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación.
Coeficiente de determinación = ( )
Esto establece que 17,28% del cambio en Y se explica mediante un cambio en X.
Nota:
El r2
tiene significado sólo para las relaciones lineales. Dos variables pueden tener r2
=0 y sin embargo
estar relacionadas en sentido curvilíneo. El valor de r2
no se interpreta como si la variable Y fuera
causado por un cambio de la variable X, ya que la correlación no significa causa.
Mgs. Mario Suárez Correlación y Regresión 11
En Excel se calcula elevando al cuadrado el coeficiente de correlación o insertando la función
=COEFICIENTE.R2 como muestra la siguiente figura:
TAREA DE INTERAPRENDIZAJE
1) La siguiente tabla muestra el dinero en miles de dólares gastado en publicidad por una empresa (X)
para vender sus productos, y el número en miles de clientes (Y) que compran los productos de la
empresa.
X 15 17 14 13 18 20 17 18 16 14 20 18
Y 30 34 28 26 32 40 34 36 32 25 40 36
1.1) Realice el diagrama de dispersión en forma manual.
1.2) Realice el diagrama de dispersión empleando Excel.
1.3) Realice el diagrama de dispersión empleando el programa Graph.
1.4) Calcule el coeficiente de Pearson empleando las dos fórmulas.
0,96015
1.5) Calcule el coeficiente de determinación empleando las dos fórmulas y mediante Excel.
0,9219
Mgs. Mario Suárez Correlación y Regresión 12
2) La siguiente tabla muestra el tiempo en minutos dedicado al estudio y la calificación sobre 10
obtenida.
X 140 150 130 120 170 190 180 160 200 110 100 90
Y 7 8 7 6 8 10 9 8 10 6 5 4
2.1) Realice el diagrama de dispersión en forma manual.
2.2) Realice el diagrama de dispersión empleando Excel.
2.3) Realice el diagrama de dispersión empleando el programa Graph.
2.4) Calcule el coeficiente de Pearson empleando las dos fórmulas.
0,9817
2.5) Calcule el coeficiente de determinación empleando las dos fórmulas y mediante Excel.
0,9638
3) Cree y resuelva un ejercicio similar a los anteriores.
2) ANÁLISIS DE REGRESIÓN
Los primeros y más importantes estudios al respecto se deben a los científicos Francis Galton (1822-
1911) y Karl Pearson (1857-1936). Fue Galton quien utilizó por primera vez el término regresión para
indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos “regresaba” a la media
general.
La regresión examina la relación entre dos variables, pero restringiendo una de ellas con el objeto de
estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la
regresión es un método que se emplea para predecir el valor de una variable en función de valores
dados a la otra variable. En estadística la palabra predecir no se utiliza en el sentido empleado por los
astrólogos, futurólogos y mentalistas, sino mas bien en un sentido lógico como es el de utilizar el
conocimiento del comportamiento de una variable para obtener información sobre otra variable. Por
ejemplo, puede predecirse el resultado que obtendrá un estudiante en su examen final, basados en el
conocimiento de las calificaciones promedio de sus exámenes parciales, o predecir la preferencia de los
estudiantes por profesiones científicas, conociendo los promedios de sus calificaciones en los estudios
escolares.
En todos los casos de regresión existe una dependencia funcional entre las variables. En el caso de dos
variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de
regresión de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresión de la altura de los
árboles sobre su diámetro, lo cual significa que midiendo el diámetro (variable independiente) y
reemplazando su valor en una relación definida según la clase de árbol se obtiene la altura, y aun sin
necesidad de cálculos aprecian la altura utilizando gráficas de la función de dependencia, altura =
función del diámetro.
2.1) PRINCIPIO DE LOS MÍNIMOS CUADRADOS
2.1.1) LA RECTA DE LOS MÍNIMOS CUADRADOS
Se llama línea de mejor ajuste y se define como la línea que hace mínima la suma de los cuadrados de
las desviaciones respecto a ella de todos los puntos que corresponden a la información recogida.
Mgs. Mario Suárez Correlación y Regresión 13
La recta de los mínimos cuadrados que aproxima el conjunto de puntos  11,YX ,  22 ,YX ,  33 ,YX
,……… NN YX , tomando en cuenta a Y como variable dependiente tiene por ecuación
A esta ecuación suele llamarse recta de regresión de Y sobre X, y se usa para estimar los valores de Y
para valores dados de X.
Si a la recta de regresión se le suma en ambos lados ∑ ∑( ) se obtiene
∑ ∑
Si a la recta de regresión se multiplica por X a ambos lados y luego se suma
∑ ∑ ( ) se obtiene ∑ ∑ ∑
Las constantes 0a y 1a quedan fijadas al resolver simultáneamente las ecuaciones anteriormente
encontradas, es decir, al resolver el siguiente sistema de ecuaciones:





 
 
2
10
10
XaXaXY
XaNaY
Que se llaman las ecuaciones normales para la recta de mínimos cuadrados.
Las constantes 0a y 1a de las anteriores ecuaciones también se pueden calcular empleando las
siguientes fórmulas:
∑ ∑ ∑ ∑
∑ (∑ )
∑ ∑ ∑
∑ (∑ )
Otra ecuación para los mínimos cuadrados para XXx  y YYy  de la recta de regresión de Y
sobre X es:
(
∑
∑
)
La recta de los mínimos cuadrados que aproxima el conjunto de puntos  11,YX ,  22 ,YX ,  33 ,YX
,……… NN YX , tomando en cuenta a X como variable dependiente tiene por ecuación
A esta ecuación suele llamarse recta de regresión de X sobre Y, y se usa para estimar los valores de X
para valores dados de Y. Las constantes y quedan fijadas al resolver el siguiente sistema de
ecuaciones:





 
 
2
10
10
YbYbXY
YbNbX
Las constantes y del sistema de ecuaciones anterior se pueden calcular empleando las siguientes
fórmulas:
∑ ∑ ∑ ∑
∑ (∑ )
∑ ∑ ∑
∑ (∑ )
Mgs. Mario Suárez Correlación y Regresión 14
Otra ecuación para los mínimos cuadrados para XXx  y YYy  es:
(
∑
∑
)
El punto de intersección entre las rectas XaaY 10  con YbbX 10  se simboliza  YX, y se llama
centroide o centro de gravedad.
Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de
una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 152 157 162 167 173 178 182 188
Y 56 61 67 72 70 72 83 92
1) Ajustar la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema:





 
 
2
10
10
XaXaXY
XaNaY
2) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas:
∑ ∑ ∑ ∑
∑ (∑ )
∑ ∑ ∑
∑ (∑ )
3) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula:
(
∑
∑
)
4) Ajustar la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema:





 
 
2
10
10
YbYbXY
YbNbX
5) Calcular el punto centroide.
6) Calcular el coeficiente de determinación.
7) Elaborar el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos
cuadrados obtenidas en los pasos anteriores.
8) Estimar el valor de Y cuando X = 200 en el diagrama de dispersión de Y como variable dependiente.
R: 8,2
9) Estimar el valor de X cuando Y= 100 en el diagrama de dispersión X como variable dependiente.
Mgs. Mario Suárez Correlación y Regresión 15
Solución:
Para comenzar a resolver el ejercicio se llena la siguiente tabla:
X Y XY X2
Y2
152 56 8512 23104 3136
157 61 9577 24649 3721
162 67 10854 26244 4489
167 72 12024 27889 5184
173 70 12110 29929 4900
178 72 12816 31684 5184
182 83 15106 33124 6889
188 92 17296 35344 8464
Σ X =1359 Σ Y = 573 Σ XY = 98295 Σ X2
= 231967 Σ Y2
= 41967
1) Reemplazando valores en el sistema se tiene:





 
 
2
10
10
XaXaXY
XaNaY
{ {
Resolviendo el sistema por determinantes (regla de Cramer) se obtiene:
| |
| |
| |
Interpretación:
- El valor indica que la recta tiene una pendiente positiva aumentando a razón de 0,864
- El valor de indica el punto en donde la recta interseca al eje Y cuanto X = 0
Mgs. Mario Suárez Correlación y Regresión 16
En Excel el sistema se resuelve de la siguiente manera:
Reemplazando valores en la ecuación respectiva se obtiene:
2) Con los datos de la tabla anterior se substituye valores en las siguientes ecuaciones:
∑ ∑ ∑ ∑
∑ (∑ ) ( )
∑ ∑ ∑
∑ (∑ ) ( )
Reemplazando valores en la ecuación respectiva se obtiene:
3) Se calcula las medias aritméticas de X y Y para llenar la siguiente tabla:
̅
∑
Mgs. Mario Suárez Correlación y Regresión 17
̅
̅
X Y x= - ̅ y= -̅ xy x2
y2
152 56 -17,88 -15,625 279,297 319,516 244,141
157 61 -12,88 -10,625 136,797 165,766 112,891
162 67 -7,875 -4,625 36,422 62,016 21,391
167 72 -2,875 0,375 -1,078 8,266 0,141
173 70 3,125 -1,625 -5,078 9,766 2,641
178 72 8,125 0,375 3,047 66,016 0,141
182 83 12,125 11,375 137,922 147,016 129,391
188 92 18,125 20,375 369,297 328,516 415,141
Σ X=1359 Σ Y=573 Σxy = 956,625 Σ x2
= 1106,875 Σ x2
= 925,875
Reemplazando valores en la fórmula respectiva se obtiene:
(
∑
∑
) ̅ ( ̅)
( ) ( ) ( )
4) Reemplazando valores en sistema respectivo se obtiene:





 
 
2
10
10
YbYbXY
YbNbX
{ {
Resolviendo el sistema se obtiene:
Mgs. Mario Suárez Correlación y Regresión 18
Reemplazando valores en la ecuación de la recta de mínimos cuadrados se obtiene:
Interpretación:
- El valor indica que la recta tiene una pendiente positiva aumentando a razón de 1,033
- El valor de indica el punto en donde la recta interseca al eje X cuanto Y = 0
5) Para calcular el centroide  YX, se resuelve el sistema formado por las dos rectas de los mínimos
cuadrados en donde X es ̅ y Y es ̅.
{
Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092
6) Se aplica la ecuación para calcular el coeficiente de Pearson.
∑ (∑ )(∑ )
√[ ∑ (∑ ) ][ ∑ (∑ ) ] √[ ( ) ][ ( ) ]
Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación.
Coeficiente de determinación = ( )
7) En Excel, insertando gráfico de dispersión se obtiene la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 19
Empleando el programa Graph se obtiene la siguiente figura:
8) Reemplazando X = 200 en la ecuación solicitada se obtiene:
9) Reemplazando Y = 100 en la ecuación solicitada se obtiene:
TAREA DE INTERAPRENDIZAJE
1) Consulte sobre la biografía de Francis Galton y de Cramer, y realice un organizador gráfico de cada
una.
2) Dada la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una
muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 150 155 160 165 170 175 180 185
Y 55 60 63 67 70 74 79 85
2.1) Ajuste la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema. El
sistema resuelva de manera manual y mediante Excel.





 
 
2
10
10
XaXaXY
XaNaY
Mgs. Mario Suárez Correlación y Regresión 20
2.2) Ajuste la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas
∑ ∑ ∑ ∑
∑ (∑ )
∑ ∑ ∑
∑ (∑ )
2.3) Ajuste la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula
(
∑
∑
)
2.4) Ajuste la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema. El
sistema resuelva de manera manual y mediante Excel.





 
 
2
10
10
YbYbXY
YbNbX
2.5) Ajuste la recta de mínimos cuadrados para X como variable dependiente empleando las fórmulas
∑ ∑ ∑ ∑
∑ (∑ )
∑ ∑ ∑
∑ (∑ )
2.6) Ajuste la recta de mínimos cuadrados para X como variable dependiente empleando la fórmula
(
∑
∑
)
2.7) Calcule el punto centroide de manera manual y empleando Excel.
̅ ̅
2.8) Calcule el coeficiente de determinación.
0,99
2.9) Elabore el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos
cuadrados obtenidas en los pasos anteriores. Elabore de manera manual, empleando Excel y el
programa Graph.
2.10) Estime el valor de Y cuando X = 173 en el diagrama de dispersión de Y como variable
dependiente.
73,6
2.11) Estime el valor de X cuando Y = 73 en el diagrama de dispersión de Y como variable
dependiente.
172,2
3) Cree y resuelva un ejercicio similar al anterior con datos obtenidos de 10 amigas suyas.
Mgs. Mario Suárez Correlación y Regresión 21
2.1.2) LA PARÁBOLA DE LOS MÍNIMOS CUADRADOS
La parábola de mínimos cuadrados que aproxima el conjunto de puntos (X1,Y1) , (X2,Y2),
(X3,Y3),…..(XN,YN) tiene ecuación dada por 2
210 XaXaaY  , donde las constantes 0a , 1a y 2a se
determinan al resolver simultáneamente el sistema de ecuaciones que se forma al multiplicar la
ecuación 2
210 XaXaaY  por 1, X, Y sucesivamente, y sumando después.








4
2
3
1
2
0
2
3
2
2
10
2
210
XaXaXaYX
XaXaXaXY
XaXaNaY
Ejemplo ilustrativo
La siguiente tabla muestra la población de un país en los años 1960-2010 en intervalos de 5 años.
Año 196019651970197519801985 1990 1995 2000 2005 2010
Población (millones) 4,52 5,18 6,25 7,42 8,16 9,12 10,9211,6212,6813,1213,97
1) Ajustar una parábola de mínimos cuadrados de la forma 2
210 XaXaaY 
2) Calcular los valores de tendencia para los años dados.
3) Estimar la población para los años 2015 y 2020.
4) Calcular el coeficiente de determinación.
5) Elaborar un diagrama de dispersión, y en el mismo diagrama graficar la parábola de los mínimos
cuadrados.
Nota: Se recomienda codificar o cambiar la numeración de los años, eligiendo X de modo que el año
central, 1985, corresponda a X= 0, para que se hagan más fáciles los cálculos.
Solución:
1) Para ajustar una parábola de mínimos cuadrados se llena la siguiente tabla:
Año X Y X2
X3
X4
XY X2
Y
1960 -5 4,52 25 -125 625 -22,6 113
1965 -4 5,18 16 -64 256 -20,72 82,88
1970 -3 6,25 9 -27 81 -18,75 56,25
1975 -2 7,42 4 -8 16 -14,84 29,68
1980 -1 8,16 1 -1 1 -8,16 8,16
1985 0 9,12 0 0 0 0 0
1990 1 10,92 1 1 1 10,92 10,92
1995 2 11,62 4 8 16 23,24 46,48
2000 3 12,68 9 27 81 38,04 114,12
Mgs. Mario Suárez Correlación y Regresión 22
2005 4 13,12 16 64 256 52,48 209,92
2010 5 13,97 25 125 625 69,85 349,25
Σ 0 102,96 110 0 1958 109,46 1020,66
Se reemplaza valores en el sistema y se obtiene:








4
2
3
1
2
0
2
3
2
2
10
2
210
XaXaXaYX
XaXaXaXY
XaXaNaY
{ {
Resolviendo el sistema empleando determinantes (regla de Cramer) se obtiene:
Mgs. Mario Suárez Correlación y Regresión 23
El sistema resuelto en Excel se muestra en la siguiente figura:
Reemplazando los valores encontrados se obtiene la ecuación de la parábola de mínimos cuadrados:
Y = 9,464 + 0,995X - 0,01X2
2) Los valores de tendencia se obtienen al reemplazar los valores de X en la ecuación de la parábola de
mínimos cuadrados, los cuales se presenta en la siguiente tabla:
Año X Y Valores de tendencia
Y = 9,464 + 0,995X - 0,01X2
1960 -5 4,52 4,24
1965 -4 5,18 5,32
1970 -3 6,25 6,39
1975 -2 7,42 7,43
1980 -1 8,16 8,46
1985 0 9,12 9,46
1990 1 10,92 10,45
1995 2 11,62 11,41
2000 3 12,68 12,36
2005 4 13,12 13,28
2010 5 13,97 14,19
Mgs. Mario Suárez Correlación y Regresión 24
3) Para estimar la población de los años 2015 y 2020 se transforma estos años a X siguiendo la
secuencia de la tabla anterior, siendo X = 6 para el año 2015 y X= 7 para el 2020
Entonces para el 2015 se tiene:
Y = 9,464 + 0,995X - 0,01X2
=9,464 + 0,995(6) - 0,01(6)2
= 9,464 + 5,97-0,36 =15,074
Para el 2020 se tiene:
Y = 9,464 + 0,995X - 0,01X2
=9,464 + 0,995(7) - 0,01(7)2
= 9,464 + 6,965-0,49 =15,939
4) Se llena la siguiente tabla y se aplica la ecuación para calcular el coeficiente de Pearson
Año X Y X2
XY Y2
1960 -5 4,52 25 -22,6 20,430
1965 -4 5,18 16 -20,72 26,832
1970 -3 6,25 9 -18,75 39,063
1975 -2 7,42 4 -14,84 55,056
1980 -1 8,16 1 -8,16 66,586
1985 0 9,12 0 0 83,174
1990 1 10,92 1 10,92 119,246
1995 2 11,62 4 23,24 135,024
2000 3 12,68 9 38,04 160,782
2005 4 13,12 16 52,48 172,134
2010 5 13,97 25 69,85 195,161
Σ 0 102,96 110 109,46 1073,490
∑ (∑ )(∑ )
√[ ∑ (∑ ) ][ ∑ (∑ ) ] √[ ( ) ][ ( ) ]
Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación.
Coeficiente de determinación = ( )
El coeficiente de determinación calculado en Excel se muestra en la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 25
5) El diagrama de dispersión y la parábola de los mínimos cuadrados mediante Excel se muestra en la
siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 26
Empleando el programa Graph se obtiene la siguiente figura:
TAREA DE INTERAPRENDIZAJE
1) La siguiente tabla muestra la población aproximada de la Provincia de Imbabura en los años
1960-2010 en intervalos de 5 años.
Año 19601965197019751980198519901995200020052010
Población (miles) 123 140 170 201 221 247 296 315 344 356 379
1.1) Ajuste una parábola de mínimos cuadrados de la forma 2
210 XaXaaY 
Y = 256,464 + 26,991X - 0,265X2
1.2) Calcule los valores de tendencia para los años dados de manera manual y empleando Excel.
Año 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Valor de tendencia114,88144,26173,11201,42229,21256,46283,19309,39335,05360,19384,79
1.3) Estime la población para los años 2015 y 2020
Año 2015 = 408,87 miles de habitantes
Año 2020 = 432,42 miles de habitantes
1.4) Calcule el coeficiente de determinación de manera manual y empleando Excel.
Mgs. Mario Suárez Correlación y Regresión 27
0,992
1.5) Elabore un diagrama de dispersión, y en el mismo diagrama graficar la parábola de los mínimos
cuadrados de manera manual, empleando Excel y empleando Graph.
2) Cree y resuelva un ejercicio de aplicación de la parábola de los mínimos cuadrados con datos de la
población del Ecuador o de cualquier otro país de manera manual, empleando Excel y Graph.
2.1.3) REGRESIÓN EXPONENCIAL
Cuando la curva de regresión de y sobre x es exponencial, es decir para cualquier x considerada, la
media de la distribución está dada por la siguiente ecuación predictora:
Tomando logaritmos en ambos miembros:
y se puede estimar ahora log Y y log β, y de ahí obtener  y  , aplicando los métodos de los mínimos
cuadrados.
Donde las constantes  y  quedan fijadas al resolver simultáneamente las ecuaciones:





2
logloglog
logloglog
XXYX
XNY


Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas
por cierto fabricante que aún pueden usarse después de recorrer cierto número de millas:
Miles de Millas recorridas (X) 1 2 5 15 25 30 35 40
Porcentaje útil (Y) 99 95 85 55 30 24 20 15
1) Elaborar el diagrama de dispersión.
2) Ajustar una curva exponencial aplicando el método de mínimos cuadrados.
3) Calcular la ecuación predictora.
4) Graficar la ecuación predictora.
5) Estimar qué porcentaje de las llantas radiales del fabricante durarán 50000 millas.
Solución:
1) Elaborando el diagrama de dispersión empleando Excel se obtiene la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 28
Empleando el programa Graph se obtiene la siguiente figura:
2) Se llena la siguiente tabla:
X Y log Y X2
X· logY
1 99 1,996 1 1,996
2 95 1,978 4 3,955
5 85 1,929 25 9,647
15 55 1,740 225 26,105
25 30 1,477 625 36,928
30 24 1,380 900 41,406
35 20 1,301 1225 45,536
40 15 1,176 1600 47,044
Σ X=153 Σ log Y=12,97759 Σ X2
= 4605 Σ X· logY = 212,61769
Mgs. Mario Suárez Correlación y Regresión 29
Resolviendo empleando Excel se muestra en la siguiente figura:
Reemplazando valores en el sistema se obtiene:





2
logloglog
logloglog
XXYX
XNY


{ {
Al resolver el sistema se obtiene:
| |
| |
| |
Reemplazando valores se obtiene:
Aplicando el antilogaritmo se obtiene:
( )
Mgs. Mario Suárez Correlación y Regresión 30
Resolviendo empleando Excel se muestra en la siguiente figura:
3) Reemplazando en la ecuación predictora se obtiene:
4) Graficando la ecuación predictora empleando Excel se obtiene la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 31
En Graph se obtiene la siguiente figura:
5) La estimación del porcentaje de llantas radiales que durarán 50000 millas se obtiene reemplazando
en la ecuación predictora el valor de X = 50
Entonces el porcentaje sería de 9,106%
TAREA DE INTERAPRENDIZAJE
1) Elabore un organizador gráfico sobre la regresión exponencial.
2) Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante
que aún pueden usarse después de recorrer cierto número de millas:
Miles de Millas recorridas (X) 1 2 5 10 20 30 40 50
Porcentaje útil (Y) 98 92 80 64 36 32 17 11
2.1) Ajuste una curva exponencial aplicando el método de mínimos cuadrados. Resolver manualmente
y empleando Excel. Realizar los cálculos empleando la mayor cantidad de decimales.
2.2) Calcule la ecuación predictora.
2.3) Grafique la ecuación predictora de manera manual, empleando Excel y el programa Graph.
2.4) Estime qué porcentaje de las llantas radiales del fabricante durarán 35000 millas.
21,7%
Mgs. Mario Suárez Correlación y Regresión 32
3) Cree y resuelva un ejercicio empleando los conocimientos de la regresión exponencial de manera
manual, empleando Excel y Graph.
2.1.4) REGRESIÓN POTENCIAL
La regresión potencial tiene por ecuación predictora:
y la regresión recíproca es:
Para el primer caso los valores siguen una ley potencial. Si la ecuación predictora está dada por:

 XY  , tomando logaritmos en ambos miembros, queda:
Donde las constantes  y  quedan fijadas al resolver simultáneamente las ecuaciones:





2
)(logloglogloglog
logloglog
XXYX
XNY


Para el segundo caso, si la ecuación predictora está dada por )/(1 XY   , entonces invirtiendo, la
misma expresión se puede escribir 1/)(/1 XY   , o sea:
Donde las constantes  y  quedan fijadas al resolver simultáneamente las ecuaciones:







21
1
XX
Y
X
XN
Y


Ejemplos ilustrativo N° 1
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable
independiente) e Y es la presión de una masa dada de gas (variable resultante).
X 1 2 3 4 5 6 7
Y 7 30 90 170 290 450 650
1.1) Elaborar el diagrama de dispersión.
1.2) Ajustar una curva exponencial aplicando el método de mínimos cuadrados.
1.3) Calcular la ecuación predictora.
1.4) Graficar la ecuación predictora.
1.5) Estimar la presión de la masa de gas de volumen 9.
Mgs. Mario Suárez Correlación y Regresión 33
Solución:
1.1) El diagrama de dispersión elaborado en Excel se presenta en la siguiente figura:
El diagrama de dispersión elaborado en Graph se presenta en la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 34
1.2) Para ajustar una curva exponencial aplicando el método de mínimos cuadrados se llena la siguiente
tabla:
X Y log X log Y log X· log Y (log X)2
1 7 0,0000 0,8451 0,0000 0,0000
2 30 0,3010 1,4771 0,4447 0,0906
3 90 0,4771 1,9542 0,9324 0,2276
4 170 0,6021 2,2304 1,3429 0,3625
5 290 0,6990 2,4624 1,7211 0,4886
6 450 0,7782 2,6532 2,0646 0,6055
7 650 0,8451 2,8129 2,3772 0,7142
Σ X=28 Σ logX=3,7024 Σ logY=14,4354 Σ log X· log Y =8,8829 Σ(log X)2
= 2,4890
Reemplazando valores en el sistema de ecuaciones se obtiene:





2
)(logloglogloglog
logloglog
XXYX
XNY


{ {
Al resolver el sistema se obtiene: log α = 0,819 ; β = 2,351
Reemplazando valores en la ecuación predictora expresada en logaritmos se tiene:
1.3) Para calcular la ecuación predictora, primero se calcula el valor de α de la siguiente manera:
Reemplazando en la ecuación predictora se obtiene:
1.4) Graficando la ecuación predictora mediante Excel se muestra en la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 35
Empleando Graph se obtiene la siguiente figura:
1.5) Para estimar la presión de la masa de gas de volumen 9 se reemplaza el valor X = 9 en la ecuación
predictora
Ejemplo ilustrativo N° 2
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable
independiente e Y la variable resultante.
X 1 2 3 4 5 6 7
Y 1,4 1 0,9 0,7 0,6 0,55 0,5
2.1) Elaborar el diagrama de dispersión.
2.2) Calcular las constantes  y  , aplicando el método de mínimos cuadrados.
2.3) Calcular la ecuación predictora.
2.4) Graficar la ecuación predictora.
2.5) Estimar el valor de Y para X = 9
Solución:
2.1) El diagrama de dispersión elaborado en Excel se muestra en la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 36
El diagrama de dispersión elaborado en Graph se muestra en la siguiente figura:
2.2) Para calcular las constantes  y  , aplicando el método de mínimos cuadrados se llena la
siguiente tabla:
X Y 1/Y X(1/Y) X2
1 1,4 0,7143 0,7143 1
2 1 1,0000 2,0000 4
3 0,9 1,1111 3,3333 9
4 0,7 1,4286 5,7143 16
5 0,6 1,6667 8,3333 25
6 0,55 1,8182 10,9091 36
7 0,5 2,0000 14,0000 49
Σ X = 28 Σ (1/Y) = 9,7388 Σ X(1/Y) = 45,0043 Σ X2
= 140
Reemplazando valores en el siguiente sistema se obtiene:







21
1
XX
Y
X
XN
Y


{ {
Al resolver el sistema se obtiene:
α = 0,5271; β = 0,2160
2.3) Para calcular la ecuación predictora se reemplaza los valores encontrados de α y β, y se obtiene:
Mgs. Mario Suárez Correlación y Regresión 37
2.4) La gráfica la ecuación predictora elaborada en Excel se muestra en la siguiente figura:
La gráfica la ecuación predictora elaborada en Graph se muestra en la siguiente figura:
2.5) Para estimar el valor de Y para X = 9 se reemplaza el valor de X en la ecuación predictora.
Mgs. Mario Suárez Correlación y Regresión 38
TAREA DE INTERAPRENDIZAJE
1) Elabore un organizador gráfico sobre la regresión potencial.
2) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable
independiente) e Y es la presión de una masa dada de gas (variable resultante).
X 1 2 3 4 5 6 7
Y 5 35 90 180 300 460 670
2.1) Elabore el diagrama de dispersión de manera manual, empleando Excel y Graph
2.2) Ajuste una curva exponencial aplicando el método de mínimos cuadrados empleando por lo menos
4 decimales para los cálculos.
2.3) Calcule la ecuación predictora.
2.4) Grafique la ecuación predictora de manera manual, empleando Excel y Graph.
2.5) Estime la presión de la masa de gas de volumen 9.
979,17
3) Cree y resuelva un ejercicio similar al anterior.
4) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable
independiente e Y la variable resultante.
X 1 2 3 4 5 6 7
Y 1,5 1 0,8 0,9 0,5 0,4 0,3
4.1) Elabore el diagrama de dispersión de manera manual, empleando Excel y Graph.
4.2) Calcule las constantes  y  , aplicando el método de mínimos cuadrados de manera manual y
empleando Excel.
α = 0,0159; β = 0,4196
4.3) Calcule la ecuación predictora.
4.4) Grafique la ecuación predictora de manera manual, empleando Excel y Graph.
4.5) Estime el valor de Y para X = 8
0,2965
5) Cree y resuelva un ejercicio similar al anterior de manera manual, empleando Excel y el programa
Graph.
Mgs. Mario Suárez Correlación y Regresión 39
2.2) ERROR ESTÁNDAR DE ESTIMACIÓN
Es el grado de dispersión de los datos con respecto a la recta de regresión
El error estándar de estimación se calcula con la fórmula:
√
∑( )
Donde:
= cada valor de Y
= valor estimado de Y a partir de la recta de regresión
N = número de datos
Nota: Como se puede observar, el error estándar de estimación es un cálculo de la desviación estándar
de la muestra de datos con respecto a la recta de regresión, en la que sustituye a la media de la
muestra, y con n-2 en el denominador en vez de n-1. La razón de que sea n-2, es debido a que se pierde
2 grados de libertad al calcular las 2 constantes, y en la recta de regresión.
Otras ecuaciones para calcular el error estándar de estimación son:
√
∑ ∑ ∑
√
∑ ∑
Donde:
= ordenada en el origen (punto de intersección de la recta con el eje y)
1a = pendiente de la recta (tangente del ángulo de inclinación de la recta)
̅
̅
Ejemplo ilustrativo
Calcular error estándar de estimación empleando las 3 fórmulas dadas, utilizando los datos de la tabla
del ejemplo para ajustar la recta de mínimos cuadrados para Y como variable dependiente.
X Y
152 56
157 61
162 67
167 72
173 70
178 72
182 83
188 92
Solución:
Para comenzar a resolver este ejemplo recordemos que ya se obtuvo los valores respectivos al resolver
el ejemplo para ajustar la recta de mínimos cuadrados, los cuales fueron:
ΣX = 1359; ΣY = 573; ΣXY = 98295; ΣX2
= 231967; ΣY2
= 41967; Σxy = 956,625; Σ x2
= 1106,875;
Σ y2
= 925,875; = -75,191; = 0,864;
Mgs. Mario Suárez Correlación y Regresión 40
1) Para emplear la primera fórmula se llena la siguiente tabla:
X Y Yest = -75,191+0,86X Yest (Y- Yest)2
152 56 -75,191+0,86(152) 55,529 0,222
157 61 -75,191+0,86(157) 59,829 1,371
162 67 -75,191+0,86(162) 64,129 8,243
167 72 -75,191+0,86(167) 68,429 12,752
173 70 -75,191+0,86(173) 73,589 12,881
178 72 -75,191+0,86(178) 77,889 34,680
182 83 -75,191+0,86(182) 81,329 2,792
188 92 -75,191+0,86(188) 86,489 30,371
Σ 103,312
Se reemplaza valores en la primera fórmula se obtiene:
√
∑( )
√
Realizando los cálculos de los componentes de la fórmula empleando Excel se obtiene un valor más
exacto, ya que Excel utiliza una mayor cantidad de decimales al realizar los cálculos. Estos cálculos se
muestran en la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 41
2) Reemplazando valores en la segunda fórmula se obtiene:
√
∑ ∑ ∑
√
( )( ) ( )
√
√
Los cálculos de los componentes de la fórmula empleando Excel se muestran en la siguiente figura:
Mgs. Mario Suárez Correlación y Regresión 42
3) Reemplazando valores en la tercera fórmula se obtiene:
√
∑ ∑
√
( )
√
Los cálculos de los componentes de la fórmula empleando Excel se muestran en la siguiente figura:
En Excel:
Mgs. Mario Suárez Correlación y Regresión 43
El diagrama dispersión y la recta de mínimos cuadrados elaborado en Excel se muestra en la siguiente
figura, donde R2
es el coeficiente de determinación:
Interpretación: El valor de , significa que los puntos están dispersos a una distancia de
4,064 de la recta de regresión.
TAREA DE INTERAPRENDIZAJE
Dada la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra
de 8 estudiantes varones tomada al azar del segundo semestre de una universidad.
X 150 155 160 165 170 175 180 185
Y 56 61 64 68 72 75 80 90
1) Calcule el coeficiente de determinación de manera manual y empleando Excel.
0,97
2) Calcule el error estándar de estimación empleando la primera fórmula. Utilice 5 decimales para los
cálculos. Los elementos de la fórmula calcule empleando Excel, tal como se indicó en el ejemplo.
2,1
3) Calcule el error estándar de estimación empleando la segunda fórmula. Utilice 5 decimales para los
cálculos. Los elementos de la fórmula calcule empleando Excel, tal como se indicó en el ejemplo.
2,1
4) Calcule el error estándar de estimación empleando la tercera fórmula. Utilice 5 decimales para los
cálculos. Los elementos de la fórmula calcule empleando Excel, tal como se indicó en el ejemplo.
2,1
5) Calcule el error estándar de estimación empleando exclusivamente Excel.
2,1
6) Elabore el diagrama de dispersión, y en el mismo diagrama graficar la recta de regresión. Realice de
manera manual, empleando Excel y Graph.
Mgs. Mario Suárez Correlación y Regresión 44
REFERENCIAS BIBLIOGRÁFICAS
SUÁREZ, Mario, (2012), Interaprendizaje de Estadística Básica, Universidad Técnica del Norte
TAPIA, Fausto Ibarra, Ecuador.
SUÁREZ, Mario, (2011), Coeficiente de correlación de Pearson para datos agrupados en intervalos,
www.monografias.com/trabajos86/
SUÁREZ, Mario, (2011), Coeficiente de Correlación por Rangos de Spearman,
www.monografias.com/trabajos85/
SUÁREZ, Mario, (2011), La recta de los mínimos cuadrados, www.monografias.com/trabajos85/
SUÁREZ, Mario (2011), Análisis de regresión mediante la parábola de los mínimos cuadrados,
www.monografias.com/trabajos86/
SUÁREZ, Mario (2011), Regresión potencial mediante el método de los mínimos cuadrados,
www.monografias.com/trabajos89/
SUÁREZ, Mario (2011), Regresión exponencial mediante el método de los mínimos cuadrados,
www.monografias.com/trabajos89/

Más contenido relacionado

La actualidad más candente

Ejercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excel
Ejercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excelEjercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excel
Ejercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excelJusto Pastor Alonzo
 
Diagrama de tallos y hojas
Diagrama de tallos y hojasDiagrama de tallos y hojas
Diagrama de tallos y hojasMontserg93
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadisticaDaday Rivas
 
Análisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación linealAnálisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación linealPedro Rico Hernández
 
Trabajo colaborativo 2_unidad2 (1)
Trabajo colaborativo 2_unidad2 (1)Trabajo colaborativo 2_unidad2 (1)
Trabajo colaborativo 2_unidad2 (1)Adier Velasquez
 
Apunte metodosnumericos
Apunte metodosnumericosApunte metodosnumericos
Apunte metodosnumericosbartvwn
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadisticahoteles1
 
Tabla de frecuencia. estadistica
Tabla de frecuencia. estadisticaTabla de frecuencia. estadistica
Tabla de frecuencia. estadisticaSofiaGallardo24
 
Ejercicos y problemas de interpolacion de lagrange.
Ejercicos y problemas de interpolacion de lagrange.Ejercicos y problemas de interpolacion de lagrange.
Ejercicos y problemas de interpolacion de lagrange.Sergio Riveros
 
9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionalesANDREASEGURA30
 
Transformaciones lineales
Transformaciones linealesTransformaciones lineales
Transformaciones linealesalgebra
 
Mediana y Moda en datos agrupados [Estadísticas]
Mediana y Moda en datos agrupados [Estadísticas]Mediana y Moda en datos agrupados [Estadísticas]
Mediana y Moda en datos agrupados [Estadísticas]pipofukingdrumsbeats
 

La actualidad más candente (20)

Probabilidad y Estadistica
Probabilidad y EstadisticaProbabilidad y Estadistica
Probabilidad y Estadistica
 
6 regresion y correlación
6 regresion y correlación6 regresion y correlación
6 regresion y correlación
 
Ejercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excel
Ejercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excelEjercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excel
Ejercicios resueltos-de-distribucic3b3n-binomial-y-poison-usando-tablas-y-excel
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Diagrama de tallos y hojas
Diagrama de tallos y hojasDiagrama de tallos y hojas
Diagrama de tallos y hojas
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
 
Análisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación linealAnálisis de regresión lineal y correlación lineal
Análisis de regresión lineal y correlación lineal
 
Trabajo colaborativo 2_unidad2 (1)
Trabajo colaborativo 2_unidad2 (1)Trabajo colaborativo 2_unidad2 (1)
Trabajo colaborativo 2_unidad2 (1)
 
Apunte metodosnumericos
Apunte metodosnumericosApunte metodosnumericos
Apunte metodosnumericos
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
 
Tabla de frecuencia. estadistica
Tabla de frecuencia. estadisticaTabla de frecuencia. estadistica
Tabla de frecuencia. estadistica
 
Ejercicos y problemas de interpolacion de lagrange.
Ejercicos y problemas de interpolacion de lagrange.Ejercicos y problemas de interpolacion de lagrange.
Ejercicos y problemas de interpolacion de lagrange.
 
9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionales
 
Ejercicios estadistica
Ejercicios estadisticaEjercicios estadistica
Ejercicios estadistica
 
Transformaciones lineales
Transformaciones linealesTransformaciones lineales
Transformaciones lineales
 
Laboratorio 2
Laboratorio 2Laboratorio 2
Laboratorio 2
 
Estadistica - Medidas de posicion
Estadistica - Medidas de posicionEstadistica - Medidas de posicion
Estadistica - Medidas de posicion
 
espacios vectoriales
espacios vectorialesespacios vectoriales
espacios vectoriales
 
Mediana y Moda en datos agrupados [Estadísticas]
Mediana y Moda en datos agrupados [Estadísticas]Mediana y Moda en datos agrupados [Estadísticas]
Mediana y Moda en datos agrupados [Estadísticas]
 
Problemas unidad 3
Problemas unidad 3Problemas unidad 3
Problemas unidad 3
 

Similar a Correlación y regresión empleando excel y graph

Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicamovapa
 
Coeficientes de correlación de pearson y de spearman
Coeficientes de correlación de pearson y de spearmanCoeficientes de correlación de pearson y de spearman
Coeficientes de correlación de pearson y de spearmanSalazarLuis477
 
analisis de regresion y correlacion de variables
analisis de regresion y correlacion de variablesanalisis de regresion y correlacion de variables
analisis de regresion y correlacion de variablesAngelCastillo858247
 
Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanJCMENESESV
 
Coeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanCoeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanJCMENESESV
 
Mi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimoMi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimonochesk
 
05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptxPEALOZACASTILLOCINTI
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019franciscoe71
 
Regresiòn
RegresiònRegresiòn
Regresiònregline
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealHaret Diaz
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealHaret Diaz
 

Similar a Correlación y regresión empleando excel y graph (20)

Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monica
 
Regresión lineal
Regresión linealRegresión lineal
Regresión lineal
 
Unidad ii, graficos. su importancia en fisica
Unidad ii, graficos.  su importancia en fisicaUnidad ii, graficos.  su importancia en fisica
Unidad ii, graficos. su importancia en fisica
 
SesióN 8
SesióN 8SesióN 8
SesióN 8
 
SesióN 8
SesióN 8SesióN 8
SesióN 8
 
Coeficientes de correlación de pearson y de spearman
Coeficientes de correlación de pearson y de spearmanCoeficientes de correlación de pearson y de spearman
Coeficientes de correlación de pearson y de spearman
 
analisis de regresion y correlacion de variables
analisis de regresion y correlacion de variablesanalisis de regresion y correlacion de variables
analisis de regresion y correlacion de variables
 
Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y Spearman
 
Coeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanCoeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y Spearman
 
Regresión lineal (1).pdf
Regresión lineal (1).pdfRegresión lineal (1).pdf
Regresión lineal (1).pdf
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Mi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimoMi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimo
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019
 
Regresiòn
RegresiònRegresiòn
Regresiòn
 
correlación
correlación correlación
correlación
 
CORRELACION.pdf
CORRELACION.pdfCORRELACION.pdf
CORRELACION.pdf
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 

Último

Presentación Materiales para la Construcción.ppt
Presentación Materiales para la Construcción.pptPresentación Materiales para la Construcción.ppt
Presentación Materiales para la Construcción.pptCARLOSAXELVENTURAVID
 
PPT obligaciones ambientales oefa minan.pptx
PPT obligaciones ambientales oefa minan.pptxPPT obligaciones ambientales oefa minan.pptx
PPT obligaciones ambientales oefa minan.pptxDanmherJoelAlmironPu
 
La Navegacion en Internet con navegadores
La Navegacion en Internet con navegadoresLa Navegacion en Internet con navegadores
La Navegacion en Internet con navegadoresjosegillopez
 
TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdf
TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdfTALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdf
TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdfMiguelGomez900779
 
Taller construcción de Prototipos Uno uML
Taller construcción de Prototipos Uno uMLTaller construcción de Prototipos Uno uML
Taller construcción de Prototipos Uno uMLAderMogollonLuna
 
linea de tiempo television y su avance en los años
linea de tiempo television y su avance en los añoslinea de tiempo television y su avance en los años
linea de tiempo television y su avance en los añosMaraPazCrdenas
 
PLANIFICACION ANUAL , año 2024. nivel primaria
PLANIFICACION ANUAL , año 2024. nivel primariaPLANIFICACION ANUAL , año 2024. nivel primaria
PLANIFICACION ANUAL , año 2024. nivel primariajosevilla696981
 
PERFIL SECRETARIAL - SECRETARIADO EJECUTIVO
PERFIL SECRETARIAL - SECRETARIADO EJECUTIVOPERFIL SECRETARIAL - SECRETARIADO EJECUTIVO
PERFIL SECRETARIAL - SECRETARIADO EJECUTIVOAdrianaBernal82
 

Último (8)

Presentación Materiales para la Construcción.ppt
Presentación Materiales para la Construcción.pptPresentación Materiales para la Construcción.ppt
Presentación Materiales para la Construcción.ppt
 
PPT obligaciones ambientales oefa minan.pptx
PPT obligaciones ambientales oefa minan.pptxPPT obligaciones ambientales oefa minan.pptx
PPT obligaciones ambientales oefa minan.pptx
 
La Navegacion en Internet con navegadores
La Navegacion en Internet con navegadoresLa Navegacion en Internet con navegadores
La Navegacion en Internet con navegadores
 
TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdf
TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdfTALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdf
TALLER SOBRE METODOLOGÍAS DE DESARROLLO DE SOFTWARE..pdf
 
Taller construcción de Prototipos Uno uML
Taller construcción de Prototipos Uno uMLTaller construcción de Prototipos Uno uML
Taller construcción de Prototipos Uno uML
 
linea de tiempo television y su avance en los años
linea de tiempo television y su avance en los añoslinea de tiempo television y su avance en los años
linea de tiempo television y su avance en los años
 
PLANIFICACION ANUAL , año 2024. nivel primaria
PLANIFICACION ANUAL , año 2024. nivel primariaPLANIFICACION ANUAL , año 2024. nivel primaria
PLANIFICACION ANUAL , año 2024. nivel primaria
 
PERFIL SECRETARIAL - SECRETARIADO EJECUTIVO
PERFIL SECRETARIAL - SECRETARIADO EJECUTIVOPERFIL SECRETARIAL - SECRETARIADO EJECUTIVO
PERFIL SECRETARIAL - SECRETARIADO EJECUTIVO
 

Correlación y regresión empleando excel y graph

  • 1. Mgs. Mario Suárez Correlación y Regresión 1 CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL Y GRAPH 1) ANÁLISIS DE CORRELACIÓN Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable. 1.1) DIAGRAMA DE DISPERSIÓN Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos correspondientes a los pares ordenados (X,Y) de los valores de las variables. 1.2) CLASIFICACIÓN DE LA CORRELACIÓN 1.2.1) Según la relación entre variables - Correlación lineal: Se representa mediante una línea recta. - Correlación no lineal: Se representa con una línea curva. 1.2.2) Según el número de variables - Correlación simple: La variable dependiente actúa sobre la variable independiente. - Correlación múltiple: Cuando la variable dependiente actúa sobre varias variables independientes. - Correlación parcial: Cuando la relación que existe entre una variable dependiente y una independiente es de tal forma que los demás factores permanezcan constantes. 1.2.3) Según el valor cuantitativo - Correlación perfecta: El valor del coeficiente de correlación es 1 - Correlación imperfecta: El coeficiente de correlación es menor a 1 sea en sentido positivo o negativo. - Correlación nula: El coeficiente de correlación es 0. No existe correlación entre las variables. Ejemplo: Número de calzado de una persona y su cociente intelectual. 1.2.4) Según el signo - Correlación positiva.- Dos variables tiene correlación positiva cuando al aumentar o disminuir el valor de una de ellas entonces el valor correspondiente a la otra aumentará o disminuirá respectivamente, es decir, cuando las dos variables aumentan en el mismo sentido. Ejemplo: Peso de una persona y su talla. - Correlación negativa.- Dos variables tiene correlación negativa cuando al aumentar o disminuir el valor de una de ellas entonces el valor de la otra disminuirá o aumentará respectivamente, es decir, una variable aumenta y otra disminuye o viceversa. Ejemplo: Número de partidos ganados por un equipo en una temporada y su posición final en la tabla.
  • 2. Mgs. Mario Suárez Correlación y Regresión 2 1.3) COEFICIENTES DE CORRELACIÓN Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores  1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y). No hay correlación Correlación Positiva Correlación Negativa
  • 3. Mgs. Mario Suárez Correlación y Regresión 3 Para interpretar el coeficiente de correlación utilizamos la siguiente escala: Valor Significado -1 Correlación negativa grande y perfecta -0,9 a -0,99 Correlación negativa muy alta -0,7 a -0,89 Correlación negativa alta -0,4 a -0,69 Correlación negativa moderada -0,2 a -0,39 Correlación negativa baja -0,01 a -0,19 Correlación negativa muy baja 0 Correlación nula 0,01 a 0,19 Correlación positiva muy baja 0,2 a 0,39 Correlación positiva baja 0,4 a 0,69 Correlación positiva moderada 0,7 a 0,89 Correlación positiva alta 0,9 a 0,99 Correlación positiva muy alta 1 Correlación positiva grande y perfecta 1.3.1) COEFICIENTE DE CORRELACIÓN DE KARL PEARSON Llamando también coeficiente de correlación producto-momento. Se calcula aplicando la siguiente ecuación: ∑ √(∑ )(∑ ) r = Coeficiente producto-momento de correlación lineal XXx  ; YYy  Ejemplo ilustrativo: Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de correlación que existe entre ellas mediante el coeficiente de PEARSON. X 18 17 15 16 14 12 9 15 16 14 16 18 ΣX =180 Y 13 15 14 13 9 10 8 13 12 13 10 8 ΣY= 138 Solución: Se calcula la media aritmética ̅ ∑ Para X: ̅ Para Y: ̅
  • 4. Mgs. Mario Suárez Correlación y Regresión 4 Se llena la siguiente tabla: X Y x = X- 𝑿̅ y = Y- 𝒀̅ x2 xy y2 18 13 3 1,5 9 4,5 2,25 17 15 2 3,5 4 7 12,25 15 14 0 2,5 0 0 6,25 16 13 1 1,5 1 1,5 2,25 14 9 -1 -2,5 1 2,5 6,25 12 10 -3 -1,5 9 4,5 2,25 9 8 -6 -3,5 36 21 12,25 15 13 0 1,5 0 0 2,25 16 12 1 0,5 1 0,5 0,25 14 13 -1 1,5 1 -1,5 2,25 16 10 1 -1,5 1 -1,5 2,25 18 8 3 -3,5 9 -10,5 12,25 Σ =180 Σ= 138 72 28 63 Se aplica la fórmula: ∑ √(∑ )(∑ ) √( )( ) Existe una correlación moderada En Excel se calcula de la siguiente manera:
  • 5. Mgs. Mario Suárez Correlación y Regresión 5 El diagrama de dispersión en Excel: El diagrama de dispersión en el programa Graph:
  • 6. Mgs. Mario Suárez Correlación y Regresión 6 TAREA DE INTERAPRENDIZAJE 1) Elabore un organizador gráfico de los tipos de correlación. 2) Con los datos de la siguiente tabla sobre las temperaturas del día X y del día Y en determinadas horas en una ciudad X 9 10 12 14 16 18 20 22 24 26 28 30 Y 12 14 15 16 17 20 22 23 26 28 31 32 2.1) Calcule el coeficiente de correlación de Pearson empleando la fórmula y mediante Excel. 0,99 2.2) Elabore el diagrama de dispersión de manera manual. 2.3) Elabore el diagrama de dispersión empleando Excel. 2.4) Elabore el diagrama de dispersión empleando el programa Graph. 3) Cree y resuelva un ejercicio similar al anterior. 4) Consulte y presente un ejemplo resuelto del coeficiente de correlación de Pearson para datos agrupados en intervalos en http://www.monografias.com/trabajos85/coeficiente-correlacion-karl- pearson/coeficiente-correlacion-karl-pearson.shtml 1.3.2) COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas. Se calcula aplicando la siguiente ecuación: ∑ ( ) sr = Coeficiente de correlación por rangos de Spearman d = Diferencia entre los rangos ( X menos Y) n = Número de datos Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más elevados le asignamos el rango 1 al siguiente el rango 2 y así sucesivamente. Si se repiten dos puntajes o más se calculan las medias aritméticas. Ejemplo ilustrativo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de Estadística. Realizar el diagrama de dispersión y calcular el coeficiente de correlación por rangos de Spearman. Estudiante X Y Dyana 1 3 Elizabeth 2 4 Mario 3 1 Orlando 4 5 Mathías 5 6 Josué 6 2 Anita 7 8 Lucía 8 7
  • 7. Mgs. Mario Suárez Correlación y Regresión 7 Solución: El diagrama de dispersión hecho en Excel se muestra en la siguiente figura: Para calcular el coeficiente de correlación por rangos de Spearman de se llena la siguiente tabla: Estudiante X Y d= X-Y d2 =(X-Y)2 Dyana 1 3 -2 4 Elizabeth 2 4 -2 4 Mario 3 1 2 4 Orlando 4 5 -1 1 Mathías 5 6 -1 1 Josué 6 2 4 16 Anita 7 8 -1 1 Lucía 8 7 1 1 Σ d2 = 32 Se aplica la fórmula: ∑ ( ) ( ) Por lo tanto existe una correlación positiva moderada entre la primera y segunda evaluación de los 8 estudiantes.
  • 8. Mgs. Mario Suárez Correlación y Regresión 8 En Excel se calcula de la siguiente manera: TAREA DE INTERAPRENDIZAJE 1) Consulte sobre la biografía de Spearman y realice un organizador gráfico de la misma. 2) La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de Matemática. X Y 1 4 2 5 3 6 4 8 5 3 6 2 7 1 8 7 2.1) Realice el diagrama de dispersión en forma manual. 2.2) Realice el diagrama de dispersión empleando Excel. 2.3) Realice el diagrama de dispersión empleando el programa Graph. 2.4) Calcule el coeficiente de correlación por rangos de Spearman empleando la ecuación. -0,19 2.5) Calcule el coeficiente de correlación empleando Excel. -0,1905 3) Cree y resuelva un ejercicio similar al anterior.
  • 9. Mgs. Mario Suárez Correlación y Regresión 9 4) La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las asignaturas de Matemática y Estadística. Calcular el coeficiente de correlación por rangos de Spearman y realizar el diagrama de dispersión. N° Estudiante Matemática Estadística 1 Dyana 10 8 2 Elizabeth 9 6 3 Mario 8 10 4 Orlando 7 9 5 Mathías 7 8 6 Josué 6 7 7 Anita 6 6 8 Lucía 4 9 Consulte la solución de este ejercicio en http://www.monografias.com/trabajos85/coeficiente- correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml 5) Cree y resuelva un ejercicio similar al anterior. 1.4) COEFICIENTE DE DETERMINACIÓN Revela qué porcentaje del cambio en Y se explica por un cambio en X. Se calcula elevando al cuadrado el coeficiente de correlación. ∑ √(∑ )(∑ ) XXx  YYy  r = Coeficiente de correlación de Pearson Coeficiente de determinación La ecuación del coeficiente producto-momento (Coeficiente de Pearson) ∑ √(∑ )(∑ ) puede escribirse en la forma equivalente: ∑ (∑ )(∑ ) √[ ∑ (∑ ) ][ ∑ (∑ ) ] De donde coeficiente de determinación = ( ) Ejemplo ilustrativo Con los datos de la siguiente tabla sobre las temperaturas, calcular el coeficiente de determinación empleando la ecuación obtenida de la forma equivalente del coeficiente de Pearson. X 18 17 15 16 14 12 9 15 16 14 16 18 Y 13 15 14 13 9 10 8 13 12 13 10 8
  • 10. Mgs. Mario Suárez Correlación y Regresión 10 Solución: Se calcula el coeficiente de Pearson llenando la siguiente tabla: X Y XY X2 Y2 18 13 234 324 169 17 15 255 289 225 15 14 210 225 196 16 13 208 256 169 14 9 126 196 81 12 10 120 144 100 9 8 72 81 64 15 13 195 225 169 16 12 192 256 144 14 13 182 196 169 16 10 160 256 100 18 8 144 324 64 Σ X=180 Σ Y =138 Σ XY=2098 Σ X2 = 2772 Σ X2 =1650 Se aplica la ecuación para calcular el coeficiente de Pearson. ∑ (∑ )(∑ ) √[ ∑ (∑ ) ][ ∑ (∑ ) ] √[ ( ) ][ ( ) ] √[ ][ ] √[ ][ ] √ Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación. Coeficiente de determinación = ( ) Esto establece que 17,28% del cambio en Y se explica mediante un cambio en X. Nota: El r2 tiene significado sólo para las relaciones lineales. Dos variables pueden tener r2 =0 y sin embargo estar relacionadas en sentido curvilíneo. El valor de r2 no se interpreta como si la variable Y fuera causado por un cambio de la variable X, ya que la correlación no significa causa.
  • 11. Mgs. Mario Suárez Correlación y Regresión 11 En Excel se calcula elevando al cuadrado el coeficiente de correlación o insertando la función =COEFICIENTE.R2 como muestra la siguiente figura: TAREA DE INTERAPRENDIZAJE 1) La siguiente tabla muestra el dinero en miles de dólares gastado en publicidad por una empresa (X) para vender sus productos, y el número en miles de clientes (Y) que compran los productos de la empresa. X 15 17 14 13 18 20 17 18 16 14 20 18 Y 30 34 28 26 32 40 34 36 32 25 40 36 1.1) Realice el diagrama de dispersión en forma manual. 1.2) Realice el diagrama de dispersión empleando Excel. 1.3) Realice el diagrama de dispersión empleando el programa Graph. 1.4) Calcule el coeficiente de Pearson empleando las dos fórmulas. 0,96015 1.5) Calcule el coeficiente de determinación empleando las dos fórmulas y mediante Excel. 0,9219
  • 12. Mgs. Mario Suárez Correlación y Regresión 12 2) La siguiente tabla muestra el tiempo en minutos dedicado al estudio y la calificación sobre 10 obtenida. X 140 150 130 120 170 190 180 160 200 110 100 90 Y 7 8 7 6 8 10 9 8 10 6 5 4 2.1) Realice el diagrama de dispersión en forma manual. 2.2) Realice el diagrama de dispersión empleando Excel. 2.3) Realice el diagrama de dispersión empleando el programa Graph. 2.4) Calcule el coeficiente de Pearson empleando las dos fórmulas. 0,9817 2.5) Calcule el coeficiente de determinación empleando las dos fórmulas y mediante Excel. 0,9638 3) Cree y resuelva un ejercicio similar a los anteriores. 2) ANÁLISIS DE REGRESIÓN Los primeros y más importantes estudios al respecto se deben a los científicos Francis Galton (1822- 1911) y Karl Pearson (1857-1936). Fue Galton quien utilizó por primera vez el término regresión para indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos “regresaba” a la media general. La regresión examina la relación entre dos variables, pero restringiendo una de ellas con el objeto de estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la regresión es un método que se emplea para predecir el valor de una variable en función de valores dados a la otra variable. En estadística la palabra predecir no se utiliza en el sentido empleado por los astrólogos, futurólogos y mentalistas, sino mas bien en un sentido lógico como es el de utilizar el conocimiento del comportamiento de una variable para obtener información sobre otra variable. Por ejemplo, puede predecirse el resultado que obtendrá un estudiante en su examen final, basados en el conocimiento de las calificaciones promedio de sus exámenes parciales, o predecir la preferencia de los estudiantes por profesiones científicas, conociendo los promedios de sus calificaciones en los estudios escolares. En todos los casos de regresión existe una dependencia funcional entre las variables. En el caso de dos variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de regresión de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresión de la altura de los árboles sobre su diámetro, lo cual significa que midiendo el diámetro (variable independiente) y reemplazando su valor en una relación definida según la clase de árbol se obtiene la altura, y aun sin necesidad de cálculos aprecian la altura utilizando gráficas de la función de dependencia, altura = función del diámetro. 2.1) PRINCIPIO DE LOS MÍNIMOS CUADRADOS 2.1.1) LA RECTA DE LOS MÍNIMOS CUADRADOS Se llama línea de mejor ajuste y se define como la línea que hace mínima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la información recogida.
  • 13. Mgs. Mario Suárez Correlación y Regresión 13 La recta de los mínimos cuadrados que aproxima el conjunto de puntos  11,YX ,  22 ,YX ,  33 ,YX ,……… NN YX , tomando en cuenta a Y como variable dependiente tiene por ecuación A esta ecuación suele llamarse recta de regresión de Y sobre X, y se usa para estimar los valores de Y para valores dados de X. Si a la recta de regresión se le suma en ambos lados ∑ ∑( ) se obtiene ∑ ∑ Si a la recta de regresión se multiplica por X a ambos lados y luego se suma ∑ ∑ ( ) se obtiene ∑ ∑ ∑ Las constantes 0a y 1a quedan fijadas al resolver simultáneamente las ecuaciones anteriormente encontradas, es decir, al resolver el siguiente sistema de ecuaciones:          2 10 10 XaXaXY XaNaY Que se llaman las ecuaciones normales para la recta de mínimos cuadrados. Las constantes 0a y 1a de las anteriores ecuaciones también se pueden calcular empleando las siguientes fórmulas: ∑ ∑ ∑ ∑ ∑ (∑ ) ∑ ∑ ∑ ∑ (∑ ) Otra ecuación para los mínimos cuadrados para XXx  y YYy  de la recta de regresión de Y sobre X es: ( ∑ ∑ ) La recta de los mínimos cuadrados que aproxima el conjunto de puntos  11,YX ,  22 ,YX ,  33 ,YX ,……… NN YX , tomando en cuenta a X como variable dependiente tiene por ecuación A esta ecuación suele llamarse recta de regresión de X sobre Y, y se usa para estimar los valores de X para valores dados de Y. Las constantes y quedan fijadas al resolver el siguiente sistema de ecuaciones:          2 10 10 YbYbXY YbNbX Las constantes y del sistema de ecuaciones anterior se pueden calcular empleando las siguientes fórmulas: ∑ ∑ ∑ ∑ ∑ (∑ ) ∑ ∑ ∑ ∑ (∑ )
  • 14. Mgs. Mario Suárez Correlación y Regresión 14 Otra ecuación para los mínimos cuadrados para XXx  y YYy  es: ( ∑ ∑ ) El punto de intersección entre las rectas XaaY 10  con YbbX 10  se simboliza  YX, y se llama centroide o centro de gravedad. Ejemplo ilustrativo Con los datos de la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad. X 152 157 162 167 173 178 182 188 Y 56 61 67 72 70 72 83 92 1) Ajustar la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema:          2 10 10 XaXaXY XaNaY 2) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas: ∑ ∑ ∑ ∑ ∑ (∑ ) ∑ ∑ ∑ ∑ (∑ ) 3) Ajustar la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula: ( ∑ ∑ ) 4) Ajustar la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema:          2 10 10 YbYbXY YbNbX 5) Calcular el punto centroide. 6) Calcular el coeficiente de determinación. 7) Elaborar el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos cuadrados obtenidas en los pasos anteriores. 8) Estimar el valor de Y cuando X = 200 en el diagrama de dispersión de Y como variable dependiente. R: 8,2 9) Estimar el valor de X cuando Y= 100 en el diagrama de dispersión X como variable dependiente.
  • 15. Mgs. Mario Suárez Correlación y Regresión 15 Solución: Para comenzar a resolver el ejercicio se llena la siguiente tabla: X Y XY X2 Y2 152 56 8512 23104 3136 157 61 9577 24649 3721 162 67 10854 26244 4489 167 72 12024 27889 5184 173 70 12110 29929 4900 178 72 12816 31684 5184 182 83 15106 33124 6889 188 92 17296 35344 8464 Σ X =1359 Σ Y = 573 Σ XY = 98295 Σ X2 = 231967 Σ Y2 = 41967 1) Reemplazando valores en el sistema se tiene:          2 10 10 XaXaXY XaNaY { { Resolviendo el sistema por determinantes (regla de Cramer) se obtiene: | | | | | | Interpretación: - El valor indica que la recta tiene una pendiente positiva aumentando a razón de 0,864 - El valor de indica el punto en donde la recta interseca al eje Y cuanto X = 0
  • 16. Mgs. Mario Suárez Correlación y Regresión 16 En Excel el sistema se resuelve de la siguiente manera: Reemplazando valores en la ecuación respectiva se obtiene: 2) Con los datos de la tabla anterior se substituye valores en las siguientes ecuaciones: ∑ ∑ ∑ ∑ ∑ (∑ ) ( ) ∑ ∑ ∑ ∑ (∑ ) ( ) Reemplazando valores en la ecuación respectiva se obtiene: 3) Se calcula las medias aritméticas de X y Y para llenar la siguiente tabla: ̅ ∑
  • 17. Mgs. Mario Suárez Correlación y Regresión 17 ̅ ̅ X Y x= - ̅ y= -̅ xy x2 y2 152 56 -17,88 -15,625 279,297 319,516 244,141 157 61 -12,88 -10,625 136,797 165,766 112,891 162 67 -7,875 -4,625 36,422 62,016 21,391 167 72 -2,875 0,375 -1,078 8,266 0,141 173 70 3,125 -1,625 -5,078 9,766 2,641 178 72 8,125 0,375 3,047 66,016 0,141 182 83 12,125 11,375 137,922 147,016 129,391 188 92 18,125 20,375 369,297 328,516 415,141 Σ X=1359 Σ Y=573 Σxy = 956,625 Σ x2 = 1106,875 Σ x2 = 925,875 Reemplazando valores en la fórmula respectiva se obtiene: ( ∑ ∑ ) ̅ ( ̅) ( ) ( ) ( ) 4) Reemplazando valores en sistema respectivo se obtiene:          2 10 10 YbYbXY YbNbX { { Resolviendo el sistema se obtiene:
  • 18. Mgs. Mario Suárez Correlación y Regresión 18 Reemplazando valores en la ecuación de la recta de mínimos cuadrados se obtiene: Interpretación: - El valor indica que la recta tiene una pendiente positiva aumentando a razón de 1,033 - El valor de indica el punto en donde la recta interseca al eje X cuanto Y = 0 5) Para calcular el centroide  YX, se resuelve el sistema formado por las dos rectas de los mínimos cuadrados en donde X es ̅ y Y es ̅. { Al resolver el sistema se obtiene el centroide: X = 169,3 y Y = 71,092 6) Se aplica la ecuación para calcular el coeficiente de Pearson. ∑ (∑ )(∑ ) √[ ∑ (∑ ) ][ ∑ (∑ ) ] √[ ( ) ][ ( ) ] Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación. Coeficiente de determinación = ( ) 7) En Excel, insertando gráfico de dispersión se obtiene la siguiente figura:
  • 19. Mgs. Mario Suárez Correlación y Regresión 19 Empleando el programa Graph se obtiene la siguiente figura: 8) Reemplazando X = 200 en la ecuación solicitada se obtiene: 9) Reemplazando Y = 100 en la ecuación solicitada se obtiene: TAREA DE INTERAPRENDIZAJE 1) Consulte sobre la biografía de Francis Galton y de Cramer, y realice un organizador gráfico de cada una. 2) Dada la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad. X 150 155 160 165 170 175 180 185 Y 55 60 63 67 70 74 79 85 2.1) Ajuste la recta de mínimos cuadrados para Y como variable dependiente resolviendo el sistema. El sistema resuelva de manera manual y mediante Excel.          2 10 10 XaXaXY XaNaY
  • 20. Mgs. Mario Suárez Correlación y Regresión 20 2.2) Ajuste la recta de mínimos cuadrados para Y como variable dependiente empleando las fórmulas ∑ ∑ ∑ ∑ ∑ (∑ ) ∑ ∑ ∑ ∑ (∑ ) 2.3) Ajuste la recta de mínimos cuadrados para Y como variable dependiente empleando la fórmula ( ∑ ∑ ) 2.4) Ajuste la recta de mínimos cuadrados para X como variable dependiente resolviendo el sistema. El sistema resuelva de manera manual y mediante Excel.          2 10 10 YbYbXY YbNbX 2.5) Ajuste la recta de mínimos cuadrados para X como variable dependiente empleando las fórmulas ∑ ∑ ∑ ∑ ∑ (∑ ) ∑ ∑ ∑ ∑ (∑ ) 2.6) Ajuste la recta de mínimos cuadrados para X como variable dependiente empleando la fórmula ( ∑ ∑ ) 2.7) Calcule el punto centroide de manera manual y empleando Excel. ̅ ̅ 2.8) Calcule el coeficiente de determinación. 0,99 2.9) Elabore el diagrama de dispersión. Y en el mismo diagrama graficar las dos rectas de mínimos cuadrados obtenidas en los pasos anteriores. Elabore de manera manual, empleando Excel y el programa Graph. 2.10) Estime el valor de Y cuando X = 173 en el diagrama de dispersión de Y como variable dependiente. 73,6 2.11) Estime el valor de X cuando Y = 73 en el diagrama de dispersión de Y como variable dependiente. 172,2 3) Cree y resuelva un ejercicio similar al anterior con datos obtenidos de 10 amigas suyas.
  • 21. Mgs. Mario Suárez Correlación y Regresión 21 2.1.2) LA PARÁBOLA DE LOS MÍNIMOS CUADRADOS La parábola de mínimos cuadrados que aproxima el conjunto de puntos (X1,Y1) , (X2,Y2), (X3,Y3),…..(XN,YN) tiene ecuación dada por 2 210 XaXaaY  , donde las constantes 0a , 1a y 2a se determinan al resolver simultáneamente el sistema de ecuaciones que se forma al multiplicar la ecuación 2 210 XaXaaY  por 1, X, Y sucesivamente, y sumando después.         4 2 3 1 2 0 2 3 2 2 10 2 210 XaXaXaYX XaXaXaXY XaXaNaY Ejemplo ilustrativo La siguiente tabla muestra la población de un país en los años 1960-2010 en intervalos de 5 años. Año 196019651970197519801985 1990 1995 2000 2005 2010 Población (millones) 4,52 5,18 6,25 7,42 8,16 9,12 10,9211,6212,6813,1213,97 1) Ajustar una parábola de mínimos cuadrados de la forma 2 210 XaXaaY  2) Calcular los valores de tendencia para los años dados. 3) Estimar la población para los años 2015 y 2020. 4) Calcular el coeficiente de determinación. 5) Elaborar un diagrama de dispersión, y en el mismo diagrama graficar la parábola de los mínimos cuadrados. Nota: Se recomienda codificar o cambiar la numeración de los años, eligiendo X de modo que el año central, 1985, corresponda a X= 0, para que se hagan más fáciles los cálculos. Solución: 1) Para ajustar una parábola de mínimos cuadrados se llena la siguiente tabla: Año X Y X2 X3 X4 XY X2 Y 1960 -5 4,52 25 -125 625 -22,6 113 1965 -4 5,18 16 -64 256 -20,72 82,88 1970 -3 6,25 9 -27 81 -18,75 56,25 1975 -2 7,42 4 -8 16 -14,84 29,68 1980 -1 8,16 1 -1 1 -8,16 8,16 1985 0 9,12 0 0 0 0 0 1990 1 10,92 1 1 1 10,92 10,92 1995 2 11,62 4 8 16 23,24 46,48 2000 3 12,68 9 27 81 38,04 114,12
  • 22. Mgs. Mario Suárez Correlación y Regresión 22 2005 4 13,12 16 64 256 52,48 209,92 2010 5 13,97 25 125 625 69,85 349,25 Σ 0 102,96 110 0 1958 109,46 1020,66 Se reemplaza valores en el sistema y se obtiene:         4 2 3 1 2 0 2 3 2 2 10 2 210 XaXaXaYX XaXaXaXY XaXaNaY { { Resolviendo el sistema empleando determinantes (regla de Cramer) se obtiene:
  • 23. Mgs. Mario Suárez Correlación y Regresión 23 El sistema resuelto en Excel se muestra en la siguiente figura: Reemplazando los valores encontrados se obtiene la ecuación de la parábola de mínimos cuadrados: Y = 9,464 + 0,995X - 0,01X2 2) Los valores de tendencia se obtienen al reemplazar los valores de X en la ecuación de la parábola de mínimos cuadrados, los cuales se presenta en la siguiente tabla: Año X Y Valores de tendencia Y = 9,464 + 0,995X - 0,01X2 1960 -5 4,52 4,24 1965 -4 5,18 5,32 1970 -3 6,25 6,39 1975 -2 7,42 7,43 1980 -1 8,16 8,46 1985 0 9,12 9,46 1990 1 10,92 10,45 1995 2 11,62 11,41 2000 3 12,68 12,36 2005 4 13,12 13,28 2010 5 13,97 14,19
  • 24. Mgs. Mario Suárez Correlación y Regresión 24 3) Para estimar la población de los años 2015 y 2020 se transforma estos años a X siguiendo la secuencia de la tabla anterior, siendo X = 6 para el año 2015 y X= 7 para el 2020 Entonces para el 2015 se tiene: Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(6) - 0,01(6)2 = 9,464 + 5,97-0,36 =15,074 Para el 2020 se tiene: Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(7) - 0,01(7)2 = 9,464 + 6,965-0,49 =15,939 4) Se llena la siguiente tabla y se aplica la ecuación para calcular el coeficiente de Pearson Año X Y X2 XY Y2 1960 -5 4,52 25 -22,6 20,430 1965 -4 5,18 16 -20,72 26,832 1970 -3 6,25 9 -18,75 39,063 1975 -2 7,42 4 -14,84 55,056 1980 -1 8,16 1 -8,16 66,586 1985 0 9,12 0 0 83,174 1990 1 10,92 1 10,92 119,246 1995 2 11,62 4 23,24 135,024 2000 3 12,68 9 38,04 160,782 2005 4 13,12 16 52,48 172,134 2010 5 13,97 25 69,85 195,161 Σ 0 102,96 110 109,46 1073,490 ∑ (∑ )(∑ ) √[ ∑ (∑ ) ][ ∑ (∑ ) ] √[ ( ) ][ ( ) ] Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinación. Coeficiente de determinación = ( ) El coeficiente de determinación calculado en Excel se muestra en la siguiente figura:
  • 25. Mgs. Mario Suárez Correlación y Regresión 25 5) El diagrama de dispersión y la parábola de los mínimos cuadrados mediante Excel se muestra en la siguiente figura:
  • 26. Mgs. Mario Suárez Correlación y Regresión 26 Empleando el programa Graph se obtiene la siguiente figura: TAREA DE INTERAPRENDIZAJE 1) La siguiente tabla muestra la población aproximada de la Provincia de Imbabura en los años 1960-2010 en intervalos de 5 años. Año 19601965197019751980198519901995200020052010 Población (miles) 123 140 170 201 221 247 296 315 344 356 379 1.1) Ajuste una parábola de mínimos cuadrados de la forma 2 210 XaXaaY  Y = 256,464 + 26,991X - 0,265X2 1.2) Calcule los valores de tendencia para los años dados de manera manual y empleando Excel. Año 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 Valor de tendencia114,88144,26173,11201,42229,21256,46283,19309,39335,05360,19384,79 1.3) Estime la población para los años 2015 y 2020 Año 2015 = 408,87 miles de habitantes Año 2020 = 432,42 miles de habitantes 1.4) Calcule el coeficiente de determinación de manera manual y empleando Excel.
  • 27. Mgs. Mario Suárez Correlación y Regresión 27 0,992 1.5) Elabore un diagrama de dispersión, y en el mismo diagrama graficar la parábola de los mínimos cuadrados de manera manual, empleando Excel y empleando Graph. 2) Cree y resuelva un ejercicio de aplicación de la parábola de los mínimos cuadrados con datos de la población del Ecuador o de cualquier otro país de manera manual, empleando Excel y Graph. 2.1.3) REGRESIÓN EXPONENCIAL Cuando la curva de regresión de y sobre x es exponencial, es decir para cualquier x considerada, la media de la distribución está dada por la siguiente ecuación predictora: Tomando logaritmos en ambos miembros: y se puede estimar ahora log Y y log β, y de ahí obtener  y  , aplicando los métodos de los mínimos cuadrados. Donde las constantes  y  quedan fijadas al resolver simultáneamente las ecuaciones:      2 logloglog logloglog XXYX XNY   Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante que aún pueden usarse después de recorrer cierto número de millas: Miles de Millas recorridas (X) 1 2 5 15 25 30 35 40 Porcentaje útil (Y) 99 95 85 55 30 24 20 15 1) Elaborar el diagrama de dispersión. 2) Ajustar una curva exponencial aplicando el método de mínimos cuadrados. 3) Calcular la ecuación predictora. 4) Graficar la ecuación predictora. 5) Estimar qué porcentaje de las llantas radiales del fabricante durarán 50000 millas. Solución: 1) Elaborando el diagrama de dispersión empleando Excel se obtiene la siguiente figura:
  • 28. Mgs. Mario Suárez Correlación y Regresión 28 Empleando el programa Graph se obtiene la siguiente figura: 2) Se llena la siguiente tabla: X Y log Y X2 X· logY 1 99 1,996 1 1,996 2 95 1,978 4 3,955 5 85 1,929 25 9,647 15 55 1,740 225 26,105 25 30 1,477 625 36,928 30 24 1,380 900 41,406 35 20 1,301 1225 45,536 40 15 1,176 1600 47,044 Σ X=153 Σ log Y=12,97759 Σ X2 = 4605 Σ X· logY = 212,61769
  • 29. Mgs. Mario Suárez Correlación y Regresión 29 Resolviendo empleando Excel se muestra en la siguiente figura: Reemplazando valores en el sistema se obtiene:      2 logloglog logloglog XXYX XNY   { { Al resolver el sistema se obtiene: | | | | | | Reemplazando valores se obtiene: Aplicando el antilogaritmo se obtiene: ( )
  • 30. Mgs. Mario Suárez Correlación y Regresión 30 Resolviendo empleando Excel se muestra en la siguiente figura: 3) Reemplazando en la ecuación predictora se obtiene: 4) Graficando la ecuación predictora empleando Excel se obtiene la siguiente figura:
  • 31. Mgs. Mario Suárez Correlación y Regresión 31 En Graph se obtiene la siguiente figura: 5) La estimación del porcentaje de llantas radiales que durarán 50000 millas se obtiene reemplazando en la ecuación predictora el valor de X = 50 Entonces el porcentaje sería de 9,106% TAREA DE INTERAPRENDIZAJE 1) Elabore un organizador gráfico sobre la regresión exponencial. 2) Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante que aún pueden usarse después de recorrer cierto número de millas: Miles de Millas recorridas (X) 1 2 5 10 20 30 40 50 Porcentaje útil (Y) 98 92 80 64 36 32 17 11 2.1) Ajuste una curva exponencial aplicando el método de mínimos cuadrados. Resolver manualmente y empleando Excel. Realizar los cálculos empleando la mayor cantidad de decimales. 2.2) Calcule la ecuación predictora. 2.3) Grafique la ecuación predictora de manera manual, empleando Excel y el programa Graph. 2.4) Estime qué porcentaje de las llantas radiales del fabricante durarán 35000 millas. 21,7%
  • 32. Mgs. Mario Suárez Correlación y Regresión 32 3) Cree y resuelva un ejercicio empleando los conocimientos de la regresión exponencial de manera manual, empleando Excel y Graph. 2.1.4) REGRESIÓN POTENCIAL La regresión potencial tiene por ecuación predictora: y la regresión recíproca es: Para el primer caso los valores siguen una ley potencial. Si la ecuación predictora está dada por:   XY  , tomando logaritmos en ambos miembros, queda: Donde las constantes  y  quedan fijadas al resolver simultáneamente las ecuaciones:      2 )(logloglogloglog logloglog XXYX XNY   Para el segundo caso, si la ecuación predictora está dada por )/(1 XY   , entonces invirtiendo, la misma expresión se puede escribir 1/)(/1 XY   , o sea: Donde las constantes  y  quedan fijadas al resolver simultáneamente las ecuaciones:        21 1 XX Y X XN Y   Ejemplos ilustrativo N° 1 Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable independiente) e Y es la presión de una masa dada de gas (variable resultante). X 1 2 3 4 5 6 7 Y 7 30 90 170 290 450 650 1.1) Elaborar el diagrama de dispersión. 1.2) Ajustar una curva exponencial aplicando el método de mínimos cuadrados. 1.3) Calcular la ecuación predictora. 1.4) Graficar la ecuación predictora. 1.5) Estimar la presión de la masa de gas de volumen 9.
  • 33. Mgs. Mario Suárez Correlación y Regresión 33 Solución: 1.1) El diagrama de dispersión elaborado en Excel se presenta en la siguiente figura: El diagrama de dispersión elaborado en Graph se presenta en la siguiente figura:
  • 34. Mgs. Mario Suárez Correlación y Regresión 34 1.2) Para ajustar una curva exponencial aplicando el método de mínimos cuadrados se llena la siguiente tabla: X Y log X log Y log X· log Y (log X)2 1 7 0,0000 0,8451 0,0000 0,0000 2 30 0,3010 1,4771 0,4447 0,0906 3 90 0,4771 1,9542 0,9324 0,2276 4 170 0,6021 2,2304 1,3429 0,3625 5 290 0,6990 2,4624 1,7211 0,4886 6 450 0,7782 2,6532 2,0646 0,6055 7 650 0,8451 2,8129 2,3772 0,7142 Σ X=28 Σ logX=3,7024 Σ logY=14,4354 Σ log X· log Y =8,8829 Σ(log X)2 = 2,4890 Reemplazando valores en el sistema de ecuaciones se obtiene:      2 )(logloglogloglog logloglog XXYX XNY   { { Al resolver el sistema se obtiene: log α = 0,819 ; β = 2,351 Reemplazando valores en la ecuación predictora expresada en logaritmos se tiene: 1.3) Para calcular la ecuación predictora, primero se calcula el valor de α de la siguiente manera: Reemplazando en la ecuación predictora se obtiene: 1.4) Graficando la ecuación predictora mediante Excel se muestra en la siguiente figura:
  • 35. Mgs. Mario Suárez Correlación y Regresión 35 Empleando Graph se obtiene la siguiente figura: 1.5) Para estimar la presión de la masa de gas de volumen 9 se reemplaza el valor X = 9 en la ecuación predictora Ejemplo ilustrativo N° 2 Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable independiente e Y la variable resultante. X 1 2 3 4 5 6 7 Y 1,4 1 0,9 0,7 0,6 0,55 0,5 2.1) Elaborar el diagrama de dispersión. 2.2) Calcular las constantes  y  , aplicando el método de mínimos cuadrados. 2.3) Calcular la ecuación predictora. 2.4) Graficar la ecuación predictora. 2.5) Estimar el valor de Y para X = 9 Solución: 2.1) El diagrama de dispersión elaborado en Excel se muestra en la siguiente figura:
  • 36. Mgs. Mario Suárez Correlación y Regresión 36 El diagrama de dispersión elaborado en Graph se muestra en la siguiente figura: 2.2) Para calcular las constantes  y  , aplicando el método de mínimos cuadrados se llena la siguiente tabla: X Y 1/Y X(1/Y) X2 1 1,4 0,7143 0,7143 1 2 1 1,0000 2,0000 4 3 0,9 1,1111 3,3333 9 4 0,7 1,4286 5,7143 16 5 0,6 1,6667 8,3333 25 6 0,55 1,8182 10,9091 36 7 0,5 2,0000 14,0000 49 Σ X = 28 Σ (1/Y) = 9,7388 Σ X(1/Y) = 45,0043 Σ X2 = 140 Reemplazando valores en el siguiente sistema se obtiene:        21 1 XX Y X XN Y   { { Al resolver el sistema se obtiene: α = 0,5271; β = 0,2160 2.3) Para calcular la ecuación predictora se reemplaza los valores encontrados de α y β, y se obtiene:
  • 37. Mgs. Mario Suárez Correlación y Regresión 37 2.4) La gráfica la ecuación predictora elaborada en Excel se muestra en la siguiente figura: La gráfica la ecuación predictora elaborada en Graph se muestra en la siguiente figura: 2.5) Para estimar el valor de Y para X = 9 se reemplaza el valor de X en la ecuación predictora.
  • 38. Mgs. Mario Suárez Correlación y Regresión 38 TAREA DE INTERAPRENDIZAJE 1) Elabore un organizador gráfico sobre la regresión potencial. 2) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el volumen (variable independiente) e Y es la presión de una masa dada de gas (variable resultante). X 1 2 3 4 5 6 7 Y 5 35 90 180 300 460 670 2.1) Elabore el diagrama de dispersión de manera manual, empleando Excel y Graph 2.2) Ajuste una curva exponencial aplicando el método de mínimos cuadrados empleando por lo menos 4 decimales para los cálculos. 2.3) Calcule la ecuación predictora. 2.4) Grafique la ecuación predictora de manera manual, empleando Excel y Graph. 2.5) Estime la presión de la masa de gas de volumen 9. 979,17 3) Cree y resuelva un ejercicio similar al anterior. 4) Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la variable independiente e Y la variable resultante. X 1 2 3 4 5 6 7 Y 1,5 1 0,8 0,9 0,5 0,4 0,3 4.1) Elabore el diagrama de dispersión de manera manual, empleando Excel y Graph. 4.2) Calcule las constantes  y  , aplicando el método de mínimos cuadrados de manera manual y empleando Excel. α = 0,0159; β = 0,4196 4.3) Calcule la ecuación predictora. 4.4) Grafique la ecuación predictora de manera manual, empleando Excel y Graph. 4.5) Estime el valor de Y para X = 8 0,2965 5) Cree y resuelva un ejercicio similar al anterior de manera manual, empleando Excel y el programa Graph.
  • 39. Mgs. Mario Suárez Correlación y Regresión 39 2.2) ERROR ESTÁNDAR DE ESTIMACIÓN Es el grado de dispersión de los datos con respecto a la recta de regresión El error estándar de estimación se calcula con la fórmula: √ ∑( ) Donde: = cada valor de Y = valor estimado de Y a partir de la recta de regresión N = número de datos Nota: Como se puede observar, el error estándar de estimación es un cálculo de la desviación estándar de la muestra de datos con respecto a la recta de regresión, en la que sustituye a la media de la muestra, y con n-2 en el denominador en vez de n-1. La razón de que sea n-2, es debido a que se pierde 2 grados de libertad al calcular las 2 constantes, y en la recta de regresión. Otras ecuaciones para calcular el error estándar de estimación son: √ ∑ ∑ ∑ √ ∑ ∑ Donde: = ordenada en el origen (punto de intersección de la recta con el eje y) 1a = pendiente de la recta (tangente del ángulo de inclinación de la recta) ̅ ̅ Ejemplo ilustrativo Calcular error estándar de estimación empleando las 3 fórmulas dadas, utilizando los datos de la tabla del ejemplo para ajustar la recta de mínimos cuadrados para Y como variable dependiente. X Y 152 56 157 61 162 67 167 72 173 70 178 72 182 83 188 92 Solución: Para comenzar a resolver este ejemplo recordemos que ya se obtuvo los valores respectivos al resolver el ejemplo para ajustar la recta de mínimos cuadrados, los cuales fueron: ΣX = 1359; ΣY = 573; ΣXY = 98295; ΣX2 = 231967; ΣY2 = 41967; Σxy = 956,625; Σ x2 = 1106,875; Σ y2 = 925,875; = -75,191; = 0,864;
  • 40. Mgs. Mario Suárez Correlación y Regresión 40 1) Para emplear la primera fórmula se llena la siguiente tabla: X Y Yest = -75,191+0,86X Yest (Y- Yest)2 152 56 -75,191+0,86(152) 55,529 0,222 157 61 -75,191+0,86(157) 59,829 1,371 162 67 -75,191+0,86(162) 64,129 8,243 167 72 -75,191+0,86(167) 68,429 12,752 173 70 -75,191+0,86(173) 73,589 12,881 178 72 -75,191+0,86(178) 77,889 34,680 182 83 -75,191+0,86(182) 81,329 2,792 188 92 -75,191+0,86(188) 86,489 30,371 Σ 103,312 Se reemplaza valores en la primera fórmula se obtiene: √ ∑( ) √ Realizando los cálculos de los componentes de la fórmula empleando Excel se obtiene un valor más exacto, ya que Excel utiliza una mayor cantidad de decimales al realizar los cálculos. Estos cálculos se muestran en la siguiente figura:
  • 41. Mgs. Mario Suárez Correlación y Regresión 41 2) Reemplazando valores en la segunda fórmula se obtiene: √ ∑ ∑ ∑ √ ( )( ) ( ) √ √ Los cálculos de los componentes de la fórmula empleando Excel se muestran en la siguiente figura:
  • 42. Mgs. Mario Suárez Correlación y Regresión 42 3) Reemplazando valores en la tercera fórmula se obtiene: √ ∑ ∑ √ ( ) √ Los cálculos de los componentes de la fórmula empleando Excel se muestran en la siguiente figura: En Excel:
  • 43. Mgs. Mario Suárez Correlación y Regresión 43 El diagrama dispersión y la recta de mínimos cuadrados elaborado en Excel se muestra en la siguiente figura, donde R2 es el coeficiente de determinación: Interpretación: El valor de , significa que los puntos están dispersos a una distancia de 4,064 de la recta de regresión. TAREA DE INTERAPRENDIZAJE Dada la siguiente tabla sobre la altura en centímetros (X) y los pesos en kilogramos (Y) de una muestra de 8 estudiantes varones tomada al azar del segundo semestre de una universidad. X 150 155 160 165 170 175 180 185 Y 56 61 64 68 72 75 80 90 1) Calcule el coeficiente de determinación de manera manual y empleando Excel. 0,97 2) Calcule el error estándar de estimación empleando la primera fórmula. Utilice 5 decimales para los cálculos. Los elementos de la fórmula calcule empleando Excel, tal como se indicó en el ejemplo. 2,1 3) Calcule el error estándar de estimación empleando la segunda fórmula. Utilice 5 decimales para los cálculos. Los elementos de la fórmula calcule empleando Excel, tal como se indicó en el ejemplo. 2,1 4) Calcule el error estándar de estimación empleando la tercera fórmula. Utilice 5 decimales para los cálculos. Los elementos de la fórmula calcule empleando Excel, tal como se indicó en el ejemplo. 2,1 5) Calcule el error estándar de estimación empleando exclusivamente Excel. 2,1 6) Elabore el diagrama de dispersión, y en el mismo diagrama graficar la recta de regresión. Realice de manera manual, empleando Excel y Graph.
  • 44. Mgs. Mario Suárez Correlación y Regresión 44 REFERENCIAS BIBLIOGRÁFICAS SUÁREZ, Mario, (2012), Interaprendizaje de Estadística Básica, Universidad Técnica del Norte TAPIA, Fausto Ibarra, Ecuador. SUÁREZ, Mario, (2011), Coeficiente de correlación de Pearson para datos agrupados en intervalos, www.monografias.com/trabajos86/ SUÁREZ, Mario, (2011), Coeficiente de Correlación por Rangos de Spearman, www.monografias.com/trabajos85/ SUÁREZ, Mario, (2011), La recta de los mínimos cuadrados, www.monografias.com/trabajos85/ SUÁREZ, Mario (2011), Análisis de regresión mediante la parábola de los mínimos cuadrados, www.monografias.com/trabajos86/ SUÁREZ, Mario (2011), Regresión potencial mediante el método de los mínimos cuadrados, www.monografias.com/trabajos89/ SUÁREZ, Mario (2011), Regresión exponencial mediante el método de los mínimos cuadrados, www.monografias.com/trabajos89/