SlideShare una empresa de Scribd logo
ANÁLISIS DE REGRESIÓN
Y CORRELACIÓN
RESPONSABLE:
PROF. CARLOS MIGUEL SANTA CRUZ VERA
AÑO LECTIVO 2020
INDICE
1. ANÁLISIS DE REGRESIÓN Y CORRELACIÓN 3
1.1 CONCEPTOS BÁSICOS. 3
1.2 AJUSTE LINEAL. 4
1.3 ESTIMACIÓN DE LOS PARÁMETROS. 5
1.4 CÁLCULO DEL PRONÓSTICO. 7
1.5 ERROR RESIDUAL (EI). 7
1.6 DEFINICIÓN Y CARACTERÍSTICAS. 8
1.7 CÁLCULO DEL COEFICIENTE DE CORRELACIÓN: MÉTODO 1. 9
1.8 CÁLCULO DEL COEFICIENTE DE CORRELACIÓN: MÉTODO 2. 9
1.9 MEDIDAS DE VARIACIÓN EN LA REGRESIÓN. 10
1.10 VARIACIÓN NO EXPLICADA (VNE). 11
1.11 VARIACIÓN EXPLICADA (VE). 11
1.12 PROPIEDADES DE LAS MEDIDAS DE VARIACIÓN EN LA REGRESIÓN. 11
2. COEFICIENTE DE DETERMINACIÓN (D). 12
1.13 AJUSTE PARABÓLICO. 13
1.14 AJUSTE EXPONENCIAL. 14
1.15 ANÁLISIS DE REGRESIÓN EN UNA SERIE DE TIEMPO. 16
3. EJERCICIOS DE APLICACIÓN RESUELTOS. 17
1.16 AJUSTE DE REGRESIÓN ENTRE EL PRECIO Y LA DEMANDA DE UN PRODUCTO. 17
1.17 COMPORTAMIENTO DE LA CAPTACIÓN DE UNA COOPERATIVA A TRAVÉS DEL TIEMPO: 21
1. EJERCICIOS DE APLICACIÓN PROPUESTOS. 30
1.18 ANÁLISIS DE REGRESIÓN ENTRE EL PRECIO DE ENTRADA A UNA SALA DE VIDEOS Y EL NÚMERO DE ESTUDIANTES
QUE ENTRAN. 30
1.19 ANÁLISIS DE REGRESIÓN ENTRE LA UTILIDAD Y EL GASTO EN PUBLICIDAD. 30
1.20 ANÁLISIS DE REGRESIÓN ENTRE EL NIVEL DE AHORRO Y EL INGRESO. 30
1.21 ANÁLISIS DE REGRESIÓN: UTILIDAD A TRAVÉS DEL TIEMPO EN UNA COMPAÑÍA DISTRIBUIDORA DE
COMPUTADORES. 31
1.22 ANÁLISIS DE REGRESIÓN: VENTAS VERSUS ESPACIO ASIGNADO. 32
1.23 ANÁLISIS DE REGRESIÓN: PASIVO PENSIONAL A TRAVÉS DEL TIEMPO. 32
1.24 ANÁLISIS DE REGRESIÓN: PRESUPUESTO EJECUTADO DE EGRESOS A TRAVÉS DEL TIEMPO. 33
1.25 ANÁLISIS DE REGRESIÓN: CRECIMIENTO DE LA POBLACIÓN A TRAVÉS DEL TIEMPO. 33
1.26 ANÁLISIS DE REGRESIÓN: UTILIDAD SEMESTRAL. 33
1. Análisis de regresión y correlación
El objetivo principal de la regresión y correlación es identificar el tipo de relación y asociación
entre variables. La regresión se encarga de determinar el tipo de relación entre las variables y la
correlación determina qué tan intensa es dicha relación.
1.1 Conceptos básicos.
Regresión. Es una técnica estadística que estudia la relación entre variables cuantitativas.
Con base en el número de variables que se relacionan dentro del estudio, la regresión se clasifica
en simple (dos variables) o múltiple (más de dos variables). La regresión múltiple también se
conoce como análisis multivariante.
Con base en el tipo de asociación existente entre las variables tratadas, la regresión puede ser
lineal, parabólica, exponencial, logarítmica, entre otras.
Diagrama de dispersión. (Nube de puntos). Es la representación gráfica de la información
original en un plano. Cuando se estudia la relación entre dos variables, se utiliza el plano
cartesiano, dentro del cual se ubican los puntos, cada uno con sus respectivas coordenadas (X,
Y), los puntos que se localizan en el plano constituyen los datos reales u originales, siendo X la
variable independiente y Y la variable dependiente, identificadas como la abscisa y la ordenada.
El objetivo de elaborar la nube de puntos es visualizar la tendencia que siguen los datos
originales, y de esta forma, decidir cuál de los tipos de asociación utilizar para el cálculo de la
función de ajuste.
Función de ajuste. Corresponde a la función matemática empleada para el ajuste o
representación matemática de la relación existente entre las variables.
La función de ajuste es utilizada para efectuar pronósticos, los cuales se identifican como los
datos pronosticados.
Los datos reales y los pronosticados deben ser semejantes, parecidos, con valores muy cercanos,
porque de lo contrario, no tiene sentido utilizar la función de ajuste hallada para pronosticar,
debido a que los pronósticos no presentarían alta confiabilidad.
1.2 Ajuste lineal.
Es utilizada cuando la tendencia que presentan los datos reales u originales es una línea recta,
tendencia no significa que todos y cada uno de los puntos reales ubicados en el plano formen
exactamente una línea recta, sino que mirándolos de manera conjunta o global, se pueda
determinar un comportamiento lineal, de tal forma que pueda ser calculada la función de una
línea recta que pase muy cerca de la mayoría de datos originales, quedando algunos puntos sobre
la línea ajustada, otros por debajo, e incluso, algunos sobre la misma línea.
Algunas nubes de puntos que representan tendencia lineal se presentan a continuación:
Ilustración 1 Ejemplos de nubes de puntos con tendencia lineal
En el análisis de la regresión lineal se calcula la función de ajuste Y = a + bX, hallando los
valores de los parámetros a y b a partir de los datos reales u originales. La función Y = a + bX,
es conocida en cálculo como la función lineal. Luego de hallar los valores de a y de b, se escribe
estadísticamente:
Fórmula (107)
a = Término independiente. Intercepto con el eje Y. Es aquel valor que toma la variable
dependiente Y cuando la variable independiente X se hace cero.
b = Pendiente de la línea recta. Es el grado de incremento o de disminución de la variable
dependiente Y, cuando la variable independiente X se incrementa en una unidad.
La pendiente es positiva (+) cuando la relación entre las variables X y Y es directamente
proporcional; es decir, al aumentar el valor de la variable X también aumenta el valor de la
variable Y.
La pendiente es negativa (─) cuando la relación entre X y Y es inversamente proporcional; es
decir, al aumentar el valor de la variable X el valor de la variable Y disminuye.
1.3 Estimación de los parámetros.
Para estimar o calcular los parámetros a y b, se utiliza el método de los mínimos cuadrados, de
la siguiente manera:
Se llega a un sistema de dos ecuaciones con dos incógnitas, siendo las incógnitas los valores de
a y de b:
Ecuación 1:
Ecuación 2:
Para encontrar los valores de a y de b, se soluciona simultáneamente este sistema por alguno de
los métodos de solución simultánea de ecuaciones, igualación, sustitución, reducción,
determinantes o con la utilización de álgebra lineal como eliminación Gaussiana, Gauss-Jordan,
pivoteo, entre otros.
Por ejemplo, si utilizamos determinantes, llegamos a los siguientes valores de a y de b:
Fórmula (108)
Fórmula (109)
Otra alternativa que agiliza el cálculo, es hallar el valor de b mediante determinantes y luego el
de a, despejándolo de la Ecuación 1, así:
Todo lo que se necesita conocer para calcular los valores de a y de b, es obtenido a partir de los
puntos (X, Y) reales u originales, siendo n el total de datos o puntos originales que han sido
recolectados para el estudio.
Se recomienda elaborar una tabla que facilite la obtención de los valores necesarios para el
cálculo de los parámetros de a y b; ésta puede ser diseñada con las siguientes columnas:
Figura 69. Diseño de tabla para el cálculo de los parámetros de a y b, para el ajuste lineal
Luego de conocer los valores respectivos de a y de b, se concluye que la función de ajuste está
dada por:
Este ajuste es considerado óptimo porque hace mínima la suma de los cuadrados de los errores.
1.4 Cálculo del pronóstico.
El cálculo del pronóstico ( ) para la variable Y, dado (conociendo) un valor de X, se obtiene
sustituyendo los valores respectivos de a, b y X en la función de ajuste hallada:
1.5 Error residual (ei).
Es cada una de las distancias verticales entre el dato real y el dato pronosticado. Todos los datos
pronosticados caen sobre la recta ajustada y los datos reales algunos se ubican por encima, por
debajo o sobre la línea de ajuste; entre más pequeña sea esta distancia, el pronóstico será más
confiable.
Fórmula (110)
Ésta distancia debe ser mínima para que exista un buen ajuste o una buena bondad de ajuste; la
sumatoria de todos los residuales debe ser igual a cero o muy cercana a cero:
Un error es positivo cuando el dato real se ubica por encima de la función de ajuste, es decir, el
dato real es mayor al dato pronosticado:
Un error es negativo cuando el dato real se ubica por debajo de la función de ajuste, es decir, el
dato real es menor al dato pronosticado:
Un error es igual a cero cuando el dato real se ubica exactamente sobre la función de ajuste, es
decir, cuando el dato real es igual al dato pronosticado:
La recta ajustada minimiza la sumatoria de los errores residuales cuadráticos, en otras
palabras: la función minimiza
La figura a continuación ilustra lo mencionado:
Figura 70. Representación gráfica de error residual
Ilustración 2 Coeficiente de correlación (r).
1.6 Definición y características.
El coeficiente de correlación se denota con la letra r. Es aquel valor que se encarga de dar el
grado de asociación entre la variable dependiente Y y la variable independiente X.
El rango de valores dentro del cual siempre se encuentra el coeficiente de correlación es:
límite inferior ─ 1 y límite superior 1, así:
El signo del coeficiente de correlación debe coincidir siempre con el signo del parámetro b. El
signo del coeficiente de correlación indica si la relación entre las variables es inversamente o
directamente proporcional.
El valor en absoluto del coeficiente de correlación indica el grado de asociación entre las
variables, es la fuerza de la relación entre las variables y la confiabilidad en los pronósticos.
Si r = 1, la relación entre X y Y es directamente proporcional en un 100%. En este caso, todos
los datos reales caen sobre la línea ajustada, todos los datos reales son idénticos a los
pronosticados, por lo tanto, al utilizar la función de ajuste para efectos de pronósticos, la
confiabilidad es del 100%.
Si r = ─ 1, la relación entre X y Y es inversamente proporcional en un 100%. En este caso, todos
los datos reales caen sobre la línea ajustada, todos los datos reales son idénticos a los
pronosticados, por lo tanto, al utilizar la función de ajuste para efectuar pronósticos, la
confiabilidad es del 100%.
Si r = 0, no existe relación lineal entre las variables, la función lineal de ajuste no puede ser
utilizada para pronosticar.
Entre más cercano se encuentre el valor de r de ─ 1 o de 1, implica un grado mayor de asociación
y relación entre las variables, y entre más cercano se encuentre a cero menor será el grado de
relación.
1.7 Cálculo del coeficiente de correlación: Método 1.
Fórmula (111)
Cov (XY) = covarianza de XY
Var (X) = varianza de X
Var (Y) = varianza de Y
Las varianzas siempre son valores positivos, la covarianza puede ser positiva o negativa, por tal
motivo, el signo de r depende del signo que tenga la covarianza.
La covarianza se calcula como el promedio del producto de las desviaciones respecto a la media
para cada variable, así:
Fórmula (112)
= media de la variable X
= media de la variable Y
Otra forma de calcular la covarianza es:
Fórmula (113)
La covarianza de X, Y es igual a la media de (XY) menos la media de X por la media de Y.
Las varianzas para cada variable se calculan así:
1.8 Cálculo del coeficiente de correlación: Método 2.
Para este método, se hace necesario conocer las medidas de variación en la regresión.
Estas son: la variación total, la variación no explicada y la variación explicada.
VT = variación total
VNE = variación no explicada
VE = variación explicada
Fórmula (114)
Fórmula (115)
Al utilizar este método, el signo del coeficiente de correlación se le asigna dependiendo del signo
que tenga el parámetro b.
1.9 Medidas de variación en la regresión.
Existen tres medidas de variación básicas dentro del estudio de la regresión, éstas son:
variación total, variación no explicada y variación explicada.
13.5.1 Variación total (VT).
Es la suma de cuadrados totales (SCT). Es la sumatoria de las desviaciones cuadráticas respecto
a la media, para la variable Y.
Fórmula (116)
Ilustración 3 Representación gráfica de la variación total
1.10 Variación no explicada (VNE).
Es la suma de los cuadrados del error (SCE). Es la sumatoria de las desviaciones cuadráticas de
los valores reales con respecto a los valores pronosticados, para la variable Y.
Fórmula (117)
Ilustración 4 Representación gráfica de a variación no explicada
1.11 Variación explicada (VE).
Es la suma de los cuadrados de la regresión (SCR). Es la sumatoria de las desviaciones
cuadráticas de los valores pronosticados respecto a la media de los valores reales, para la variable
Y.
Fórmula (118)
1.12 Propiedades de las medidas de variación en la regresión.
Propiedad 1. Las medidas de variación en la regresión siempre son valores positivos.
, ,
Propiedad 2. La variación total es igual a la sumatoria de la variación no explicada con la
variación explicada.
Fórmula (119)
Nota:
, por lo tanto,
De aquí se tiene que:
2. Coeficiente de determinación (D).
Es el coeficiente de correlación cuadrado.
Fórmula (120)
Este coeficiente determina la bondad de ajuste, es decir, determina si la función matemática
aplicada representa en forma adecuada los datos originales.
El rango de valores dentro del cual siempre se encuentra el coeficiente de determinación es:
límite inferior, cero (0), y límite superior, uno (1); siempre es un valor positivo menor o igual a
uno (1), así:
Fórmula (121)
Nota: El coeficiente de correlación es la raíz cuadrada del coeficiente de determinación,
así:
Fórmula (122)
Mientras que el coeficiente de correlación mide el grado de asociación lineal, el coeficiente de
determinación es aquel valor que determina la bondad del ajuste (ajustes no lineales), determina
si la función matemática aplicada representa en forma adecuada los datos originales, determina
el grado de representatividad del ajuste efectuado.
1.13 Ajuste parabólico.
El ajuste de regresión parabólico es utilizado cuando la nube de puntos o diagrama de dispersión
presenta una tendencia parabólica. El ajuste parabólico esta dado por la función cuadrática:
Fórmula (123)
Con los datos originales o reales (X, Y) se plantea el siguiente sistema de tres ecuaciones con
tres incógnitas:
(1)
(2)
(3)
Se soluciona simultáneamente por algún método: igualación, sustitución, reducción,
determinantes o algún método de algebra lineal.
Para facilitar el planteamiento del anterior sistema, se puede optar por elaborar una tabla con las
siguientes columnas, de tal forma que se puedan obtener las sumatorias necesarias.
Figura 73. Diseño de tabla para el cálculo de valores del sistema de ecuaciones para el
ajuste parabólico
Luego de encontrar los respectivos valores de a, b y c, se sustituyen en la función de
ajuste
Se concluye que esta función representa de manera adecuada a los datos originales, y por tal
motivo, puede ser utilizada para pronosticar Y dado un valor respectivo de X, el cálculo del
pronóstico se efectúa sustituyendo X en la función de ajuste para hallar el valor de .
Cuando el valor de c, coeficiente en X2
es negativo (─), la función de ajuste parabólica abre
hacia abajo, y en caso de ser positivo (+) la parábola abre hacia arriba.
Ilustración 5 Representación gráfica del ajuste parabólico
1.14 Ajuste exponencial.
El ajuste de regresión exponencial es utilizado cuando el comportamiento de la nube de puntos
o diagrama de dispersión presenta una tendencia exponencial. La función de ajuste exponencial
está dada por:
En esta función se tiene:
a = es el intercepto en el eje Y b = indica si la función es
creciente o decreciente, siempre b 1
Si 0 < b < 1 la función es decreciente
Si b > 1 la función es creciente
Ilustración 6 Representación gráfica del ajuste exponencial
Para encontrar los valores de a y de b, se toma como base la serie de datos original con los
valores respectivos de X y de Y, para plantear un sistema de dos ecuaciones con dos incógnitas.
Se parte de:
Se saca logaritmo a ambos lados de la igualdad:
Se aplican propiedades de los logaritmos, y se obtiene:
Se plantean las dos ecuaciones con dos incógnitas, utilizando el método de los mínimos
cuadrados.
Las dos ecuaciones resultantes son:
(1)
(2)
Las dos incógnitas son: log a y log b, por tal motivo, luego de solucionar simultáneamente el
sistema de ecuaciones, se debe sacar antilogaritmo a ambos resultados para hallar los valores de
a y de b, respectivamente.
Se recomienda elaborar una tabla a partir de los datos originales, que contenga las siguientes
columnas, para efecto de facilitar el cálculo de las sumatorias necesarias para el planteamiento
del sistema de ecuaciones.
Figura 76. Diseño de tabla para el cálculo de valores del sistema de ecuaciones para el
ajuste exponencial
X Y X2
log Y X ⋅ log Y
∑X - ∑X2
∑log Y ∑X ⋅ log Y
1.15 Análisis de regresión en una serie de tiempo.
Una serie de tiempo nos muestra el comportamiento de una variable a través del tiempo.
Utilizando la regresión como aplicación dentro de las series temporales se cuenta con dos
variables, donde una de ellas es el tiempo.
La variable X siempre se asocia con el tiempo, y la variable Y es aquella que se desea analizar a
través del tiempo. Como el tiempo es identificado en este tema con días, meses, semestres,
bimestres, años, entre otros; es en este sentido que se hace indispensable asignarle a cada
identificación del tiempo un número, y de ahí en adelante, consecutivos. Es muy importante
tener en cuenta los consecutivos de X en el momento de efectuar un pronóstico.
A continuación se muestran varios ejemplos de asignación de valores consecutivos para X, dado
una identificación de tiempo mensual; de igual manera se aplica para las otras identificaciones
del tiempo.
Figura 77. Ejemplos de asignación de valores consecutivos para el análisis de regresión en
una serie de tiempo
Tiempo
(meses)
X X X X X
Enero 0 -3 0 1 -4
Febrero 1 -2 3 2 -2
Marzo 2 -1 6 3 0
Abril 3 0 9 4 2
Mayo 4 1 12 5 4
Junio 5 2 15 6 6
Julio 6 3 18 7 8
Agosto 7 4 21 8 10
Septiembre 8 5 24 9 12
… … … … … …
3. Ejercicios de aplicación resueltos.
1.16 Ajuste de regresión entre el precio y la demanda de un producto.
El departamento de investigaciones económicas de una compañía desea realizar un estudio sobre
los precios y la demanda de su principal producto. Para ello cuenta con la siguiente información:
Variable X: Precio (miles de $)
Variable Y: Demanda (número de unidades)
X Y
5 100
7 90
9 86
12 72
17 60
23 55
30 43
Se pide:
a) Elaborar el diagrama de dispersión o nube de puntos. ¿Qué tendencia se visualiza
en el gráfico?
b) Calcular la función de ajuste y graficarla sobre el diagrama.
c) Pronosticar el número de unidades demandadas para un precio de $15.000.
d) Calcular el coeficiente de correlación e interpretarlo.
Solución
a) Diagrama de dispersión:
Los datos originales o reales presentan una tendencia lineal, por tal motivo, el análisis de
regresión y correlación se efectúa con ajuste lineal.
b) Cálculo de la función de ajuste:
X Y X2 XY
5 100 25 500
7 90 49 630
9 86 81 774
12 72 144 864
17 60 289 1.020
23 55 529 1.265
30 43 900 1.290
103 506 2.017 6.343
El sistema de ecuaciones que se plantea es
el siguiente:
Ecuación 1.
Ecuación 2.
Se soluciona simultáneamente el sistema de ecuaciones y se encuentra que el valor de las
incógnitas esta dado por: a = 104,64 y b = -2,2; por lo tanto, la función de ajuste que representa
de manera adecuada a los datos originales está dada por la siguiente expresión matemática:
Gráfica de la función de ajuste sobre el diagrama de dispersión:
Nube de puntos
Precio (miles $)
c) Pronóstico del número de unidades demandadas para un precio de $15.000:
, para un valor de
unidades
d) Coeficiente de correlación:
Se elabora una tabla con las columnas necesarias para calcular la covarianza y las
varianzas respectivas.
5 100 94,37 768,08 -269,22
7 90 59,51 313,80 -136,65
9 86 32,65 188,08 -78,37
12 72 7,37 0,08 0,78
17 60 5,22 150,94 -28,08
23 55 68,65 298,80 -143,22
30 43 233,65 857,65 -447,65
103 506 501,43 2.577,43 -1.102,43
Media de X: 14,71
Media de Y: 72,29
Var(X): 71,63
Var(Y): 368,20
Cov(XY): -157,489796
Coeficiente de correlación: -0,97
Nube de puntos
Precio (miles $)
La relación entre el precio y el número de unidades demandadas es inversamente proporcional
en un 97%. Los pronósticos que se efectúen utilizando la función de ajuste hallada, tendrán un
grado de confiabilidad del 97%, ya que el grado de asociación lineal entre las variables es del
97%.
Otra forma de calcular el coeficiente de correlación:
Para calcular el coeficiente de correlación utilizando el coeficiente de determinación, se debe
tener presente que al resultado hallado siempre se le pone el signo que tenga el parámetro b
(coeficiente en X) de la función de ajuste hallada.
Se elabora una tabla que sea de utilidad para hallar la variación explicada (VE) y la
variación total (VT).
5 100 93,643305 768,08 456,15
7 90 89,246154 313,80 287,66
9 86 84,849003 188,08 157,84
12 72 78,253276 0,08 35,61
17 60 67,260399 150,94 25,25
23 55 54,068946 298,80 331,85
30 43 38,678917 857,65 1.129,42
103 506 - 2.577,428571 2.423,772446
̅ ∑
∑( ̂ ̅)
El
coeficiente de correlación lleva el signo de b, en este caso, negativo (-), por lo tanto, se concluye
que
1.17 Comportamiento de la captación de una cooperativa a través del tiempo:
Enfoque de regresión y correlación.
Analizar el comportamiento de la captación anual en millones de pesos de una cooperativa,
utilizar el ajuste que se considere adecuado, para tal fin, visualizar a través del diagrama de
dispersión cuál es la tendencia de la nube de puntos.
Año Captación
(millones $)
1996 1,3
1997 3,5
1998 14,5
1999 27,1
2000 41,3
2001 70,3
2002 87,1
2003 130,5
2004 150,3
a) Elaborar el diagrama de dispersión, visualizar la tendencia de los datos originales,
¿Cuál tipo de ajuste es conveniente efectuar?
b) Efectuar un ajuste lineal y graficar la función de ajuste sobre el diagrama.
Calcular pronósticos y compararlos con el valor original o real. Calcular el coeficiente
de correlación y el de determinación e interpretar resultados.
c) Efectuar un ajuste parabólico y graficar la función de ajuste sobre el diagrama.
Calcular pronósticos y compararlos con el valor original o real. Calcular el coeficiente
de determinación e interpretarlo.
d) Efectuar un ajuste exponencial y graficar la función de ajuste sobre el diagrama.
Calcular pronósticos y compararlos con el valor original o real. Calcular el coeficiente
de determinación e interpretarlo.
e) Luego de realizar los numerales b), c) y d), ¿cuál ajuste elige dentro del análisis
de esta serie de datos como representativo? Comparar la elección realizada con el ajuste
propuesto en el numeral a).
Solución
a) Diagrama de dispersión o nube de puntos:
Año X Y
1996 0 1,3
1997 1 3,5
1998 2 14,5
1999 3 27,1
2000 4 41,3
2001 5 70,3
2002 6 87,1
2003 7 130,5
2004 8 150,3
Al visualizar el gráfico, la tendencia de los puntos originales parece ser lineal, sin embargo
también se asemeja a la mitad derecha de una parábola que abre hacia arriba, o también a una
exponencial creciente. ¿Qué decisión tomar, si los tres ajustes se acercan a la tendencia?
A continuación se efectúan los tres ajustes para analizar resultados y poder tomar la decisión
sobre el tipo de ajuste adecuado que se ha de aplicar en esta serie de datos en particular.
Nota: Cuando se tienen dudas respecto a la tendencia de los datos originales en una serie de
tiempo, se puede suavizar la serie utilizando el método de los promedios móviles, a través del
cual se seleccionan períodos de determinada longitud y luego se calculan medias aritméticas
sucesivas, posteriormente, se grafican y se puede mirar con mayor claridad cuál es la tendencia.
Si los datos son pocos no se recomienda este método, además, con este método se pierden datos
al principio y al final de la serie.
b) Ajuste lineal:
Año X Y XY X2
Diagrama de dispersión
Año
1996 0 1,3 0 0
1997 1 3,5 3,5 1
1998 2 14,5 29 4
1999 3 27,1 81,3 9
2000 4 41,3 165,2 16
2001 5 70,3 351,5 25
2002 6 87,1 522,6 36
2003 7 130,5 913,5 49
2004 8 150,3 1.202,4 64
Total 36 525,9 3.269 204
Se plantea el siguiente sistema de ecuaciones:
(1)
(2)
Al solucionar simultáneamente este sistema de ecuaciones se obtiene:
y
La función de ajuste lineal está dada por:
Gráfica de la función de ajuste lineal sobre el diagrama de dispersión:
Cálculo de los pronósticos utilizando la función de ajuste lineal:
Año X Y
1996 0 1,3 -19,26 20,56 422,7136
1997 1 3,5 0,16333333 3,336666667 11,1333444
1998 2 14,5 19,5866667 -5,086666667 25,8741778
Ajuste lineal
Año
1999 3 27,1 39,01 -11,91 141,8481
2000 4 41,3 58,4333333 -17,13333333 293,551111
2001 5 70,3 77,8566667 -7,556666667 57,1032111
2002 6 87,1 97,28 -10,18 103,6324
2003 7 130,5 116,703333 13,79666667 190,348011
2004 8 150,3 136,126667 14,17333333 200,883378
Total - - - - 1447,08733
Los valores reales no tienen similitud con los datos pronosticados.
La sumatoria de los errores residuales cuadráticos es , no tiende a ser un valor
pequeño. Más adelante se comparan las sumatorias de los errores residuales cuadráticos para
mirar cuál es el menor.
Coeficiente de correlación lineal:
Año X Y
1996 0 1,3 -19,26 6.036,254044 3.264,217778
1997 1 3,5 0,16333333 3.395,3929 3.017,671111
1998 2 14,5 19,5866667 1.509,063511 1.930,137778
1999 3 27,1 39,01 377,2658778 981,7777778
2000 4 41,3 58,4333333 4,54384 293,5511111
2001 5 70,3 77,8566667 377,2658778 140,8177778
2002 6 87,1 97,28 1.509,063511 821,7777778
2003 7 130,5 116,703333 3.395,3929 5.193,604444
2004 8 150,3 136,126667 6.036,254044 8.439,484444
Total - 525,9 - 22.635,95267 24.083,04
Media de Y: 58,4333333
Coeficiente de determinación D = 0,9399126
Coeficiente de correlación r = 0,9694909
Más adelante se comparan los coeficientes de determinación para analizar cuál de los tres
ajustes presenta el coeficiente D más alto, es decir, el más cercano al valor de 1.
En este ajuste, el coeficiente de correlación lineal es r = 0,9694909, lo que significa que la
función de ajuste hallada tiene un grado de representatividad del 96,9% para efectuar los
pronósticos, sin embargo, aunque este porcentaje parezca alto, no es confiable, porque como se
detectó anteriormente, los valores pronosticados son muy diferentes a los datos reales.
c) Ajuste parabólico:
Año X Y X2 X3 X4 XY X2Y
1996 0 1,3 0 0 0 0 0
1997 1 3,5 1 1 1 3,5 3,5
1998 2 14,5 4 8 16 29 58
1999 3 27,1 9 27 81 81,3 243,9
2000 4 41,3 16 64 256 165,2 660,8
2001 5 70,3 25 125 625 351,5 1.757,5
2002 6 87,1 36 216 1.296 522,6 3.135,6
2003 7 130,5 49 343 2.401 913,5 6.394,5
2004 8 150,3 64 512 4.096 1.202,4 9.619,2
Total - 525,9 204 1.296 8.772 3.269 21.873
Se soluciona simultáneamente el siguiente sistema de 3x3:
(1)
(2)
La solución de este sistema está dada por:
La función de ajuste parabólica está dada por:
Gráfico de la función de ajuste parabólico sobre el diagrama de dispersión:
Ajuste parabólico
Año
Al visualizar este gráfico se detecta que los puntos reales se encuentran más cercanos a la
función de ajuste parabólica que en el caso anterior, del ajuste lineal.
Cálculo de los Pronósticos utilizando la función de ajuste parabólica:
Año X Y
1996 0 1,3 -
0,18727276
1,487272758 2,21198026
1997 1 3,5 4,93151514 -
1,431515144
2,04923561
1998 2 14,5 14,137316 0,362683974 0,13153967
1999 3 27,1 27,4301299 -
0,330129889
0,10898574
2000 4 41,3 44,8099567 -
3,509956732
12,3197963
2001 5 70,3 66,2767966 4,023203445 16,186166
2002 6 87,1 91,8306494 -
4,730649359
22,3790434
2003 7 130,5 121,471515 9,028484856 81,5135388
2004 8 150,3 155,199394 -
4,899393909
24,0040607
Total - - - - 160,904346
Los pronósticos calculados con el ajuste parabólico se encuentran más cercanos a los datos
originales que en el caso del ajuste lineal, también se puede observar que la sumatoria de los
errores residuales cuadráticos es menor a la arrojada en el ajuste lineal.
Cálculo del coeficiente de Determinación en el ajuste parabólico:
Año X Y
1996 0 1,3 -0,18727276 3.436,37546 3.264,21778
1997 1 3,5 4,93151514 2.862,44455 3.017,67111
1998 2 14,5 14,137316 1.962,13715 1.930,13778
1999 3 27,1 27,4301299 961,198624 981,777778
2000 4 41,3 44,8099567 185,59639 293,551111
2001 5 70,3 66,2767966 61,5199153 140,817778
2002 6 87,1 91,8306494 1.115,38072 821,777778
2003 7 130,5 121,471515 3.973,81237 5.193,60444
2004 8 150,3 155,199394 9.363,67048 8.439,48444
Total - 525,9 - 23.922,1356 24.083,04
Media de Y = 58,4333333
Coeficiente de determinación D = 0,99331877
En el presente ajuste parabólico, el coeficiente de determinación es más alto que el hallado en
el ajuste lineal, por lo tanto, este ajuste representa mucho mejor a la serie de datos original.
d) Ajuste exponencial:
Año X Y X2
1996 0 1,3 0 0,11394335 0
1997 1 3,5 1 0,54406804 0,54406804
1998 2 14,5 4 1,161368 2,322736
1999 3 27,1 9 1,43296929 4,29890787
2000 4 41,3 16 1,61595005 6,46380021
2001 5 70,3 25 1,84695533 9,23477663
2002 6 87,1 36 1,94001816 11,6401089
2003 7 130,5 49 2,11561051 14,8092736
2004 8 150,3 64 2,17695898 17,4156718
Total - 525,9 204 12,9478417 66,7293431
Se plantea el siguiente sistema de ecuaciones:
(1)
Al solucionar simultáneamente el sistema, se obtiene como resultado:
Para hallar los valores de a y de b, se aplica antilogaritmo:
Recordar que el logaritmo de un número es el exponente al cual hay que elevar la base para que
dé dicho número, es decir:
La función de ajuste exponencial está dada por:
La función de ajuste exponencial también puede ser expresada como:
Para hallar el valor de c y poder expresarla con la base (e) de los logaritmos naturales (ln),
tenemos presente el siguiente análisis matemático:
En este caso específico, se tiene que:
Por tal motivo, la función de ajuste exponencial también puede quedar expresada así:
Gráfica de la función de ajuste exponencial sobre el diagrama de dispersión:
Cálculo de los pronósticos utilizando la función de ajuste exponencial:
Año X Y
1996 0 1,3 2,77194109 -
1,471941086
2,16661056
𝑏 𝑒
ln 𝑏 ln 𝑒
ln 𝑏 ln 𝑒
ln 𝑏
ln 𝑏
ln 𝑏
Ajuste exponencial
Año
1997 1 3,5 4,91756678 -
1,417566783
2,00949558
1998 2 14,5 8,72401769 5,775982311 33,3619717
1999 3 27,1 15,4768584 11,62314163 135,097421
2000 4 41,3 27,4567468 13,84325317 191,635658
2001 5 70,3 48,7096883 21,59031173 466,141561
2002 6 87,1 86,4135051 0,686494939 0,4712753
2003 7 130,5 153,302025 -
22,80202516
519,932351
2004 8 150,3 271,965718 -
121,6657176
14.802,5469
Total - - - - 16.153,3632
Los datos pronosticados utilizando la función de ajuste exponencial indican que ésta no es
adecuada, porque no presentan semejanza o similitud con los datos reales u originales, además,
la sumatoria de los errores residuales cuadráticos es alta.
Cálculo del Coeficiente de determinación en el ajuste exponencial:
Para calcular el coeficiente de determinación en un ajuste exponencial se debe elaborar
preliminarmente la siguiente tabla:
2,77194109 0,442784 0,11394335 0,991747265 1,754845263
4,91756678 0,69175027 0,54406804 0,557857836 0,800275228
8,72401769 0,94071654 1,161368 0,247936816 0,076884796
15,4768584 1,18968281 1,43296929 0,061984204 3,226E-05
27,4567468 1,43864908 1,61595005 0 0,031435635
48,7096883 1,68761535 1,84695533 0,061984204 0,16671399
86,4135051 1,93658162 1,94001816 0,247936816 0,25137095
153,302025 2,18554789 2,11561051 0,557857836 0,458276781
271,965718 2,43451416 2,17695898 0,991747265 0,54510151
Total 12,9478417 12,9478417 3,719052243 4,084936413
El valor de este coeficiente de determinación es inferior a los arrojados en los dos
anteriores ajustes.
d) Decisión del tipo de ajuste:
El ajuste más adecuado para esta serie de datos es el ajuste parabólico.
1. Ejercicios de aplicación propuestos.
1.18 Análisis de regresión entre el precio de entrada a una sala de videos y el número de
estudiantes que entran.
La junta de estudiantes de una institución educativa intenta determinar si el precio de entrada a
la sala de videos ejerce algún efecto sobre el número de estudiantes que utilizan la instalación.
Se cuenta con la siguiente información sobre el precio (en miles de pesos por hora) y el número
de estudiantes que entran al recinto:
Precio 1,25 1,5 1,75 2 2,1 1 2,5 1,1
No.
Estudiantes
95 83 75 72 69 101 65 98
a) Graficar el diagrama de dispersión (probar visualmente que los datos originales
presentan una tendencia lineal).
b) Calcular la función de ajuste y graficarla sobre el diagrama de dispersión.
c) Calcular el coeficiente de correlación.
d) Pronosticar cuál es el número de estudiantes que ingresan al recinto si el precio
es de $1.900.
Interpretar resultados.
1.19 Análisis de regresión entre la utilidad y el gasto en publicidad.
Una empresa descubre que sus utilidades netas (en millones de $) se incrementan al aumentar la
cantidad gastada en publicidad (en millones de $) del producto. La empresa dispone de los
siguientes registros:
Gasto en
publicidad
10 11 12,3 13,5 15 15,5 17
Utilidades netas 50 63 68 73 75 77 83
a) Graficar el diagrama de dispersión y probar visualmente que la nube de puntos
presenta una tendencia lineal.
b) Calcular la función de ajuste lineal y graficarla sobre el diagrama.
c) Pronosticar de cuánto es la utilidad si el gasto en publicidad es de $14 millones.
d) Calcular el coeficiente de correlación.
Interpretar resultados.
1.20 Análisis de regresión entre el nivel de ahorro y el ingreso.
El departamento de personal de una compañía desea analizar el comportamiento del ahorro
mensual de sus empleados en relación con el salario devengado por los mismos, para ello cuenta
con la siguiente información:
Ingreso mensual
(miles $)
Ahorro mensual
(miles $)
500 100
600 80
550 90
700 200
720 120
730 150
800 200
820 180
830 210
850 220
a) Graficar el diagrama de dispersión y visualizar cuál es la tendencia que siguen
los datos originales.
b) Elaborar diferentes tipos de ajuste, para cada uno de ellos: calcular la función de
ajuste y graficarla sobre el diagrama; calcular pronósticos; errores residuales; coeficiente
de determinación.
1.21 Análisis de regresión: Utilidad a través del tiempo en una compañía distribuidora de
computadores.
La utilidad de una compañía dedicada a distribuir equipos de computador para oficinas presenta
las siguientes utilidades en cada uno de los años respectivos:
Año 2000 2001 2002 2003 2004 2005 2006 2007 2008
Utilidades (millones
$)
6 6,5 7 7,2 7,3 7,6 8 8,1 7,9
a) Graficar el diagrama de dispersión y analizar visualmente cuál es la tendencia
que siguen estos datos.
b) Elaborar el ajuste lineal y el parabólico, ¿cuál considera más adecuado?, explicar.
Para cada uno de los dos tipos de ajuste analizar: función de ajuste y gráfica de la función de
ajuste; cálculo de pronósticos; coeficiente de correlación lineal; coeficiente de determinación.
1.22 Análisis de regresión: Ventas versus espacio asignado.
Un comerciante desea analizar si las ventas semanales (en miles de $) tienen relación alguna con
el espacio asignado para vender (en metros cuadrados). De acuerdo a eventos pasados se recopiló
la siguiente información:
Ventas semanales
Espacio disponible
m2
635 7
528 6
456 4,5
654 6,3
498 5
539 5,2
580 7
620 8
472 6
587 6,8
a) Graficar el diagrama de dispersión, analizar visualmente cuál es la tendencia de
esta serie de datos.
b) Analizar dos tipos de ajuste diferentes y justificar cuál de ellos elige.
1.23 Análisis de regresión: Pasivo pensional a través del tiempo.
El pasivo pensional de una entidad estatal viene presentando el siguiente comportamiento:
Año 2003 2004 2005 2006 2007
Semestre I II I II I II I II I II
Pasivo
pensional
(millones $)
7 8 10,8 13 14,8 21,1 26,5 30 30,2 31
a) Graficar el diagrama de dispersión. Analizar visualmente la tendencia que siguen
los datos.
b) Efectuar el ajuste lineal, el parabólico y el exponencial. Analizar cada uno de
ellos y justificar cuál de éstos considera más adecuado.
Para cada uno de los ajustes se pide: calcular la función de ajuste y graficarla sobre el diagrama
de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación y en el caso
del ajuste lineal, el coeficiente de correlación lineal.
1.24 Análisis de regresión: Presupuesto ejecutado de egresos a través del tiempo.
El presupuesto ejecutado de egresos de una caja de compensación familiar viene mostrando el
siguiente comportamiento en los últimos años:
Año 2001 2002 2003 2004 2005 2006 2007 2008
Presupuesto
ejecutado de egresos
(millones $)
114 144 177,2 191 311,5 314,1 426 555
a) Graficar el diagrama de dispersión, analizar visualmente la tendencia de los datos
originales.
b) Efectuar ajuste lineal, parabólico y exponencial. Analizar y justificar cuál de ellos
considera de mayor pertinencia.
Para cada uno de los ajustes se pide: calcular la función de ajuste y graficarla sobre el diagrama
de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación y en el caso
del ajuste lineal, el coeficiente de correlación lineal.
1.25 Análisis de regresión: Crecimiento de la población a través del tiempo.
La población (en millones de habitantes) de una zona determinada del país viene presentando el
siguiente comportamiento a través del tiempo:
Año 2001 2002 2003 2004 2005 2006 2007 2008
Población
(millones de
habitantes)
1,7 5,95 20,83 72,89 255,11 892,87 3.125,05 10.937,68
a) Graficar el diagrama de dispersión y visualizar cuál es la tendencia que sigue la
población a través del tiempo.
b) Efectuar diferentes tipos de ajuste y analizar cuál de ellos es el más adecuado.
Para cada uno de los ajustes aplicados, calcular: función de ajuste y graficarla sobre el diagrama
de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación.
1.26 Análisis de regresión: Utilidad semestral.
Los siguientes datos se refieren al comportamiento de la utilidad semestral (millones de pesos)
de una empresa dedicada a la fabricación de artículos de cuero:
Año 2005 2006 2007 2008 2009
Semestre I II I II I II I II I II
Pasivo
pensional
(millones $)
2,07 2,14 2,23 2,34 2,57 2,63 2,85 3,01 3,67 4,1
a) Graficar el diagrama de dispersión y visualizar cuál es la tendencia que siguen las
utilidades a través del tiempo.
b) Efectuar ajuste lineal, parabólico y exponencial. Analizar y justificar cuál de ellos
considera de mayor pertinencia.
Para cada uno de los ajustes se pide: calcular la función de ajuste y graficarla sobre el diagrama
de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación y en el caso
del ajuste lineal, el coeficiente de correlación lineal.
ENLACE A VIDEOS
1. Correlación de variables
https://www.youtube.com/watch?v=CU3SuzkWP0s&list=PLFkbGwyzAy6wT7OSCCUf4e5G9MpL6
KkeI&index=37&t=161s
2. Ejercicio de coeficiente de correlacion
https://www.youtube.com/watch?v=TQyYCBLIw0U&list=PLFkbGwyzAy6wT7OSCCU
f4e5G9MpL6KkeI&index=38&t=746s
Bibliografía
Gabriel, J. (2017). Diseños experimentales teoria y practica para experimentos agropecuarios.
Guayaquil, Ecuador: Compas.
Marro, E. D.‐A.–F. (s.f.). Prueba de Hipótesis para la diferencia de medias. Prueba de Hipótesis
para la diferencia de medias.
McGRAW-HILL/INTERAMERICANA EDITORES, S.A. de C.V. (2009). Estadisticas cuarta
edicion. Mexico: The McGraw-Hill Companies, Inc.
Superprof material didactico. (26 de Agosto de 2015). Tabla de distribución normal. Obtenido de
Tabla de distribución normal:
https://www.superprof.es/apuntes/escolar/matematicas/probabilidades/distribucion-
normal/tabla-de-la-distribucion-normal.html
Zuluaga, M. N. (s.f.). ESTADÍSTICA PARA EDUCACIÓN SUPERIOR. Medellin: Esumer.

Más contenido relacionado

La actualidad más candente

Regresión y correlación estadística aplicada
Regresión y correlación estadística aplicadaRegresión y correlación estadística aplicada
Regresión y correlación estadística aplicada
Dany Deyvis Rios Garcia
 
Análisis de regresión y correlación lineal
Análisis de regresión y correlación linealAnálisis de regresión y correlación lineal
Análisis de regresión y correlación lineal
alerioz
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
thomas669
 
Teoria De Correlacion
Teoria De CorrelacionTeoria De Correlacion
Teoria De Correlacion
mallita
 
Análisis de Correlacion Lineal
Análisis de Correlacion LinealAnálisis de Correlacion Lineal
Análisis de Correlacion Lineal
Universidad Nacional Mayor de San Marcos
 
Diagrama de dispersión y regresion cuadratica
Diagrama de dispersión y regresion cuadraticaDiagrama de dispersión y regresion cuadratica
Diagrama de dispersión y regresion cuadratica
darlenisv
 
Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacion
Cleofé Zavaleta
 
Heterocedasticidad
HeterocedasticidadHeterocedasticidad
Heterocedasticidad
franbf66
 
Regresión y Correlación Lineal
Regresión y Correlación LinealRegresión y Correlación Lineal
Regresión y Correlación Lineal
jmconforte
 
5 ejercicios de correlación
5 ejercicios de correlación5 ejercicios de correlación
5 ejercicios de correlación
1010karen
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019
franciscoe71
 
Mapa conceptual de estadistica
Mapa conceptual de estadisticaMapa conceptual de estadistica
Mapa conceptual de estadistica
wilmerp17
 
Tarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión linealTarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión lineal
María Gordón
 
Homocedasticidad
HomocedasticidadHomocedasticidad
Homocedasticidad
franbf66
 
Regresión correlacion 23-04
Regresión  correlacion 23-04Regresión  correlacion 23-04
Regresión correlacion 23-04
Dyjohaner Trematerra
 
Analisis De Regresion Y Correlacion
Analisis De Regresion Y CorrelacionAnalisis De Regresion Y Correlacion
Analisis De Regresion Y Correlacion
JUAN CARLOS GONZALEZ SANCHEZ
 
REGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEALREGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEAL
Jesús Paredes
 
Mi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimoMi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimo
nochesk
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011
Robinho Navarrete
 
Tema 2.1 regresión lineal
Tema 2.1  regresión linealTema 2.1  regresión lineal
Tema 2.1 regresión lineal
Anthony Maule
 

La actualidad más candente (20)

Regresión y correlación estadística aplicada
Regresión y correlación estadística aplicadaRegresión y correlación estadística aplicada
Regresión y correlación estadística aplicada
 
Análisis de regresión y correlación lineal
Análisis de regresión y correlación linealAnálisis de regresión y correlación lineal
Análisis de regresión y correlación lineal
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
 
Teoria De Correlacion
Teoria De CorrelacionTeoria De Correlacion
Teoria De Correlacion
 
Análisis de Correlacion Lineal
Análisis de Correlacion LinealAnálisis de Correlacion Lineal
Análisis de Correlacion Lineal
 
Diagrama de dispersión y regresion cuadratica
Diagrama de dispersión y regresion cuadraticaDiagrama de dispersión y regresion cuadratica
Diagrama de dispersión y regresion cuadratica
 
Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacion
 
Heterocedasticidad
HeterocedasticidadHeterocedasticidad
Heterocedasticidad
 
Regresión y Correlación Lineal
Regresión y Correlación LinealRegresión y Correlación Lineal
Regresión y Correlación Lineal
 
5 ejercicios de correlación
5 ejercicios de correlación5 ejercicios de correlación
5 ejercicios de correlación
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019
 
Mapa conceptual de estadistica
Mapa conceptual de estadisticaMapa conceptual de estadistica
Mapa conceptual de estadistica
 
Tarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión linealTarea 1 correlación y regresión lineal
Tarea 1 correlación y regresión lineal
 
Homocedasticidad
HomocedasticidadHomocedasticidad
Homocedasticidad
 
Regresión correlacion 23-04
Regresión  correlacion 23-04Regresión  correlacion 23-04
Regresión correlacion 23-04
 
Analisis De Regresion Y Correlacion
Analisis De Regresion Y CorrelacionAnalisis De Regresion Y Correlacion
Analisis De Regresion Y Correlacion
 
REGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEALREGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEAL
 
Mi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimoMi parte de proba de 5.2 hasta el ultimo
Mi parte de proba de 5.2 hasta el ultimo
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011
 
Tema 2.1 regresión lineal
Tema 2.1  regresión linealTema 2.1  regresión lineal
Tema 2.1 regresión lineal
 

Similar a ANALISIS DE CORRELACION

regresiones leniales.pptx
regresiones leniales.pptxregresiones leniales.pptx
regresiones leniales.pptx
YONILZARABIAHUAMAN
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
jorge chami
 
TEMAS DE IO.docx
TEMAS DE IO.docxTEMAS DE IO.docx
TEMAS DE IO.docx
cero17
 
Tema 6
Tema 6Tema 6
Análisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simpleAnálisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simple
Joan Fernando Chipia Lobo
 
4. estadística descriptiva
4.  estadística descriptiva4.  estadística descriptiva
4. estadística descriptiva
Leonardo Daniel López Condoy
 
Concepto
ConceptoConcepto
Concepto
PPEPPE2
 
2.2 variables bidimensionales
2.2 variables bidimensionales2.2 variables bidimensionales
2.2 variables bidimensionales
Consuelo Valle
 
Correlacion pearson y sperman
Correlacion pearson y spermanCorrelacion pearson y sperman
Correlacion pearson y sperman
soaric
 
Analisis de regresion
Analisis de regresionAnalisis de regresion
Analisis de regresion
Jose Castañeda
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
Graciela Orellana
 
Correlación de Person
Correlación de PersonCorrelación de Person
Correlación de Person
Xaviier A. Landaez
 
regresion y correlacion lineal_ppt123456
regresion y correlacion lineal_ppt123456regresion y correlacion lineal_ppt123456
regresion y correlacion lineal_ppt123456
Jesús Paredes
 
Tema 9
Tema 9Tema 9
Correlación PEARSON
Correlación PEARSONCorrelación PEARSON
Correlación PEARSON
Servicio Apoyo SAIA
 
SesióN 8
SesióN 8SesióN 8
SesióN 8
SesióN 8SesióN 8
Correlacion de pearson y spearman
Correlacion de pearson y spearmanCorrelacion de pearson y spearman
Correlacion de pearson y spearman
CassandraSoffia
 
Tema 9.pdf
Tema 9.pdfTema 9.pdf
Tema 9.pdf
RenanPM1
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
miguelescobarrivero
 

Similar a ANALISIS DE CORRELACION (20)

regresiones leniales.pptx
regresiones leniales.pptxregresiones leniales.pptx
regresiones leniales.pptx
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
TEMAS DE IO.docx
TEMAS DE IO.docxTEMAS DE IO.docx
TEMAS DE IO.docx
 
Tema 6
Tema 6Tema 6
Tema 6
 
Análisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simpleAnálisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simple
 
4. estadística descriptiva
4.  estadística descriptiva4.  estadística descriptiva
4. estadística descriptiva
 
Concepto
ConceptoConcepto
Concepto
 
2.2 variables bidimensionales
2.2 variables bidimensionales2.2 variables bidimensionales
2.2 variables bidimensionales
 
Correlacion pearson y sperman
Correlacion pearson y spermanCorrelacion pearson y sperman
Correlacion pearson y sperman
 
Analisis de regresion
Analisis de regresionAnalisis de regresion
Analisis de regresion
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Correlación de Person
Correlación de PersonCorrelación de Person
Correlación de Person
 
regresion y correlacion lineal_ppt123456
regresion y correlacion lineal_ppt123456regresion y correlacion lineal_ppt123456
regresion y correlacion lineal_ppt123456
 
Tema 9
Tema 9Tema 9
Tema 9
 
Correlación PEARSON
Correlación PEARSONCorrelación PEARSON
Correlación PEARSON
 
SesióN 8
SesióN 8SesióN 8
SesióN 8
 
SesióN 8
SesióN 8SesióN 8
SesióN 8
 
Correlacion de pearson y spearman
Correlacion de pearson y spearmanCorrelacion de pearson y spearman
Correlacion de pearson y spearman
 
Tema 9.pdf
Tema 9.pdfTema 9.pdf
Tema 9.pdf
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
 

Más de Carlos Miguel Santa Cruz Vera

Apa 5
Apa 5Apa 5
Apa 4
Apa 4Apa 4
Apa 3
Apa 3Apa 3
Apa 1
Apa 1Apa 1
Apa 2
Apa 2Apa 2
variables
variables variables
PRUEBA DE HIPOTESIS
PRUEBA DE HIPOTESISPRUEBA DE HIPOTESIS
PRUEBA DE HIPOTESIS
Carlos Miguel Santa Cruz Vera
 
DISTRIBUCION CHI
DISTRIBUCION CHIDISTRIBUCION CHI
DISTRIBUCION DE PROBABILIDAD CONTINUA
DISTRIBUCION DE PROBABILIDAD CONTINUADISTRIBUCION DE PROBABILIDAD CONTINUA
DISTRIBUCION DE PROBABILIDAD CONTINUA
Carlos Miguel Santa Cruz Vera
 
DISTRIBUCION DE PROBABILIDAD
DISTRIBUCION DE PROBABILIDADDISTRIBUCION DE PROBABILIDAD
DISTRIBUCION DE PROBABILIDAD
Carlos Miguel Santa Cruz Vera
 
INTRODUCCION A LA PROBABILIDAD
INTRODUCCION A LA PROBABILIDADINTRODUCCION A LA PROBABILIDAD
INTRODUCCION A LA PROBABILIDAD
Carlos Miguel Santa Cruz Vera
 
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLELAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
Carlos Miguel Santa Cruz Vera
 
CAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIESCAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIES
Carlos Miguel Santa Cruz Vera
 
CAMBIAR TIPO DE GRAFICO
CAMBIAR TIPO DE GRAFICOCAMBIAR TIPO DE GRAFICO
CAMBIAR TIPO DE GRAFICO
Carlos Miguel Santa Cruz Vera
 
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLELAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
Carlos Miguel Santa Cruz Vera
 
CAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIESCAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIES
Carlos Miguel Santa Cruz Vera
 
CAMBIAR TIPO DE GRAFICO EN EXCEL
CAMBIAR TIPO DE GRAFICO EN EXCELCAMBIAR TIPO DE GRAFICO EN EXCEL
CAMBIAR TIPO DE GRAFICO EN EXCEL
Carlos Miguel Santa Cruz Vera
 
ESTADISTICA PARA EXCEL
ESTADISTICA PARA EXCELESTADISTICA PARA EXCEL
ESTADISTICA PARA EXCEL
Carlos Miguel Santa Cruz Vera
 
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLELAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
Carlos Miguel Santa Cruz Vera
 
GRAFICO DE COLUMNAS Y LINEAS EN EXCEL
GRAFICO DE COLUMNAS Y LINEAS EN EXCELGRAFICO DE COLUMNAS Y LINEAS EN EXCEL
GRAFICO DE COLUMNAS Y LINEAS EN EXCEL
Carlos Miguel Santa Cruz Vera
 

Más de Carlos Miguel Santa Cruz Vera (20)

Apa 5
Apa 5Apa 5
Apa 5
 
Apa 4
Apa 4Apa 4
Apa 4
 
Apa 3
Apa 3Apa 3
Apa 3
 
Apa 1
Apa 1Apa 1
Apa 1
 
Apa 2
Apa 2Apa 2
Apa 2
 
variables
variables variables
variables
 
PRUEBA DE HIPOTESIS
PRUEBA DE HIPOTESISPRUEBA DE HIPOTESIS
PRUEBA DE HIPOTESIS
 
DISTRIBUCION CHI
DISTRIBUCION CHIDISTRIBUCION CHI
DISTRIBUCION CHI
 
DISTRIBUCION DE PROBABILIDAD CONTINUA
DISTRIBUCION DE PROBABILIDAD CONTINUADISTRIBUCION DE PROBABILIDAD CONTINUA
DISTRIBUCION DE PROBABILIDAD CONTINUA
 
DISTRIBUCION DE PROBABILIDAD
DISTRIBUCION DE PROBABILIDADDISTRIBUCION DE PROBABILIDAD
DISTRIBUCION DE PROBABILIDAD
 
INTRODUCCION A LA PROBABILIDAD
INTRODUCCION A LA PROBABILIDADINTRODUCCION A LA PROBABILIDAD
INTRODUCCION A LA PROBABILIDAD
 
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLELAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
 
CAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIESCAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIES
 
CAMBIAR TIPO DE GRAFICO
CAMBIAR TIPO DE GRAFICOCAMBIAR TIPO DE GRAFICO
CAMBIAR TIPO DE GRAFICO
 
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLELAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
 
CAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIESCAMBIAR TIPO DE GRAFICO DE SERIES
CAMBIAR TIPO DE GRAFICO DE SERIES
 
CAMBIAR TIPO DE GRAFICO EN EXCEL
CAMBIAR TIPO DE GRAFICO EN EXCELCAMBIAR TIPO DE GRAFICO EN EXCEL
CAMBIAR TIPO DE GRAFICO EN EXCEL
 
ESTADISTICA PARA EXCEL
ESTADISTICA PARA EXCELESTADISTICA PARA EXCEL
ESTADISTICA PARA EXCEL
 
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLELAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
LAS FUNCIONES Y SU UTILIDAD PARA DESCRIBIR UNA VARIABLE
 
GRAFICO DE COLUMNAS Y LINEAS EN EXCEL
GRAFICO DE COLUMNAS Y LINEAS EN EXCELGRAFICO DE COLUMNAS Y LINEAS EN EXCEL
GRAFICO DE COLUMNAS Y LINEAS EN EXCEL
 

Último

Todo sobre el acta constitutiva de la empresa.pdf
Todo sobre el acta constitutiva de la empresa.pdfTodo sobre el acta constitutiva de la empresa.pdf
Todo sobre el acta constitutiva de la empresa.pdf
La Paradoja educativa
 
Examen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdfExamen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdf
20minutos
 
Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...
Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...
Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...
Unidad de Espiritualidad Eudista
 
Radicación con expresiones algebraicas para 9no grado
Radicación con expresiones algebraicas para 9no gradoRadicación con expresiones algebraicas para 9no grado
Radicación con expresiones algebraicas para 9no grado
perezducasaarmando
 
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdfGuia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Demetrio Ccesa Rayme
 
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdfMundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
ViriEsteva
 
Dia de la Bandera colegio Santa Angela 2024
Dia de la Bandera colegio Santa Angela 2024Dia de la Bandera colegio Santa Angela 2024
Dia de la Bandera colegio Santa Angela 2024
77361565
 
el pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdfel pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdf
almitamtz00
 
Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1
MauricioSnchez83
 
LA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
LA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJELA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
LA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
jecgjv
 
665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf
665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf
665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf
valerytorresmendizab
 
3° SES COMU LUN10 CUENTO DIA DEL PADRE 933623393 PROF YESSENIA (1).docx
3° SES COMU LUN10  CUENTO DIA DEL PADRE  933623393 PROF YESSENIA (1).docx3° SES COMU LUN10  CUENTO DIA DEL PADRE  933623393 PROF YESSENIA (1).docx
3° SES COMU LUN10 CUENTO DIA DEL PADRE 933623393 PROF YESSENIA (1).docx
rosannatasaycoyactay
 
Power Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascaradoPower Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascarado
https://gramadal.wordpress.com/
 
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptxSEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
Osiris Urbano
 
Manual de procedimiento para gráficos HC
Manual de procedimiento para gráficos HCManual de procedimiento para gráficos HC
Manual de procedimiento para gráficos HC
josseanlo1581
 
La vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primariaLa vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primaria
EricaCouly1
 
PANDERETAS DECORADAS CON MOTIVOS DE LA RIOJA
PANDERETAS DECORADAS CON MOTIVOS DE LA RIOJAPANDERETAS DECORADAS CON MOTIVOS DE LA RIOJA
PANDERETAS DECORADAS CON MOTIVOS DE LA RIOJA
estroba5
 
Maristella Svampa-La sociedad excluyente.pdf
Maristella Svampa-La sociedad excluyente.pdfMaristella Svampa-La sociedad excluyente.pdf
Maristella Svampa-La sociedad excluyente.pdf
belbarcala
 
Lecciones 10 Esc. Sabática. El espiritismo desenmascarado docx
Lecciones 10 Esc. Sabática. El espiritismo desenmascarado docxLecciones 10 Esc. Sabática. El espiritismo desenmascarado docx
Lecciones 10 Esc. Sabática. El espiritismo desenmascarado docx
Alejandrino Halire Ccahuana
 

Último (20)

Todo sobre el acta constitutiva de la empresa.pdf
Todo sobre el acta constitutiva de la empresa.pdfTodo sobre el acta constitutiva de la empresa.pdf
Todo sobre el acta constitutiva de la empresa.pdf
 
Examen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdfExamen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdf
 
Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...
Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...
Triduo Eudista: Jesucristo, Sumo y Eterno Sacerdote; El Corazón de Jesús y el...
 
Radicación con expresiones algebraicas para 9no grado
Radicación con expresiones algebraicas para 9no gradoRadicación con expresiones algebraicas para 9no grado
Radicación con expresiones algebraicas para 9no grado
 
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdfGuia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
 
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdfMundo ABC Examen 1 Grado- Tercer Trimestre.pdf
Mundo ABC Examen 1 Grado- Tercer Trimestre.pdf
 
Dia de la Bandera colegio Santa Angela 2024
Dia de la Bandera colegio Santa Angela 2024Dia de la Bandera colegio Santa Angela 2024
Dia de la Bandera colegio Santa Angela 2024
 
A VISITA DO SENHOR BISPO .
A VISITA DO SENHOR BISPO                .A VISITA DO SENHOR BISPO                .
A VISITA DO SENHOR BISPO .
 
el pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdfel pensamiento critico de paulo freire en basica .pdf
el pensamiento critico de paulo freire en basica .pdf
 
Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1
 
LA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
LA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJELA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
LA PEDAGOGIA AUTOGESTONARIA EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
 
665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf
665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf
665033394-TODAS-LAS-SANGRES-resumen-Por-Capitulos.pdf
 
3° SES COMU LUN10 CUENTO DIA DEL PADRE 933623393 PROF YESSENIA (1).docx
3° SES COMU LUN10  CUENTO DIA DEL PADRE  933623393 PROF YESSENIA (1).docx3° SES COMU LUN10  CUENTO DIA DEL PADRE  933623393 PROF YESSENIA (1).docx
3° SES COMU LUN10 CUENTO DIA DEL PADRE 933623393 PROF YESSENIA (1).docx
 
Power Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascaradoPower Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascarado
 
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptxSEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
 
Manual de procedimiento para gráficos HC
Manual de procedimiento para gráficos HCManual de procedimiento para gráficos HC
Manual de procedimiento para gráficos HC
 
La vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primariaLa vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primaria
 
PANDERETAS DECORADAS CON MOTIVOS DE LA RIOJA
PANDERETAS DECORADAS CON MOTIVOS DE LA RIOJAPANDERETAS DECORADAS CON MOTIVOS DE LA RIOJA
PANDERETAS DECORADAS CON MOTIVOS DE LA RIOJA
 
Maristella Svampa-La sociedad excluyente.pdf
Maristella Svampa-La sociedad excluyente.pdfMaristella Svampa-La sociedad excluyente.pdf
Maristella Svampa-La sociedad excluyente.pdf
 
Lecciones 10 Esc. Sabática. El espiritismo desenmascarado docx
Lecciones 10 Esc. Sabática. El espiritismo desenmascarado docxLecciones 10 Esc. Sabática. El espiritismo desenmascarado docx
Lecciones 10 Esc. Sabática. El espiritismo desenmascarado docx
 

ANALISIS DE CORRELACION

  • 1. ANÁLISIS DE REGRESIÓN Y CORRELACIÓN RESPONSABLE: PROF. CARLOS MIGUEL SANTA CRUZ VERA AÑO LECTIVO 2020
  • 2. INDICE 1. ANÁLISIS DE REGRESIÓN Y CORRELACIÓN 3 1.1 CONCEPTOS BÁSICOS. 3 1.2 AJUSTE LINEAL. 4 1.3 ESTIMACIÓN DE LOS PARÁMETROS. 5 1.4 CÁLCULO DEL PRONÓSTICO. 7 1.5 ERROR RESIDUAL (EI). 7 1.6 DEFINICIÓN Y CARACTERÍSTICAS. 8 1.7 CÁLCULO DEL COEFICIENTE DE CORRELACIÓN: MÉTODO 1. 9 1.8 CÁLCULO DEL COEFICIENTE DE CORRELACIÓN: MÉTODO 2. 9 1.9 MEDIDAS DE VARIACIÓN EN LA REGRESIÓN. 10 1.10 VARIACIÓN NO EXPLICADA (VNE). 11 1.11 VARIACIÓN EXPLICADA (VE). 11 1.12 PROPIEDADES DE LAS MEDIDAS DE VARIACIÓN EN LA REGRESIÓN. 11 2. COEFICIENTE DE DETERMINACIÓN (D). 12 1.13 AJUSTE PARABÓLICO. 13 1.14 AJUSTE EXPONENCIAL. 14 1.15 ANÁLISIS DE REGRESIÓN EN UNA SERIE DE TIEMPO. 16 3. EJERCICIOS DE APLICACIÓN RESUELTOS. 17 1.16 AJUSTE DE REGRESIÓN ENTRE EL PRECIO Y LA DEMANDA DE UN PRODUCTO. 17 1.17 COMPORTAMIENTO DE LA CAPTACIÓN DE UNA COOPERATIVA A TRAVÉS DEL TIEMPO: 21 1. EJERCICIOS DE APLICACIÓN PROPUESTOS. 30 1.18 ANÁLISIS DE REGRESIÓN ENTRE EL PRECIO DE ENTRADA A UNA SALA DE VIDEOS Y EL NÚMERO DE ESTUDIANTES QUE ENTRAN. 30 1.19 ANÁLISIS DE REGRESIÓN ENTRE LA UTILIDAD Y EL GASTO EN PUBLICIDAD. 30 1.20 ANÁLISIS DE REGRESIÓN ENTRE EL NIVEL DE AHORRO Y EL INGRESO. 30 1.21 ANÁLISIS DE REGRESIÓN: UTILIDAD A TRAVÉS DEL TIEMPO EN UNA COMPAÑÍA DISTRIBUIDORA DE COMPUTADORES. 31 1.22 ANÁLISIS DE REGRESIÓN: VENTAS VERSUS ESPACIO ASIGNADO. 32 1.23 ANÁLISIS DE REGRESIÓN: PASIVO PENSIONAL A TRAVÉS DEL TIEMPO. 32 1.24 ANÁLISIS DE REGRESIÓN: PRESUPUESTO EJECUTADO DE EGRESOS A TRAVÉS DEL TIEMPO. 33 1.25 ANÁLISIS DE REGRESIÓN: CRECIMIENTO DE LA POBLACIÓN A TRAVÉS DEL TIEMPO. 33 1.26 ANÁLISIS DE REGRESIÓN: UTILIDAD SEMESTRAL. 33
  • 3. 1. Análisis de regresión y correlación El objetivo principal de la regresión y correlación es identificar el tipo de relación y asociación entre variables. La regresión se encarga de determinar el tipo de relación entre las variables y la correlación determina qué tan intensa es dicha relación. 1.1 Conceptos básicos. Regresión. Es una técnica estadística que estudia la relación entre variables cuantitativas.
  • 4. Con base en el número de variables que se relacionan dentro del estudio, la regresión se clasifica en simple (dos variables) o múltiple (más de dos variables). La regresión múltiple también se conoce como análisis multivariante. Con base en el tipo de asociación existente entre las variables tratadas, la regresión puede ser lineal, parabólica, exponencial, logarítmica, entre otras. Diagrama de dispersión. (Nube de puntos). Es la representación gráfica de la información original en un plano. Cuando se estudia la relación entre dos variables, se utiliza el plano cartesiano, dentro del cual se ubican los puntos, cada uno con sus respectivas coordenadas (X, Y), los puntos que se localizan en el plano constituyen los datos reales u originales, siendo X la variable independiente y Y la variable dependiente, identificadas como la abscisa y la ordenada. El objetivo de elaborar la nube de puntos es visualizar la tendencia que siguen los datos originales, y de esta forma, decidir cuál de los tipos de asociación utilizar para el cálculo de la función de ajuste. Función de ajuste. Corresponde a la función matemática empleada para el ajuste o representación matemática de la relación existente entre las variables. La función de ajuste es utilizada para efectuar pronósticos, los cuales se identifican como los datos pronosticados. Los datos reales y los pronosticados deben ser semejantes, parecidos, con valores muy cercanos, porque de lo contrario, no tiene sentido utilizar la función de ajuste hallada para pronosticar, debido a que los pronósticos no presentarían alta confiabilidad. 1.2 Ajuste lineal. Es utilizada cuando la tendencia que presentan los datos reales u originales es una línea recta, tendencia no significa que todos y cada uno de los puntos reales ubicados en el plano formen exactamente una línea recta, sino que mirándolos de manera conjunta o global, se pueda determinar un comportamiento lineal, de tal forma que pueda ser calculada la función de una línea recta que pase muy cerca de la mayoría de datos originales, quedando algunos puntos sobre la línea ajustada, otros por debajo, e incluso, algunos sobre la misma línea. Algunas nubes de puntos que representan tendencia lineal se presentan a continuación:
  • 5. Ilustración 1 Ejemplos de nubes de puntos con tendencia lineal En el análisis de la regresión lineal se calcula la función de ajuste Y = a + bX, hallando los valores de los parámetros a y b a partir de los datos reales u originales. La función Y = a + bX, es conocida en cálculo como la función lineal. Luego de hallar los valores de a y de b, se escribe estadísticamente: Fórmula (107) a = Término independiente. Intercepto con el eje Y. Es aquel valor que toma la variable dependiente Y cuando la variable independiente X se hace cero. b = Pendiente de la línea recta. Es el grado de incremento o de disminución de la variable dependiente Y, cuando la variable independiente X se incrementa en una unidad. La pendiente es positiva (+) cuando la relación entre las variables X y Y es directamente proporcional; es decir, al aumentar el valor de la variable X también aumenta el valor de la variable Y. La pendiente es negativa (─) cuando la relación entre X y Y es inversamente proporcional; es decir, al aumentar el valor de la variable X el valor de la variable Y disminuye. 1.3 Estimación de los parámetros. Para estimar o calcular los parámetros a y b, se utiliza el método de los mínimos cuadrados, de la siguiente manera:
  • 6. Se llega a un sistema de dos ecuaciones con dos incógnitas, siendo las incógnitas los valores de a y de b: Ecuación 1: Ecuación 2: Para encontrar los valores de a y de b, se soluciona simultáneamente este sistema por alguno de los métodos de solución simultánea de ecuaciones, igualación, sustitución, reducción, determinantes o con la utilización de álgebra lineal como eliminación Gaussiana, Gauss-Jordan, pivoteo, entre otros. Por ejemplo, si utilizamos determinantes, llegamos a los siguientes valores de a y de b: Fórmula (108) Fórmula (109) Otra alternativa que agiliza el cálculo, es hallar el valor de b mediante determinantes y luego el de a, despejándolo de la Ecuación 1, así: Todo lo que se necesita conocer para calcular los valores de a y de b, es obtenido a partir de los puntos (X, Y) reales u originales, siendo n el total de datos o puntos originales que han sido recolectados para el estudio. Se recomienda elaborar una tabla que facilite la obtención de los valores necesarios para el cálculo de los parámetros de a y b; ésta puede ser diseñada con las siguientes columnas: Figura 69. Diseño de tabla para el cálculo de los parámetros de a y b, para el ajuste lineal
  • 7. Luego de conocer los valores respectivos de a y de b, se concluye que la función de ajuste está dada por: Este ajuste es considerado óptimo porque hace mínima la suma de los cuadrados de los errores. 1.4 Cálculo del pronóstico. El cálculo del pronóstico ( ) para la variable Y, dado (conociendo) un valor de X, se obtiene sustituyendo los valores respectivos de a, b y X en la función de ajuste hallada: 1.5 Error residual (ei). Es cada una de las distancias verticales entre el dato real y el dato pronosticado. Todos los datos pronosticados caen sobre la recta ajustada y los datos reales algunos se ubican por encima, por debajo o sobre la línea de ajuste; entre más pequeña sea esta distancia, el pronóstico será más confiable. Fórmula (110) Ésta distancia debe ser mínima para que exista un buen ajuste o una buena bondad de ajuste; la sumatoria de todos los residuales debe ser igual a cero o muy cercana a cero: Un error es positivo cuando el dato real se ubica por encima de la función de ajuste, es decir, el dato real es mayor al dato pronosticado: Un error es negativo cuando el dato real se ubica por debajo de la función de ajuste, es decir, el dato real es menor al dato pronosticado: Un error es igual a cero cuando el dato real se ubica exactamente sobre la función de ajuste, es decir, cuando el dato real es igual al dato pronosticado: La recta ajustada minimiza la sumatoria de los errores residuales cuadráticos, en otras palabras: la función minimiza La figura a continuación ilustra lo mencionado: Figura 70. Representación gráfica de error residual
  • 8. Ilustración 2 Coeficiente de correlación (r). 1.6 Definición y características. El coeficiente de correlación se denota con la letra r. Es aquel valor que se encarga de dar el grado de asociación entre la variable dependiente Y y la variable independiente X. El rango de valores dentro del cual siempre se encuentra el coeficiente de correlación es: límite inferior ─ 1 y límite superior 1, así: El signo del coeficiente de correlación debe coincidir siempre con el signo del parámetro b. El signo del coeficiente de correlación indica si la relación entre las variables es inversamente o directamente proporcional. El valor en absoluto del coeficiente de correlación indica el grado de asociación entre las variables, es la fuerza de la relación entre las variables y la confiabilidad en los pronósticos. Si r = 1, la relación entre X y Y es directamente proporcional en un 100%. En este caso, todos los datos reales caen sobre la línea ajustada, todos los datos reales son idénticos a los pronosticados, por lo tanto, al utilizar la función de ajuste para efectos de pronósticos, la confiabilidad es del 100%. Si r = ─ 1, la relación entre X y Y es inversamente proporcional en un 100%. En este caso, todos los datos reales caen sobre la línea ajustada, todos los datos reales son idénticos a los pronosticados, por lo tanto, al utilizar la función de ajuste para efectuar pronósticos, la confiabilidad es del 100%. Si r = 0, no existe relación lineal entre las variables, la función lineal de ajuste no puede ser utilizada para pronosticar. Entre más cercano se encuentre el valor de r de ─ 1 o de 1, implica un grado mayor de asociación y relación entre las variables, y entre más cercano se encuentre a cero menor será el grado de relación.
  • 9. 1.7 Cálculo del coeficiente de correlación: Método 1. Fórmula (111) Cov (XY) = covarianza de XY Var (X) = varianza de X Var (Y) = varianza de Y Las varianzas siempre son valores positivos, la covarianza puede ser positiva o negativa, por tal motivo, el signo de r depende del signo que tenga la covarianza. La covarianza se calcula como el promedio del producto de las desviaciones respecto a la media para cada variable, así: Fórmula (112) = media de la variable X = media de la variable Y Otra forma de calcular la covarianza es: Fórmula (113) La covarianza de X, Y es igual a la media de (XY) menos la media de X por la media de Y. Las varianzas para cada variable se calculan así: 1.8 Cálculo del coeficiente de correlación: Método 2.
  • 10. Para este método, se hace necesario conocer las medidas de variación en la regresión. Estas son: la variación total, la variación no explicada y la variación explicada. VT = variación total VNE = variación no explicada VE = variación explicada Fórmula (114) Fórmula (115) Al utilizar este método, el signo del coeficiente de correlación se le asigna dependiendo del signo que tenga el parámetro b. 1.9 Medidas de variación en la regresión. Existen tres medidas de variación básicas dentro del estudio de la regresión, éstas son: variación total, variación no explicada y variación explicada. 13.5.1 Variación total (VT). Es la suma de cuadrados totales (SCT). Es la sumatoria de las desviaciones cuadráticas respecto a la media, para la variable Y. Fórmula (116) Ilustración 3 Representación gráfica de la variación total
  • 11. 1.10 Variación no explicada (VNE). Es la suma de los cuadrados del error (SCE). Es la sumatoria de las desviaciones cuadráticas de los valores reales con respecto a los valores pronosticados, para la variable Y. Fórmula (117) Ilustración 4 Representación gráfica de a variación no explicada 1.11 Variación explicada (VE). Es la suma de los cuadrados de la regresión (SCR). Es la sumatoria de las desviaciones cuadráticas de los valores pronosticados respecto a la media de los valores reales, para la variable Y. Fórmula (118) 1.12 Propiedades de las medidas de variación en la regresión. Propiedad 1. Las medidas de variación en la regresión siempre son valores positivos. , ,
  • 12. Propiedad 2. La variación total es igual a la sumatoria de la variación no explicada con la variación explicada. Fórmula (119) Nota: , por lo tanto, De aquí se tiene que: 2. Coeficiente de determinación (D). Es el coeficiente de correlación cuadrado. Fórmula (120) Este coeficiente determina la bondad de ajuste, es decir, determina si la función matemática aplicada representa en forma adecuada los datos originales. El rango de valores dentro del cual siempre se encuentra el coeficiente de determinación es: límite inferior, cero (0), y límite superior, uno (1); siempre es un valor positivo menor o igual a uno (1), así:
  • 13. Fórmula (121) Nota: El coeficiente de correlación es la raíz cuadrada del coeficiente de determinación, así: Fórmula (122) Mientras que el coeficiente de correlación mide el grado de asociación lineal, el coeficiente de determinación es aquel valor que determina la bondad del ajuste (ajustes no lineales), determina si la función matemática aplicada representa en forma adecuada los datos originales, determina el grado de representatividad del ajuste efectuado. 1.13 Ajuste parabólico. El ajuste de regresión parabólico es utilizado cuando la nube de puntos o diagrama de dispersión presenta una tendencia parabólica. El ajuste parabólico esta dado por la función cuadrática: Fórmula (123) Con los datos originales o reales (X, Y) se plantea el siguiente sistema de tres ecuaciones con tres incógnitas: (1) (2) (3) Se soluciona simultáneamente por algún método: igualación, sustitución, reducción, determinantes o algún método de algebra lineal. Para facilitar el planteamiento del anterior sistema, se puede optar por elaborar una tabla con las siguientes columnas, de tal forma que se puedan obtener las sumatorias necesarias. Figura 73. Diseño de tabla para el cálculo de valores del sistema de ecuaciones para el ajuste parabólico
  • 14. Luego de encontrar los respectivos valores de a, b y c, se sustituyen en la función de ajuste Se concluye que esta función representa de manera adecuada a los datos originales, y por tal motivo, puede ser utilizada para pronosticar Y dado un valor respectivo de X, el cálculo del pronóstico se efectúa sustituyendo X en la función de ajuste para hallar el valor de . Cuando el valor de c, coeficiente en X2 es negativo (─), la función de ajuste parabólica abre hacia abajo, y en caso de ser positivo (+) la parábola abre hacia arriba. Ilustración 5 Representación gráfica del ajuste parabólico 1.14 Ajuste exponencial. El ajuste de regresión exponencial es utilizado cuando el comportamiento de la nube de puntos o diagrama de dispersión presenta una tendencia exponencial. La función de ajuste exponencial está dada por: En esta función se tiene: a = es el intercepto en el eje Y b = indica si la función es creciente o decreciente, siempre b 1 Si 0 < b < 1 la función es decreciente Si b > 1 la función es creciente
  • 15. Ilustración 6 Representación gráfica del ajuste exponencial Para encontrar los valores de a y de b, se toma como base la serie de datos original con los valores respectivos de X y de Y, para plantear un sistema de dos ecuaciones con dos incógnitas. Se parte de: Se saca logaritmo a ambos lados de la igualdad: Se aplican propiedades de los logaritmos, y se obtiene: Se plantean las dos ecuaciones con dos incógnitas, utilizando el método de los mínimos cuadrados. Las dos ecuaciones resultantes son: (1) (2)
  • 16. Las dos incógnitas son: log a y log b, por tal motivo, luego de solucionar simultáneamente el sistema de ecuaciones, se debe sacar antilogaritmo a ambos resultados para hallar los valores de a y de b, respectivamente. Se recomienda elaborar una tabla a partir de los datos originales, que contenga las siguientes columnas, para efecto de facilitar el cálculo de las sumatorias necesarias para el planteamiento del sistema de ecuaciones. Figura 76. Diseño de tabla para el cálculo de valores del sistema de ecuaciones para el ajuste exponencial X Y X2 log Y X ⋅ log Y ∑X - ∑X2 ∑log Y ∑X ⋅ log Y 1.15 Análisis de regresión en una serie de tiempo. Una serie de tiempo nos muestra el comportamiento de una variable a través del tiempo. Utilizando la regresión como aplicación dentro de las series temporales se cuenta con dos variables, donde una de ellas es el tiempo. La variable X siempre se asocia con el tiempo, y la variable Y es aquella que se desea analizar a través del tiempo. Como el tiempo es identificado en este tema con días, meses, semestres, bimestres, años, entre otros; es en este sentido que se hace indispensable asignarle a cada identificación del tiempo un número, y de ahí en adelante, consecutivos. Es muy importante tener en cuenta los consecutivos de X en el momento de efectuar un pronóstico. A continuación se muestran varios ejemplos de asignación de valores consecutivos para X, dado una identificación de tiempo mensual; de igual manera se aplica para las otras identificaciones del tiempo. Figura 77. Ejemplos de asignación de valores consecutivos para el análisis de regresión en una serie de tiempo Tiempo (meses) X X X X X Enero 0 -3 0 1 -4
  • 17. Febrero 1 -2 3 2 -2 Marzo 2 -1 6 3 0 Abril 3 0 9 4 2 Mayo 4 1 12 5 4 Junio 5 2 15 6 6 Julio 6 3 18 7 8 Agosto 7 4 21 8 10 Septiembre 8 5 24 9 12 … … … … … … 3. Ejercicios de aplicación resueltos. 1.16 Ajuste de regresión entre el precio y la demanda de un producto. El departamento de investigaciones económicas de una compañía desea realizar un estudio sobre los precios y la demanda de su principal producto. Para ello cuenta con la siguiente información: Variable X: Precio (miles de $) Variable Y: Demanda (número de unidades) X Y 5 100 7 90 9 86 12 72 17 60 23 55 30 43 Se pide: a) Elaborar el diagrama de dispersión o nube de puntos. ¿Qué tendencia se visualiza en el gráfico? b) Calcular la función de ajuste y graficarla sobre el diagrama. c) Pronosticar el número de unidades demandadas para un precio de $15.000. d) Calcular el coeficiente de correlación e interpretarlo. Solución a) Diagrama de dispersión:
  • 18. Los datos originales o reales presentan una tendencia lineal, por tal motivo, el análisis de regresión y correlación se efectúa con ajuste lineal. b) Cálculo de la función de ajuste: X Y X2 XY 5 100 25 500 7 90 49 630 9 86 81 774 12 72 144 864 17 60 289 1.020 23 55 529 1.265 30 43 900 1.290 103 506 2.017 6.343 El sistema de ecuaciones que se plantea es el siguiente: Ecuación 1. Ecuación 2. Se soluciona simultáneamente el sistema de ecuaciones y se encuentra que el valor de las incógnitas esta dado por: a = 104,64 y b = -2,2; por lo tanto, la función de ajuste que representa de manera adecuada a los datos originales está dada por la siguiente expresión matemática: Gráfica de la función de ajuste sobre el diagrama de dispersión: Nube de puntos Precio (miles $)
  • 19. c) Pronóstico del número de unidades demandadas para un precio de $15.000: , para un valor de unidades d) Coeficiente de correlación: Se elabora una tabla con las columnas necesarias para calcular la covarianza y las varianzas respectivas. 5 100 94,37 768,08 -269,22 7 90 59,51 313,80 -136,65 9 86 32,65 188,08 -78,37 12 72 7,37 0,08 0,78 17 60 5,22 150,94 -28,08 23 55 68,65 298,80 -143,22 30 43 233,65 857,65 -447,65 103 506 501,43 2.577,43 -1.102,43 Media de X: 14,71 Media de Y: 72,29 Var(X): 71,63 Var(Y): 368,20 Cov(XY): -157,489796 Coeficiente de correlación: -0,97 Nube de puntos Precio (miles $)
  • 20. La relación entre el precio y el número de unidades demandadas es inversamente proporcional en un 97%. Los pronósticos que se efectúen utilizando la función de ajuste hallada, tendrán un grado de confiabilidad del 97%, ya que el grado de asociación lineal entre las variables es del 97%. Otra forma de calcular el coeficiente de correlación: Para calcular el coeficiente de correlación utilizando el coeficiente de determinación, se debe tener presente que al resultado hallado siempre se le pone el signo que tenga el parámetro b (coeficiente en X) de la función de ajuste hallada. Se elabora una tabla que sea de utilidad para hallar la variación explicada (VE) y la variación total (VT). 5 100 93,643305 768,08 456,15 7 90 89,246154 313,80 287,66 9 86 84,849003 188,08 157,84 12 72 78,253276 0,08 35,61 17 60 67,260399 150,94 25,25 23 55 54,068946 298,80 331,85 30 43 38,678917 857,65 1.129,42 103 506 - 2.577,428571 2.423,772446 ̅ ∑ ∑( ̂ ̅)
  • 21. El coeficiente de correlación lleva el signo de b, en este caso, negativo (-), por lo tanto, se concluye que 1.17 Comportamiento de la captación de una cooperativa a través del tiempo: Enfoque de regresión y correlación. Analizar el comportamiento de la captación anual en millones de pesos de una cooperativa, utilizar el ajuste que se considere adecuado, para tal fin, visualizar a través del diagrama de dispersión cuál es la tendencia de la nube de puntos. Año Captación (millones $) 1996 1,3 1997 3,5 1998 14,5 1999 27,1 2000 41,3 2001 70,3 2002 87,1 2003 130,5 2004 150,3 a) Elaborar el diagrama de dispersión, visualizar la tendencia de los datos originales, ¿Cuál tipo de ajuste es conveniente efectuar? b) Efectuar un ajuste lineal y graficar la función de ajuste sobre el diagrama. Calcular pronósticos y compararlos con el valor original o real. Calcular el coeficiente de correlación y el de determinación e interpretar resultados. c) Efectuar un ajuste parabólico y graficar la función de ajuste sobre el diagrama. Calcular pronósticos y compararlos con el valor original o real. Calcular el coeficiente de determinación e interpretarlo. d) Efectuar un ajuste exponencial y graficar la función de ajuste sobre el diagrama. Calcular pronósticos y compararlos con el valor original o real. Calcular el coeficiente de determinación e interpretarlo. e) Luego de realizar los numerales b), c) y d), ¿cuál ajuste elige dentro del análisis de esta serie de datos como representativo? Comparar la elección realizada con el ajuste propuesto en el numeral a).
  • 22. Solución a) Diagrama de dispersión o nube de puntos: Año X Y 1996 0 1,3 1997 1 3,5 1998 2 14,5 1999 3 27,1 2000 4 41,3 2001 5 70,3 2002 6 87,1 2003 7 130,5 2004 8 150,3 Al visualizar el gráfico, la tendencia de los puntos originales parece ser lineal, sin embargo también se asemeja a la mitad derecha de una parábola que abre hacia arriba, o también a una exponencial creciente. ¿Qué decisión tomar, si los tres ajustes se acercan a la tendencia? A continuación se efectúan los tres ajustes para analizar resultados y poder tomar la decisión sobre el tipo de ajuste adecuado que se ha de aplicar en esta serie de datos en particular. Nota: Cuando se tienen dudas respecto a la tendencia de los datos originales en una serie de tiempo, se puede suavizar la serie utilizando el método de los promedios móviles, a través del cual se seleccionan períodos de determinada longitud y luego se calculan medias aritméticas sucesivas, posteriormente, se grafican y se puede mirar con mayor claridad cuál es la tendencia. Si los datos son pocos no se recomienda este método, además, con este método se pierden datos al principio y al final de la serie. b) Ajuste lineal: Año X Y XY X2 Diagrama de dispersión Año
  • 23. 1996 0 1,3 0 0 1997 1 3,5 3,5 1 1998 2 14,5 29 4 1999 3 27,1 81,3 9 2000 4 41,3 165,2 16 2001 5 70,3 351,5 25 2002 6 87,1 522,6 36 2003 7 130,5 913,5 49 2004 8 150,3 1.202,4 64 Total 36 525,9 3.269 204 Se plantea el siguiente sistema de ecuaciones: (1) (2) Al solucionar simultáneamente este sistema de ecuaciones se obtiene: y La función de ajuste lineal está dada por: Gráfica de la función de ajuste lineal sobre el diagrama de dispersión: Cálculo de los pronósticos utilizando la función de ajuste lineal: Año X Y 1996 0 1,3 -19,26 20,56 422,7136 1997 1 3,5 0,16333333 3,336666667 11,1333444 1998 2 14,5 19,5866667 -5,086666667 25,8741778 Ajuste lineal Año
  • 24. 1999 3 27,1 39,01 -11,91 141,8481 2000 4 41,3 58,4333333 -17,13333333 293,551111 2001 5 70,3 77,8566667 -7,556666667 57,1032111 2002 6 87,1 97,28 -10,18 103,6324 2003 7 130,5 116,703333 13,79666667 190,348011 2004 8 150,3 136,126667 14,17333333 200,883378 Total - - - - 1447,08733 Los valores reales no tienen similitud con los datos pronosticados. La sumatoria de los errores residuales cuadráticos es , no tiende a ser un valor pequeño. Más adelante se comparan las sumatorias de los errores residuales cuadráticos para mirar cuál es el menor. Coeficiente de correlación lineal: Año X Y 1996 0 1,3 -19,26 6.036,254044 3.264,217778 1997 1 3,5 0,16333333 3.395,3929 3.017,671111 1998 2 14,5 19,5866667 1.509,063511 1.930,137778 1999 3 27,1 39,01 377,2658778 981,7777778 2000 4 41,3 58,4333333 4,54384 293,5511111 2001 5 70,3 77,8566667 377,2658778 140,8177778 2002 6 87,1 97,28 1.509,063511 821,7777778 2003 7 130,5 116,703333 3.395,3929 5.193,604444 2004 8 150,3 136,126667 6.036,254044 8.439,484444 Total - 525,9 - 22.635,95267 24.083,04 Media de Y: 58,4333333 Coeficiente de determinación D = 0,9399126 Coeficiente de correlación r = 0,9694909 Más adelante se comparan los coeficientes de determinación para analizar cuál de los tres ajustes presenta el coeficiente D más alto, es decir, el más cercano al valor de 1. En este ajuste, el coeficiente de correlación lineal es r = 0,9694909, lo que significa que la función de ajuste hallada tiene un grado de representatividad del 96,9% para efectuar los pronósticos, sin embargo, aunque este porcentaje parezca alto, no es confiable, porque como se detectó anteriormente, los valores pronosticados son muy diferentes a los datos reales. c) Ajuste parabólico: Año X Y X2 X3 X4 XY X2Y 1996 0 1,3 0 0 0 0 0 1997 1 3,5 1 1 1 3,5 3,5 1998 2 14,5 4 8 16 29 58
  • 25. 1999 3 27,1 9 27 81 81,3 243,9 2000 4 41,3 16 64 256 165,2 660,8 2001 5 70,3 25 125 625 351,5 1.757,5 2002 6 87,1 36 216 1.296 522,6 3.135,6 2003 7 130,5 49 343 2.401 913,5 6.394,5 2004 8 150,3 64 512 4.096 1.202,4 9.619,2 Total - 525,9 204 1.296 8.772 3.269 21.873 Se soluciona simultáneamente el siguiente sistema de 3x3: (1) (2) La solución de este sistema está dada por: La función de ajuste parabólica está dada por: Gráfico de la función de ajuste parabólico sobre el diagrama de dispersión: Ajuste parabólico Año
  • 26. Al visualizar este gráfico se detecta que los puntos reales se encuentran más cercanos a la función de ajuste parabólica que en el caso anterior, del ajuste lineal. Cálculo de los Pronósticos utilizando la función de ajuste parabólica: Año X Y 1996 0 1,3 - 0,18727276 1,487272758 2,21198026 1997 1 3,5 4,93151514 - 1,431515144 2,04923561 1998 2 14,5 14,137316 0,362683974 0,13153967 1999 3 27,1 27,4301299 - 0,330129889 0,10898574 2000 4 41,3 44,8099567 - 3,509956732 12,3197963 2001 5 70,3 66,2767966 4,023203445 16,186166 2002 6 87,1 91,8306494 - 4,730649359 22,3790434 2003 7 130,5 121,471515 9,028484856 81,5135388 2004 8 150,3 155,199394 - 4,899393909 24,0040607 Total - - - - 160,904346 Los pronósticos calculados con el ajuste parabólico se encuentran más cercanos a los datos originales que en el caso del ajuste lineal, también se puede observar que la sumatoria de los errores residuales cuadráticos es menor a la arrojada en el ajuste lineal. Cálculo del coeficiente de Determinación en el ajuste parabólico: Año X Y 1996 0 1,3 -0,18727276 3.436,37546 3.264,21778 1997 1 3,5 4,93151514 2.862,44455 3.017,67111 1998 2 14,5 14,137316 1.962,13715 1.930,13778 1999 3 27,1 27,4301299 961,198624 981,777778 2000 4 41,3 44,8099567 185,59639 293,551111 2001 5 70,3 66,2767966 61,5199153 140,817778 2002 6 87,1 91,8306494 1.115,38072 821,777778 2003 7 130,5 121,471515 3.973,81237 5.193,60444 2004 8 150,3 155,199394 9.363,67048 8.439,48444 Total - 525,9 - 23.922,1356 24.083,04 Media de Y = 58,4333333 Coeficiente de determinación D = 0,99331877 En el presente ajuste parabólico, el coeficiente de determinación es más alto que el hallado en el ajuste lineal, por lo tanto, este ajuste representa mucho mejor a la serie de datos original.
  • 27. d) Ajuste exponencial: Año X Y X2 1996 0 1,3 0 0,11394335 0 1997 1 3,5 1 0,54406804 0,54406804 1998 2 14,5 4 1,161368 2,322736 1999 3 27,1 9 1,43296929 4,29890787 2000 4 41,3 16 1,61595005 6,46380021 2001 5 70,3 25 1,84695533 9,23477663 2002 6 87,1 36 1,94001816 11,6401089 2003 7 130,5 49 2,11561051 14,8092736 2004 8 150,3 64 2,17695898 17,4156718 Total - 525,9 204 12,9478417 66,7293431 Se plantea el siguiente sistema de ecuaciones: (1) Al solucionar simultáneamente el sistema, se obtiene como resultado: Para hallar los valores de a y de b, se aplica antilogaritmo: Recordar que el logaritmo de un número es el exponente al cual hay que elevar la base para que dé dicho número, es decir: La función de ajuste exponencial está dada por: La función de ajuste exponencial también puede ser expresada como:
  • 28. Para hallar el valor de c y poder expresarla con la base (e) de los logaritmos naturales (ln), tenemos presente el siguiente análisis matemático: En este caso específico, se tiene que: Por tal motivo, la función de ajuste exponencial también puede quedar expresada así: Gráfica de la función de ajuste exponencial sobre el diagrama de dispersión: Cálculo de los pronósticos utilizando la función de ajuste exponencial: Año X Y 1996 0 1,3 2,77194109 - 1,471941086 2,16661056 𝑏 𝑒 ln 𝑏 ln 𝑒 ln 𝑏 ln 𝑒 ln 𝑏 ln 𝑏 ln 𝑏 Ajuste exponencial Año
  • 29. 1997 1 3,5 4,91756678 - 1,417566783 2,00949558 1998 2 14,5 8,72401769 5,775982311 33,3619717 1999 3 27,1 15,4768584 11,62314163 135,097421 2000 4 41,3 27,4567468 13,84325317 191,635658 2001 5 70,3 48,7096883 21,59031173 466,141561 2002 6 87,1 86,4135051 0,686494939 0,4712753 2003 7 130,5 153,302025 - 22,80202516 519,932351 2004 8 150,3 271,965718 - 121,6657176 14.802,5469 Total - - - - 16.153,3632 Los datos pronosticados utilizando la función de ajuste exponencial indican que ésta no es adecuada, porque no presentan semejanza o similitud con los datos reales u originales, además, la sumatoria de los errores residuales cuadráticos es alta. Cálculo del Coeficiente de determinación en el ajuste exponencial: Para calcular el coeficiente de determinación en un ajuste exponencial se debe elaborar preliminarmente la siguiente tabla: 2,77194109 0,442784 0,11394335 0,991747265 1,754845263 4,91756678 0,69175027 0,54406804 0,557857836 0,800275228 8,72401769 0,94071654 1,161368 0,247936816 0,076884796 15,4768584 1,18968281 1,43296929 0,061984204 3,226E-05 27,4567468 1,43864908 1,61595005 0 0,031435635 48,7096883 1,68761535 1,84695533 0,061984204 0,16671399 86,4135051 1,93658162 1,94001816 0,247936816 0,25137095 153,302025 2,18554789 2,11561051 0,557857836 0,458276781 271,965718 2,43451416 2,17695898 0,991747265 0,54510151 Total 12,9478417 12,9478417 3,719052243 4,084936413 El valor de este coeficiente de determinación es inferior a los arrojados en los dos anteriores ajustes. d) Decisión del tipo de ajuste: El ajuste más adecuado para esta serie de datos es el ajuste parabólico.
  • 30. 1. Ejercicios de aplicación propuestos. 1.18 Análisis de regresión entre el precio de entrada a una sala de videos y el número de estudiantes que entran. La junta de estudiantes de una institución educativa intenta determinar si el precio de entrada a la sala de videos ejerce algún efecto sobre el número de estudiantes que utilizan la instalación. Se cuenta con la siguiente información sobre el precio (en miles de pesos por hora) y el número de estudiantes que entran al recinto: Precio 1,25 1,5 1,75 2 2,1 1 2,5 1,1 No. Estudiantes 95 83 75 72 69 101 65 98 a) Graficar el diagrama de dispersión (probar visualmente que los datos originales presentan una tendencia lineal). b) Calcular la función de ajuste y graficarla sobre el diagrama de dispersión. c) Calcular el coeficiente de correlación. d) Pronosticar cuál es el número de estudiantes que ingresan al recinto si el precio es de $1.900. Interpretar resultados. 1.19 Análisis de regresión entre la utilidad y el gasto en publicidad. Una empresa descubre que sus utilidades netas (en millones de $) se incrementan al aumentar la cantidad gastada en publicidad (en millones de $) del producto. La empresa dispone de los siguientes registros: Gasto en publicidad 10 11 12,3 13,5 15 15,5 17 Utilidades netas 50 63 68 73 75 77 83 a) Graficar el diagrama de dispersión y probar visualmente que la nube de puntos presenta una tendencia lineal. b) Calcular la función de ajuste lineal y graficarla sobre el diagrama. c) Pronosticar de cuánto es la utilidad si el gasto en publicidad es de $14 millones. d) Calcular el coeficiente de correlación. Interpretar resultados. 1.20 Análisis de regresión entre el nivel de ahorro y el ingreso.
  • 31. El departamento de personal de una compañía desea analizar el comportamiento del ahorro mensual de sus empleados en relación con el salario devengado por los mismos, para ello cuenta con la siguiente información: Ingreso mensual (miles $) Ahorro mensual (miles $) 500 100 600 80 550 90 700 200 720 120 730 150 800 200 820 180 830 210 850 220 a) Graficar el diagrama de dispersión y visualizar cuál es la tendencia que siguen los datos originales. b) Elaborar diferentes tipos de ajuste, para cada uno de ellos: calcular la función de ajuste y graficarla sobre el diagrama; calcular pronósticos; errores residuales; coeficiente de determinación. 1.21 Análisis de regresión: Utilidad a través del tiempo en una compañía distribuidora de computadores. La utilidad de una compañía dedicada a distribuir equipos de computador para oficinas presenta las siguientes utilidades en cada uno de los años respectivos: Año 2000 2001 2002 2003 2004 2005 2006 2007 2008 Utilidades (millones $) 6 6,5 7 7,2 7,3 7,6 8 8,1 7,9 a) Graficar el diagrama de dispersión y analizar visualmente cuál es la tendencia que siguen estos datos. b) Elaborar el ajuste lineal y el parabólico, ¿cuál considera más adecuado?, explicar. Para cada uno de los dos tipos de ajuste analizar: función de ajuste y gráfica de la función de ajuste; cálculo de pronósticos; coeficiente de correlación lineal; coeficiente de determinación.
  • 32. 1.22 Análisis de regresión: Ventas versus espacio asignado. Un comerciante desea analizar si las ventas semanales (en miles de $) tienen relación alguna con el espacio asignado para vender (en metros cuadrados). De acuerdo a eventos pasados se recopiló la siguiente información: Ventas semanales Espacio disponible m2 635 7 528 6 456 4,5 654 6,3 498 5 539 5,2 580 7 620 8 472 6 587 6,8 a) Graficar el diagrama de dispersión, analizar visualmente cuál es la tendencia de esta serie de datos. b) Analizar dos tipos de ajuste diferentes y justificar cuál de ellos elige. 1.23 Análisis de regresión: Pasivo pensional a través del tiempo. El pasivo pensional de una entidad estatal viene presentando el siguiente comportamiento: Año 2003 2004 2005 2006 2007 Semestre I II I II I II I II I II Pasivo pensional (millones $) 7 8 10,8 13 14,8 21,1 26,5 30 30,2 31 a) Graficar el diagrama de dispersión. Analizar visualmente la tendencia que siguen los datos. b) Efectuar el ajuste lineal, el parabólico y el exponencial. Analizar cada uno de ellos y justificar cuál de éstos considera más adecuado. Para cada uno de los ajustes se pide: calcular la función de ajuste y graficarla sobre el diagrama de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación y en el caso del ajuste lineal, el coeficiente de correlación lineal.
  • 33. 1.24 Análisis de regresión: Presupuesto ejecutado de egresos a través del tiempo. El presupuesto ejecutado de egresos de una caja de compensación familiar viene mostrando el siguiente comportamiento en los últimos años: Año 2001 2002 2003 2004 2005 2006 2007 2008 Presupuesto ejecutado de egresos (millones $) 114 144 177,2 191 311,5 314,1 426 555 a) Graficar el diagrama de dispersión, analizar visualmente la tendencia de los datos originales. b) Efectuar ajuste lineal, parabólico y exponencial. Analizar y justificar cuál de ellos considera de mayor pertinencia. Para cada uno de los ajustes se pide: calcular la función de ajuste y graficarla sobre el diagrama de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación y en el caso del ajuste lineal, el coeficiente de correlación lineal. 1.25 Análisis de regresión: Crecimiento de la población a través del tiempo. La población (en millones de habitantes) de una zona determinada del país viene presentando el siguiente comportamiento a través del tiempo: Año 2001 2002 2003 2004 2005 2006 2007 2008 Población (millones de habitantes) 1,7 5,95 20,83 72,89 255,11 892,87 3.125,05 10.937,68 a) Graficar el diagrama de dispersión y visualizar cuál es la tendencia que sigue la población a través del tiempo. b) Efectuar diferentes tipos de ajuste y analizar cuál de ellos es el más adecuado. Para cada uno de los ajustes aplicados, calcular: función de ajuste y graficarla sobre el diagrama de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación. 1.26 Análisis de regresión: Utilidad semestral. Los siguientes datos se refieren al comportamiento de la utilidad semestral (millones de pesos) de una empresa dedicada a la fabricación de artículos de cuero: Año 2005 2006 2007 2008 2009 Semestre I II I II I II I II I II Pasivo pensional (millones $) 2,07 2,14 2,23 2,34 2,57 2,63 2,85 3,01 3,67 4,1
  • 34. a) Graficar el diagrama de dispersión y visualizar cuál es la tendencia que siguen las utilidades a través del tiempo. b) Efectuar ajuste lineal, parabólico y exponencial. Analizar y justificar cuál de ellos considera de mayor pertinencia. Para cada uno de los ajustes se pide: calcular la función de ajuste y graficarla sobre el diagrama de dispersión; calcular pronósticos; errores residuales; coeficiente de determinación y en el caso del ajuste lineal, el coeficiente de correlación lineal. ENLACE A VIDEOS 1. Correlación de variables https://www.youtube.com/watch?v=CU3SuzkWP0s&list=PLFkbGwyzAy6wT7OSCCUf4e5G9MpL6 KkeI&index=37&t=161s 2. Ejercicio de coeficiente de correlacion https://www.youtube.com/watch?v=TQyYCBLIw0U&list=PLFkbGwyzAy6wT7OSCCU f4e5G9MpL6KkeI&index=38&t=746s Bibliografía Gabriel, J. (2017). Diseños experimentales teoria y practica para experimentos agropecuarios. Guayaquil, Ecuador: Compas. Marro, E. D.‐A.–F. (s.f.). Prueba de Hipótesis para la diferencia de medias. Prueba de Hipótesis para la diferencia de medias. McGRAW-HILL/INTERAMERICANA EDITORES, S.A. de C.V. (2009). Estadisticas cuarta edicion. Mexico: The McGraw-Hill Companies, Inc. Superprof material didactico. (26 de Agosto de 2015). Tabla de distribución normal. Obtenido de Tabla de distribución normal: https://www.superprof.es/apuntes/escolar/matematicas/probabilidades/distribucion- normal/tabla-de-la-distribucion-normal.html Zuluaga, M. N. (s.f.). ESTADÍSTICA PARA EDUCACIÓN SUPERIOR. Medellin: Esumer.