Este documento presenta los conceptos de diagrama de dispersión, coeficiente de correlación de Pearson, modelo de regresión lineal simple, coeficiente de determinación y cómo aplicarlos para analizar la relación entre dos variables. Explica cómo construir un diagrama de dispersión, calcular el coeficiente de correlación, los parámetros de la ecuación de regresión y el error estándar. Luego, muestra un ejemplo práctico donde se analiza la relación entre el tiempo de residencia y la actitud hacia una ciudad.
2. Técnicas e
Instrumentos para
la Investigación
Técnicas e
Instrumentos para
la Investigación
SESIÓN 07:
Diagrama de dispersión y
Coeficiente de correlación lineal de Pearson.
Modelo de regresión lineal simple.
Coeficiente de determinación.
3. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
RESULTADO DE
APRENDIZAJE
CONTENIDOS/TEMÁTICA EVIDENCIAS DE APRENDIZAJE
Aplica y describe en los
informes parciales los
fundamentos de investigación,
operacionalización de
variables, técnicas e
instrumentos de recolección
de datos, Población, muestra
y muestreo, procesamiento de
datos, tablas, figuras y
medidas estadísticas y
presenta el segundo avance
del informe estadístico.
Diagrama de dispersión y
Coeficiente de correlación lineal de
Pearson.
Modelo de regresión lineal simple.
Coeficiente de determinación).
Avance parcial del informe
estadístico (INV): Recopilación de
datos estadísticos para la
elaboración del diagrama de
dispersión y su coeficiente de
correlación lineal.
4. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
El diagrama de dispersión es una
gráfica de los valores de dos variables
para todos los casos u observaciones
Se acostumbra graficar la variable
dependiente sobre el eje vertical y la
variable independiente sobre el eje
horizontal. Un diagrama de dispersión
sirve para determinar forma de la
relación entre las variables. La
gráfica puede alertar al investigador
sobre patrones en los datos o sobre
problemas potenciales. (Malhotra,
2008 pp.543-548)
Diagrama de dispersión:
https://www.youtube.com/watch?v=S1DPtadoXSA
5. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Ejemplo diagrama de dispersión
Gráfica de Y (actitud hacia la ciudad) contra X
(tiempo de residencia). Los puntos están
ordenados en una banda que va de la parte
inferior izquierda hacia la parte superior derecha.
El patrón se distingue con facilidad: mientras
una variable aumenta, la otra también lo hace.
Este diagrama de dispersión parece indicar que
la relación entre X e Y es lineal, y que bien
podría describirse con una línea recta.
6. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Coeficiente de correlación lineal de Pearson
Cuando los datos se distribuyen con una distribución normal.
El coeficiente de correlación se expresa como:
𝑹=
𝑺𝑪𝒙𝒚
√𝑺𝑪𝒙 𝑺𝑪𝒚
𝑆𝐶𝑥=∑𝑋𝑖
2
−¿¿ 𝑆𝐶𝑦=∑𝑌𝑖
2
−¿¿
𝑆𝐶𝑥𝑦=∑ 𝑋𝑖 𝑌𝑖 −
(∑ 𝑋𝑖)(∑𝑌𝑖)
𝑛
7. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Los datos se muestran como un conjunto de puntos, cada uno con el valor
de una variable que determina la posición en el eje horizontal (x) y el valor
de la otra variable determinado por la posición en el eje vertical (y)
Correlación positiva fuerte: A un
crecimiento de X (causa) corresponde un
crecimiento de Y(efecto). Controlando la
evolución de los valores de X, quedan
controlados los valores de Y.
Correlación positiva débil: A un
crecimiento de X se observa una tendencia
a crecer de Y, pero se presume que existen
muchas otras causas de dependencia.
Correlación negativa fuerte: A un
crecimiento de X se observa una
tendencia a disminuir de Y.
Correlación negativa moderada: A
un crecimiento de X se observa una
tendencia a disminuir de Y, pero se
presume que existen otras causas de
dependencia.
Correlación nula: no existe relación lineal
ninguna, las variables X e Y no se
relacionan.
Correlación negativa débil: A un
crecimiento de X se observa una
tendencia a disminuir de Y, pero se
presume que existen muchas otras
causas de dependencia.
Grado de correlación
9. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Mediante la técnica de los mínimos
cuadrados se determina la mejor línea al
disminuir lo más posible el cuadrado de las
distancias verticales de todos los puntos a
partir de la línea.
A la línea con mejor ajuste se le denomina
línea de regresión. Cualquier punto que no
caiga en la línea regresión no estará
completamente explicado.
Se llama error a la distancia vertical de cada
punto a la recta las que se elevan al
cuadrado cuya suma de los errores
cuadrados, es la medida del error total.
e
10. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
En el modelo de regresión bivariada, la forma general de
una línea recta es:
Modelo de regresión lineal simple
Y = β0 + β1 X + e
Donde:
Y = variable dependiente o de criterio X = variable independiente o predictiva
β0 = intersección de la línea β1 = pendiente de la línea
e = Error de estimación
11. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Estimación de parámetros
En mayoría de los casos b0 y b1 no se conocen y se estiman a partir de
las observaciones de las muestras, por medio de la ecuación:
Donde:
estimador de Yi
a estimador b0
b estimador de b1
a : constante o término independiente
b : pendiente de la línea de regresión que indica el cambio esperado en
Y cuando X se modifica en una unidad.
^
𝑌 𝑖=𝑎+𝑏 𝑋𝑖
12. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Método de los mínimos cuadrados
𝑺 𝑪𝒙𝒚 =∑ 𝑿𝒊𝒀 𝒊 −
(∑ 𝑿𝒊)(∑𝒀𝒊)
𝒏 𝑺𝑪𝒙=∑𝑿𝒊
𝟐
−¿¿
Consiste en hallar los valores de a y b , haciendo mínima la
suma de los cuadrados de los errores para estimar la recta de
regresión lineal simple utilizando las fórmulas:
Suma Cruzada de X, Y Suma de Cuadrados de X
13. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Con las formulas anteriores, obtenemos la pendiente b, haciendo la siguiente
división:
Luego, la intersección, , se puede calcular por medio de:
donde:
Así obtenemos ecuación estimada de regresión:
𝑿
¿
=
∑ 𝑿𝒊
𝒏
𝒀
¿
=
∑ 𝒀𝒊
𝒏
𝒃=
𝑺 𝑪𝒙𝒚
𝑺 𝑪𝒙
𝒂=𝒀
¿
−𝒃 𝑿
¿
Variable dependiente o
de criterio
Variable independiente o
predictiva
Intersección de la
línea
Pendiente de la línea
^
𝒀 𝒊=𝒂+𝒃 𝑿𝒊
14. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Error Estándar
Cuando se realiza una predicción, es importante determinar el error estándar, el cual
se representa por Sy.x y mide la dispersión de los datos observados con respecto a
la línea de regresión.
𝑺𝒚 .𝒙=
√∑𝒚
𝟐
−𝜷𝟎∑𝒚−𝜷𝟏 ∑𝒙𝒚
𝒏−𝟐
15. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Coeficiente de determinación
La fuerza de la asociación se mide con el coeficiente de determinación, R2
, el
cual varía entre 0 y 1, e indica la proporción de la variación total en Y que se
explica por la variación en X.
El coeficiente de determinación o bondad de ajuste mide cuanta varianza explica
un modelo cualquiera; en el caso de tener un modelo lineal; el coeficiente de
determinación coincide con el cuadrado del coeficiente de Pearson.
100 (%)
16. Técnicas e
Instrumentos para
la Investigación
Regresión lineal
https://phet.colorado.edu/sims/html/least-squares-regression/latest/least-squares-regression_es.html
17. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Caso de aplicación:
Un investigador desea explicar las actitudes hacia la ciudad de residencia de
los participantes, en términos del tiempo que han vivido en dicha ciudad. La
actitud se mide en una escala de 11 puntos (1 = no le gusta la ciudad, 11 =
le gusta mucho la ciudad), en tanto que el tiempo de residencia en la ciudad
se mide en años. De una muestra de 12 participantes se obtuvieron los datos
la tabla siguiente. Por razones ilustrativas, sólo tomamos en cuenta un
pequeño número de observaciones. En la práctica real, la correlación y la
regresión se deben realizar con una muestra mucho más grande.
18. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Explicación de la actitud hacia la ciudad de residencia
Número de
participante
Tiempo de
residencia (X)
Actitud hacia la
ciudad (Y)
1 10 6
2 12 9
3 12 8
4 4 3
5 12 10
6 6 4
7 8 5
8 2 2
9 18 11
10 9 9
11 17 10
12 2 2
19. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Gráfico de dispersión:
18; 11
17; 10
10; 6
8; 5
6; 4
4; 3
2; 2
12; 10
12; 9
9; 9
12; 8
20. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Explicación de la actitud hacia la ciudad de residencia
Número de
participante
Tiempo de
residencia
(X)
Actitud hacia
la ciudad (Y)
X.Y X2
Y2
1 10 6 60 100 36
2 12 9 108 144 81
3 12 8 96 144 64
4 4 3 12 16 9
5 12 10 120 144 100
6 6 4 24 36 16
7 8 5 40 64 25
8 2 2 4 4 4
9 18 11 198 324 121
10 9 9 81 81 81
11 17 10 170 289 100
12 2 2 4 4 4
Totales 112 79 917 1350 641
21. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
𝑅=
𝑆𝐶𝑥𝑦
√𝑆𝐶𝑥 𝑆𝐶𝑦
𝑅=
179.67
√304.67×120.92
=0.9361
-
Calculando el coeficiente de correlación lineal de Pearson
-
-
22. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
-
-
𝒃=
𝑆𝐶𝑥𝑦
𝑆𝐶𝑥
=𝟎.𝟓𝟖𝟗𝟕 𝑋=
∑ 𝑋𝑖
𝑛
=9.33 𝑌 =
∑𝑌 𝑖
𝑛
=6.58
𝒂=𝑌 − 𝛽1 𝑋 =6.58 −0.5877 ×9.33=𝟏.𝟎𝟕𝟗𝟑
^
𝑌 𝑖=1.0793 +0.5897 𝑋𝑖
Calculando los coeficientes la suma de cuadrados y los coeficientes a y b
Ecuación de regresión estimada
^
𝒀 𝒊=𝒂+𝒃 𝑿𝒊
23. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
𝑆𝑦 . 𝑥=
√641−1.0793(79)−0.5897(917)
12−2
=𝟏.𝟐𝟐𝟑
Calculando el error estándar
𝑺𝒚 .𝒙=
√∑𝒚𝟐
−𝒂∑𝒚 −𝒃∑𝒙𝒚
𝒏−𝟐
Desviación
estándar
∑𝑦2
=641
𝒂=𝟏.𝟎𝟕𝟗𝟑
∑𝑦=79
𝒃=𝟎.𝟓𝟖𝟗𝟕
∑𝑥𝑦=917
𝒏=𝟏𝟐
24. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Calculando el coeficiente de determinación
100 (%) 100 (%)
100 (%) %
Interpretación: El 87.92 % de variación de la variable dependiente
es explicada por el modelo de regresión lineal por lo que a la
diferencia con el 100% (100% - 87.92% = 12.08%) se le denomina
variación residual
25. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Calculando en Excel por el gráfico de dispersión
Ir a insertar, elegir
gráfico de
dispersión
26. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Seleccionar los
rangos de la
variable (x) , (y)
27. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Elegir en diseño
rápido la opción
“diseño 9”
28. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
0 2 4 6 8 10 12 14 16 18 20
0
2
4
6
8
10
12
f(x) = 0.589715536105033 x + 1.07932166301969
R² = 0.876241692517196
Axis
Title
Obtenemos el
modelo de
regresión lineal y
el coeficiente de
determinación
29. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Calculando en Excel por análisis de datos
En el menú
escogemos
regresión
Elegimos la opción
análisis de datos
30. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Elegimos los
rangos Y , X
podemos colocar
rótulos para titular
nuestros
resultados.
Elegimos el rango
de salida donde
saldrán los
resultados y
aceptamos.
31. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.93607782
Coeficiente de determinación R^2 0.87624169
R^2 ajustado 0.86386586
Error típico 1.22329236
Observaciones 12
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 105.952225 105.952225 70.8026564 7.5452E-06
Residuos 10 14.964442 1.4964442
Total 11 120.916667
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
Intercepción 1.07932166 0.74335121 1.45196731 0.17715225 -0.57696806 2.73561138 -0.57696806 2.73561138
Tiempo de residencia (X) 0.58971554 0.07008382 8.41443144 7.5452E-06 0.43355904 0.74587203 0.43355904 0.74587203
Comparando resultados Coeficiente de
correlación de
Pearson
Coeficiente de
determinación
Error estándar
Total de la muestra
𝒂
𝒃
32. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Regresión en SPSS versión 26
Trasladamos los
datos del Excel
(control c; control v)
Editamos y
rotulamos en vista
de variables
Editamos nombre y
etiqueta, decimales
33. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Elegimos
regresión/lineales
Elegimos variable
dependiente e
independiente
34. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Escogemos
estimaciones y
ajuste del modelo/
continuar
35. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Elegimos la variable
dependiente
(DEPENDENT) y
ajuste de la variable
predictora
(*ADJPRED)
36. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Comparando resultados
Coeficiente de
correlación de
Pearson
Coeficiente de
determinación
Error estándar
𝒂
𝒃
37. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
0 2 4 6 8 10 12 14
0
2
4
6
8
10
12
Gráfico de dispersión
Regresión Valor pronosticado ajustado (Pulsar)
Actitud
hacia
la
ciudad
También nos
muestra el grafico
de dispersión
38. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Análisis de correlación de Person
Elegimos
correlacionar /
bivariadas
40. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
Correlación de
Pearson para
variables
paramétricas
Correlación
significativa,
(P<0.05) evidencia
estadística para
rechazar H0
41. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
REFERENCIAS
Malhotra, Narest, (2008) Investigación de mercados. Quinta edición. Editorial Pearson
Educatíón, México ISBN: 978-970-26-1185-1 Área: Administración y economía
Moore David. (1997) Estadística aplicada básica. Segunda edición. Antoni Bosch Editor
Lind, A., Marchal, G. y Wathen, A. (2012) . Estadística aplicada a los negocios y la
economía. (15. Ed). México: McGraw-Hill Interamericana Editores
Pagano, R. (2011). Estadística para ciencias del comportamiento. (9. Ed). México: Cengage
Learning Editores Corporativo Santa Fe
42. Técnicas e
Instrumentos para
la Investigación
Programa de Investigación
Formativa
No saber es una excusa que tiene una
solución muy simple: Aprender
GRACIAS POR SU ATENCIÓN
Luis Medina