Este documento presenta el análisis de la correlación entre la frecuencia cardiaca y la edad en una muestra de 8 personas. Se calcula el coeficiente de correlación de Pearson y se realiza un contraste de hipótesis para determinar si existe correlación en la población. Los resultados muestran una correlación positiva muy baja en la muestra (r=0.043) que no es estadísticamente significativa (p=0.919), por lo que no se puede afirmar que exista correlación en la población con un nivel de significación del 0.01.
2. ENUNCIADO
• En una muestra de 8 personas medimos la frecuencia cardiaca
(FC) y la edad.
1. Di si en la muestra, existe asociación lineal o correlación entre las
dos variables y por qué. Y si existe, ¿Cómo es la correlación?
2. Averigua, usando SPSS y también sin usar SPSS, si existe
correlación entre FC y edad en la población de donde proviene la
muestra, para un nivel significación de 0.01, razonando paso a
paso la decisión tomada.
3. 1. Di si en la muestra, existe asociación lineal o correlación entre
las dos variables y por qué. Y si existe, ¿Cómo es la correlación?
1º) Debemos conocer ¿qué es una correlación?
Correlación: relación o dependencia que existe entre dos variables o cambio
sistemático en las puntuaciones de dos variables de intervalo/razón.
Dos variables se relacionan cuando las mediciones de una variable cambian
simultáneamente con las medidas de la otra (= si sus mediciones cambian
simultánea y proporcionalmente).
2º) Adelantamos unas conclusiones, observando nuestros datos de las variables y
representando gráficamente las dos variables. Para ello realizamos los pasos
siguientes:
4. • 1º) Ordenamos los datos obtenidos en nuestra tabla.
• 2º) Para reafirmar nuestra teoría, emplearemos el
programa SPSS.
FC 61 100 96 95 65 72 90 82
EDAD 24 35 47 52 58 69 72 80
Según la definición anterior, podemos afirmar que al ordenar nuestros datos,
podemos observar como a simple vista no parece que exista correlación entre
las dos variables, puesto que se observa una tendencia general de que a
medida que los valores de variable “edad” aumentan los valores de la variable
“FC” no lo hacen.
5. • Abrimos el programa.
• Entramos en vista de variables y diseñamos
nuestras dos variables “FC” y “Edad”
(ambas cuantitativas).
7. Una vez colocados nuestros datos procedemos
a elaborar un gráfico el cual nos permitirá
comprobar si existe una tendencia lineal en la
relación. Para ello:
Cliqueamos sobre “Gráficos”, después en
“Cuadro de dialogo antiguos” y
“Dispersión/puntos”.
Por último, cliqueamos en “Dispersión simple”
y “Definir”
8. Tras cliquear en “Definir”
aparece un nuevo cuadro
donde designamos las variables
en los Eje X e Y.
Posteriormente cliqueamos en
“Aceptar”.
9. El diagrama de dispersión confirma que no siguen un patrón gráfico lineal, los puntos
están dispersos, no se agruparían alrededor de una recta imaginaria ascendente.
Aunque se observa que no existe una tendencia lineal en la relación, hay que recurrir
a procedimientos analíticos que permitan verificar con exactitud la Hipótesis de
linealidad.
10. Coeficiente de Correlación
• Es el estadístico que cuantifica la correlación,
la relación, entre dos variables. Hay dos tipos:
Coeficientes r de Pearson Coeficiente rho de Spearman
11. • Como nuestro enunciado no nos informa si nuestras
variables cuantitativas siguen una distribución normal
debemos de comprobarlo. Para ello podemos emplear:
Test de Kolmogorov-
Smirnov
Si el tamaño muestral es superior a 50
Test de Shapiro-Wilks
Si el tamaño muestral es inferior a 50
Como nuestra muestra tiene un tamaño muestral de 8, es decir, menor que 50 (8< 50)
utilizamos el Test de Shapiro- Wilks . (Este lo calculamos por el programa SPSS)
Planteamos las hipótesis, la cual una de ellas se aceptará según el resultado de la prueba
estadística Shapiro- Wilks:
Ho= las variables en la población tienen distribución Normal
H1=Las variables en la población son distintas a la distribución Normal.
12. Situados en vista de datos, con los
datos anteriormente añadidos en
nuestras variables, cliqueamos en
“Analizar”, después en “Estadísticos
descriptivos” y por último en
“Explorar”.
13. A continuación, nos aparece un cuadro en el cual añadimos
nuestra variables a la lista de dependientes y cliqueamos sobre
“Gráficos”, seleccionando la opción “Gráficos con pruebas de
normalidad” y cliqueamos sobre continuar.
Por último le damos a “Aceptar”.
14. Tras el procedimiento nos aparece un cuadro. Donde
comprobamos:
El p-valor asociado a la prueba de Shapiro- Wilk es 0,342
(este lo obtenemos de la Sig. del cuadro) , con lo cual, este
es mayor que el nivel de significación que nos dio el
enunciado (α=0.01).
Con ello podemos afirmar que aceptamos la Ho y
rechazamos la H1 ya que (0,342>0,01), con lo cual las
variables tienen una distribución normal.
15. Coeficiente de Correlación de Pearson
• Aplicamos la prueba paramétrica, Correlación de
Pearson puesto que nuestras variables son
cuantitativas y siguen una distribución normal.
Con ello vamos a comprobar si existe correlación
de ambas variables o no en la población.
• Para ello hay que utilizar la siguiente formula:
• r= Coeficiente de correlación de
Pearson
• X= variable independiente de intervalo/
razón
• Y= variable dependiente de intervalo/
razón
• X`= Media de la variable independiente,
x
• Y`= Media de la variable dependiente Y
16. Propiedades de la Correlación de
Pearson
• Debemos de tener en cuenta que:
– Mide el grado de asociación lineal
– Es adimensional.
– Solo toma valores comprendidos entre -1 y +1
Relación Positiva Relación Negativa
Correlación Directa Correlación Inversa
• Grados de correlación:
Correlación fuerte: cuanto más se
aproximan los puntos a la recta.
o Positiva
o Negativa
Correlación débil: cuando los puntos
se separan de la recta
Correlación nula: No hay asociación
17. Cálculo del Coeficiente de Correlación
de Pearson:
• Elaboramos una tabla donde organizamos nuestros datos de la siguiente forma:
– Variable “EDAD” X
– Variable “FC”= = Y
18. Calcular el Coeficiente de Correlación
de Pearson
• Una vez diseñada la tabla procedemos a
aplicar la fórmula:
19. • Como hemos comprobado r ≠ 0 (r=0,043) en la
muestra, por tanto, como r tiene un valor positivo y
esta comprendido entre 0 y 0,2 (0</ρ/≤0,2), podemos
afirmar que es una correlación positiva muy baja.
• Sin embargo, ahora vamos a comprobar si ambas
variables están también relacionadas en la población
de donde proviene la muestra o solo se debe al azar, es
decir, comprobamos si es significativo el coeficiente de
correlación obtenido.
20. Para ello realizamos un contraste de hipótesis
con el fin de aceptar una:
H0: ρ= 0 (En la población no hay correlación entre
variables)
H1:ρ≠ 0 (En la población hay correlación entre
variables)
21. Para realizar el contraste de hipótesis, nos
disponemos a calcular el estadístico t que sigue
una distribución t de Student con n-2 grados de
libertad:
.
22. Ahora obtenemos el valor del punto
crítico en la tabla t de Student y lo
comparamos con tn-2=0,105.
• Para 6 grados de libertad y un nivel
de significación α=0,01 (utilizando
la tabla de T- Student) el valor del
punto crítico es:
– t0,01;6= 3,143
23. Conclusión
• tn-2 =0,105
• tn-2,α=3,143
Como tn-2 < tn-2,α aceptamos la Ho con la
máxima confianza de no equivocarnos del 0,01
(99%).
Por tanto no existe correlación entre las
variables “edad” y “FC” en la población, lo cual
nos lleva a afirmar que la muestra no es
representativa.
24. EN SPSS
En vista de datos cliqueamos sobre
“Analizar” luego en “Correlaciones”
y por último en “Bivariadas”
25. Posteriormente, se abre una ventana,
en la cual añadimos nuestras variables
en la caja “Variables” y seleccionamos
“Pearson”, “Bilateral” y “Marcar las
correlaciones significativas”.
Por último cliqueamos sobre
“Opciones, una vez allí pulsamos sobre
“Medidas y desviaciones estándar”
Tras todo el procedimiento cliqueamos
sobre “Continuar” y “Aceptar”
26. Nos aparece una tabla con las correlaciones de
Pearson de cada una de las variables, donde
podemos ver como:
• El coeficiente de correlación lineal de cada
variable con ella misma es 1, es decir, perfecta.
• El coeficiente de correlación lineal de una variable
con la otra es de 0,043.
o Este valor es positivo, lo cual nos indica que
la variable FC aumenta a la vez que lo hace
Edad.
o Este valor al ser muy bajo, la correlación es
muy baja.
El valor de la p asociado al contraste de hipótesis nos indica la
probabilidad de que en la población las variables estudiadas no
estén correlacionadas linealmente.
Nuestro valor de p (Sig.) es 0,919 y es mayor que α= 0,01 que nos
lleva a aceptar la hipótesis nula con una alta confianza (99%), por
tanto no existe correlación entre “FC” y “edad” en la población.