El documento describe cómo calcular el coeficiente de correlación de Pearson entre la edad y el peso de un grupo de niños. Muestra que existe una fuerte correlación positiva (0.91) entre las variables en la muestra. Para determinar si esta correlación existe en la población general, se formulan la hipótesis nula (que no hay correlación) y la hipótesis alternativa (que sí hay correlación). El estadístico de contraste calculado es mayor que el punto crítico, por lo que se rechaza la hipótesis nula y se acepta que existe una correlación
Seminario 10 por Virginia Valiente Rosa Subgrupo 4
1. Seminario 10: Correlación De Pearson
De una muestra de niños conocemos su edad medida en días y su peso en kg., según
los resultados de la tabla. Si ambas variables se distribuyen normalmente:
1. Averiguar si existe correlación entre ambas variables en la población de donde
proviene la muestra.
-Sabemos que el coeficiente de correlación lineal de Pearson, mide la asociación entre dos variables
cuantitativas pero para ello las variables tienen que tener una distribución normal. Por tanto, antes de
calcularlo habrá que comprobar que se cumplan las condiciones de normalidad de las dos variables.
o IDENTIFICAR LAS VARIABLES:
Las variables que nos dan son edad y peso, ambas variables cuantitativas distribuidas normalmente y medidas
una sola vez, así que habremos de calcular el coeficiente de Pearson y averiguar si es estadísticamente
significativo.
o CALCULAMOS EL COEFICIENTE DE CORRELACIÓN DE PEARSON (rxy), sustituyendo en la
siguiente fórmula:
𝐫𝐱𝐲 =
[𝐍 ∑ 𝐗𝐘 − ∑ 𝐗 ∑ 𝐘]
√[(𝐍 ∑ 𝐗 𝟐 − ( ∑ 𝐱) 𝟐)(𝐍 ∑ 𝐘 𝟐 − (∑ 𝐘) 𝟐)]
N (nº de elementos o datos)=21
r = 0,910, como es diferente de 0 y se acerca a 1, hay correlación entre ambas variables y como
además está por encima de 0’8 y por debajo de 1, es una correlación positiva (cuando los valores de
una variable aumentan también lo hacen lo de la otra) y muy alta; pero no debemos olvidar que esto
ocurre solo en la muestra, ahora nos preguntamos si esto también ocurre en la población, para lo
que tenemos que hacer un contraste de hipótesis.
o CONTRASTE DE HIPÓTESIS: es un contraste de hipótesis bilateral, formulamos la hipótesis
nula y la alterna.
-Hipótesis Nula, H0; r=0, quiere decir que el coeficiente de correlación obtenido procede de una
población cuya correlación es cero, es decir en la población NO hay correlación entre las variables.
ΣX ΣY ΣX2
ΣY2 ΣXY
1890 122.815 245700 772.14 12892.35
2. -Hipótesis Alterna, H1; rǂ0, quiere decir que el coeficiente de correlación obtenido procede de una
población cuyo coeficiente de correlación es diferente a 0, es decir, en la población SI hay correlación
entre las variables.
Ahora pasamos a hacer el CONTRASTE DE HIPÓTESIS para lo que usaremos la prueba de T-
Student, y calcularemos el estadístico de contraste que sigue una distribución t con n-2 grados de
libertad. Lo calculamos mediante la siguiente fórmula sustituyendo los valores:
rxy= 0.91
n-2= 21-2=19
tn-2=rxy√[(𝒏 – 2)/1 – rxy
2
]; tn-2= 0’91 (19/0’1719; tn-2= 9’5670
Proseguimos calculando el punto crítico, para ello usamos la tabla de T-student, en este caso
utilizaremos la de 1 cola y el valor que nos da se compara con el del punto crítico la t de Student con
19 (n-2) grados de libertad y un nivel de significación (α= 0’025)
El punto crítico es 2.0930
Así que como el valor de tn-2 que nos da es mayor que el punto crítico
(tn-2 (9,5670987)>tn-2; α (2,093)), aceptaremos la hipótesis alterna (H1) y rechazaremos la hipótesis
nula (H0), lo que quiere decir que, SI existe correlación entre las variables, significa que a mayor
edad, mayor peso hay en la población.