Seminario 10

SEMINARIO 10
Salud Benítez García Grupo 1

Problema 1
 En un municipio español se ha realizado una pequeña encuesta que ha preguntado
por el nº de personas que habitan en un hogar y el nº de habitaciones del mismo.
Si ambas variables se distribuyen normalmente:
1. Averiguar si existe correlación entre ambas variables en la población de donde
derivan los datos. Calcular el coef. De correlación de Pearson.
2. Averiguar si el coeficiente de correlación es significativo. Realizar las hipótesis.
3. Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de
Pearson y evaluar los resultados.

 Tenemos que comprobar si existe normalidad o no en la
muestra
- Utilizamos R Pearson si se distribuye normalmente
- Utilizamos Rho de Spearman si no se distribuye normalmente
 Para realizar las pruebas de normalidad utilizamos SPSS
o Utilizamos el test Kolmogorov- Smirnov: Si el tamaño
muestral es superior a 50
o Test de Shapiro-Wilks: Si el tamaño muestral es inferior a
50

Comprobamos si las variables se
distribuyen normalmente en SPSS
1. Metemos los datos
en SPSS

2. Pinchamos en
Analizar  Estadísticos
descriptivos 
Explorar

3. Seleccionamos las
variables y pinchamos
en “Gráficos”

Si el resultado de la sig. es mayor que 0,05
 se acepta la Ho, o lo que es lo mismo, se
acepta que el conjunto de datos sigue una
distribución normal
Si el resultado de la sig. es menor que 0,05
 se rechaza la Ho, o lo que es lo mismo, se
rechaza que el conjunto de datos siga una
Como vemos, la sig. es
mayor de 0,05  por lo
tanto aceptamos la Ho, la
muestra sigue una
Como la muestra es menor de 50, nos fijamos en
Shapiro-Wilks

Coeficiente de correlación de Pearson
 Mide la asociación entre dos variables cuantitativas
 Requiere que las variables tengan una distribución normal, por lo tanto antes
de calcularlo tenemos que comprobar si la muestra sigue una distribución
normal  como hemos hecho anteriormente.
 Mide el grado de
asociación
 Es adimensional
 Solo toma valores entre -1
y 1  a partir de 0,8 es
una correlación fuerte

Hacemos la fórmula
 r = coeficiente de correlacion de pearson
 Σxy= sumatorio de los productos de ambas
variables
 Σx: sumatoria de los valores de la variable
independiente
 Σy: sumatoria de los valores de la variable
dependiente
 Σx2: sumatoria de los valores al cuadrado de la
variable independiente
 Σy2= sumatoria de los valores al cuadrado de la
variable dependiente
 N: tamaño de la muestra en función de parejas
x y X2 Y2 xy
3 2 9 4 6
5 3 25 9 15
4 4 16 16 16
6 4 36 16 24
5 3 25 9 15
4 3 16 9 12
Σx=27 Σy=19 Σx2 =127 Σy2=63 Σxy=88
Nº personas X
Nº habitaciones Y N= 6

r=
6𝑥88 −(27𝑥19)
6𝑥127 − 729 [ 6𝑥63 − 361 ]
=0,633
Si el resultado nos da:
• O La correlación en esa
población será 0
• ≠ 0 Si existe correlación, y
hay que estudiarla mediante la
T de Student para ver si la
relación es al azar o no
Como el resultado de la correlación es 0,633≠ 0 hay que estudiarlo. Y
para eso hay que hacer la T de Student.
 Con N-2 grados de libertad, siendo N: numero de muestra
 Pearson puede ser 0 o ≠ 0 (hay una cierta relación entre variables)
 T de Student te dice si la relación se a producido al azar o no.

 N-2 grados de libertad, siendo N: numero de muestra gl=4
𝑇 𝑛 − 2 =
𝑟𝑥𝑦
(𝑛 − 2)
1 − 𝑟𝑥𝑦2
𝑇𝑛 − 2 = 0,633
4
1 − 0,633 2
= 1,635
Ahora vamos a comparar el valor obtenido
en T de Student con las tablas
Una vez que hemos hecho el
coeficiente de correlación de Pearson
y nos ha salido ≠ 0, vamos a ver si el
resultado es significativo mediante la
T de Student

Buscamos en la tabla de distribución de T de Student, para ello
vamos a suponer que tenemos un nivel de confianza del 95%,
fijándonos también que el grado de libertad es 4.
• Si T calculada > T tablas,
rechazamos hipótesis nula  por
tanto las variables están relacionadas.
• Si T calculada < T tablas, aceptamos
la hipótesis nula
por tanto no existe relación
significativa entre las variables
• Hipótesis nula (H0): No hay diferencia entre nº de
personas que habitan en un hogar y el nº de habitaciones
del mismo o que la diferencia encontrada se debe al azar
• Hipótesis alternativa (H1): Hay diferencia
estadísticamente significativa entre el nº de personas que
habitan en un hogar y el nº de habitaciones del mismo.
• La T tabla es 2,132 >1,635
que es la T calculada, por
tanto aceptamos la H0 .
Respuesta: No existe
diferencia significativa entre
el nº de personas que habitan
en un hogar y el nº de
habitaciones del mismo, y si
existe diferencia se debe al
azar.

2. Realizamos un gráfico de dispersión simple

3. Señalamos las dos variables

Y este es el gráfico de dispersión simple

4. Ahora hacemos la correlación de Pearson

5. Señalamos las variables y pinchamos en “Pearson”

Podemos observar que 0,177>0,05,
por lo tanto aceptamos la H0,
aceptando entonces que no existe
diferencia significativa entre las
variables, y si existe es debido al azar

Seminario 10

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Seminario 10

Similar a Seminario 10 (20)

Más de Salud Benitez Garcia

Más de Salud Benitez Garcia (16)

Último

Último (20)

Seminario 10