2. 1)Queremos saber si existe
relación entre el peso y la altura
Nuestra hipótesis alternativa ( H1), será: Existe relación entre
el peso y la altura.
Para saber si en variables cuantitativas podemos utilizar la R de
Pearson, o en su defecto la Rho de Spearman, debemos
comprobar si hay una relación lineal y una distribución normal
con respecto a las variables.
Para ello, mediante el diagrama de puntos podemos
comprobar si hay una tendencia lineal:
En SPSS para realizar el diagrama de puntos, seleccionaremos
las siguientes pestañas:
GRAFICOSCUADRO DE DIALOGO
ANTIGUODISPERSION/PUNTODISPERSION SIMPLE.
3. Como podemos observar en el gráfico,
sigue una distribución lineal, por lo que se
cumple la
primera asunción para la R de Pearson.
4. Explorar la normalidad.
• El segundo paso es explorar la normalidad: lo que se podría hacer
de modo grafico o mediante pruebas( Kolmogorov-smirnof y
Shapiro-Wilk).
• Debemos explorar la normalidad de las dos variables que estamos
analizando: Peso y Talla.
• Para ello en SPSS, seleccionamos: ANALIZAR ESTADISTICOS
DESCRIPTIVOS EXPLORAR e incluiremos las variables peso y talla
dentro de la lista de dependientes.
• Por otro lado, dentro de la misma pestaña seleccionaremos los
gráficos de histograma y los gráficos con pruebas de normalidad.
• A continuación, nos saldrá, primero la tabla de control y
seguidamente las pruebas de normalidad de Kolmogorov y de
Shapiro.
5. La casilla denominada en este caso significación, es la p, o el error tipo 1. Al ser
menor de 0,05 quiere decir que aceptamos la hipótesis alternativa, es decir,
existe relación entre el peso y la talla, y existen diferencias respecto a la
distribución normal.
Al haber aceptado la hipótesis alternativa, podríamos decir que nuestra
hipótesis es distinta a la hipótesis de normalidad.
(PARA ACEPTAR LA HIPOTESIS NULA, LA P DEBE SER MAYOR A 0,05 Y PARA
ACEPTAR LA ALTERNATIVA DEBE SER MENOR A 0,05).
Según esta prueba estadística no podríamos aplicar la R de Pearson, ya que,
las variables siguen una tendencia lineal pero no una distribución normal. Sin
embargo, también podemos explorar la normalidad de forma grafica, que es
lo que procederemos a ver ahora:
6. Observando el histograma de la variable peso con la curva normal,
identificamos una leve asimetría hacia la izquierda.
7. En este grafico, el gráfico Q-Q, observamos que por
debajo, hay ciertas puntuaciones que se alejan de la
línea, que representaría la normalidad.
8. En el gráfico de cajas, también se representan algunas puntuaciones
alejadas como el individuo 24
9. Con los gráficos, respecto a la talla,
también se observan las diferencias
En los dos últimos gráficos, apreciamos
bastante simetría, por lo que podríamos
decir, que al menos la talla si se asemeja
más, a diferencia con el peso, a la
distribución normal. En el peso, hay un
leve incumplimiento
10. Normalidad
• Sin embargo, en muestras grandes, las muestras tienden a ser
significativas por lo que, las pruebas de normalidad realizadas
no funcionan bien, ya que nuestra muestra es muy grande
( N= 569).
Aunque hemos hecho las pruebas de normalidad, no
deberíamos haberlas hecho, por el tamaño de la población
escogida, ya que con una N por encima de 100, directamente
tienden a la distribución normal.
De esta manera nuestra muestra es lineal y normal.
11. Conclusión
• Por tanto, podemos aplicar la R de Pearson: En el programa
SPSS seleccionaríamos lo siguiente:
• ANALIZAR CORRELACIONES BIVARIADAS.
12.
13. Correlaciones
• La correlación del peso con el peso y de la talla con la talla es
obviamente 1. Cuando se compara una variable consigo
mismo el resultado siempre será 1.
• El peso con la talla, según Pearson es 0,65 Hay una alta
correlación. El error tipo 1 es 0, es decir, se acepta la hipótesis
alternativa, porque es menor a 0,05EXISTE RELACION
ENTRE EL PESO Y LA TALLA.
• En la diapositiva anterior, se representaba también las
correlaciones no paramétricas que aunque no eran necesarias
en este caso, la hemos pedido. La Rho de Spearman el
resultado es muy parecido a Pearson, en cambio la tau b de
kendall es más conservadora.
14. Variables categóricas
• Ahora veremos la segunda parte, que es para variables
categóricas, ya que antes hemos visto para variables
cuantitativas u ordinales. En este caso, utilizaremos la
correlacion puntual biserial, coeficiente phi, contingencia y v
de cramer.
15. Correlación puntual biserial
• Se utiliza cuando queremos relacionar una variable binaria o
categórica y una variable cuantitativa.
• Variable binaria: Sexo
• Variable cuantitativa: Frecuencia de ejercicio físico.
• H1: Existe relación entre el sexo y la frecuencia de ejercicio
físico.
• H0: No existe relación entre el sexo y la frecuencia de
ejercicio físico.
16. Normalidad
• Lo primero que debemos de hacer es explorar la normalidad
de la variable cuantitativa, pero no lo vamos a hacer porque
nuestra muestra es grande y asumimos que es normal, por lo
que directamente nos vamos a explorar la relación.
17. Correlación
• La puntual biserial no es más que un coeficiente de la R de
Pearson.
• ANALIZARCORRELACIONES BIVARIADASPEARSON
El tamaño del efecto es medio
puesto que la r es 0,3, es
decir, la relación entre
el sexo y el ejercicio físico es
0,3. El signo es negativo(
RELACION NEGATIVA) es
decir, a más sexo menos
ejercicio, como habíamos
puesto que el 1 era chico y el
2 era chica, quiere decir que
cuando pasamos de chico a
chica se reduzca la
frecuencia de ejercicio.
18. Coeficiente de Phi
• Se utilizaba para ver la relación entre dos variables categóricas
dicotómicas.: por ejemplo, Sexo y consumo de tabaco.
•
• H1 sería: Existe relación entre sexo y el consumo de tabaco.
• Para ver la relación, utilizamos tablas de contingencia.
• ANALIZAR ESTADISTICOS DESCRIPTIVOSTABLAS
CRUZADAS
• ESTADISTICOS CASILLAS OBSERVADO Y ESPERADO
19. El coeficiente de phi es muy bajo, es menor de 0,1, por lo que el
tamaño del efecto es muy bajo. La p es mayor a 0,05, por lo que
aceptamos la hipótesis nula:
No existe relación entre sexo y consumo de tabaco.
20. No hay apenas diferencia entre las frecuencias observadas y las
esperadas.
21. Coeficiente de contingencia y V
de Cramer
• Variables categóricas pero con más de dos categorías,
nominales
• H1: Existe relación entre el grado APGAR( 3 categorias) y la
frecuencia del consumo de tabaco.
22. La correlación es baja ya que es 0,20 y Es positiva, de manera que cuanto
más funcional es la familia, más personas fuman todos los días. Además si
observamos el recuento observado y esperado, podemos apreciar, que se
afirma con más frecuencia a la que se esperaba que fuma tabaco todos los
días