2. DEFINICIÓN.
- Explicar qué es la estadística bivariada y para qué sirve
La estadística descriptiva bivariada aborda el estudio de los sucesos
en los que intervienen dos variables simultáneamente. Cuando
queremos describir conjuntamente dos variables estadísticas, el
primer paso será representar los datos en una tabla de frecuencias.
3. OBJETIVOS.
Podemos ver dos objetivos:
Por una parte el objetivo general que consiste en utilizar la estadística bivariada para establecer
la asociación entre dos variables de nuestro fichero de datos, dando respuesta a hipótesis de
investigación específicas.
Por otra parte el objetivo específico los cuales analizaremos e interpretaremos a continuación.
4. ¿HAY ASOCIACIÓN ENTRE LAS VARIABLES “altura” Y “peso”?
A Describe y representa los datos gráficamente
-Peso: vector numérico, unidades kg
-Altura: vector numérico, unidades metros
Para representar estas dos variables cuantitativas vamos a utilizar el histograma, el diagrama de
cajas y el q-q.
5. Cliqueamos en gráficos y a
continuación en histogramas.
Elegimos como primera variable
la altura.
6. Representamos ahora en el
diagrama de cajas la altura.
Podemos observar que la mediana
está en el centro de la caja por lo
que diríamos que hay normalidad
a pesar de haber algunos puntos
extremos.
7. Representamos la altura en el grafico de
comparación de cuartiles.
Podemos observar que hay muchos
puntos que se salen de la línea por lo que
está en duda la normalidad.
8. Representamos en el histograma nuestra segunda
variable “peso” donde observamos que las mayores
frecuencias 80-100% se encuentran entre 50-70kg.
Podemos observar que hay una pequeña asimetría hacia
la derecha.
9. Representamos en el diagrama de cajas nuestra variable
“peso”. Observamos que la mediana corresponde con el
centro de la caja pero que existen numerosos puntos
extremos “outliers”
10. Representamos en el grafico de comparación
de cuartiles la variable “peso” donde
observamos que la mayor parte de los datos
coinciden con la línea central aunque salgan
algunos puntos extremos que no coinciden.
Está en duda la normalidad
11. B: Establecer una hipótesis adecuada para el estudio.
H0 (hipótesis nula): no existe asociación entre la altura y el
peso. Esto, es lo mismo que decir que cunado varía la altura no
varía el peso.
H1 (hipótesis alternativa): existe asociación entre la altura y
el peso. Esto, es lo mismo que decir que cuando varía el peso
varía la altura.
12. C: Utiliza la prueba mas adecuada para contrastar tu hipótesis
En este caso nos encontramos ante dos variables cuantitativas por tanto podemos utilizar la correlaccion R de Pearson y
RHO de Spearman.
Las asunciones de la RHO de Pearson son:
- Linealidad
- Normalidad
Para llevar a cabo el análisis de la relación lineal vamos a usar un diagrama de dispersión y para llevar a cabo la cuantía de la
normalidad vamos a utilizar Shapiro Wilk.
13. D:Interpreta los resultado
Primero vamos a realizar un diagrama de dispersión para comprobar la relación lineal. Para ello
cliqueamos en diagrama de dispersión y posteriormente utilizamos las variables “altura” y “peso”
14. Podemos observar que hay una linealidad entre las dos variables donde la mayor parte se acercan a la línea.
15. Ahora vamos a realizar Shapiro Wilk para comprobar la normalidad. Para ello cliqueamos en resúmenes y en test de
normalidad.
16. Como podemos observar en ambos casos el p-value es menor a 0.05 por lo que nos lleva a aceptar la hipótesis
nula, que deja claro no normalidad. Pero es cierto que el Shapiro Wilk no funciona con muestras grandes por lo
que podría haber fallos pero como las graficas tampoco están muy claras que haya normalidad vamos a
realizarla prueba de correlación de Spearman.
17.
18. Observamos que el grado de disociación es de 0,61 por lo que la asociación es elevada.
19. METODOLOGÍA
1. POBLACIÓN DE ESTUDIO. MUESTRA
La muestra serían las 290 personas a las que le hemos realizado el estudio, que son 290 estudiantes de
primero de enfermería de la Universidad de Sevilla, centros propios y adscritos para conocer sus estilos de
vida y activos en salud.
2. VARIABLES A ANALIZAR
Las dos variables que hemos utilizado son peso y altura, que son dos variables cuantitativas porque se pueden
medir numéricamente.
Los datos se han recogido utilizando el fichero de datos “activossalud.Rdata” / “estadística_tics”
20. 3. ANÁLISIS DE DATTOS
- Software estadístico utilizado: para nuestra muestra hemos utilizado el Software estadístico Rcommander, el cual
funciona a través de comandos.
- Análisis estadísticos que se van a realizar: para realizar el análisis hemos utilizado gráficos como son el histograma, el
diagrama de cajas y bigotes y el q-q. además, como pruebas estadísticas hemos utilizado R de Pearson y Rho de
Spearman .