El documento analiza diferentes tipos de análisis bivariados entre variables cualitativas y cuantitativas utilizando datos de salud. Incluye un análisis entre dos variables cualitativas "practicar deporte" y "sexo" utilizando una tabla de doble entrada. También incluye un análisis entre una variable cualitativa politómica "botellón" y una variable cuantitativa "altura" estudiando la normalidad y homocedasticidad. Por último, analiza dos variables cuantitativas "mantenimiento hogar" y "medicaliz
2. ELEGIMOS LAS
VARIABLES
Para empezar, cargamos el
conjunto de datos activos
en salud, y para seleccionar
las variables entramos en el
conjunto de datos activo.
Así, he elegido las variables
“practicar deporte” y “sexo”.
3. Queremos hacer una
tabla de doble entrada
con las variables
cualitativas
seleccionadas.
4. CONCLUSIÓN
Como es una tabla de
2x2 calculamos el grado
de libertad (filas-
1)x(columnas-1). En este
caso, el grado de
libertad es 1. Como p-
value es menor a 0,5
(que es el valor de p con
un 95% de confianza y
grado de libertad uno)
rechazamos la hipótesis
nula, y aceptamos la
alternativa
(estableciendo la
asociación).
6. Con el conjunto de datos
ya cargado elegimos una
variable cuantitativa y
otra cualitativa; en este
caso las variables serán
“botellón” y “altura”.
Como vemos, la
cualitativa es politómica
porque tiene más de dos
categorías.
7. Vamos a proceder a
estudiar la normalidad
(primero gráficamente)
y la homocedasticidad
de la variable
cuantitativa, es decir, la
altura.
Haremos un histograma,
un diagrama de cajas y
una gráfica de
comparación de
cuartiles.
13. Ahora que hemos
estudiado la normalidad
gráficamente, haremos el
test de normalidad.
14. CONCLUSIÓN
NORMALIDAD
Al ser menos a 0,05,
podemos confirmar que
no sigue la distribución
normal, es decir,
rechazamos la hipótesis
nula.
Como no sigue la
normalidad podemos
realizar los test
correspondientes.
Vamos a estudiar la
homocedasticidad a
través del test de Levene.
15. La homocedasticidad
(que vamos a estudiar
mediante el test de
Levene) se refiere a si
hay igualdad entre las
varianzas.
16. Al ser mayor a 0,05 no
alcanza la significación
estadística y aceptamos
la hipótesis nula. Por lo
que hay igualdad entre
varianzas.
17. Como no hay
normalidad, debido a
que si falla una de las
dos magnitudes (la
normalidad o la
homocedasticidad)
realizamos un test no
paramétrico.
Como en este caso una
variable es politómica,
haremos el test de
Kruskal-Wallis.
18. CONCLUSIÓN
Como el resultado es
mayor a 0,05 aceptamos
la hipótesis nula.
Concluyendo así al decir
que no hay relación
entre las dos variables,
es decir, entre la altura y
el botellón.
20. ELEGIR
VARIABLES
Con el conjunto de datos
ya cargado elegimos dos
variables cuantitativas,
en este caso,
“mantenimiento hogar” y
“medicalización”.
21. LINEALIDAD
Vamos a estudiar la
linealidad de las dos
variables seleccionadas
mediante el diagrama de
dispersión (que
encontraremos en
gráficas).
Para tener un valor de
referencia seleccionamos
la línea de mínimos
cuadrados.
22. DIAGRAMA DE DISPERSIÓN
Existe linealidad y
pendiente
descendiente por lo
que vamos a estudiar
la normalidad de las
dos variables.
23. NORMALIDAD
Usando el test de
normalidad con Shapiro-
Wilk obtenemos estos
resultados.
Como podemos ver, al
ser menor a 0,05, no se
sigue la distribución
normal.
Vamos a realizar un test
no paramétrico para ver
la correlación entre las
variables.
24. CONCLUSIÓN
Como Rho da - 0,082, la
correlación entre ambas
variables es muy débil.