2. ÍNDICE
1. Introducción.
2. Objetivo.
3. Metodología.
3.1 - Población de estudio. Muestra.
3.2 - Variables a analizar.
3.3 - Análisis de datos.
4. Resultados.
5. Conclusiones
3. 1. INTRODUCCIÓN.
¿Qué es la estadística bivariada?
Es una técnica estadística que estudia aquellos sucesos en los que intervienen
dos variables simultáneamente.
¿Para qué sirve?
Sirve para determinar:
- Si dos variables tienen relación entre sí.
- Si la relación entre ellas es fuerte, moderada o débil.
- Qué dirección tiene la relación.
4. 2. OBJETIVO.
- General: Utilizar la estadística bivariada para establecer la asociación entre
dos variables de nuestro fichero de datos, dando respuesta a hipótesis de
investigación específicas.
- Específicos:
• Queremos conocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y “Practicadeporte” (Sí, No). Para usamos el
software “R commander”.
• Determina que si existe asociación entre las variables “practica deporte” y
“escalaaa”. Para ello usamos el software “R commander”.
5. 3. METODOLOGÍA.
3.1- Población de estudio. Muestra
El fichero “estadistica_tics” contiene los datos de las encuestas realizadas a 291
estudiantes de primero de enfermería de la Universidad de Sevilla, centros
propios y
adscritos para conocer sus estilos de vida y activos en salud.
3.2 - Variables a analizar
• En el ejercicio 1 hay dos variables dicotómicas y cualitativas que son “sexo” y
“practicadeporte” (si/no)
• En el ejercicio 4 hay dos variables: “escalaaa”, cuantitativa y
“praciticadeporte”, cualitativa.
6. 3. METODOLOGÍA
3.2 - Variables a analizar
Recogida de datos:
• Ejercicio 1:
- Sexo: variable tipo factor con dos categorías: 1-Varón, 2 – Mujer
- Practicadeporte: 1- Sí, 2- No
• Ejercicio 4:
- Practicadeporte: 1- Sí, 2- No
- Escalaas: Escala cuantitativa, formada sumando la puntuación obtenida en las
variables: botellón, horarecogida, consumotabaco, tabaco, cerveza, vino,
combinados, hachis, parejassexuales, proteccionpreservativo, marchaatras,
pildoradiadespues, fruta, verduras, embutidos, dulces, refrescos, practicadeporte,
horapracticadeportiva.
A más puntuación en la escala, más saludable es la vida de la persona encuestada
(activos en salud).
7. 3. METODOLOGÍA
3.3 - Análisis de datos.
Para analizar los datos recogidos vamos a utilizar “R”, programa estadístico
destinado al análisis estadístico y representación de datos, sin embargo, el ser un
programa que funciona exclusivamente mediante comandos, es un límite para su
utilización por otros profesionales no estadísticos.
Por ello usaremos R commander, que permite la utilización de R sin tener que escribir
comandos.
Los análisis estadísticos que vamos a realizar son:
- En el ejercicio 1, como son dos variables dicotómicas y cualitativas usaremos Chi
cuadrado de Pearson.
- En el ejercicio 4, como una variable es cuantitativa y la otra es cualitativa,
usaremos T de student
8. 4. RESULTADOS.
EJERCICIO 1:
Los datos los representamos en una tabla de
contingencia, usada para analizar la asociación
entre dos o más variables cualitativas (en este caso
sólo dos), en la que hay 240 mujeres y 51 hombres.
En ella observamos que hay gran diferencia entre
el número de hombres que practican deporte (hay
más) y los que no, diferencia menos destacable en
mujeres, en las que hay más que no lo practican.
Establecemos las hipótesis para nuestro ejercicio:
• H0(hipótesis nula): No existe asociación entre el sexo y la práctica de deporte, es decir,
estas variables son independientes. (P > 0,05)
• H1(hipótesis alternativa): Sí existe relación entre el sexo y la práctica de deporte, es decir,
estas variable son dependientes. (P ≤ 0,05)
Sexo Practica deporte
Si No Total
Varón 42 9 51
Hembra 117 123 240
Total 132 159 291
9. 4. RESULTADOS.
La prueba más adecuada para contrastar mi hipótesis según cómo son las
variables
es Chi cuadrado de Pearson ya que se trata de dos variables dicotómicas
cualitativas. Gracias a esta, observamos si la diferencia de datos
– Es debida al azar
Recordemos que la Ho establece que no hay diferencia, que hay igualdad.
Aceptamos la Ho
– Es debida a algo más, por ejemplo una asociación entre las variables que
estudiamos.
Rechazamos la H0. Aceptamos la H1.
10. 4. RESULTADOS.
X2 =
(frecuencias observadas−frecuencias esperadas)2
frecuencias esperadas
= 2,901
𝐹𝐸1.1=
𝑎+𝑏 ∗(𝑎+𝑐)
𝑛
= 𝟐𝟑, 𝟏𝟑 𝐹𝐸1.2=
𝑎+𝑏 ∗(𝑏+𝑑)
𝑛
= 𝟐𝟕, 𝟖𝟔
𝐹𝐸2.1=
𝑐+𝑑 ∗(𝑎+𝑐)
𝑛
= 𝟏𝟎𝟖, 𝟖𝟔 𝐹𝐸1.2=
𝑐+𝑑 ∗(𝑏+𝑑)
𝑛
= 𝟏𝟑𝟏, 𝟏𝟑
Sexo Practica deporte
Si No Total
Varón 42 9 51
Hembra 117 123 240
Total 132 159 291
Fe (23,13)
Fe (108,86)
b
Fe(27,86)
c
Fe(131,13)
d
Comparamos nuestra
X2 con el valor de la
Chi – cuadrado
teórica según la tabla,
con un nivel de
significación de 0,05,
y es 3,8415
Dicha tabla la
encontramos en:
http://labrad.fisica.e
du.uy/docs/tabla_chi
_cuadrado.pdf
a
11. 4. RESULTADOS.
Ejercicio 1:
Como 3,8415 > 2,901
NO hay más diferencia en los datos mas allá que la que habría si la diferencia
fuera producto del azar.
Así que aceptamos Ho, no existe asociación entre el sexo y la práctica de
deporte, con un nivel de significación del 0,05.
12. 4. RESULTADOS.
Ejercicio 4:
Establecemos las hipótesis para nuestro ejercicio:
H0 (hipótesis nula): No existe asociación entre la práctica de deporte y la vida
saludable de la persona. (P > 0,05)
H1 (hipóstasis alternativa): Sí existe asociación entre la práctica de deporte y
el nivel de vida saludable de una persona. (P ≤ 0,05)
Para realizar la prueba T student debemos asumir sus asunciones:
- Hay 2 variables, una cuantitativa y la otra cualitativa. (Sí)
- Existe igualdad entre las varianzas.
- Las dos variables deben seguir la distribución normal
13. 4. RESULTADOS.
Para medir la homocedasticidad, es
decir, la igualdad entre las varianzas,
usamos el Test de Levene.
Según este;
H0: Hay homocedasticidad, igualdad de
varianzas (p > 0,05)
H1: No hay heterocedasticidad,
diferencia en las varianzas (p ≤ 0,05)
En nuestro caso, P = 0,4078, por lo que
aceptamos H0, hay homocedasticidad
14. 4. RESULTADOS.
Hay diferentes puebas para medir la normalidad de las variables:
- Gráficas:
escalaas
frequency
30 40 50 60 70
010203040
Histograma
3040506070
escalaas
131
226
288
273
Diagrama de cajas
-2 -1 0 1 2
3040506070
norm quantiles
escalaas
131 288
Gráfica Q-Q
15. 4. RESULTADOS.
- O pruebas no paramétricas
Test de normalidad de Shapiro – Wlik:
H0: La distribución es igual a la normal.
(P > 0,05)
H1: la distribción es diferente a la distribución
normal. (P ≤ 0,05)
En nuestro caso, P = 0,2312, luego sí hay
normalidad
16. 4. RESULTADOS.
Como asumimos las tres asunciones
necesarias para poder aplicar T –
student, lo hacemos:
P < 0,05, por lo que rechazamos la
hipótesis nula y aceptamos la
alternativa, sí hay asociación
entre la práctica de deporte y el
nivel de vida saludable de una
persona.
17. 5. CONCLUSIONES.
Ejercicio1: Como era de esperar, no podemos afirmar que exista relación entre el
sexo de un individuo y la realización o no de algún deporte
Ejercicio 4: Tras las pruebas realizada podemos afirmar con un nivel de
confianza del 95% que sí existe relación entre el nivel de vida saludable de
una persona y la práctica de deporte.