Informe estadístico
correspondiente a los
seminarios de
Estadística bivariada
Yasmin Morvarid, Owrang Calvo
GRUPO 4
Subgrupo 17
GUÍA
 1. Introducción.
 2. Objetivo.
 3. Metodología.
 3.1 - Población de estudio. Muestra.
 3.2 - Variables a analizar.
 3.3 - Análisis de datos.
 4. Resultados.
 5. Conclusiones
1.Introducción
 En esta ocasión trabajaremos con la estadística bivariada. Se trata de un
conjunto de técnicas empleadas para el estudio de sucesos en los que
intervienen dos variables simultáneamente.
 Nos permite detectar:
 - Si dos variables tienen relación entre sí.
 - Si la relación entre ellas es fuerte, moderada o débil.
 - Qué dirección tiene la relación.
2.Objetivos general y específicos
 Utilizar la estadística bivariada para establecer la asociación entre dos
variables de nuestro fichero de datos, dando respuesta a hipótesis de
investigación específicas.
 Queremos conocer si existe asociación entre el sexo y la práctica de deporte en la
muestra correspondiente al archivo “activossalud.Rdata”. Para ello hemos
empleado “Rcommander”, que nos ha demostrado hay más hombres que mujeres
que practiquen deporte en nuestra muestra.
 Queremos conocer si existe asociación entre el sexo y el consumo de fruta en la
muestra correspondiente al archivo “activossalud.Rdata”. Para ello hemos usado
“Rcommander”, que nos ha demostrado que no existe una asociación fiable.
3.Metodología
 3.1 - Población de estudio. Muestra.
 3.2 - Variables a analizar.
 3.3 - Análisis de datos.
3.1 - Población de estudio. Muestra.
 Los datos de las encuestas se han realizado a 290 estudiantes de primero de
enfermería de la Universidad de Sevilla, centros propios y adscritos para
conocer sus estilos de vida y activos en salud.
 Podemos decir que la muestra es grande.
3.2- Variables a analizar. Tipo
 En primer lugar, debemos determinar de qué tipo son las variables con las que
trabajamos
 Sexo: cualitativa dicotómica
 Práctica de deporte: cualitativa dicotómica
 Consumo de fruta: cualitativa NO DICOTÓMICA
 Todas ellas son cualitativas porque determinan una cualidad sin valor
numérico. Algunas son dicotómicas porque tienen 2 categorías
 Además todas son INDEPENDIENTES, ya que los datos provienen de sujetos
diferentes.
3.2- Variables a analizar. Recogida
 Los alumnos respondían las encuestas seleccionando una categoría para cada
variable. Como se puede ver a continuación:
 Sexo: variable tipo factor con dos categorías:
 1-Varón
 2 – Mujer
 Fruta:
 1- “Nunca o casi nunca”
 2- “Menos de una vez por semana”
 3-“Una o dos veces a la semana”
 4- “Tres o más veces a la semana”
 5 “A diario”
 Práctica de deporte:
 1- Sí,
 2- No
3.3- Análisis de datos. Software
 Para analizar los datos recogidos vamos a utilizar “R”, programa estadístico
destinado al análisis estadístico y representación de datos, sin embargo, el
ser un programa que funciona exclusivamente mediante comandos, es un
límite para su utilización por otros profesionales no estadísticos. Por ello
usaremos R commander, que permite la utilización de R sin tener que escribir
comandos.
3.3- Análisis de datos.
 Ante los datos obtenidos en R commander nos planteamos las siguientes
hipótesis:
 Sobre el objetivo 1:
 H0: No existe asociación entre el sexo y la práctica de deporte. Ésta se aceptará si
el valor de P obtenido en el test es mayor que 0.05
 H1: Sí existe asociación entre el sexo y la práctica de deporte. Ésta se aceptará si
el valor de P obtenido en el test es menor o igual que 0.05
 Sobre el objetivo 2:
 H0: No existe asociación entre el sexo y el consumo de fruta. Ésta se aceptará si el
valor de P obtenido en el test es mayor que 0.05
 H1: Sí existe asociación entre el sexo y el consumo de fruta. Ésta se aceptará si el
valor de P obtenido en el test es menor o igual que 0.05
3.3- Análisis de datos.
 Para obtener las tablas que necesitamos seguimos el siguiente procedimiento
en ambos casos:
3.3- Análisis de datos.
 En el caso especial de la fruta, no marcamos el Test
de Fisher ni los porcentajes ya que se trata de una
variable politómica.
 En el caso del deporte sí que los marcamos ya que
calcular estos valores sí que tiene sentido.
3.3- Análisis de datos. Fruta
 Obtuvimos las siguientes tablas para el caso de la fruta:
Tabla de frecuencias absolutas:
fruta
sexo Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o mas veces a la semana pero no a diario A diario
Varón 2 6 10 18 15
Mujer 30 26 57 48 78
Tabla de frecuencias esperadas:
fruta
sexo Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o mas veces a la semana pero no a diario A diario
Varón 5.627586 5.627586 11.78276 11.6069 16.35517
Mujer 26.372414 26.372414 55.21724 54.3931 76.64483
Tabla de componentes de la Chi cuadrado:
fruta
sexo Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o mas veces a la semana pero no a diario A diario
Varón 2.34 0.02 0.27 3.52 0.11
Mujer 0.50 0.01 0.06 0.75 0.02
3.3- Análisis de datos. Fruta
 En primer lugar, observamos por las frecuencias esperadas que ninguna es
menor que 5, por tanto en la variable fruta no deberemos reagrupar valores.
 Al comparar las frecuencias absolutas y observadas se obtienen los
componentes de la Chi cuadrado. De esta forma, notamos diferencias en el
consumo de fruta “nunca o casi nunca” y “tres o más veces a la semana pero
no a diario”
3.3- Análisis de datos. Deporte
 En el caso del deporte obtuvimos las siguientes tablas
Frecuencias absolutas:
práctica de deporte
sexo No Si Total
Varón 9 42 51
Mujer 123 117 240
Porcentajes:
práctica de deporte
sexo No Si
Varón 17.6 82.4
Mujer 51.2 48.8
Frecuencias esperadas:
práctica de deporte
sexo No Si
Varón 23.13402 27.86598
Mujer 108.86598 131.13402
Componentes de Chi cuadrado:
práctica de deporte
sexo No Si
Varón 8.64 7.17
Mujer 1.84 1.52
3.3- Análisis de datos. Deporte.
 En primer lugar observamos que ninguna de las frecuencias esperadas es
menor a 5, por tanto no es necesario el Test de Fisher.
 En las tablas observamos diferencias notables entre las frecuencias
observadas y esperadas
 Además vemos que hay un porcentaje mayor de hombres que sí practican
deporte.
4. Resultados. Fruta
 El valor de P es mayor que 0,05 por lo que aceptaremos la hipótesis nula.
 Aunque si calculamos, 1-p, diremos que existe asociación en el 89% de los
casos
4. Resultados. Deporte
 Obtuvimos un valor de P menor a 0,05 por tanto aceptamos la hipótesis
alternativa.
 Si calculamos 1-p= 99% de acierto
5. Conclusiones
 Hay varones que dicen consumir fruta “nunca o casi nunca” menos de lo
esperado. Sin embargo, consumen fruta “tres o más veces a la semana pero no
a diario” más de lo esperado. Es decir, en nuestra muestra los hombres tienen
una conducta más saludable de lo esperado.
 No existe una asociación fiable entre el sexo y el consumo de fruta ya que el
valor de p es 0,1072 > 0,05.
 Los varones dicen practicar deporte más de lo esperado y las mujeres menos
de lo esperado.
 Existe una asociación entre el sexo y la práctica de deporte. En el 99% de los
casos hay más hombres que mujeres que realicen deporte. Por tanto, deberían
orientarse algunos programas de educación para la salud para empoderar a
mujeres a practicar deporte.

Bivariada

  • 1.
    Informe estadístico correspondiente alos seminarios de Estadística bivariada Yasmin Morvarid, Owrang Calvo GRUPO 4 Subgrupo 17
  • 2.
    GUÍA  1. Introducción. 2. Objetivo.  3. Metodología.  3.1 - Población de estudio. Muestra.  3.2 - Variables a analizar.  3.3 - Análisis de datos.  4. Resultados.  5. Conclusiones
  • 3.
    1.Introducción  En estaocasión trabajaremos con la estadística bivariada. Se trata de un conjunto de técnicas empleadas para el estudio de sucesos en los que intervienen dos variables simultáneamente.  Nos permite detectar:  - Si dos variables tienen relación entre sí.  - Si la relación entre ellas es fuerte, moderada o débil.  - Qué dirección tiene la relación.
  • 4.
    2.Objetivos general yespecíficos  Utilizar la estadística bivariada para establecer la asociación entre dos variables de nuestro fichero de datos, dando respuesta a hipótesis de investigación específicas.  Queremos conocer si existe asociación entre el sexo y la práctica de deporte en la muestra correspondiente al archivo “activossalud.Rdata”. Para ello hemos empleado “Rcommander”, que nos ha demostrado hay más hombres que mujeres que practiquen deporte en nuestra muestra.  Queremos conocer si existe asociación entre el sexo y el consumo de fruta en la muestra correspondiente al archivo “activossalud.Rdata”. Para ello hemos usado “Rcommander”, que nos ha demostrado que no existe una asociación fiable.
  • 5.
    3.Metodología  3.1 -Población de estudio. Muestra.  3.2 - Variables a analizar.  3.3 - Análisis de datos.
  • 6.
    3.1 - Poblaciónde estudio. Muestra.  Los datos de las encuestas se han realizado a 290 estudiantes de primero de enfermería de la Universidad de Sevilla, centros propios y adscritos para conocer sus estilos de vida y activos en salud.  Podemos decir que la muestra es grande.
  • 7.
    3.2- Variables aanalizar. Tipo  En primer lugar, debemos determinar de qué tipo son las variables con las que trabajamos  Sexo: cualitativa dicotómica  Práctica de deporte: cualitativa dicotómica  Consumo de fruta: cualitativa NO DICOTÓMICA  Todas ellas son cualitativas porque determinan una cualidad sin valor numérico. Algunas son dicotómicas porque tienen 2 categorías  Además todas son INDEPENDIENTES, ya que los datos provienen de sujetos diferentes.
  • 8.
    3.2- Variables aanalizar. Recogida  Los alumnos respondían las encuestas seleccionando una categoría para cada variable. Como se puede ver a continuación:  Sexo: variable tipo factor con dos categorías:  1-Varón  2 – Mujer  Fruta:  1- “Nunca o casi nunca”  2- “Menos de una vez por semana”  3-“Una o dos veces a la semana”  4- “Tres o más veces a la semana”  5 “A diario”  Práctica de deporte:  1- Sí,  2- No
  • 9.
    3.3- Análisis dedatos. Software  Para analizar los datos recogidos vamos a utilizar “R”, programa estadístico destinado al análisis estadístico y representación de datos, sin embargo, el ser un programa que funciona exclusivamente mediante comandos, es un límite para su utilización por otros profesionales no estadísticos. Por ello usaremos R commander, que permite la utilización de R sin tener que escribir comandos.
  • 10.
    3.3- Análisis dedatos.  Ante los datos obtenidos en R commander nos planteamos las siguientes hipótesis:  Sobre el objetivo 1:  H0: No existe asociación entre el sexo y la práctica de deporte. Ésta se aceptará si el valor de P obtenido en el test es mayor que 0.05  H1: Sí existe asociación entre el sexo y la práctica de deporte. Ésta se aceptará si el valor de P obtenido en el test es menor o igual que 0.05  Sobre el objetivo 2:  H0: No existe asociación entre el sexo y el consumo de fruta. Ésta se aceptará si el valor de P obtenido en el test es mayor que 0.05  H1: Sí existe asociación entre el sexo y el consumo de fruta. Ésta se aceptará si el valor de P obtenido en el test es menor o igual que 0.05
  • 11.
    3.3- Análisis dedatos.  Para obtener las tablas que necesitamos seguimos el siguiente procedimiento en ambos casos:
  • 12.
    3.3- Análisis dedatos.  En el caso especial de la fruta, no marcamos el Test de Fisher ni los porcentajes ya que se trata de una variable politómica.  En el caso del deporte sí que los marcamos ya que calcular estos valores sí que tiene sentido.
  • 13.
    3.3- Análisis dedatos. Fruta  Obtuvimos las siguientes tablas para el caso de la fruta: Tabla de frecuencias absolutas: fruta sexo Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o mas veces a la semana pero no a diario A diario Varón 2 6 10 18 15 Mujer 30 26 57 48 78 Tabla de frecuencias esperadas: fruta sexo Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o mas veces a la semana pero no a diario A diario Varón 5.627586 5.627586 11.78276 11.6069 16.35517 Mujer 26.372414 26.372414 55.21724 54.3931 76.64483 Tabla de componentes de la Chi cuadrado: fruta sexo Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o mas veces a la semana pero no a diario A diario Varón 2.34 0.02 0.27 3.52 0.11 Mujer 0.50 0.01 0.06 0.75 0.02
  • 14.
    3.3- Análisis dedatos. Fruta  En primer lugar, observamos por las frecuencias esperadas que ninguna es menor que 5, por tanto en la variable fruta no deberemos reagrupar valores.  Al comparar las frecuencias absolutas y observadas se obtienen los componentes de la Chi cuadrado. De esta forma, notamos diferencias en el consumo de fruta “nunca o casi nunca” y “tres o más veces a la semana pero no a diario”
  • 15.
    3.3- Análisis dedatos. Deporte  En el caso del deporte obtuvimos las siguientes tablas Frecuencias absolutas: práctica de deporte sexo No Si Total Varón 9 42 51 Mujer 123 117 240 Porcentajes: práctica de deporte sexo No Si Varón 17.6 82.4 Mujer 51.2 48.8 Frecuencias esperadas: práctica de deporte sexo No Si Varón 23.13402 27.86598 Mujer 108.86598 131.13402 Componentes de Chi cuadrado: práctica de deporte sexo No Si Varón 8.64 7.17 Mujer 1.84 1.52
  • 16.
    3.3- Análisis dedatos. Deporte.  En primer lugar observamos que ninguna de las frecuencias esperadas es menor a 5, por tanto no es necesario el Test de Fisher.  En las tablas observamos diferencias notables entre las frecuencias observadas y esperadas  Además vemos que hay un porcentaje mayor de hombres que sí practican deporte.
  • 17.
    4. Resultados. Fruta El valor de P es mayor que 0,05 por lo que aceptaremos la hipótesis nula.  Aunque si calculamos, 1-p, diremos que existe asociación en el 89% de los casos
  • 18.
    4. Resultados. Deporte Obtuvimos un valor de P menor a 0,05 por tanto aceptamos la hipótesis alternativa.  Si calculamos 1-p= 99% de acierto
  • 19.
    5. Conclusiones  Hayvarones que dicen consumir fruta “nunca o casi nunca” menos de lo esperado. Sin embargo, consumen fruta “tres o más veces a la semana pero no a diario” más de lo esperado. Es decir, en nuestra muestra los hombres tienen una conducta más saludable de lo esperado.  No existe una asociación fiable entre el sexo y el consumo de fruta ya que el valor de p es 0,1072 > 0,05.  Los varones dicen practicar deporte más de lo esperado y las mujeres menos de lo esperado.  Existe una asociación entre el sexo y la práctica de deporte. En el 99% de los casos hay más hombres que mujeres que realicen deporte. Por tanto, deberían orientarse algunos programas de educación para la salud para empoderar a mujeres a practicar deporte.