INFORME ESTADÍSTICO: ESTADÍSTICA
BIVARIADA
1. INTRODUCCIÓN
La estadística descriptiva bivariada aborda el estudio de los sucesos en los que intervienen
dos variables simultáneamente. Cuando queremos describir conjuntamente dos variables
estadísticas, el primer paso será (al igual que en el caso de la estadística univariada),
representar los datos en una tabla de frecuencias.
2. OBJETIVOS
o General:
Utilizar la estadística bivariada para establecer la asociación entre dos variables de
nuestro fichero de datos, dando respuesta a hipótesis de investigación específicas.
o Objetivos específicos:
a) Determinar si existe asociación entre las variables “sexo” y “consumo de
fruta” del archivo “activossalud.Rdata”.
b) Determinar si existe relación y cómo de fuerte es, entre las variables
“altura” y “peso”.
3. METODOLOGÍA
3.1. Población de estudio. Muestra:
Los datos analizados para realizar el siguiente informe han sido recogidos de las
encuestas realizadas a 290 estudiantes de primero de enfermería de la Universidad de
Sevilla, centros propios y adscritos para conocer sus estilos de vida y activos en salud.
3.2. Variables a analizar:
a) “Sexo”: se trata de una variable cualitativa nominal. Presenta dos
categorías, hombre y mujer, por tanto se trata además de una variable
dicotómica.
“Comer fruta”: se trata de una variable cualitativa ordinal. Presenta cinco
categorías: 1- “nunca o casi nunca”, 2- “menos de una vez por semana”,
3- “una o dos veces por semana”, 4- “tres o más veces a la semana”, 5- “a
diario”.
b) “Altura“: se trata de una variable cuantitativa continua, cuyos valores
mínimos y máximos son de 1,460 metros y 2 metros.
“Peso”: se trata de una variable cuantitativa continua. Está expresada en
Kilogramos y sus valores mínimos y máximos son de 38 Kg y 130 Kg.
3.3. Análisis de datos:
o He utilizado el Software R. Versión 3.3.1.
o Los análisis estadísticos que voy a utilizar son los siguientes:
- Para el caso A voy a utilizar Chi-Cuadrado, ya que ambas variables son
cualitativas.
- Para el caso B voy a utilizar el Test de Shapiro-Wilk para comprobar la
normalidad y Spearman para comprobar la correlación. Además haré uso de
un diagrama de dispersión.
4. RESULTADOS
a) ¿Existe relación entre sexo y el consumo de fruta?
Nunca o
casi nunca
Menos de
una vez por
semana
Una o dos
veces a la
semana
Tres o más
veces a la
semana A diario Total
Hombre 2 6 10 18 15 51
Mujer 30 26 57 48 78 293
Total 32 32 67 66 93 290
Planteamos las siguientes hipótesis:
- H0: el sexo no influye en el consumo de fruta
- H1: el sexo influye en el consumo de fruta
Para el contraste de hipótesis podemos utilizar el estadístico Chi-Cuadrado, a través de la
siguiente fórmula:
𝑋2
= ∑
( 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑒𝑐𝑢𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠)2
𝑓𝑟𝑒𝑐𝑒𝑢𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠
En la siguiente tabla podemos observar las frecuencias esperadas:
(fo= frecuencia observada)
Nunca o casi
nunca
Menos de una
vez por
semana
Una o dos
veces a la
semana
Tres o más
veces a la
semana
A diario Total
Hombre (32x51)/290=
5,627
fo= 2
(32x51)/290=
5,627
fo= 6
(67x51)/290=
11,782
fo= 10
(66x51)/290=
11,606
fo= 18
(93x51)/290=
16,355
fo= 15
51
Mujer (32x239)/290=
26,372
fo= 30
(32x239)/290=
26,372
fo= 26
(67x239)/290=
55,217
fo= 57
(66x239)/290=
54,393
fo= 38
(93x239)/290=
76,644
fo= 78
239
Total 32 32 67 66 93 290
A continuación calculamos la Chi-Cuadrado observada:
X2 =
(2−5,627)2
5,627
+
(30−26 ,372)2
26,372
+
(6−5,627)2
5,627
+
(26−26,372)2
26 ,372
+
(10−11,782)2
11 ,782
+
(57−55,217)2
55 ,217
+
(18−11,606)2
11,606
+
(48−54,393)2
54,393
+
(15−16,355)2
16,355
+
(78−76,644)2
76,644
X = 7’6
Podemos observar que la Chi-Cuadrado observada es de 7’6 y la Chi-Cuadrado esperada
es de 14’86, con un grado de libertad de 4 y un nivel de significación del 0’05. Por tanto,
no existe relación entre las variables “sexo” y “consumo de fruta” y aceptamos la
hipótesis H0.
b) ¿Influye la altura en el peso de los estudiantes?
Planteamos las siguientes hipótesis:
- H0: no existe relación entre las variables “altura” y “peso”.
- H1: existe relación entre las variables “altura” y “peso”.
La siguiente gráfica se trata de un diagrama de dispersión, donde la variable “altura” está
representada en el eje X y la variable “peso” está representada en el eje Y.
A primera vista podemos observar que existe una relación lineal positiva.
A continuación debemos comprobar la normalidad, para ello utilizaremos el Test de
Shapiro-Wilk:
Podemos observar que para la variable “altura” el p-valor es de 4,686e-06 y que para la
variable “peso” el p-valor es de 8,406e-13, por tanto, son valores menores que 0,05 y se
acepta la H1. Ambas variables no siguen una distribución normal.
Como ambas variables no siguen la distribución normal, debemos hacer uso de los test
no paramétricos, en este caso, utilizaremos el Test de correlación de Spearman:
Podemos decir que existe correlación entre ambas variables, ya que el resultado es de
0,6224114, y que la relación es fuerte.
5. CONCLUSIONES
CASO A
En conclusión, hemos aceptado la hipótesis nula (H0) que afirma que la frecuencia con la
que los estudiantes consumen fruta a lo largo de sus vidas no guarda relación con el sexo
al que pertenezcan.
CASO B
En conclusión, hemos obtenido que p-valor es menor que el grado de significación 0,05
(2,2e-16<0,05), por lo tanto, aceptamos la hipótesis alternativa (H1) que afirma que si
existe relación entre la altura y el peso de los estudiantes.
Si extrapolamos estos resultados a la población concluimos que aquellos estudiantes que
son más altos, normalmente, pesan más.
María García Campallo
1º de Enfermería. Grupo 3; Subgrupo 12.

Estadisticabivariada

  • 1.
    INFORME ESTADÍSTICO: ESTADÍSTICA BIVARIADA 1.INTRODUCCIÓN La estadística descriptiva bivariada aborda el estudio de los sucesos en los que intervienen dos variables simultáneamente. Cuando queremos describir conjuntamente dos variables estadísticas, el primer paso será (al igual que en el caso de la estadística univariada), representar los datos en una tabla de frecuencias. 2. OBJETIVOS o General: Utilizar la estadística bivariada para establecer la asociación entre dos variables de nuestro fichero de datos, dando respuesta a hipótesis de investigación específicas. o Objetivos específicos: a) Determinar si existe asociación entre las variables “sexo” y “consumo de fruta” del archivo “activossalud.Rdata”. b) Determinar si existe relación y cómo de fuerte es, entre las variables “altura” y “peso”. 3. METODOLOGÍA 3.1. Población de estudio. Muestra: Los datos analizados para realizar el siguiente informe han sido recogidos de las encuestas realizadas a 290 estudiantes de primero de enfermería de la Universidad de Sevilla, centros propios y adscritos para conocer sus estilos de vida y activos en salud. 3.2. Variables a analizar: a) “Sexo”: se trata de una variable cualitativa nominal. Presenta dos categorías, hombre y mujer, por tanto se trata además de una variable dicotómica. “Comer fruta”: se trata de una variable cualitativa ordinal. Presenta cinco categorías: 1- “nunca o casi nunca”, 2- “menos de una vez por semana”,
  • 2.
    3- “una odos veces por semana”, 4- “tres o más veces a la semana”, 5- “a diario”. b) “Altura“: se trata de una variable cuantitativa continua, cuyos valores mínimos y máximos son de 1,460 metros y 2 metros. “Peso”: se trata de una variable cuantitativa continua. Está expresada en Kilogramos y sus valores mínimos y máximos son de 38 Kg y 130 Kg. 3.3. Análisis de datos: o He utilizado el Software R. Versión 3.3.1. o Los análisis estadísticos que voy a utilizar son los siguientes: - Para el caso A voy a utilizar Chi-Cuadrado, ya que ambas variables son cualitativas. - Para el caso B voy a utilizar el Test de Shapiro-Wilk para comprobar la normalidad y Spearman para comprobar la correlación. Además haré uso de un diagrama de dispersión. 4. RESULTADOS a) ¿Existe relación entre sexo y el consumo de fruta? Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o más veces a la semana A diario Total Hombre 2 6 10 18 15 51 Mujer 30 26 57 48 78 293 Total 32 32 67 66 93 290
  • 3.
    Planteamos las siguienteshipótesis: - H0: el sexo no influye en el consumo de fruta - H1: el sexo influye en el consumo de fruta Para el contraste de hipótesis podemos utilizar el estadístico Chi-Cuadrado, a través de la siguiente fórmula: 𝑋2 = ∑ ( 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑒𝑐𝑢𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠)2 𝑓𝑟𝑒𝑐𝑒𝑢𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 En la siguiente tabla podemos observar las frecuencias esperadas: (fo= frecuencia observada) Nunca o casi nunca Menos de una vez por semana Una o dos veces a la semana Tres o más veces a la semana A diario Total Hombre (32x51)/290= 5,627 fo= 2 (32x51)/290= 5,627 fo= 6 (67x51)/290= 11,782 fo= 10 (66x51)/290= 11,606 fo= 18 (93x51)/290= 16,355 fo= 15 51 Mujer (32x239)/290= 26,372 fo= 30 (32x239)/290= 26,372 fo= 26 (67x239)/290= 55,217 fo= 57 (66x239)/290= 54,393 fo= 38 (93x239)/290= 76,644 fo= 78 239 Total 32 32 67 66 93 290 A continuación calculamos la Chi-Cuadrado observada: X2 = (2−5,627)2 5,627 + (30−26 ,372)2 26,372 + (6−5,627)2 5,627 + (26−26,372)2 26 ,372 + (10−11,782)2 11 ,782 + (57−55,217)2 55 ,217 + (18−11,606)2 11,606 + (48−54,393)2 54,393 + (15−16,355)2 16,355 + (78−76,644)2 76,644 X = 7’6 Podemos observar que la Chi-Cuadrado observada es de 7’6 y la Chi-Cuadrado esperada es de 14’86, con un grado de libertad de 4 y un nivel de significación del 0’05. Por tanto,
  • 4.
    no existe relaciónentre las variables “sexo” y “consumo de fruta” y aceptamos la hipótesis H0. b) ¿Influye la altura en el peso de los estudiantes? Planteamos las siguientes hipótesis: - H0: no existe relación entre las variables “altura” y “peso”. - H1: existe relación entre las variables “altura” y “peso”. La siguiente gráfica se trata de un diagrama de dispersión, donde la variable “altura” está representada en el eje X y la variable “peso” está representada en el eje Y. A primera vista podemos observar que existe una relación lineal positiva.
  • 5.
    A continuación debemoscomprobar la normalidad, para ello utilizaremos el Test de Shapiro-Wilk: Podemos observar que para la variable “altura” el p-valor es de 4,686e-06 y que para la variable “peso” el p-valor es de 8,406e-13, por tanto, son valores menores que 0,05 y se acepta la H1. Ambas variables no siguen una distribución normal. Como ambas variables no siguen la distribución normal, debemos hacer uso de los test no paramétricos, en este caso, utilizaremos el Test de correlación de Spearman: Podemos decir que existe correlación entre ambas variables, ya que el resultado es de 0,6224114, y que la relación es fuerte.
  • 6.
    5. CONCLUSIONES CASO A Enconclusión, hemos aceptado la hipótesis nula (H0) que afirma que la frecuencia con la que los estudiantes consumen fruta a lo largo de sus vidas no guarda relación con el sexo al que pertenezcan. CASO B En conclusión, hemos obtenido que p-valor es menor que el grado de significación 0,05 (2,2e-16<0,05), por lo tanto, aceptamos la hipótesis alternativa (H1) que afirma que si existe relación entre la altura y el peso de los estudiantes. Si extrapolamos estos resultados a la población concluimos que aquellos estudiantes que son más altos, normalmente, pesan más. María García Campallo 1º de Enfermería. Grupo 3; Subgrupo 12.