Informe estadístico bivariado
Matías Asencio Ponce
Grupo 4, subgrupo 15
1º Enfermería
Estadística y TICs
ÍNDICE
• Introducción
• Objetivo
• Metodología
• Resultados
• Conclusiones
1. Introducción
• El análisis bivariado es un procedimiento para
analizar si las semejanzas o las diferencias
encontradas en los datos se deben al azar o a otras
circunstancias.
• Si la diferencia se debe a alguna circunstancia
distinta al azar teniendo en cuenta el nivel de
significación que hemos asumido (0.05, 0.01…)
decimos que la diferencia es estadísticamente
significativa.
• Todo esto nos va a permitir tomar decisiones que se
apoyen en los datos.
• Vamos a ver algunas pruebas estadísticas que
usamos en el análisis bivariado.
• Van a depender del tipo de variable que usemos
(cuantitativa, cualitativa) del número de
variables, del número de sujetos que vamos a
estudiar, de la distribución que adopta la
frecuencia (usando el test de Shapiro-Wilk o el
de Kolmogorov) y si las mediciones se realizan
una sola vez en el tiempo o más de una en
tiempo diferentes.
Dentro de las pruebas paramétricas tenemos al menos una
variable cuantitativa que sigue una distribución normal.
• -T de Student
• -ANOVA
Dentro de las no paramétricas tenemos o todas cualitativas
o la cuantitativa no sigue la distribución normal.
• -Chi cuadrado
• -McNemar
• -Q de Cochran
• -U de Mann-Whitney
• -T de Wilcoxon
2. Objetivos
• 2.1 Objetivo general: utilizar la estadística
bivariada para establecer la asociación entre dos
variables de nuestro fichero de datos “Activos en
salud” dando respuesta a hipótesis de una
investigación específica.
2.1. Objetivos específicos:
• Conocer si existe relación entre el sexo y el hecho de practicar
deporte ayudándome de una tabla y realizando un contraste
de hipótesis.
• Mis objetivos con respecto al segundo estudio son conocer si
existe relación entre la altura y el peso utilizando un gráfico de
dispersión y haciendo un contraste de hipótesis. También voy
a analizar cómo de fuerte es la correlación entre altura y peso.
Para ello voy a realizar una serie de pasos utilizando los
estadísticos más apropiados en cada situación y llegaremos a
unas conclusiones.
3. Metodología
• Estamos realizando un estudio a una población
de 291 estudiantes de primero de Enfermería de
la Universidad de Sevilla, centros propios y
adscritos para así poder conocer sus estilos de
vida y activos en salud, para ello les hemos
realizado una encuesta.
Primeramente voy a analizar las variables “sexo” y
“practicas deporte”.
• Sexo: Es una variable cualitativa (factor)
dicotómica y nominal. 1 corresponde a varón y 2
a mujer.
• Practicas deporte: De nuevo estamos ante una
variable cualitativa (factor) con dos categorías y
nominal. 1 corresponde a Sí y 2 corresponde a
No.
Posteriormente estudiaré las variables “altura” y
“peso”.
• Altura: Es una variable cuantitativa y se mide en
metros.
• Peso: Es una variable también cuantitativa cuyas
unidades son los Kg.
• He estado utilizando el Software R, que es libre y
sin garantía alguna.
• Los estadísticos que vamos a usar son la Chi
cuadrado en el primer caso y Rho de Spearman
en el segundo. Además, en el estudio del peso y
la altura también usaremos un diagrama de
dispersión. Para comprobar la normalidad
usaremos el Test de Shapiro-Wilk.
4. Resultados
Primeramente quiero averiguar lo siguiente:
¿Influye el sexo en el hecho de practicar
deporte?
• Hipótesis nula (H0): Los hombres y las
mujeres practican deporte de igual manera.
• Hipótesis alternativa (H1): Los hombres y
las mujeres practican deporte de manera
diferente.
Frecuencias observadas:
Sexo Práctica
deporte no
Práctica
deporte sí
Total
Hombre a=9 b=42 a+b=51
Mujer c=123 d=117 c+d=140
Total a+c=132 b+d=159 n=291
Frecuencias esperadas
Sexo Práctica deporte
no
Práctica deporte sí
Hombre 23.13 27.87
Mujer 108.87 131.13
• El resultado de la Chi cuadrado es 19,163.
• El grado de libertad de esta tabla es 1 y vamos a
trabajar con un nivel de significación del 0,05.
• Miramos en la tabla teórica y vemos que la
frecuencia esperada es 3,84.
Ahora quiero estudiar esto: ¿Existe relación entre la
altura y el peso?
Representamos las variables en un diagrama de
dispersión e intuimos que siguen una relación lineal
positiva.
• Hipótesis nula (H0): La altura no influye en el
peso.
• Hipótesis alternativa (H1): La altura sí
influye en el peso.
• Primeramente vamos a comprobar si las variables
siguen la normalidad.
• La normalidad la podemos comprobar con gráficos
como histogramas, box Plot, QQ o con el Test de
Shapiro-Wilk.
• Yo he realizado el test de Shapiro-Wilk para la
variable altura ya que si solo una de las dos variables
no siguiera la normalidad tendríamos que utilizar
un test no paramétrico.
• El p-valor en la variable altura= 4,686e-06
• Al ser un p-valor menor que 0,05 rechazamos la
hipótesis nula y por tanto vamos que no se sigue la
normalidad.
• Como no sigue la normalidad vamos a usar la Rho
de Spearman.
• Hay una buena correlación entre las variables ya que
el resultado es 0,6224114.
• El p-valor es de 2,2e-16.
5. Conclusiones
• En el primer estudio como el resultado de la Chi
observada es 19,163 que es mayor que 3,84 (que es
el valor que vemos en la tabla) llegamos a la
conclusión de que el sexo sí influye en el hecho de
practicar deporte.
• En el segundo estudio al ver que el p-valor es 2,2e-
16 que es menor que 0.05 podemos decir que se
alcanza significación estadística. Esto nos lleva a
concluir que sí hay relación entre las variables altura
y peso y que los resultados obtenidos los puedo
extrapolar a toda la población.

Bivariado

  • 1.
    Informe estadístico bivariado MatíasAsencio Ponce Grupo 4, subgrupo 15 1º Enfermería Estadística y TICs
  • 2.
    ÍNDICE • Introducción • Objetivo •Metodología • Resultados • Conclusiones
  • 3.
    1. Introducción • Elanálisis bivariado es un procedimiento para analizar si las semejanzas o las diferencias encontradas en los datos se deben al azar o a otras circunstancias. • Si la diferencia se debe a alguna circunstancia distinta al azar teniendo en cuenta el nivel de significación que hemos asumido (0.05, 0.01…) decimos que la diferencia es estadísticamente significativa. • Todo esto nos va a permitir tomar decisiones que se apoyen en los datos.
  • 4.
    • Vamos aver algunas pruebas estadísticas que usamos en el análisis bivariado. • Van a depender del tipo de variable que usemos (cuantitativa, cualitativa) del número de variables, del número de sujetos que vamos a estudiar, de la distribución que adopta la frecuencia (usando el test de Shapiro-Wilk o el de Kolmogorov) y si las mediciones se realizan una sola vez en el tiempo o más de una en tiempo diferentes.
  • 5.
    Dentro de laspruebas paramétricas tenemos al menos una variable cuantitativa que sigue una distribución normal. • -T de Student • -ANOVA Dentro de las no paramétricas tenemos o todas cualitativas o la cuantitativa no sigue la distribución normal. • -Chi cuadrado • -McNemar • -Q de Cochran • -U de Mann-Whitney • -T de Wilcoxon
  • 6.
    2. Objetivos • 2.1Objetivo general: utilizar la estadística bivariada para establecer la asociación entre dos variables de nuestro fichero de datos “Activos en salud” dando respuesta a hipótesis de una investigación específica.
  • 7.
    2.1. Objetivos específicos: •Conocer si existe relación entre el sexo y el hecho de practicar deporte ayudándome de una tabla y realizando un contraste de hipótesis. • Mis objetivos con respecto al segundo estudio son conocer si existe relación entre la altura y el peso utilizando un gráfico de dispersión y haciendo un contraste de hipótesis. También voy a analizar cómo de fuerte es la correlación entre altura y peso. Para ello voy a realizar una serie de pasos utilizando los estadísticos más apropiados en cada situación y llegaremos a unas conclusiones.
  • 8.
    3. Metodología • Estamosrealizando un estudio a una población de 291 estudiantes de primero de Enfermería de la Universidad de Sevilla, centros propios y adscritos para así poder conocer sus estilos de vida y activos en salud, para ello les hemos realizado una encuesta.
  • 9.
    Primeramente voy aanalizar las variables “sexo” y “practicas deporte”. • Sexo: Es una variable cualitativa (factor) dicotómica y nominal. 1 corresponde a varón y 2 a mujer. • Practicas deporte: De nuevo estamos ante una variable cualitativa (factor) con dos categorías y nominal. 1 corresponde a Sí y 2 corresponde a No.
  • 10.
    Posteriormente estudiaré lasvariables “altura” y “peso”. • Altura: Es una variable cuantitativa y se mide en metros. • Peso: Es una variable también cuantitativa cuyas unidades son los Kg.
  • 11.
    • He estadoutilizando el Software R, que es libre y sin garantía alguna. • Los estadísticos que vamos a usar son la Chi cuadrado en el primer caso y Rho de Spearman en el segundo. Además, en el estudio del peso y la altura también usaremos un diagrama de dispersión. Para comprobar la normalidad usaremos el Test de Shapiro-Wilk.
  • 12.
    4. Resultados Primeramente quieroaveriguar lo siguiente: ¿Influye el sexo en el hecho de practicar deporte? • Hipótesis nula (H0): Los hombres y las mujeres practican deporte de igual manera. • Hipótesis alternativa (H1): Los hombres y las mujeres practican deporte de manera diferente.
  • 13.
    Frecuencias observadas: Sexo Práctica deporteno Práctica deporte sí Total Hombre a=9 b=42 a+b=51 Mujer c=123 d=117 c+d=140 Total a+c=132 b+d=159 n=291
  • 14.
    Frecuencias esperadas Sexo Prácticadeporte no Práctica deporte sí Hombre 23.13 27.87 Mujer 108.87 131.13
  • 15.
    • El resultadode la Chi cuadrado es 19,163. • El grado de libertad de esta tabla es 1 y vamos a trabajar con un nivel de significación del 0,05. • Miramos en la tabla teórica y vemos que la frecuencia esperada es 3,84.
  • 16.
    Ahora quiero estudiaresto: ¿Existe relación entre la altura y el peso? Representamos las variables en un diagrama de dispersión e intuimos que siguen una relación lineal positiva.
  • 17.
    • Hipótesis nula(H0): La altura no influye en el peso. • Hipótesis alternativa (H1): La altura sí influye en el peso.
  • 18.
    • Primeramente vamosa comprobar si las variables siguen la normalidad. • La normalidad la podemos comprobar con gráficos como histogramas, box Plot, QQ o con el Test de Shapiro-Wilk. • Yo he realizado el test de Shapiro-Wilk para la variable altura ya que si solo una de las dos variables no siguiera la normalidad tendríamos que utilizar un test no paramétrico.
  • 19.
    • El p-valoren la variable altura= 4,686e-06 • Al ser un p-valor menor que 0,05 rechazamos la hipótesis nula y por tanto vamos que no se sigue la normalidad. • Como no sigue la normalidad vamos a usar la Rho de Spearman. • Hay una buena correlación entre las variables ya que el resultado es 0,6224114. • El p-valor es de 2,2e-16.
  • 20.
    5. Conclusiones • Enel primer estudio como el resultado de la Chi observada es 19,163 que es mayor que 3,84 (que es el valor que vemos en la tabla) llegamos a la conclusión de que el sexo sí influye en el hecho de practicar deporte. • En el segundo estudio al ver que el p-valor es 2,2e- 16 que es menor que 0.05 podemos decir que se alcanza significación estadística. Esto nos lleva a concluir que sí hay relación entre las variables altura y peso y que los resultados obtenidos los puedo extrapolar a toda la población.