1. • Se desea realizar un estudio sobre la en una muestra de mujeres y
hombres, de la que se obtienen los datos de la siguiente tabla (glucemia
medida en g/litros y edad en años).
1. Mediante software estadístico, calcula los valores máximo y mínimo,
media, mediana, desviación típica, rango, cuartiles y medidas de forma
de la/s variable/s numérica/s.
2. Comenta e interpreta los resultados obtenidos en la desviación típica,
cuartiles y medidas de forma.
3. Presenta una tabla con todas las frecuencias posibles de la/s variable/s
cualitativa/s.
4. Mediante software estadístico, representa gráficamente la distribución
de cada una de las variables.
5. Crea un gráfico que relacione “Glucemia” y “Sexo”. Interpreta y comenta
el gráfico.
6. Mediante software estadístico, crea una tabla de contingencia que
relacione “Cabello” y “Sexo”.
2. 1.1. Importamos un excel creado por
nosotros para poder trabajar con los
datos del ejercicio
3. 1.2.Para calcular las medidas de síntesis de nuestra
distribución de datos, accedemos en R commander a
«estadísticos»-»resúmenes»-»resúmenes numéricos».
4. 1.3.Seleccionamos las 2 variables numéricas de
las cuales queremos saber las medidas de
síntesis.
7. 2.1.Desviación típica
• Como podemos observar, en un principio parece
que los datos se alejan más de su media en la
edad que en la glucemia, ya que su desviación
típica es un número bastante mayor.
• Sin embargo, como se puede apreciar en la
siguiente foto, vemos que el coeficiente de
variación es bastante menor en la edad (0,38)
que en la glucemia (0,55).
• Por tanto, concluimos que en la glucemia los
datos están más dispersos que en la edad en esta
muestra.
8.
9. 2.2.Cuartiles.
• En el primer cuartil de la variable edad (valor que deja
detrás de él el 25% de los datos) observamos que nos da
35,30 , mientras que en la variable glucemia nos da 0,95.
Esto quiere decir que el 25% de los datos más bajos tienen
una edad máxima de 35,30 años y una glucemia máxima de
0,95 mg/dL.
• En el segundo cuartil de la variable edad o en su mediana
(valor que deja detrás de él el 50% de los datos)
observamos que nos da 47 años, mientras que en la
variable glucemia nos da 1,115 mg/dL. Esto quiere decir
que el 50% de los datos más bajos tienen una edad máxima
de 47 años y una glucemia máxima de 1,115, la que todavía
puede considerarse de una persona sana.
10. 2.2.Cuartiles.
• En el tercer cuartil, podemos observar que en
la variable edad nos da un valor de 59,50,
mientras que en la variable glucemia nos da
un valor de 1,99. Esto quiere decir que el 75%
de los datos tienen una edad máxima de 59
años y medio y una glucemia máxima de 1,99
mg/dL, que ya debería ser una cifra a tener en
cuenta para la diabetes.
11. 2.3.Medidas de forma
• Podemos observar en el programa de R
commander que la variable edad dibujaría una
gráfica asimétrica de cola izquierda y platicúrtica
gracias a los valores negativos tanto de asimetría
como de curtosis (-0,078 y -0,907
respectivamente).
• También podemos observar que la variable
glucemia, sin embargo, dibujaría una gráfica
asimétrica de cola derecha y leptocúrtica, gracias
a sus valores positivos tanto de asimetría como
de curtosis (1,19 y 0,31 respectivamente).
12. 3.1. En este caso, accedemos en R commander a
«estadísticos»- «resúmenes»- «distribución de
frecuencias».
13. 3.2.Seleccionamos las 2 variables cualitativas
sobre las que queremos saber sus frecuencias.
21. 4.2.1.Edad (Histograma): Realizamos un proceso similar
que con el histograma de la variable glucemia, pero
elegimos la variable edad. Este sería el resultado:
22. 4.2.2.Edad (Diagrama de caja): Realizamos un proceso parecido
al del diagrama de caja de la variable glucemia, pero elegimos la
variable edad. Este es nuestro resultado:
23. 4.3.1.Sexo (gráfica de sectores): Accedemos en R
commander a «gráficas»- «gráfica de sectores».
32. 5.4. Analizamos la gráfica.
• Como podemos apreciar, aparte de que hay
un mayor número de mujeres que de hombres
en nuestra muestra, las mujeres presentan
con mayor frecuencia un nivel de glucemia
más alto que los hombres, por lo que podría
indicarnos que son más propensas a sufrir
diabetes o no controlar esta (ya que los
niveles de glucemia se encuentran bastante
elevados en algunas mujeres y no tanto en los
hombres).
33. 6.1.Accedemos en R commander a
«estadísticos»- «tablas de contingencia»- «tabla
de doble entrada».