2. SE DESEA REALIZAR UN ESTUDIO SOBRE LA EN UNA MUESTRA DE MUJERES Y HOMBRES, DE LA QUE SE
OBTIENEN LOS DATOS DE LA SIGUIENTE TABLA (GLUCEMIA MEDIDA EN G/LITROS Y EDAD EN AÑOS)
1. MEDIANTE SOFTWARE ESTADÍSTICO, CALCULA LOS VALORES MÁXIMO Y MÍNIMO, MEDIA, MEDIANA,
DESVIACIÓN TÍPICA, RANGO, CUARTILES Y MEDIDAS DE FORMA DE LA/S VARIABLE/S NUMÉRICA/S. CUELGA
SU DESARROLLO EN EL BLOG.
2. PRECOMENTA E INTERPRETA LOS RESULTADOS OBTENIDOS EN LA DESVIACIÓN TÍPICA, CUARTILES Y
MEDIDAS DE FORMA.
3. SENTA UNA TABLA CON TODAS LAS FRECUENCIAS POSIBLES DE LA/S VARIABLE/S CUALITATIVA/S.
4. MEDIANTE SOFTWARE ESTADÍSTICO, REPRESENTA GRÁFICAMENTE LA DISTRIBUCIÓN DE CADA UNA DE LAS
VARIABLES.
5. CREA UN GRÁFICO QUE RELACIONE “GLUCEMIA” Y “SEXO”. INTERPRETA Y COMENTA EL GRÁFICO.
6. MEDIANTE SOFTWARE ESTADÍSTICO, CREA UNA TABLA DE CONTINGENCIA QUE RELACIONE “CABELLO” Y
“SEXO”.
EJERCICIO
3. En primer lugar, copiamos la
tabla del ejercicio en un Excel
para luego poder importarla a R
4. Una vez seleccionado el conjunto de datos (nuestra tabla en Excel) vemos
como en R aparece un nuevo conjunto de datos de 40 filas y 4 columnas
5. 1ºEJERCICIO
Como podemos comprobar, sólo nos calcula los valores máximo y mínimo, media, mediana, desviación
típica, rango, cuartiles y medidas de forma de la/s variable/s numérica/s de las variables cuantitativas
pero no de las cualitativas.
6.
7. 2.EJERCICIO
La desviación típica, es una medida de dispersión para variables
cuantitativas y de intervalo. Se define como la raíz cuadrada de la
varianza de la variable. Si la observamos en nuestro caso, la
desviación típica (sd) de la edad ( 17,89) y de la glucemia ( 0,88)
podemos decir que en la edad hay una mayor variabilidad de
datos mientras que en la glucemia los datos son mas parecidos o
similares.
Los cuartiles, son las puntuaciones que dividen a la distribución
en cuatro partes iguales, cada una de ellas con el 25% de los
casos. Además la mediana coincide con el 2ºcuartil. Por tanto:
Como consecuencia, el coeficiente de asimetría es negativo por lo
que la curva es asimétricamente negativa. Esto quiere decir que
los valores se tienden a reunir más en la parte derecha de la
media. Debido a que entre los números bajos hay más diferencia
y entre los más altos hay más homogeneidad.
El coeficiente de Kurtosis es negativo, la distribución se llama
platicúrtica, es decir, hay una menor concentración de datos en
torno a la media.
EDAD Q1: 0,95 Q2: 1,15 Q3: 1,19
GLUCEMIA Q1: 35,5 Q2: 47 Q3: 59
8. 3ºEJERCICIO
Una vez que conocemos la frecuencia absoluta (counts) y los porcentajes (percentages) que son
la frecuencia relativa x100. Procemeos a realizar la tabla
9. fa: frecuencia absoluta: Contabilizan el número de
individuos de cada modalidad.
fi: frecuencia relativa: Número de individuos de cada
modalidad, pero dividido por el total (n).
p: porcentaje (fi x 100)
Fa: frecuencia absoluta acumulada
Fi frecuencia relativa acumulada
P: porcentajes acumulados
SEXO CABELLO
Xi fa fi p Fa Fi P Xi fa fi p Fa Fi P
mujer 24 0,6 60 24 0.6 60 Castaño 7 0,175 17,5 7 0,175 17,5
hombre 16 0,4 40 40 1 100 Negro 28 0,7 70 35 0,875 87,5
40 1 100 rubio 5 0,125 12,5 40 1 100
40 1 100
13. Como podemos ver en la
mujer aparecen tanto los
niveles de glucemia más
bajos como el más alto, cosa
en el hombre a partir de 3.0
no hay más.
Por otro lado es curioso que
en la mujer no aparece
ninguna cuyo nivel de
glucemia este entre 2.0 y 2.5.
Como conclusión diría que
en la mujer encontramos
más desigualdades en los
datos en comparación con el
hombre.