Trabajo tic seminario 6.1

• Se desea realizar un estudio sobre la en una muestra de mujeres y
hombres, de la que se obtienen los datos de la siguiente tabla (glucemia
medida en g/litros y edad en años).
1. Mediante software estadístico, calcula los valores máximo y mínimo,
media, mediana, desviación típica, rango, cuartiles y medidas de forma
de la/s variable/s numérica/s.
2. Comenta e interpreta los resultados obtenidos en la desviación típica,
cuartiles y medidas de forma.
3. Presenta una tabla con todas las frecuencias posibles de la/s variable/s
cualitativa/s.
4. Mediante software estadístico, representa gráficamente la distribución
de cada una de las variables.
5. Crea un gráfico que relacione “Glucemia” y “Sexo”. Interpreta y comenta
el gráfico.
6. Mediante software estadístico, crea una tabla de contingencia que
relacione “Cabello” y “Sexo”.

1.1. Importamos un excel creado por
nosotros para poder trabajar con los
datos del ejercicio

1.2.Para calcular las medidas de síntesis de nuestra
distribución de datos, accedemos en R commander a
«estadísticos»-»resúmenes»-»resúmenes numéricos».

1.3.Seleccionamos las 2 variables numéricas de
las cuales queremos saber las medidas de
síntesis.

1.4.Seleccionamos todas las medidas de
resumen que queremos obtener de esas
variables.

1.5.Aceptamos y vemos el resultado.

2.1.Desviación típica
• Como podemos observar, en un principio parece
que los datos se alejan más de su media en la
edad que en la glucemia, ya que su desviación
típica es un número bastante mayor.
• Sin embargo, como se puede apreciar en la
siguiente foto, vemos que el coeficiente de
variación es bastante menor en la edad (0,38)
que en la glucemia (0,55).
• Por tanto, concluimos que en la glucemia los
datos están más dispersos que en la edad en esta
muestra.

2.2.Cuartiles.
• En el primer cuartil de la variable edad (valor que deja
detrás de él el 25% de los datos) observamos que nos da
35,30 , mientras que en la variable glucemia nos da 0,95.
Esto quiere decir que el 25% de los datos más bajos tienen
una edad máxima de 35,30 años y una glucemia máxima de
0,95 mg/dL.
• En el segundo cuartil de la variable edad o en su mediana
(valor que deja detrás de él el 50% de los datos)
observamos que nos da 47 años, mientras que en la
variable glucemia nos da 1,115 mg/dL. Esto quiere decir
que el 50% de los datos más bajos tienen una edad máxima
de 47 años y una glucemia máxima de 1,115, la que todavía
puede considerarse de una persona sana.

2.2.Cuartiles.
• En el tercer cuartil, podemos observar que en
la variable edad nos da un valor de 59,50,
mientras que en la variable glucemia nos da
un valor de 1,99. Esto quiere decir que el 75%
de los datos tienen una edad máxima de 59
años y medio y una glucemia máxima de 1,99
mg/dL, que ya debería ser una cifra a tener en
cuenta para la diabetes.

2.3.Medidas de forma
• Podemos observar en el programa de R
commander que la variable edad dibujaría una
gráfica asimétrica de cola izquierda y platicúrtica
gracias a los valores negativos tanto de asimetría
como de curtosis (-0,078 y -0,907
respectivamente).
• También podemos observar que la variable
glucemia, sin embargo, dibujaría una gráfica
asimétrica de cola derecha y leptocúrtica, gracias
a sus valores positivos tanto de asimetría como
de curtosis (1,19 y 0,31 respectivamente).

3.1. En este caso, accedemos en R commander a
«estadísticos»- «resúmenes»- «distribución de
frecuencias».

3.2.Seleccionamos las 2 variables cualitativas
sobre las que queremos saber sus frecuencias.

3.3.Aceptamos y observamos las
frecuencias de ambas variables.

4.1.1.Glucemia (Histograma): Accedemos
en R commander a «gráficas»-
«histograma».

Seleccionamos la variable glucemia
para crear nuestra gráfica.

4.1.2.Glucemia (Diagrama de caja): Accedemos
en R commander a «gráficas»- «diagrama de
caja»

4.2.1.Edad (Histograma): Realizamos un proceso similar
que con el histograma de la variable glucemia, pero
elegimos la variable edad. Este sería el resultado:

4.2.2.Edad (Diagrama de caja): Realizamos un proceso parecido
al del diagrama de caja de la variable glucemia, pero elegimos la
variable edad. Este es nuestro resultado:

4.3.1.Sexo (gráfica de sectores): Accedemos en R
commander a «gráficas»- «gráfica de sectores».

Seleccionamos la variable sexo para
crear nuestro diagrama.

Aceptamos y observamos los
resultados.

4.4.1. Cabello (gráfica de barras): Accedemos en
R commander a «gráficas»- «gráfica de barras».

Seleccionamos la variable cabello para
crear nuestra gráfica.

Aceptamos y observamos nuestro
resultados.

5.1. Accedemos desde R commander a
«gráficas»- «histograma».

5.2. Seleccionamos la variable glucemia y en
«gráfica por grupos» seleccionamos la variable
sexo.

5.3.Aceptamos y vemos la relación
entre varias variables en el gráfico.

5.4. Analizamos la gráfica.
• Como podemos apreciar, aparte de que hay
un mayor número de mujeres que de hombres
en nuestra muestra, las mujeres presentan
con mayor frecuencia un nivel de glucemia
más alto que los hombres, por lo que podría
indicarnos que son más propensas a sufrir
diabetes o no controlar esta (ya que los
niveles de glucemia se encuentran bastante
elevados en algunas mujeres y no tanto en los
hombres).

6.1.Accedemos en R commander a
«estadísticos»- «tablas de contingencia»- «tabla
de doble entrada».

6.2. Seleccionamos las dos variables de
nuestra tabla de doble entrada: sexo y
cabello.

6.3.Aceptamos y vemos nuestra tabla
en R commander.

Trabajo tic seminario 6.1

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (8)

Similar a Trabajo tic seminario 6.1

Similar a Trabajo tic seminario 6.1 (20)

Último

Último (20)

Trabajo tic seminario 6.1