1. Informe de Estadística Descriptiva
1.-Realiza el análisis descriptivo numérico de dos variables cuantitativas y otras dos
variables cualitativas.
2.-Realiza el análisis descriptivo mediante gráficos de las cuatro variables,
empleando en cada caso un tipo de gráfico diferente.
3.- Observa e interpreta los resultados obtenidos en los apartados anteriores.
¿Cómo se distribuyen los valores de las variables seleccionadas? ¿Cómo es la
muestra estudiada?
Introducción: ¿Qué es la estadística descriptiva?
La estadística descriptiva es la técnica matemática que obtiene, organiza, presenta
y describe un conjunto de datos con el propósito de facilitar su uso generalmente
con el apoyo de tablas,medidas numéricas o gráficas. Ésta utiliza las medidas de
frecuencia y las variables, que pueden ser cualitativas o cuantitativas.
Para las variables cuantitativas utilizamos las medidas de tendencia central, que nos
permiten conocer el centro de una distribución de datos cuantitativos. Pueden ser:
- Moda: es el valor con mayor frecuencia en una distribución de datos.
- Mediana: representa el valor de la variable de posición central en un conjunto
de datos ordenados.
- Media:es el valor característico de una serie de datos cuantitativos, se
obtiene a partir de la suma de todos sus valores dividida entre el número de
sumandos. La más utilizada.
También podemos usar las medidas de dispersión, que permiten cuantificar la
variabilidad o la dispersión de las distintas puntuaciones de los datos, pueden ser:
- Rango: es el intervalo entre el valor máximo y el valor mínimo.
- Varianza:es la esperanza del cuadrado de la desviación de dicha variable
respecto a su media.
- Desviación típica: es la raíz cuadrada de la varianza y sirve para eliminar las
unidades al cuadrado de esta.
También se usan las medidas de posición, como los cuartiles, los deciles y los
percentiles.
Las variables cuantitativas pueden ser continuas (tienen un número infinito de
valores entre dos valores cualesquiera) o discretas (siempre es numérica).
Para las variables cualitativas se ordenan según el número de categorías en
dicotómicas o politómicas, y según el orden de jerarquía en nominales u ordinales.
Análisis de variables cuantitativas
Vamos a proceder a analizar dos variables cuantitativas del conjunto de datos
“ActivosSalud.RData”. En este caso seleccionamos las variables “altura” y “peso”.
2. Cuando en Rcommander, con la variable “altura” seleccionamos Resúmenes
numéricos del menú Estadísticos, podemos observar estos datos:
Media: 1,667
Desviación típica (sd): 0,08078101
Índice intercuartílico (IQR): 0,12
Mínimo (0%): 1,46
Q1 (25%): 1,6
Q2 (50%): 1,655
Q3 (75%): 1,72
Máximo (100%): 2
N: 290
NA: 1
En el caso de la variable “peso”, realizando los mismos pasos, obtenemos esto:
Media: 62,75571
Desviación típica (sd): 12,65981
Índice intercuartílico (IQR): 14
Mínimo (0%): 38
Q1 (25%): 54
Q2 (50%): 60
Q3 (75%): 68
Máximo (100%): 130
N: 275
NA: 16
3. A continuación, representamos ambas variables gráficamente.
Con la altura utilizamos un histograma:
La mayoría de las personas tratadas en el estudio responden a una altura de 1,6-1,7
cm, siendo de 1,9-2,0 la minoría.
En la variable peso, utilizamos un diagrama de cajas:
4. Podemos observar como la línea que señala el mínimo corresponde con 40, Q1 con
50, la mediana con 60, Q2 con 70 y el máximo con 90.
Análisis de variables cualitativas
Vamos a analizar dos variables cualitativas, en este caso cogemos “refrescos” y
“verduras”.
5. Para representar gráficamente la variable “verduras” utilizamos un diagrama de
barras:
Como podemos ver, la mayoría de encuestados consumen verduras “tres o más
veces a la semana pero no a diario” y la minoría “nunca o casi nunca”.
Para representar gráficamente la variable “refrescos” utilizamos un diagrama de
sectores:
6. Como vemos, la mayoría de encuestados responden que consumen refrescos
“menos de una vez a la semana” y “nunca”, ambos valores están igualados, y una
minoría responde “a diario”.