Este documento introduce los conceptos básicos de la estadística descriptiva, incluyendo las variables cualitativas y cuantitativas, las medidas de posición central como la media, mediana y moda, y los conceptos de individuo, población y muestra. También describe las tablas de frecuencia y diferentes tipos de gráficos estadísticos. Finalmente, presenta un ejemplo para ilustrar el cálculo de medidas de posición central y la creación de una tabla de frecuencia para un conjunto de datos sobre el peso al nacer de bebés.
1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población,
altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer
conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de
la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser
1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo
puede ser 80,3 km/h, 94,57 km/h...etc.
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los
alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo:
edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad,
altura y peso de los alumnos de una clase).
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la
altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre
el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población
será el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una
ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy
compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.
Medidas de posición central
Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas
medidas permiten conocer diversas características de esta serie de datos.
Las principales medidas de posición central son las siguientes:
2. 1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media,
siendo las más utilizadas:
Media aritmética o promedio: se calcula multiplicando cada valor por el número de veces que se repite. La
suma de todos estos productos se divide por el total de datos de la muestra:
2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de
valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo
toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).
3.- Moda: es el valor que más se repite en la muestra.
Distribución de frecuencia
La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que
se ha recogido sobre la variable que se estudia.
Tablas de frecuencias
Las tablas de frecuencias sirven para ordenar los datos de una muestra y permitir que se pueda leer la
información en forma más clara. En una tabla de frecuencias encontramos las siguientes simbolizaciones.
n es el tamaño de la muestra
fa es la frecuencia absoluta, que indica la cantidad de veces que ocurre cada valor de la variable en la
muestra.
fr es la frecuencia relativa, que indica la fracción total de la muestra que corresponde a cada valor de la
variable y se calcula mediante la formula
f r=
f
n
fp es la frecuencia porcentual, que indica el porcentaje del total de elementos de la muestra que corresponde
a cada valor de la variable, y se calcula mediante la formula
f p=f r.100
fac es la frecuencia acumulada, que indica la frecuencia absoluta que se acumula hasta esa fila de la tabla.
Gráficos estadísticos.
Gráfico de líneas: se utiliza para analizar la evolución de una variable en el tiempo.
Gráfico circular: se utiliza para analizar la participación de cada categoría de la variable en el total de la
muestra.
Histograma: se utiliza para representar tablas de frecuencias que están expresadas por intervalos.
3. Ventas
1er trim.
2º trim.
3er trim.
4º trim.
Grafico circular
1er trimestre 2do trimestre 3er trimestre 4to trimestre
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Serie 3
Serie 2
Serie 1
Grafico
De lineas
4. 1er trimestre 2do trimestr 3er trimestre 4to trimestre
0
1
2
3
4
5
6
Serie 1
Serie 2
Serie 3
Histograma
VEAMOS UN EJEMPLO:
En la provincia se quiere saber cuál es el peso medio de los bebes al nacer. Los siguientes son los pesos (en
Kg.) de 25 bebes nacidos en una maternidad durante un mes.
3,1 – 2,8 – 3,1 – 2,5 – 3,2 – 3,1 – 3,9 – 3,9 – 2,8 – 3,1 – 3 – 3,5 – 2,8 – 2,6 – 2,5 – 3,8 – 3,2 – 2,5 – 2,8 – 3,6 –
3,6 – 3,9 – 2,8 – 3,9 – 2,7.
1) En este caso: ¿cuál es la población estadística? ¿Cuál es el individuo? ¿Cuál es la muestra? ¿Cuál es la
variable? ¿Es cualitativa o cuantitativa?
2) Calcula la media, la mediana y la moda.
3) ¿Para qué se solicitaría esta información? ¿Quiénes son los supuestos interesados?
4) Realiza la grafica correspondiente.
5) Realiza la tabla de frecuencias.
5. Respuestas
1) La población estadística son todos los bebes de la provincia. El individuo en estudio es el bebe. La
muestra son los 25 bebes nacidos en esa maternidad. La variable es el peso de los bebes. Es cuantitativa,
continua y unidimensional.
Para calcular la media sumamos todos los valores del peso que se obtuvo en la muestra y lo dividimos por 25
(cantidad de bebes nacidos)
2,5 – 2,5 – 2,5 – 2,6 – 2,7.– 2,8 – 2,8 –2,8 – 2,8 – 2,8– 3 – 3,1 –3,1 –3,1 – 3,1– 3,2 –3,2 –3,5–3,6 – 3,6 – 3,8
– 3,9 –3,9 –3,9 –3,9
3 . 2,5 + 2,6 + 2,7 + 5 . 2,8 + 3 + 4 . 3,1 + 2 . 3,2 + 3,5 + 2 . 3,6 + 3,8 + 4 . 3,9
Moda = = 3,14 kg
25
Quiere decir que el peso promedio de los bebes es 3,14 kg.
La mediana en este caso es 3,1 kg ya que es el valor de la serie que se ubica en el centro de la muestra.
La moda es 2,8 Kg por ser el valor que se repite más veces.
3) Puede tener varias respuestas. Una de ellas puede ser para controlar el tema de la mortalidad infantil,
desnutrición, alimentación de la madre en el embarazo, etc
4) El mayor interesado en este caso será el Estado Provincial que debe trabajar en la prevención de estas
situaciones. Pueden existir otras respuestas.
2.5 2.6 2.7 2.8 3 3.1 3.2 3.5 3.6 3.8 3.9
0
1
2
3
4
5
6
Peso de bebes
peso de los bebes (en Kg)
cantidad de bebes
Datos otorgados por la maternidad.
Peso de los bebes
(Kg)
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
Frecuencia
acumulada
2.5 3 0.12 12% 3
2,6 1 0.04 4% 4
2,7 1 0.04 4% 5
2,8 5 0.2 20% 10
3 1 0.04 4% 11
3,1 4 0.16 16% 15
3,2 2 0.08 8% 17
3,5 1 0.04 4% 18
3,6 2 0.08 8% 20
3,8 1 0.04 4% 21
3,9 4 0.16 16% 25
totales 25 1 100% ----------