Este documento presenta los conceptos básicos de estadística descriptiva para la organización y resumen de datos cualitativos y cuantitativos mediante tablas y gráficos. Explica cómo construir tablas de frecuencias absolutas y relativas para datos cualitativos, así como tablas de frecuencias, histogramas y ojivas para datos cuantitativos. Además, detalla los pasos para definir clases e intervalos y elaborar distribuciones de frecuencias para la organización de datos numéricos.
2. INTRODUCCIÓN
Los datos se clasifican en cualitativos y
cuantitativos.
Para resumir un conjunto de datos se usan tablas y
gráficos.
Para la elaboración de tablas y gráficos se debe
emplear el software adecuado: Excel y Minitab.
3. RESUMEN DE DATOS
CUALITATIVOS
• Distribución de frecuencia
• Distribuciones de frecuencia relativa y porcentual
• Gráficas de barras y circulares
6. DISTRIBUCIONES DE FRECUENCIA
RELATIVA Y FRECUENCIA PORCENTUAL
La frecuencia relativa de una clase es la fracción o
proporción de elementos que pertenecen a cada
clase.
Donde n es el número total de elementos
7. EJEMPLO:
Para calcular la frecuencia relativa de la Coke Classic
se divide 19 entre 50: 19/50=0,38. Lo que implica que
el 38% de los elementos corresponden a esta clase.
8. GRÁFICAS DE BARRAS Y CIRCULARES
Del ejemplo anterior, la gráfica de barras:
10. NOTAS:
Los expertos estadísticos recomiendan que las
clases con frecuencias menores se agrupen en una
clase agregada llamada: otros (frecuencias
menores a 5%)
La suma de frecuencias relativas es siempre igual
a 1.
16. RESUMEN DE DATOS
CUANTITATIVOS
• Distribución de frecuencia
• Distribución de frecuencia relativa y frecuencia porcentual
• Diagrama de puntos
• Histograma
• Distribuciones acumuladas
• Ojiva
17. DISTRIBUCIÓN DE FRECUENCIA
Los 3 pasos para definir las clases de una
distribución de frecuencia con los datos cuantitativos
son:
1. Determinar el número de clases que no se
superponen.
2. Definir el ancho de cada clase.
3. Determinar los límites de clase.
18. PASO 1: NÚMERO DE CLASES
Se recomienda usar entre 5 y 20 clases.
El número de clases (k) debe ser el menor número
entero tal que 2k > n, donde n es el número de
elementos (existen otros métodos).
Por ejemplo, si el número de elementos es 50;
entonces buscamos la potencia de 2 menor y más
cercana a ese valor: 26 > 50. En consecuencia k=6;
es decir, se emplearán 6 clases.
19. PASO 2: DEFINIR EL ANCHO DE CADA CLASE
Es recomendable que sea el mismo para todas.
El ancho de clase o tic (tamaño del intervalo de
clase) se calcula:
Donde H: máximo valor y L: mínimo valor
El valor del tic se redondea por exceso; es decir, si
los datos tienen una cifra decimal y el tic=3,345
entonces se usa tic=3,4
20. PASO 3: DETERMINAR LOS LÍMITES DE CADA
CLASE
Deben elegirse de modo que cada elemento pertenezca
a una y solo una clase.
Para la primera clase, el límite inferior es el dato menor
de los elementos.
Para cada clase el límite superior se calcula: LSn
= LIn + tic
Cuando los datos son discretos se emplean
representaciones simples como: 12 – 18; 19 – 25; etc.
Cuando los datos son continuos se suelen emplear
intervalos como: [2,3;4,5[; [4,5;6,7[; etc. Aunque, a
veces dichos intervalos se representan como: 2,3 – 4,5;
4,5 – 6,7; etc.; los cuales deben interpretarse de la
misma forma (cerrado el límite inferior y abierto el límite
superior).
21. NOTAS:
El punto medio de clase o marca de clase, es el
valor medio entre los límites superior e inferior de
cada clase; es decir, se obtiene de la semisuma de
dichos valores.
Por ejemplo, si un intervalo de clase es 15 – 21; la
marca de clase sería igual a (15+21)/2 = 18
La distribución de frecuencia relativa y frecuencia
porcentual para datos cuantitativos se elabora de la
misma forma que en la tabla de frecuencias para
datos cualitativos.
22. EJEMPLO:
Elabora la tabla de distribución de frecuencias para
los siguientes datos:
Se tomaron los tiempos que demoran los
trabajadores de una empresa en realizar el
empaquetado de un producto en una línea de
producción (en segundos).
10.8 12.5 15 15.8 15.8 14.6 14 15 18 20
15.4 16.4 15.9 16.4 16.8 19 20.4 22 24 25.4
18 16.8 18.4 18.4 21.5 20.3 25.8 30.2 30.4 32.5
25.4 26.2 28.4 29.2 35.4 36.4 38.4 39.2 38.8 40
24. DIAGRAMA DE PUNTOS
Ejemplo: De una muestra de 20 clientes de la
auditora Pricewaterhousecoopers (pwc), se obtuvo:
El diagrama de puntos correspondiente sería:
25. HISTOGRAMA
Gráfico que se elabora para datos previamente
resumidos.
La variable de interés se coloca en el eje horizontal
y la frecuencia (absoluta o relativa) en el eje
vertical.
Del ejemplo anterior:
28. DISTRIBUCIONES ACUMULADAS
En lugar de indicar la frecuencia de cada clase,
muestran el número de elementos con valores
menores o iguales que el límite superior de
cada clase.
30. OJIVA
Es la gráfica de una distribución acumulada.
Muestra los valores de los datos en el eje
horizontal, y las frecuencias absolutas acumuladas
o relativas acumuladas, sobre el eje vertical.
40. BIBLIOGRAFÍA
Anderson, Sweeney, Williams (2012). Estadística
para Negocios y Economía (11° Ed.). Estadística
Descriptiva: Presentaciones tabulares y gráficas
(pp. 31-48) México. CENGAGE Learning.
Estadística para los Negocios: Organización de
datos (2013). Universidad San Ignacio de Loyola.