1. Maestría en gerencia logística
cateDra De técnicas cUantitatiVas De gestiÓn
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS
MSc. Alexander A. Nuñez
Economista
Facilitador de la Asignatura
OCTUBRE 2012
3. Maestría en gerencia logística
•Las tablas de distribución de frecuencias se utilizan
cuando se recolectan datos, con ellas se pueden
representar los datos de manera que es más fácil
analizarlos.
•Se pueden elaborar tablas de distribución de
frecuencias para datos no agrupados y para datos
agrupados. Estas últimas se utiliza cuando se tienen
muchos datos.
4. Maestría en gerencia logística
DE INTERÉS ESTADISTICO PARA LA TOMA DE DECISIONES
Entre 1994 y 1999 el número de teléfonos móviles vendidos en todo el
mundo se disparó de 26 millones a casi 300 millones. En ese mismo momento, la
tecnología cambio del analógico al digital. Motorola, líder mundial del sector de
telefonía móvil en 1997, se perdió el cambio a la tecnología digital por tan sólo uno o
dos años. En ese breve tiempo, Nokia, una empresa hasta entonces desconocida,
situada cerca del Circulo Polar, se convirtió en la número uno mundial.
Una década antes Nokia había estado haciendo neumáticos y botas de
goma; de repente, era una de las empresas de alta tecnología con mayor
crecimiento en Europa. Para Motorola, recuperar su posición de líder va a ser una
tarea difícil.
5. Maestría en gerencia logística
DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS
Cuando disponemos de cierto número de datos de alguna variable
cuantitativa, bien sea ésta discreta o continua, con el objeto de analizarlos es necesario
organizarlos de alguna manera, por ejemplo, ordenarlos en forma creciente o
decreciente con lo cual obtendremos una serie estadística ordenada.
Ejemplo: Se dispone de los datos de treinta familias y su correspondiente número de
hijos:
2,3,2,1,3,3,0,1,3,2
2,2,3,4,0,2,3,1,0,4
2,2,3,1,1,2,0,1,2,3
Con estos datos construimos una tabla del número de familias, ordenadas
de acuerdo al número de hijos:
6. Número de Hijos Recuento de Familias Número de Familias
0 IIII 4
1 IIIIII 6
2 IIIIIIIIII 10
3 IIIIIIII 8
4 II 2
La columna número de hijos, constituyen las clases de la variable “X”, que
puede tomar valores desde X1=0 hasta X5= 4.
El número de familias de cada clase constituye su frecuencia absoluta, o sea
el número de observaciones que corresponde a cada clase. Así, a la clase 0
corresponden 4 frecuencias, a la clase 1 corresponden 6 frecuencias, etc..
Esta tabla de manera simplificada la podemos representar de la siguiente manera:
Xi fi
0 4
1 6
2 10
3 8
4 2
30
7. Maestría en gerencia logística
A esta tabla le damos el nombre de “Distribución de Frecuencias” de
datos agrupados. Este tipo de tablas se utiliza cuando el número de valores que
toma la variable es pequeño y la variable es de tipo discreto, tal como el
presente ejemplo.
En el caso de que el número de valores que toma la variable es grande y la
variable es de tipo continuo, se utiliza la tabla de distribución de frecuencias
agrupadas con intervalos de clases.
En la presentación de este tipo de tablas, donde aparecen las clases y las
frecuencias absolutas, se suelen agregar las frecuencias relativas y las frecuencias
acumuladas, las cuales son necesarias para un análisis más completo de la
distribución.
La frecuencia relativa de una clase no es más que la razón o cociente que
resulta de dividir la frecuencia absoluta de dicha clase por el número total de
frecuencias.
La frecuencia acumulada de una clase se determina sumándole a su
frecuencia absoluta las frecuencias absolutas de las clases anteriores. En el caso de
la primera clase, la frecuencia absoluta será igual a la frecuencia acumulada.
8. Maestría en gerencia logística
Xi fi hi Fi Hi
0 4 0,13 4 0,13
1 6 0,20 10 0,33
2 10 0,33 20 0,67
3 8 0,27 28 0,93
4 2 0,07 30 1,00
30 1,00
En la columna de frecuencias relativas (hi) podemos leer que el 13,3%
de las familias no tienen hijos ; el 20% tiene 1 hijo, el 33% tiene 2 hijos y así
sucesivamente.
En la columna de frecuencias acumuladas (Fi) podemos leeer que 10
familias tienen 1 hijo o ninguno; 20 familias tienen 2 hijos o menos, 28 familias
tienen 3 hijos o menos y así sucesivamente.
9. Maestría en gerencia logística
DITRIBUCIÓN DE FRECUENCIAS CON
INTERVALOS DE CLASES
10. Maestría en gerencia logística
Cuando los datos disponibles son muy numerosos y los valores
correspondientes difieren poco entre sí en cuanto a su magnitud; es conveniente
agruparlos en varias clases, para lo cual se divide el recorrido o intervalo total de
variación en intervalos más pequeños, que son los llamados intervalos de clases. En
base a dichos intervalos se hace el recuento de las frecuencias absolutas.
Veamos el procedimiento con el siguiente ejemplo:
Disponemos de los salarios de 80 obreros de cierta fábrica que aparecen en
la siguiente tabla ordenadas de menor a mayor.
Dichos salarios se corresponden con una muestra de lo que devengaba un
obrero diariamente en la década de los años cincuenta, relativamente bajos pero con
poder adquisitivo. Esta serie por contener valores bajos nos permite realizar
fácilmente los cálculos que se requieren para calcular las distintas medidas de una
distribución de frecuencias.
11. Maestría en gerencia logística
35 50 57 64 70 74 80 87
38 50 58 65 70 75 80 88
44 50 59 65 70 75 80 88
45 51 60 66 70 75 81 89
45 53 60 67 70 76 82 90
46 53 60 67 70 77 84 90
46 55 61 68 72 78 84 93
48 55 62 69 73 79 85 94
48 56 63 70 74 80 86 95
49 57 64 70 74 80 86 105
En dicha tabla observamos un salario mínimo de Bs. 35 y un salario máximo
de Bs. 105. Todos los demás salarios están comprendidos entre esos dos valores. La
diferencia entre el valor del salario máximo y del salario mínimo constituye el
intervalo total de variación de la variable.
12. Maestría en gerencia logística
Este intervalo total o recorrido lo vamos a dividir en intervalos más pequeños,
que llamaremos intervalos de clases, y en base a los cuales hacemos el recuento de
frecuencias absolutas, correspondientes a cada intervalo.
Entonces vemos a describir el procedimiento para construir la distribución de
frecuencias de tipo continuo que agruparía a los datos de tabla anterior, de acuerdo a
los conceptos y orden siguientes:
1.- El intervalo total de variación o recorrido.
Hemos dicho que el intervalo total lo determinamos tomando en cuenta el
valor del salario máximo y el del salario mínimo y estableciendo la diferencia entre
ellos:
Intervalo Total= 105-35 = 70
13. Maestría en gerencia logística
2.- Elección del Intervalo de Clases
El número de clases que tenga la distribución dependerá del tamaño del
intervalo de clase, ya que:
Intervalo Total / Intervalo de Clase = Número de Clases
El tamaño o amplitud de dicho intervalo debe ser tal que no haya ni
excesivas clases ni muy pocas. Si hay demasiadas clases es posible que algunas de ellas
no tengan frecuencias o tengan muy pocas, y sin son pocas clases las frecuencias
pueden quedar muy comprimidas, perdiéndose alguna valiosa información de la
manera cómo se distribuyen los datos.
Con relación a esto, no hay ninguna ley que nos diga cuál es el intervalo de
clases más conveniente y sólo dependerá de la experiencia que tenga la persona y el
número de observaciones y sus correspondientes valores. Entonces de acuerdo al
estudio de los datos se puede probar con uno u otro intervalo de clases para ver si nos
da una distribución aceptable. También existe una regla práctica, la llamada Regla de
Sturges, la cual nos puede indicar de manera aproximada el tamaño del intervalo de
clases a usar, y que obedece a la siguiente fórmula.
14. Maestría en gerencia logística
Intervalo de Clases (ic) = Intervalo total / 1 + 3,322 log N
Donde “N” es el número total de observaciones o frecuencias.
Aplicando esta fórmula al presente ejemplo, tendremos:
Ic = 105-35 / 1+ 3,322 Log 80
Ic = 70 / 1 + 3,322 x 1,9030
Ic= 70 / 1 + 6,32
Ic = 70 / 7,32
Ic = 9,59
Podemos redondear este resultado, de tal forma que Ic = 10
15. Maestría en gerencia logística
3.- Número de Clases
El número de clases queda determinado por el valor de Ic, si es que se
trata de tomar un Ic igual para todas las clases. Esto es lo que se hace
generalmente, pero a veces es conveniente usar clases con intervalos de distintos
tamaños. En el presente ejemplo, el número de clases será:
Nro. de Clases = Intervalo total / Intervalo de Clases = 70 / 10 = 7
O sea que la distribución constará de 7 clases.
4.- Límites de las Clases
Para fijar los límites inferior y superior de cada clase, comenzamos por el
valor mínimo de la serie o por un valor próximo a él, pero no menor.
Si partimos del valor 35, como la amplitud del intervalo de clases es igual a
10, y como todas las clases tienen la misma amplitud obtendremos la siguiente tabla.
17. Maestría en gerencia logística
6.- Recuento de Frecuencias
El recuento de frecuencias se realiza asignándole a cada clase, el número
de observaciones cuyos valores estén comprendidos entre los límites superior e
inferior de cada clase. Así, observamos que a la primera clase corresponden 3
observaciones, a la segunda 13 observaciones, etc.
19. Maestría en gerencia logística
BIBLIOGRAFÍA CONSULTADA
•JOHNSON Robert y KUBY Patricia. Estadística elemental, lo esencial. 2°
edición. International Thomson Editores S.A.
•CHAO Lincoln L. Estadística para las ciencias administrativas. Tercera
edición. Editorial Mc Graw Hill.
•PORTUS Lincoyan. Curso práctico de estadística. Editorial Mc Graw Hill.