2. DISTRIBUCION DE FRECUENCIAS
La distribución de frecuencias es un resumen tabular en el que los datos se presentan en
agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente.
En una tabla de distribución de frecuencias, de una serie de datos, se muestra el número de
observaciones llamado frecuencia de determinada variable dentro de un grupo específico.
La tabla de distribución de frecuencias proporciona pistas acerca de las características de la
población sujeta a estudio.
Además permite realizar cálculos posteriores para el análisis de los datos.
Al agrupar o condensar en tablas de distribución de frecuencias, el proceso del análisis e
interpretación de los datos se hace mucho más manejable y significativo
3. TABLA DE DISTRIBUCION DE FRECUENCIAS
La tabla de distribución de frecuencias, está compuesta por los siguientes
elementos:
Rango.
Número de clases o intervalos.
Ancho de clase o intervalo.
Limites aparentes y reales.
Frecuencias.
Marcas de clase.
4. RANGO
Llamado también recorrido, indica la amplitud de la
ubicación numérica del conjunto de datos.
Es la diferencia que existe entre el mayor y el menor de
los datos:
R = Dato mayor - Dato menor
5. B) NUMERO DE CLASES O INTERVALOS (K)
El número de agrupamientos de clase a utilizar depende principalmente del número de observaciones
en los datos, es decir, un número mayor de observaciones requiere un número mayor de grupos de
clase o intervalos.
El número de clases debe estar entre 5 y 15. Si no hay suficientes intervalos o si hay demasiados, se
obtendrá poca información.
Una tabla con demasiada concentración de datos no es significativa, lo mismo sería cierto en el otro
extremo, si una tabla tuviera demasiados intervalos, habría una subconcentración de datos, y se
sabría muy poco.
Para determinar el número de clases se emplea la siguiente relación:
1 + 3.32 • log (n), donde "n" es el número de datos de la muestra.
K = 1 + 3.32 log(n)
6. C) AMPLITUD O INTERVALO DE CLASE (i)
Cada grupo denominado también clase, debe poseer un tamaño o amplitud.
A esta amplitud se le denomina intervalo y es representado por “i”.
Si se desea que cada grupo o clase posea igual intervalo, el rango debe ser dividido entre el número de grupos
que se desea formar, entonces, el tamaño o anchura del intervalo o clase viene dado por
i = Rango / No. de clases
o sea i = R/K
Para estudiar un hecho en el que la amplitud de la población es grande, se definen los intervalos de clase.
Estas clases pueden tener una amplitud constante o variable; así por ejemplo, si se trata de estudiar la estatura
de un grupo de estudiantes universitarios, una vez elegida la muestra, es conveniente dividir en clases las
estaturas de los alumnos investigados, los cuales se pueden clasificar de la siguiente forma:
Menos de 160 cm
De 160 a 170 cm
De 170 a 180 cm
Igual o mas de 180 cm
7. C) AMPLITUD O INTERVALO DE CLASE (i)
Se observa que la primera y última clase tienen amplitud desconocida,
mientras que las otras dos tiene una amplitud de 11 cm.
Los límites son160 cm, 170 cm y 180 cm.
Se llaman límites del intervalo a los valores extremos de dicho intervalo.
Por ejemplo, dado el intervalo del ejemplo anterior 160-170 cm, diremos
que 160 cm es el extremo inferior y que 170 cm es el extremo superior.
Sin embargo, resulta un poco confuso pensar que los extremos son valores
que se incluyen en dos intervalos de clase; para que esto no suceda, es
necesario considerar únicamente el extremo inferior en cada intervalo,
mientras que el superior se considera incluido en el siguiente intervalo o
viceversa.
8. d) LIMITES APARANTES (La)
Todo intervalo está formado por dos límites de clase o límites aparentes, un
limite inferior y un limite superior.
Los límites aparentes se utilizan para evitar ambigüedad en la clasificación
por intervalos.
Por ejemplo, de las estaturas anteriores se tiene: menos 160 a 169, de 170
a 179, igual o más de 180 cm.
9. e) LIMITES REALES DE CLASE (Lr)
Debido a la discontinuidad que existe entre los grupos, conviene lograr que, donde
finalice un grupo comience el siguiente, con lo cual se obtendrán nuevos límites a
los cuales se les denomina límites reales o verdaderos y se obtienen encontrando
el punto medio de el límite aparente superior de un grupo y el límite aparente
inferior del siguiente grupo.
También pueden calcularse a partir de los límites aparentes considerando que:
Si los limites son numeros enteros, entonces, restar 0.5 al limite inferior y
sumar 0.5 al limite superior
Si los límites no son números enteros, se debe restar y sumar a los
intervalos de clase 0.05 si tienen un solo decimal, 0.005 si tienen dos
decimales, 0.0005 si tienen tres decimales, etc
10. f) MARCAS DE CLASE (Xi)
Son los puntos medios de cada intervalo y son los
valores usados para representar todos los datos
resumidos en un intervalo particular.
11. EJEMPLO
Si los limites de intervalo son 160 – 169, entonces los limites reales
serán:
159.5 – 169.5
Y la marca de clase es
(160 + 169)/2 = 164.5
13. FRECUENCIA ABSOLUTA O DE INTERVALO (fi)
La frecuencia absoluta es la que indica cómo están
distribuidos los datos en cada grupo, es decir, cómo está
repartida la cantidad total de datos entre los grupos.
Indica cuantos datos posee el primer grupo, el segundo
grupo, el tercero,...
14. FRECUENCIA RELATIVA (fr)
La frecuencia relativa es la proporción entre la frecuencia de un intervalo y el número total de datos,
es decir, el valor de una fracción cuyo numerador es la frecuencia absoluta y cuyo denominador es el
número de individuos de la población.
La frecuencia relativa está comprendida siempre entre 0 y 1 y está dada por:
15. FRECUENCIA REALTIVA (f%)
Si la frecuencia relativa la expresamos mediante porcentajes, encontramos la frecuencia porcentual.
Se calcula multiplicando por 100 el valor de la frecuencia relativa.
La frecuencia porcentual está comprendida lógicamente entre 0 y 100 y esta dada por:
El uso de la frecuencia relativa o porcentual se vuelve esencial siempre que una serie de
datos se compara con otras series de datos.
Especialmente si difiere el número de observaciones en cada serie de datos.
16. FRECUENCIA ACUMULADA ABSOLUTA (Fa)
La frecuencia acumulada identifica el número de observaciones
acumuladas en cada grupo.
Se calcula a partir de las frecuencias absolutas ya que estas
proporcionan la suma de las repeticiones anteriores a un
intervalo determinado
17. FRECUENCIA ACUMULADA RELATIVA (Fr)
La frecuencia acumulada relativa es el cociente entre la frecuencia acumulada y el número total de
datos observados, con lo que se obtiene la suma de las frecuencias relativas de las repeticiones
anteriores a ésta.
Se calcula de la siguiente forma:
18. EJEMPLO 1 (Distribucion de frecuencias con enteros)
Los puntos obtenidos por un grupo de 40 estudiantes en el curso de
Física son:
Calcular:
a) Namero de clases.
b) Rango.
c) Intervalo.
d) Distribución de frecuencias
19. SOLUCION
a) El numero de grupos o clases a formar esta dado por
K = 1 + 3.32 log 40
= 1 + 3.32 (1.60206)
= 1 + 5.3188 = 6.3188
Aproximadamente tenemos que usar 6 ó 7 intervalos o clases
b) El rango se calcula de la siguiente manera:
R = Dato Mayor – Dato menor
R = 98 – 20
R = 78
c) Intervalo
i = 78/6.3188
i = 12.3440
Como los datos son números enteros se aproxima “i” al entero más cercano, entonces:
i = 12
20. SOLUCION
d) Los intervalos se calculan iniciando del dato menor ( se puede iniciar cualquier numero menor que el valor mínimo, sin
embargo, es usual que el primer limite de la tabla de distribución de frecuencias sea el mínimo) (20).
Los datos se muestran en la tabla 2.1.
El primer intervalo de la tabla es 20 – 31
Tabla 2.1. Ejemplo de un grupo de 40 estudiantes de Física.
21. SOLUCION
Frecuencias absolutas
Para calcular las frecuencias hacemos un conteo del numero de datos que pertenecen a cada intervalo.
El procedimiento puede ser:
Ordenando los datos en forma ascendente o descendente
Contando cuantos valores hay en cada intervalo, es decir de 20 a 31 hay 2, de 32 a 43 hay 7, etcétera.
O bien por cada dato del grupo original marcamos mediante una línea en el intervalo al que pertenece, como
se ilustra a continuación
23. EJEMPLO 2 DISTRIBUCION DE FRECUENCIAS
Los siguientes datos son kilómetros por galón que registraron 30 vehículos en un recorrido de 100 km
por la ciudad.
Construir una tabla de distribución de frecuencias que contenga:
a) Frecuencias relativas (fr).
b) Frecuencias acumuladas absolutas (Fa).
c) Límites reales.
24. SOLUCION
Se procede como en el ejemplo anterior, de la siguiente manera:
Rango= 37.1 - 16.4 = 20.7
Número de grupos o clases “K”
K =1 + 3.32 * log 30
= 1 + 3.32 * 1.47712
K = 1 + 4.9040 = 5.904
Tamaño del intervalo = i = 20.7 / 5.9040
i = 3.50607
Como se indicó anteriormente se debe aproximar de acuerdo al número de decimales que
tengan los datos originales, come en este caso los datos tienen un decimal, entonces:
i = 3.5
25. SOLUCION
El primer intervalo se construye de la siguiente forma:
De manera que el primer intervalo es 16.4 – 19.8
26. Los Incisos (a) y (b) se muestran en la tabla
Tabla 2.3. Frecuencias absolutas relativas y frecuencia acumulada
absoluta
27. SOLUCION
c) Para el cálculo de los límites reales se procede de la siguiente manera:
También se puede calcular el promedio de la siguiente manera:
Además la diferencia entre el límite real superior e inferior es igual a la amplitud de manera que:
Límite real superior = límite real inferior + amplitud
= 16.35 + 3.5 = 19.85
Los resultados se muestran en la tabla 2.4.
29. OBSERVACIONES PARA LIMITES REALES
1. Cada limite real superior corresponde al limite real
inferior del siguiente intervalo
2. La diferencia entre los limites reales de un intervalo
es igual al tamaño del intervalo “i”.
31. EJEMPLO 3
Los siguientes datos corresponden a los precios de paquetes de servilletas, registrados en 50
diferentes supermercados.
Construir una tabla de distribución de frecuencias que contenga:
a) Frecuencias porcentuales (fr%).
b) Frecuencias acumuladas absolutas relativas (Fr).
c) Límites reales.
d) Marcas de clase.
32. SOLUCION
El procedimiento es el siguiente:
1. Se calcula el rango:
R = Dma - Dme
R = 5.90 - 3.15 = 2.75
2. Número de grupos o clases a formar
K =1 + 3.32 * log50
= 1 + 3.32 * 1.69897
K = 6.64058
3. Tamaño del intervalo
i =2.75 / 6.64058
i = 0.41412
Como se indicó anteriormente se debe aproximar de acuerdo al número de decimales que tengan los
datos originales, como en este caso los datos tienen dos decimales, entonces:
i = 0.41
33. Los incisos a y b se muestran en la siguiente tabla
Tabla 2.5 Frecuencias absolutas porcentuales y frecuencias relativas
34. “LIMITES APARENTES”
El primer intervalo se construye de la siguiente forma:
Limite aparente inferior: 3.15;
De manera que el primer intervalo es 3.15 - 3.55.
Los incisos a y b se muestran en la siguiente tabla.
Aproximación para
datos con dos decimales
Ancho del intervalo
35. CALCULO DE “LIMITES REALES”
c) Para el cálculo de límites reales se procede de la siguiente manera:
Limite real inferior = Lri =3.15 - 0.01/2 = 3.145
Limite real superior = Lrs = 3.55 + 0.01/2 = 3.555
36. SOLUCION “MARCAS DE CLASE”
d) Para calcular las marcas de clase se realiza el siguiente procedimiento
X1 = Lai + Las = Lri + Lrs
2 2
X1 = 3.15 + 3.55 = 3.35
2
Los Resultados se muestran en la tabla 2.6.
37. Tabla 2.6. Limites Aparentes, Limites Reales y marcas de clase del
Ejemplo