1. Se nos proporcionaba un histograma con el cual íbamos a trabajar, para poder:
1. Desarrollar la tabla de distribución de frecuencias para este grupo, denominado C.
2. Calcular de esta representación gráfica, las medidas de tendencia central (media,
mediana y moda) y las de dispersión (varianza, desviación estándar y coeficiente de
variación).
3. Al final debíamos comparar los resultados de esas medidas entre los grupos A, B y C
para determinar ¿Cuál de los grupos presenta mayor dispersión? Lo que indicaría en
cual su media es menos representativa y por ende más heterogéneo.
1. Por tanto, hablemos del desarrollo de la tabla de distribución de frecuencias.
¿Cómo se elabora una tabla de distribución de frecuencias a partir de un histograma?
¿Qué se necesita?
2. La tabla requiere:
✓ Un rango (para saber de dónde a donde tabular)
✓ Determinar el número de intervalos para la tabla
✓ Calcular amplitud para definir el tamaño o el ancho que tendrán los intervalos, para
poder separar las clases
Uno puede pensar que se requieren formulas o cálculos muy especiales para ello, sin embargo,
no es así…
Antes de comenzar con los requerimientos…
En primer lugar, todos los histogramas están construidos a partir de los intervalos reales, por
tanto lo que ves, serán los valores a utilizar directamente en las tablas y servirán también para
sacar las medidas de tendencia central y las de dispersión.
En segundo lugar, muchas de las operaciones iniciales tienen que ver más con el “sentido
común” y con el conocimiento de los conceptos y su origen a la aplicación de fórmulas en sí.
3. Requerimientos para la tabla de distribución de frecuencias
Para determinar el rango de a partir de un histograma, hay que tener en cuenta que:
Debemos revisar los datos con los que contamos:
Frecuencia (asignada)
Clases (nombradas y ordenadas)
Número de intervalos o clases (se denota contando el número de clases)
Marcas de clase (valores centrales de cada intervalo)
Podemos ver el recorrido (aunque los valores de inicio y fin pueden o no representarse)
Para calcular el rango y cualquier otro dato, requerimos forzosamente conocer la amplitud,
digamos que la amplitud de los intervalos en suma daría la amplitud total…
Si observamos, la distancia que hay entre una marca de clase y otra es la misma que la que
existe entre un intervalo de clase y otro, esto se debe a la consistencia interna que tiene la
amplitud.
4. Esto también significa que si yo resto una marca de clase con respecto a alguna contigua, su
valor absoluto será la amplitud, válida, tanto para las marcas de clase como para los
intervalos.
5 – 6
6 – 7 etc…
La amplitud es la distancia que hay entre una marca de
clase y otra contigua.
Están a 1 de distancia, por lo que esa es la amplitud, A = 1
Para el rango, basta con sumar la amplitud el número
de clases que se tengan (o multiplicar la amplitud por
en número de clases)…
R = 6para este ejemplo (ten en cuenta que este valor difiere del del ejercicio original,
porque ahora utilizamos “datos reales ya organizados”)
El número de intervalos, ya lo conocemos es un dato “visible” dentro del histograma,
#intervalos es: 6
5. Los tres valores están interrelacionados, por lo que puedes comprobar que hiciste todo
bien, con la fórmula:
Amplitud =
𝑅𝑎𝑛𝑔𝑜
𝑁𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
Sustituyendo: 1 =
6
6
Para determinar los intervalos reales.
Nota que todos los intervalos tienen un ancho de 1.
Ahora, el primer intervalo…
Su marca de clase es de 5, por lo que significa que ese es el valor del centro del intervalo, para
determinar el valor inicial basta con dividir la amplitud entre dos y para el valor inicial restarla,
mientras que para el valor final se sumaría (igual que como se hizo cuando se pasó de intervalos
falsos a verdaderos)
Sería:
1
2
= 0.5
5 – 0.5 = 4.5 (Límite inferior) Y 5 + 0.5 = 5.5 (Límite superior)
6. Todos los demás intervalos se obtienen de la misma forma:
Intervalos reales
7. La tabla de distribución de frecuencias
Clase Intervalo real mi fi Fi
Reprobados 4.5 – 5.5 5 3 3
Deficientes 5.5 – 6.5 6 5 8
Suficientes 6.5 – 7.5 7 8 16
Buenos 7.5 – 8.5 8 7 23
Distinguidos 8.5 – 9.5 9 6 29
Excelentes 9.5 – 10.5 10 2 31
Continuando con el siguiente paso de la tarea…
2. Calcular de esta representación gráfica, las medidas de tendencia central (media,
mediana y moda) y las de dispersión (varianza, desviación estándar y coeficiente de
variación).
8. Medidas de tendencia central
Media
Clase Intervalo real mi fi Fi
Reprobados 4.5 – 5.5 5 3 3
Deficientes 5.5 – 6.5 6 5 8
Suficientes 6.5 – 7.5 7 8 16
Buenos 7.5 – 8.5 8 7 23
Distinguidos 8.5 – 9.5 9 6 29
Excelentes 9.5 – 10.5 10 2 31
𝑿̅ =
(5 ∗ 3) + (6 ∗ 5) + (7 ∗ 8) + (8 ∗ 7) + (9 ∗ 6) + (10 ∗ 2)
31
= 7.4516…
Mediana
Para comenzar el cálculo de la mediana, se toma el total de datos, 31 y se divide entre 2…
15.5 (a buscar en la frecuencia acumulada Fi)
Clase Intervalo
de clase
mi fi Fa
Reprobados 4.5-5.5 5 3 3
Deficientes 5.5-6.5 6 5 8
Suficientes 6.5-7.5 7 8 16
Buenos 7.5-8.5 8 7 23
Distinguidos 8.5-9.5 9 6 29
Excelentes 9.5-10.5 10 2 31
𝑿̅ = 7.45 ∑ = 31
9. Aplicar fórmula
Me = Lme + [
𝒏
𝟐
−𝑭𝒂−𝒊
𝑭𝒎𝒆
] * C
Me = 6.5 + [
𝟑𝟏
𝟐
− 𝟖
𝟖
] * 1 = 7.44
Moda
Para la moda se busca el valor más alto en la frecuencia (en caso de repetirse se realiza el
procedimiento por cada valor repetido)
Clase Intervalo
de clase
mi fi Fa
Reprobados 4.5-5.5 5 3 3
Deficientes 5.5-6.5 6 5 8
Suficientes 6.5-7.5 7 8 16
Buenos 7.5-8.5 8 7 23
Distinguidos 8.5-9.5 9 6 29
Excelentes 9.5-10.5 10 2 31
𝑿̅ = 7.45 ∑ = 31
Clase Intervalo
de clase
mi fi Fa
Reprobados 4.5-5.5 5 3 3
Deficientes 5.5-6.5 6 5 8
Suficientes 6.5-7.5 7 8 16
Buenos 7.5-8.5 8 7 23
Distinguidos 8.5-9.5 9 6 29
Excelentes 9.5-10.5 10 2 31
𝑿̅ = 7.45 ∑ = 31
10. Aplicar fórmula
Mo = Lmo + [
𝑫𝒂
𝑫𝒃+𝑫𝒂
] * C
Mo = 6.5 + [
𝟖−𝟓
𝟖−𝟕 + 𝟖−𝟓
] * 1 = 7.25
Medidas de dispersión
Clase Intervalo
de clase
mi fi Fa
Reprobados 4.5-5.5 5 3 3
Deficientes 5.5-6.5 6 5 8
Suficientes 6.5-7.5 7 8 16
Buenos 7.5-8.5 8 7 23
Distinguidos 8.5-9.5 9 6 29
Excelentes 9.5-10.5 10 2 31
𝑿̅ = 7.45 ∑ = 31
Clase Intervalo
de clase
mi fi Fa (𝒎𝒊 – 𝑿̅) 𝟐
(𝒎𝒊 – 𝑿̅) 𝟐
∗ 𝒇𝒊
Reprobados 4.5-5.5 5 3 3 6.0025 18.0075
Deficientes 5.5-6.5 6 5 8 2.1025 10.5125
Suficientes 6.5-7.5 7 8 16 0.2025 1.62
Buenos 7.5-8.5 8 7 23 0.3025 2.1175
Distinguidos 8.5-9.5 9 6 29 2.4025 14.415
Excelentes 9.5-10.5 10 2 31 6.5025 13.005
𝑿̅ = 7.45
S2 = 1.99
S = 1.41
Cv = 0.19
11. 3. Comparando entre grupos A, B y C determinar: ¿Cuál de los grupos presenta mayor
dispersión?
Grupo A Grupo B Grupo C
𝑿̅ 7.4 𝑿̅ 7.35 𝑿̅ 7.45
𝑺 1.08 𝑺 1.87 𝑺 1.41
Cv 0.15 Cv 0.25 Cv 0.19
Enunciado de discusión
De acuerdo a la información, podemos ver que las medias para los grupos son distintas,
por lo que no basta la desviación estándar para compararlas y saber cual de ellos
representa el más disperso. Para tener mayor certeza, se utiliza el coeficiente de
variación, con lo que porcentualmente sabemos cual grupo es el que tiene mayor
dispersión.
Conclusión
El grupo B con 0.25 tiene la mayor dispersión, sin embargo, a pesar de ello, su media
de 7.35 es representativa y es homogéneo al ser menor de 0.8