el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
Clase #5 Histograma.docx
1. Probabilidad y Estadística
Cuando el tamaño de la muestra consta de 30 o más datos, lo
aconsejable es agrupar los datos en clases y a partir de estas,
determinar las características de la muestra y por consiguiente
las de la poblaciòn de donde fué tomada.
𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑁𝑜𝑚𝑏𝑟𝑒
𝑁 ≥ 30 𝐺𝑟𝑎𝑛𝑑𝑒 𝐷𝑎𝑡𝑜𝑠 𝐴𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑁 < 30 𝑃𝑒𝑞𝑢𝑒ñ𝑎 𝐷𝑎𝑡𝑜𝑠 𝑁𝑜 − 𝐴𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
Antes de pasar a definir, cuál es la manera de determinar las
características de interés (media, mediana, moda, etc) cuando
se han agrupado en clases los datos de la muestra, es necesario
que sepamos como se agrupan los datos.
Ejemplo:
Los siguientes datos, se refieren a la medición de diámetros de
engranes en pulgadas (prueba no destructiva), el tamaño de la
muestra es de 40 engranes.
6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00
6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15
Para trazar la gráfica conocida como Histograma o Histograma
de frecuencias, se siguen los siguientes pasos.
2. HISTOGRAMA
El Histograma es una gráfica en forma de barras o rectángulos
verticales, en la cual en el eje de las " 𝑥 " van colocados los límites
de intervalos de clase " 𝐿𝐼𝐶 " y en el eje de las " 𝑦 " van colocadas
las frecuencias de clase " 𝑓𝑖 ".
El Histograma no es una gráfica concluyente, únicamente nos
presenta un panorama del comportamiento, tendencia,
dispersión o aleatoridad que presentan los valores de la muestra.
El procedimiento para trazar el HISTOGRAMA es el siguiente
Paso #1
Determinar el rango de variación de datos " 𝑅𝑉𝐷 ", el cual se
determina restando del valor de la observación máxima el valor
de la observación mínima.
6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00
6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15
𝑅𝑉𝐷 = 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑀á𝑥𝑖𝑚𝑎 − 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑀í𝑛𝑖𝑚𝑎
𝑅𝑉𝐷 = 7.25 − 6.00
𝑅𝑉𝐷 = 1.25
6.00 7.25
𝑅𝑉𝐷 = 1.25
3. La idea consiste en particionar o segmentar dicho rango en
grupos de igual tamaño, donde cada partición recibe el nombre
de clase o grupo.
Supongase que el rango se particiona en 5 grupos o clases, donde
cada grupo será de tamaño 0.25
La observación 6.00 se ubica o agrupa en la clase que inicia, en
este caso en la clase 1.
La observación 6.25 se ubica o agrupa en la clase que inicia, en
este caso en la clase 2
6.00 7.25
𝑅𝑉𝐷 = 1.25
6.25 6.50 6.75 7.00
6.00 7.25
𝑅𝑉𝐷 = 1.25
6.25 6.50 6.75 7.00
6.00 7.25
𝑅𝑉𝐷 = 1.25
6.25 6.50 6.75 7.00
1 2 3 4 5
4. Así sucesivamente, de tal forma que la observación 7.25 no tiene
clase donde ubicarse.
Para evitar que algunas observaciones no encuentren grupo o
clase donde ubicarse, se agranda el " 𝑅𝑉𝐷 " , definiendo el
siguiente término.
Paso #2
Determinar el rango de variación de tabla " 𝑅𝑉𝑇 " el cual consiste
en estirar el rango de variación de datos para que todas las
observaciones se ubiquen dentro de una clase.
En la práctica se sugiere que el rango de variación de tabla no
exceda al valor del rango de variación de datos en un 10%.
𝑅𝑉𝐷 < 𝑅𝑉𝑇 ≤ 1.1 𝑅𝑉𝐷
1.25 < 𝑅𝑉𝑇 ≤ 1.1(1.25)
1.25 < 𝑅𝑉𝑇 ≤ 1.375
1.25 < 𝑅𝑉𝑇 ≤ 1.38
El valor seleccionado de " 𝑅𝑉𝑇 ", es a criterio del usuario, en la
siguiente tablas se registran todos los posibles valores del rango
de variación de tabla de los cuales se selecciona 1
6.00 7.25
𝑅𝑉𝐷 = 1.25
6.25 6.50 6.75 7.00
5. 𝑅𝑉𝑇 = 1.26 𝑅𝑉𝑇 = 1.27 𝑅𝑉𝑇 = 1.28 𝑅𝑉𝑇 = 1.29 𝑅𝑉𝑇 = 1.30 𝑅𝑉𝑇 = 1.31
𝑅𝑉𝑇 = 1.32 𝑅𝑉𝑇 = 1.33 𝑅𝑉𝑇 = 1.34 𝑅𝑉𝑇 = 1.35 𝑅𝑉𝑇 = 1.36 𝑅𝑉𝑇 = 1.37
𝑅𝑉𝑇 = 1.38
El rango de variación de datos original era de 1.25, al seleccionar
el 𝑅𝑉𝑇 = 1.35 quiere decir que se van a agregar 10 𝑐𝑒𝑛𝑡é𝑠𝑖𝑚𝑎𝑠, de
las cuales se pueden agregar 5 centésimas a la izquierda y 5
centésimas a la derecha.
Paso #3
Determinar el número de grupos o clases, en los cuales se va a
particionar el rango de variación de tabla " 𝑅𝑉𝑇 ", llamado el
número de intervalos de clase " # 𝐼𝐶 ".
Existen varios criterios para determinar el número de intervalos
de clase " # 𝐼𝐶 ".
1) Criterio de la raíz cuadrada
# 𝐼𝐶 = √ 𝑛
Donde: 𝑛 [≡] número total de observaciones
Para nuestro caso particular 𝑛 = 40
6.00 7.25
𝑅𝑉𝑇 = 1.35
7.30
5.95
6. # 𝐼𝐶 = √40
# 𝐼𝐶 = 6.32455532
Dado que el número de intervalos de clase debe ser entero
# 𝐼𝐶 = 6
2) Criterio de la fórmula de Sturges
La regla de Sturges, propuesta por Herbert Sturges en 1926,
es una regla práctica acerca del número de clases que deben
considerarse al elaborar un Histograma.
Este número viene dado por la siguiente expresión:
𝑐 = 1 + 𝑙𝑜𝑔2 (𝑀)
Donde " 𝑀 " es el tamaño de la muestra
La expresión anterior puede escribirse a partir de logarítmos
base 10 de la siguiente forma:
𝑐 = 1 +
𝑙𝑜𝑔 (𝑀)
𝑙𝑜𝑔 (2)
𝑐 = 1 +
𝑙𝑜𝑔 (𝑀)
0.301029995
𝑐 = 1 + 3.321928095 𝑙𝑜𝑔 (𝑀)
7. El valor de " 𝑐 " (número de clases) es común redondearlo, si
el entero del resultado previo es “par” se redondea a la alta y
si el entero es “impar” se redondea a la baja.
Para nuestro caso particular 𝑀 = 40
𝑐 = 1 + 3.321928095 𝑙𝑜𝑔 (𝑀)
𝑐 = 1 + 3.321928095 𝑙𝑜𝑔 (40)
𝑐 = 1 + 3.321928095 (1.602059991)
𝑐 = 1 + 5.321928095
𝑐 = 6.321928095
Dado que el entero es “par” se redondea a la alta, es decir
𝑐 = 7
3) Criterio del número de clases de acuerdo al tamaño de la
muestra.
Tamaño de Muestra
(Número de Datos)
Nùmero de Clases
< 50 5 𝑎 7
50 𝑎 99 6 𝑎 10
100 𝑎 250 7 𝑎 12
> 250 10 𝑎 20
Dado que el tamaño de la muestra es 𝑛 = 40 (𝑁 < 50) se
sugiere de " 5 𝑎 7 " clases, se selecciona aquel número de
clases que nos conduzca a un tamaño de clase con el menor
número de digitos.
8. 1.35
5
= 0.27
1.35
6
= 0.225
1.35
7
= 0.192857142
La opción que nos genera una clase con el menor número de
digitos, es que el número de clases debe ser cinco
𝑐 = 5
4) Criterio empírico
Para muestras grandes se sugiere seguir la siguiente relación
10 ≤ # 𝐼𝐶 ≤ 20
Esta opción no aplica, dado que el tamaño de la muestra es
pequeño.
Paso #4
Determinar el rango de variación de intervalo de clase " 𝑅𝑉𝐼𝐶 "
también conocido como tamaño de clase.
El tamaño de clase se determina mediante la siguiente expresión.
𝑅𝑉𝐼𝐶 =
𝑅𝑉𝑇
# 𝐼𝐶
𝑅𝑉𝐼𝐶 =
1.35
5
𝑅𝑉𝐼𝐶 = 0.27
9. Conociendo el tamaño de clase es posible determinar los límites
de intervalo de clase.
Paso #5
Determinar los límites de intervalo de clase " 𝐿𝐼𝐶 ", estos límites
son fáciles de calcular, sumando el tamaño de clase al límite
inferior donde empieza cada clase.
Para la primera clase
Para la segunda clase
Para la tercera clase
7.30
5.95
+0.27
6.22
7.30
5.95
+0.27
6.22 6.49
7.30
5.95
+0.27
6.22 6.49 6.76
1
1 2
10. Para la cuarta clase
Para la quinta clase
Paso #6
Conociendo los límites de intervalo de clase, podemos agrupar
las observaciones en su clase correspondiente, para tal efecto la
escala horizontal la colocamos en forma vertical.
𝑖 𝐿𝐼𝐶
1 5.95 − 6.22
2 6.22 − 6.49
3 6.49 − 6.76
4 6.76 − 7.03
5 7.03 − 7.30
𝑖 [≡] # 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
7.30
5.95
+0.27
6.22 6.49 6.76 7.03
7.30
5.95
+0.27
6.22 6.49 6.76 7.03
2
1 3
1 2 3 4
11. Es conveniente enlistar los límites de intervalo de clase, de la
forma siguiente:
𝑖 𝐿𝐼𝐶 𝐿𝐼𝐶
1 5.95 ≤ (𝐿𝐼𝐶)1 < 6.22 [ 5.95, 6.22 )
2 6.22 ≤ (𝐿𝐼𝐶)2 < 6.49 [ 6.22, 6.49 )
3 6.49 ≤ (𝐿𝐼𝐶)3 < 6.76 [ 6.49, 6.76 )
4 6.76 ≤ (𝐿𝐼𝐶)4 < 7.03 [ 6.76, 7.03 )
5 7.03 ≤ (𝐿𝐼𝐶)5 < 7.30 [ 7.03, 7.39 )
La representación anterior, indica que en cada clase el límite
inferior SI pertenece a la clase que inicia y el límite superior NO.
Paso #7
Determinar la frecuencia de clase " 𝑓𝑖 ", el procedimiento consiste
en “contar” el número de observaciones ubicadas en cada clase.
La agrupación sigue un comportamiento semejante a la ubicación
de las hojas en los tallos.
Contabilizando los datos de la columna 1
6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00
6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15
𝑖 𝐿𝐼𝐶
𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 𝟓. 𝟗𝟓 − 𝟔. 𝟐𝟐
2 𝟔. 𝟐𝟐 − 𝟔. 𝟒𝟗
3 𝟔. 𝟒𝟗 − 𝟔. 𝟕𝟔 / /
4 𝟔. 𝟕𝟔 − 𝟕. 𝟎𝟑 /
5 𝟕. 𝟎𝟑 − 𝟕. 𝟑𝟎 / /
15. Contabilizando los datos de la columna 8
6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00
6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15
Paso #8
Construir la Tabla de Frecuencias
Contabilizando el número de observaciones que se encuentran
en cada clase, se construye una tabla llamada TABLA DE
FRECUENCIAS.
TABLA DE FRECUENCIAS
𝑖 𝐿𝐼𝐶 𝑓𝑖
1 5.95 − 6.22 2
2 6.22 − 6.49 5
3 6.49 − 6.76 17
4 6.76 − 7.03 8
5 7.03 − 7.30 8
𝑁 = 40
𝑖 𝐿𝐼𝐶
𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 𝟓. 𝟗𝟓 − 𝟔. 𝟐𝟐 / /
2 𝟔. 𝟐𝟐 − 𝟔. 𝟒𝟗 / / / / /
3 𝟔. 𝟒𝟗 − 𝟔. 𝟕𝟔 / / / / / / / / / / / / / / / / /
4 𝟔. 𝟕𝟔 − 𝟕. 𝟎𝟑 / / / / / / / /
5 𝟕. 𝟎𝟑 − 𝟕. 𝟑𝟎 / / / / / / / /
16. Paso #9
Construya un HISTOGRAMA, un Histograma es una gráfica en
forma de barras verticales, en la cual en el eje " 𝑥 " van colocados
los límites de intervalos de clase " 𝐿𝐼𝐶 " y en el eje de las " 𝑦 " van
colocadas las frecuencias de clase " 𝑓𝑖 ".
𝑖 𝐿𝐼𝐶 𝑓𝑖
1 5.95 − 6.22 2
2 6.22 − 6.49 5
3 6.49 − 6.76 17
4 6.76 − 7.03 8
5 7.03 − 7.30 8
𝑁 = 40
𝑓𝑖
𝐿𝐼𝐶
5.95 6.22 6.49 6.76 7.03 7.30
18
15
12
9
6
3
21
17. El Histograma nos sirve para determinar gráficamente el valor de
la Moda.
Moda es aquel valor el cual se encuentra presente con mayor
frecuencia en una serie de observaciones
La Moda se encuentra en la clase de mayor frecuencia, en este
caso en la clase 3, el valor se encuentra entre 6.47 ≤ 𝑀𝑜𝑑𝑎 ≤ 6.76
dicho valor se determina trazando una línea desde el vértice
superior derecho de la clase anterior a la clase que contiene a la
moda, se traza una segunda línea desde el vértice superior
izquierdo de la clase siguiente a la clase que contiene a la moda.
𝐿𝐼𝐶
5.95 6.22 6.47 6.76 7.03 7.30
18
15
12
9
6
3
21
𝑓𝑖
1.6 𝑐𝑚
0.9 𝑐𝑚
𝑍
18. En el punto de cruce entre ambas líneas se prolonga al eje " 𝑥 " y
donde lo corta es el valor de la moda.
Este valor se encuentra aplicando una regla de 3 simple,
relacionando longitudes con los valores de medición en las
observaciones.
1.6 𝑐𝑚 − 0.27 𝑖𝑛
0.9 𝑐𝑚 − 𝑍
𝑍 =
(0.9 𝑐𝑚)(0.27 𝑖𝑛)
(1.6 𝑐𝑚)
𝑍 = 0.151875
𝑀𝑜𝑑𝑎 = 6.47 + 𝑍
𝑀𝑜𝑑𝑎 = 6.47 + 0.151875
𝑀𝑜𝑑𝑎 = 6.621875