2. Introducción
En esta serie de 4 presentaciones se construye una
tabla de datos agrupados paso por paso.
El objetivo es mostrar detalladamente las
operaciones aritméticas necesarias para resumir un
conjunto de datos, agrupándolos en 10 intervalos.
Se incluye el cálculo de intervalos aparentes y
reales además de las medidas de tendencia central
y dispersión más usuales. Lim. Inferior Lim. Superior
Totales
=
Desviación media =
=
=
Frecuencias
Medidas de tendencia central y
dispersión
Clases o categorías
Intervalos
Marcas de
clase
ix if ifa ifr ifra i if x i ix x f
2
i ix x f
3. Datos agrupados
Procedimiento para datos agrupados
En esta última sección, vamos a calcular algunas
medidas de tendencia central y dispersión:
- Media aritmética
- Desviación media
- Varianza
- Desviación estándar
6. Datos agrupados
En las tres presentaciones anteriores se llevaron a
cabo los primeros diez pasos.
Se calcularon los intervalos aparentes y reales, las
marcas de clase y las frecuencias; absoluta,
acumulada, relativa y relativa acumulada.
Lim. Inferior Lim. Superior
Totales
=
Desviación media =
=
=
Frecuencias
Medidas de tendencia central y
dispersión
Clases o categorías
Intervalos
Marcas de
clase
ix if ifa ifr ifra i if x i ix x f
2
i ix x f
8. Datos agrupados
Undécimo paso: Determinar la media aritmética de
los datos: 𝒙
Para este undécimo paso vamos a agregar una
columna en la que se multipliquen las marcas de
clase por las frecuencias absolutas
correspondientes: 𝒇𝒊 𝒙𝒊
En este punto es donde se pierde algo de exactitud.
Marcas de Frecuencias
Límite Límite clase F. absoluta
inferior superior
40.5 46.5 43.5 3
Intervalos reales
9. Datos agrupados
Se pierde algo de exactitud en los cálculos porque:
Si se multiplica la frecuencia absoluta por la marca
de clase es como si sumáramos todos los datos
pero considerando que todos los valores dentro de
cada intervalo son iguales a su marca de clase.
Marcas de Frecuencias
Límite Límite clase F. absoluta
inferior superior
40.5 46.5 43.5 3
Intervalos reales Los valores encontrados dentro del
primer intervalo fueron: 42, 43 y 45.
Si los sumamos: 42+43+45 = 130
Al multiplicar 43.5x3 = 130.5
Evidentemente no son iguales:
130 ≠ 130.5
Se considera que el error no es
significativo.
10. Datos agrupados
Undécimo paso: Determinar la media aritmética de
los datos: 𝒙
Esta pérdida de exactitud es suficientemente
pequeña como para permitirnos usar los resultados
con confianza.
Si calculamos la media aritméticas sin agrupar
datos, sumando uno por uno y dividiendo entre 300
es: 71.18333
En cambio, el resultado que obtenemos al agrupar
datos es: 71.36
12. Datos agrupados
Undécimo paso: Determinar la media aritmética de
los datos: 𝒙
Si calculamos la media aritméticas sin agrupar
datos, sumando uno por uno y dividiendo entre 300
es: 71.18333
Aplicando el proceso de datos agrupados la media
aritmética fue: 71.36
Existe diferencia pero no es significativa.
13. Datos agrupados
Undécimo paso: Determinar la media aritmética de
los datos: 𝒙
La media aritmética nos indica el punto medio de
los datos, es una medida de tendencia central.
Existen otras medidas de tendencia central como la
mediana y la moda.
Consulta el procedimiento para obtenerlas
14. Datos agrupados
Duodécimo paso: Determinar la desviación media
de los datos: 𝐷 𝑥
Para estudiar un conjunto de datos no es suficiente
con conocer su tendencia central.
Se necesita determinar la dispersión de los datos,
es decir, que tanto se alejan de la media aritmética.
Un valor que nos indica esta dispersión es la
desviación media de los datos.
15. Datos agrupados
Duodécimo paso: Determinar la desviación media
de los datos: 𝐷 𝑥
Esta desviación media es el promedio de las
distancias de cada dato respecto a la media,
aunque en datos agrupados, ya vimos que se usa
la marca de clase para representar todos los datos
dentro de un intervalo.
El procedimiento es:
i ix x f
16. Datos agrupados
Duodécimo paso: Determinar la desviación media
de los datos: 𝐷 𝑥
i ix x f Diferenciaabsolutaentre
cadamarcadeclase ylamedia por
la frecuenciaabsoluta
17. Datos agrupados
Duodécimo paso: Determinar la desviación media
de los datos: 𝐷 𝑥
Para los primeros dos intervalos es:
La tabla siguiente incluye esta columna.
43.5 71.36 3 27.86 3 27.86 3 83.58i ix x f
49.5 71.36 9 21.86 9 21.86 9 196.74i ix x f
19. Datos agrupados
Decimotercer paso: Determinar la varianza y la
desviación estándar de los datos: s2 y s
Posteriormente abordaremos el tema de media,
varianza y desviación estándar de una muestra y
una población.
El procedimiento está dado por:
2
i ix x f
20. Datos agrupados
Decimotercer paso: Determinar la varianza y la
desviación estándar de los datos: s2 y s
2
i ix x f El cuadradodela diferencia
decada marca declase yla media por
la frecuencia absoluta
21. Datos agrupados
Decimotercer paso: Determinar la varianza y la
desviación estándar de los datos: s2 y s
Para los primeros dos intervalos:
Agregamos una columna más a la tabla.
2
2
(43.5 71.36) 3 (776.1976)3 2328.5388i ix x f
2
2
(49.5 71.36) 3 (477.8596)9 4300.7364i ix x f
23. Datos agrupados
En la siguiente diapositiva podemos ver la tabla
completa.
En posteriores presentaciones abordaremos el
tema de la representación gráfica de los datos.
Además es necesario contextualizar la información
para interpretar las tablas y gráficas obtenidas en
estas cuatro presentaciones.