2. FÁTIMA PONCE 2
PUNTOS A TRATAR
Sesión 3:
Estadística Descriptiva: Agrupación y Presentación
Uso e importancia de la Estadística.
Estadística Descriptiva: Presentación y análisis de datos.
oTablas de Frecuencia e Histograma.
oRepresentaciones Gráficas.
4. FÁTIMA PONCE 4
Permite construir y analizar cuadros estadísticos y
gráficos resúmenes, con el objetivo de resumir los datos,
de manera que sean entendibles e interpretables con
facilidad, a fin de que nos sirva la información para la toma
de decisiones:
Distribuciones de frecuencias e histograma,
Gráficas de barras, líneas, pie, otros.
Aplicar e interpretar medidas numéricas que resumen los
datos: Medidas de localización central (media, mediana,
moda), variabilidad (varianza, desviación estándar, coefi-
ciente de variabilidad) y emplearlos como medidas de
tendencia y riesgo.
ESTADÍSTICA DESCRIPTIVA
5. FÁTIMA PONCE 5
Los datos pueden organizarse de varias maneras.
Datos sin procesar: Recolectar y presentarlos (Datos no
agrupados).
Datos Procesados: Organizados (agrupados) a fin de ver
rápidamente alguna(s) de su(s) característica(s) para
entender mejor la población y tomar una mejor decisión:
o Distribución de frecuencias: Método para agrupar
datos. Se dividen en clases y se cuenta el número de
observaciones en cada clase.
o Representaciones Gráficas.
BÚSQUEDA DE UN PATRÓN SIGNIFICATIVO EN
LOS DATOS
6. FÁTIMA PONCE 6
Las tablas de frecuencias y las representaciones gráficas
son dos maneras equivalentes de presentar la información.
En ambos casos se han ordenado los datos de la muestra.
PRESENTACIÓN ORDENADA DE LOS DATOS
Género Frecuencia
Hombres 3
Mujeres 8
3
8
0
5
10
Hombres Mujeres
8. FÁTIMA PONCE 8
DISTRIBUCIÓN DE FRECUENCIAS
Es un resumen tabular de datos organizados en clases,
es decir, en grupos de valores que describen una
característica de los datos.
Indica el número de
veces que ocurre cada
dato en la clase.
Notas
14
11
9
18
6
8
14
15
16
13
11
12
Este resumen aporta
más claridad.
DatosDesordenados
Número de veces que
ocurre cada dato en la clase
disjunta.
Frecuencia
0
3
7
2
12
clase
0-5
6-10
11-15
16-20
9. FÁTIMA PONCE 9
Las frecuencias pueden ser:
Absoluta,
Relativa
Porcentual.
y pueden presentarse
Simple / No acumuladas,
Acumuladas: Sólo tienen sentido para variables
numéricas u ordinales. Útiles para calcular cuantiles.
DISTRIBUCIÓN DE FRECUENCIAS
10. FÁTIMA PONCE 10
Tipo de Clases
Cuantitativas:
Discretas (con poca variabilidad)
Discretas (con mucha variabilidad)
Continuas
Las clases están compuestas por datos discretos
(conteo) y datos continuos (medición).
Cualitativas:
Emplean etiquetas o nombres para determinar las
categorías.
11. FÁTIMA PONCE 11
Distribución de Frecuencias: PASOS
1. Determinar el número de clases disjuntas en las
que se dividen los datos: Debe permitir observar la
variación en los datos. Cuanto más grande sea el rango de los
datos, más clases puntuales se requiere.
El número de clases es arbitrario, pero se recomienda
esté entre 5 y 15 clases.
Para determinar el número de clases en las que se dividen los datos
(n) de la muestra se emplea:
Número de clases = raiz (n), ó
Número de clases = 3 log(n), ó
Fórmula de Sturges: Número de clases = 1 + 3.3 log(n)
Es referencial.
12. FÁTIMA PONCE 12
Distribución de Frecuencias: PASOS
2. Determinar el Ancho o tamaño del intervalo o
amplitud de clase:
El ancho debe ser el mismo para todas las clases.
Rango
Ancho aprox de clase = -----------------------------
número de clases
Dato mayor – Dato menor
Ancho aprox de clase = ---------------------------------------
número de clases
13. FÁTIMA PONCE 13
Distribución de Frecuencias: PASOS
3. Determinar los límites de clase:
Cada clase tiene un límite inferior y un límite superior.
Se recomienda que el límite inferior de la primera clase
sea el valor mínimo de los datos.
Las clases son completamente incluyentes (abarcan a
todos los datos) y mutuamente excluyentes (ningún dato
entra en más de una clase): Cada dato pertenece a una
y sólo una de las clases.
14. FÁTIMA PONCE 14
Distribución de Frecuencias: PASOS
4.Tabular o Determinar la frecuencia:
Contar el número de datos que cae
dentro de cada clase para construir la
tabla.
0
1
2
3
4
5
6
7
8
0-5 6-10 11-15 16-20
Histograma de frecuencias Absolutas
clase
0-5
6-10
11-15
16-20
Frecuencia
0
3
7
2
5.Ilustrar los datos en un
Histograma de frecuencia.
Informa acerca de la forma de
la distribución de los datos.
Se construyen rectángulos
sobre c/u de las clases, con
alturas proporcionales al
número de elementos que caen
en la clase (frecuencia).
15. FÁTIMA PONCE 15
Si se tiene el número de horas que demoran las Municipalidades
en dar respuesta a una solicitud en 50 gobiernos distritales. Elabore
una distribución de frecuencias
Datos sin
Procesar:
85 54 56 73 73
51 59 66 67 64
64 71 63 65 64
68 71 74 61 62
73 64 53 60 61
56 65 56 65 71
80 68 64 72 67
65 63 65 64 72
64 61 86 67 82
73 70 65 59 84
Ejemplo: Distribución de frecuencia
16. FÁTIMA PONCE 16
EJEMPLO: Distribución de frecuencia
1. Número de Clases 6
2. Ancho o amplitud de clase:
Valor Máximo – Valor mínimo (86 – 51) 35
= -------------------------------------- = ---------- =---- 6
Número de clases 6 6
Clases Límite inferior Límite superior
1 51 56
2 =51+6 =57 62
3 =57+6 =63 68
4 =63+6 =69 74
5 =69+6 =75 80
6 =75+6 =81 86
3. Límites de clase: Definir límite inferior y superior de c/clase
17. FÁTIMA PONCE 17
21 de los 50 gobiernos locales tuvieron una demora entre
63 y 68 horas.
Ningún gobierno distrital se demoró menos de 51 horas ni
más de 86.
Punto Medio de Clase
(51 + 56)/2 = 53.5
Clases
(demora en horas) Cuenta
Frecuencia
Absoluta (gobiernos
distritales)
51-56 IIIII I 6
57-62 IIIII II 7
63-68 IIIII IIIII IIIII IIIII I 21
69-74 IIIII IIIII I 11
75-80 I 1
81-86 IIII 4
50
4. Determinar las frecuencias
EJEMPLO: Distribución de frecuencia
18. FÁTIMA PONCE 18
EJEMPLO: Distribución de Frecuencia
5. Ilustrar en un gráfico: Histograma de frecuencias.
Informa acerca de la forma de la distribución de los datos.
Se construyen rectángulos sobre c/u de las clases, con
alturas proporcionales al número de elementos que caen
en la clase (frecuencia).
Clases
(horas)
Frecuencia
Absoluta (gob.
distritales)
51-56 6
57-62 7
63-68 21
69-74 11
75-80 1
81-86 4
50
0
5
10
15
20
25
51-56 57-62 63-68 69-74 75-80 81-86
Frecuencia
Demora (en horas)
20. FÁTIMA PONCE 20
FRECUENCIAS ACUMULADAS
Una distribución de frecuencias acumuladas permite ver
cuántas observaciones están por encima de ciertos
valores. En ejercicio anterior:
OJIVA: Gráfica de una frecuencia acumulada.
Clases
(horas)
Frecuencia
Absoluta
(gob. distritales)
51-56 6
57-62 7
63-68 21
69-74 11
75-80 1
81-86 4
50
Frecuencia
Acumulada
6
13
34
45
46
50
Frecuencia
Acumulada
%
12%
26%
68%
90%
92%
100%
21. FÁTIMA PONCE 21
POLÍGONO DE FRECUENCIA
Es una línea que conecta los puntos medios de todas las
barras de un histograma y bosqueja con mayor claridad
un perfil del patrón de los datos.
Se utiliza para representar distribuciones de frecuencias de
variables cuantitativas continuas, pero se emplean
segmentos de recta, de ahí el nombre de polígono.
0
1
2
3
4
5
6
7
8
2.5 8 13 18 23
Polígonode Frecuencias
0
2
4
6
8
2.5 8.0 13.0 18.0 23.0
HistogramadeFrecuenciasAbsolutasy
PolígonodeFrecuencias
23. FÁTIMA PONCE 23
¿Qué Gráfico Usar: Barra, Línea o Círculo?
Depende de los datos y lo que queremos mostrar. El
gráfico debe ayudar a interpretar correctamente lo que
los datos nos dicen:
Las barras se emplean para comparar.
Las líneas se usan más para ver su comportamiento
en el tiempo (la tendencia).
Círculo o Pie se emplea para mostrar proporciones o
participaciones de un todo.
24. FÁTIMA PONCE 24
Gráfico: Gráficos de Barra (comparativos)
Pueden ser:
Sencillo: Contiene una única serie
de datos.
Agrupado: Contiene varias series
de datos y cada una se representa
por un tipo de barra de un mismo
color o textura.
Apilado: Contiene varias series de
datos. La barra se divide en
segmentos de diferentes colores o
texturas y cada uno de ellos
representa una serie
Intención de postular a la Universidad
25. FÁTIMA PONCE 25
Gráfico de
Líneas
5000
5500
6000
6500
7000
7500
8000
8500
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58
Consumo Mensual de Energía Eléctrica
Muestra proporciones (%)
relativas de una variable.
Gráfico Circular
Participación del Mercado de Internet
Móvil 2015, según tipo de terminal
Fuente: OSIPTEL.
26. FÁTIMA PONCE 26
Por ejemplo de cotizaciones de acciones. Muestra el valor
más alto, el más bajo y el de cierre de la acción.
Gráfico de Máximos y Mínimos (datos
financieros)
27. FÁTIMA PONCE 27
Es un gráfico que representa mediante figuras o símbolos las
frecuencias de una variable cualitativa o discreta.
Suelen usarse para comparar magnitudes o ver la evolución
en el tiempo de una categoría concreta.
Por ejemplo:
PICTOGRAMA
Transporte Residencial/ Industria/ Otros
Comercio Minería
42% 29% 25% 4%
Consumo final de energía total por
sectores
28. FÁTIMA PONCE 28
BIBLIOGRAFIA
Anderson, D., Sweeney, D. y Williams T. (2008).
Cap 2.
Levin, R. y Rubin, D. (2010). Cap. 2.