2. Estadística Descriptiva
Introducción
Frecuentemente los datos obtenidos en el
muestreo son tan numerosos, que pueden ser
virtualmente inútiles, a menos que se
condensen convenientemente a través de las
técnicas que proporciona la Estadística
Descriptiva, las cuales se pueden clasificar en
tres grupos:
Tablas o Cuadros,
Gráficas, y
Estimación de Parámetros
septiembre de 2011 2
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
3. TABLAS O CUADROS
2. Título - Lo más condensado y
claro posible
3. Encabezados
4. Cuerpo o Matriz
Tabla No. 1
Número de Habitantes por Sexo y Entidad
Federativa en la República Mexicana
Número de Habitantes
Estado Hombres Mujeres Total
Aguascalientes
Zacatecas
5. Origen de los datos Fuente: XXV Censo de Población, INEGI
Estas permiten mostrar sólo los datos relevantes para facilitar
el análisis de los mismos, los elementos mas importantes que
los constituyen son:
Estadística Descriptiva
1. Número
septiembre de 2011
3
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
4. EJEMPLO 1: TABLAS DE DATOS DE DOS VARIABLES
Velocidad de corte 40 RPM 60 RPM 80 RPM 100 RPM
La configuración Tipo 2 Tipo 3
Velocidad de corte
Configuración 40 RPM 60 RPM 80 RPM 100 RPM
1
2
Velocidad de
Corte
Configuración
1 2
40 RPM
60 RPM
80 RPM
100 RPM
Vel.
Corte
Conf.
Observaciones
1 2 … n
40
1
2
60
1
2
80
1
2
100
1
2
Estadística Descriptiva
5. EJEMPLO 2: TABLA DE DATOS DE TRES VARIABLES
Tamaño de
la broca
Configuración
Velocidad de corte
40 RPM 60 RPM 80 RPM 100 RPM
1/16 Plg
1
2
1/8 Plg
1
2
1/4 Plg
1
2
Velocidad de corte 40 RPM 60 RPM 80 RPM 100 RPM
La configuración Tipo 2 Tipo 3
Tamaño de la broca 1/16 Plg 1/8 Plg 1/4 Plg
Tamaño de Broca 1/16 Plg 1/8 Plg 1/4 Plg
Velocidad de corte 40 60 80 100 40 60 80 100 40 60 80 100
Configuración
1
2
Vel. Corte Conf.
Tamaño
Broca
Observaciones
1 2 … n
40
1
1/16
1/8
1/4
2
1/16
1/8
1/4
60
1
1/16
1/8
1/4
2
1/16
1/8
1/4
80
1
1/16
1/8
1/4
2
1/16
1/8
1/4
100
1
1/16
1/8
1/4
2
1/16
1/8
1/4
Las tablas de mas de una entrada
distribuida en filas y columnas es mas
compacta.
Estadística Descriptiva
6. TABLAS DE FRECUENCIA
Algunas Reglas para Determinar el Número de Clases:
Regla empírica : 5 k 15
Regla de Stuges :
o 2k-1 < n 2k
o k = 1 + 3.3 log n
donde:
k = número de clases
n = número de datos o tamaño de la muestra
Son un caso especial de tablas, es un paso intermedio en el
análisis de datos. El paso inicial, que es crítico, es la
determinación del número de clases, cuando estas no están
limitadas por el problema
Estadística Descriptiva
septiembre de 2011
6
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
)
log(
322
.
3
1
)
log(
322
.
3
1
)
log(
)
2
log(
1
1
)
log(
)
2
log(
)
1
(
2 1
n
k
n
k
n
k
n
k
n
k
7. Rango = R = Xmax - Xmín
Ancho de Clase = AC = Rango / k
Longitud de Clase= LC = Ancho de Clase + Unidad Mínima
Marca de Clase = mi = (Límitesup + Límiteinf) / 2
= mi-1 + Longitud de Clase
También la longitud de clase se puede obtener mediante:
LC= mi+1 - mi
Los restantes elementos necesarios en la construcción de la
tabla de frecuencia o para la realización de análisis
posteriores son:
Estadística Descriptiva
TABLAS DE FRECUENCIA
septiembre de 2011
7
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Unidad Mínima: es el valor 1 con tantos
decimales como haya en los datos:
Enteros: 1
Un decimal: 0.1
Dos decimales: 0.01
⋮
8. Clases
Los Límites de Clase se obtienen a partir de la información
anterior de diversas maneras:
TABLAS DE FRECUENCIA
1. El primer límite inferior (LI1) es igual a
Xmín
2. El límite superior es: LSi = LIi + AC
3. Los restantes LIi pueden obtenerse por:
a. LIi = LSi-1 + Unidad Mínima
b. LIi = LIi-1 + LC
4. Los restantes LSi pueden obtenerse
como en el paso 2 o por LSi = LSi-1 + LC
5. Se continuará poniendo límites hasta
que Xmax ≤ LSi
33 - 43
44 - 54
55 - 65
66 - 76
77 - 87
88 - 98
8
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
agosto de 2010
Ejemplo:
Xmin = 33
Xmax = 97
AC = 10
Estadística Descriptiva
9. Múltiplos de Cinco:
Múltiplos de Diez:
Clases m1 fi
33 - 43 38
44 - 54 49
55 - 65 60
66 - 76 71
77 - 87 82
88 - 98 93
La obtención del número de elementos que caen en cada
clase, conocida como frecuencia de clase absoluta fi , se
puede obtener mediante varia técnicas, como:
Estadística Descriptiva
TABLAS DE FRECUENCIA
septiembre de 2011
9
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
m1 fi
38 7
49 9
60 17
71 26
82 18
93 6
10. 1-Fi 1-Fi%
83 100.00
76 91.57
67 80.72
50 60.24
24 28.92
6 7.23
mi Marca de clase
fi Frecuencia de clase absoluta
fi% Frecuencia de clase relativa
Fi Frecuencia de clase acumulada absoluta
Fi% Frecuencia de clase acumulada relativa
1-Fi Frecuencia de clase acumulada inversa absoluta
1-Fi% Frecuencia de clase acumulada inversa relativa
Las columnas mas frecuentes en una tabla de frecuencia
son:
Estadística Descriptiva
Clases m1 fi
33 - 43 38 7
44 - 54 49 9
55 - 65 60 17
66 - 76 71 26
77 - 87 82 18
88 - 98 93 6
fi%
8.43
10.84
20.48
31.33
21.69
7.23
Fi Fi%
7 8.43
16 19.28
33 39.76
59 71.08
77 92.77
83 100
TABLAS DE FRECUENCIA
septiembre de 2011
10
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
11. Permiten observar fácilmente algunas características de
la población. Los elementos que conforman las gráficas
son básicamente los mismos que conforman los
cuadros.
Gráfica No. 1 Ventas Mensuales de la Compañía
Fuente: Archivos de la empresa
0
200
400
600
2007
Miles
de
Pesos
Producto 1
Producto 2
1. Número de gráfica
2. Título de la gráfica
3. Cuerpo de la gráfica
4. Leyendas de los ejes
5. Fuente de donde provienen
GRÁFICAS
Estadística Descriptiva
septiembre de 2011
11
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
12. Estadística Descriptiva
Gráficas: Ejemplos
Las gráficas de barras ilustran las
comparaciones entre elementos
individuales, enfatizando los valores y no
el tiempo o distancia entre las categorías
0
20
40
60
80
100
87.5 105.5 123.5 141.5 159.5
Núm.
de
Trabajadores
minutos
Tiempo de realización de una tarea
S…
Las gráficas de barras
apiladas muestran la
relación de cada
elemento con el todo
Los gráficos de línea facilitan mostrar
las tendencias entre los datos a
intervalos idénticos.
Se puede mejorar la apariencia pero
no siempre la claridad si se usan
figuras y efectos en tercera dimensión.
1
2
3
4
5
septiembre de 2011
12
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
13. GRÁFICAS: LA PROPORCIÓN
septiembre de 2011
13
Regla empírica: La longitud del eje Y debe ser
unas ¾ partes la longitud del eje X.
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
14. Estadística Descriptiva
GRÁFICAS Y LA TABLA DE FRECUENCIA
Gráfica Datos Notas
Barras / Histograma, X-Y,
Diagrama de Dispersión, etc.
fi, mi
Si hay mas de una variable por cada
una de ellas habrá una fi
Polígono de Frecuencia fi, mi
Se deben agregar al inicio y al final
una clase con frecuencia cero
Ojiva menor que Fi, LRS
Ojiva mayor que 1-Fi, LRI
Pastel, Anillo fi
Las columnas adicionales, que se requiere obtener en la
tabla de frecuencia, dependen del tipo de gráfica que se
necesite dibujar.
septiembre de 2011
14
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
15. En otros casos se requiere resumir los datos en valores
numéricos que representan ciertas características
particulares de cada población (parámetros) a los que se
llama estimadores.
Existe una gran cantidad de parámetros, pero los que
tienen un mayor uso en la práctica de la estadística,
entran en las primeras dos clases de estimación de
parámetros:
• De tendencia central: media, moda y mediana.
• De variabilidad o dispersión: rango, varianza,
desviación estándar y desviación media.
Estadística Descriptiva
ESTIMACIÓN DE PARÁMETROS
septiembre de 2011
15
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
16. Es el promedio que más comúnmente se utiliza para
describir una serie de datos. Existen varias medias, de
estas la más usada es la media aritmética conocida
simplemente como media (las otras son la media
ponderada, la media geométrica y la media armónica).
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIA
septiembre de 2011
16
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Simbólicamente se escribe como:
Para Datos Simples:
Para Datos Agrupados:
1
n
i
i
X
X
n
n
m
f
X
k
i
i
i
1
17. septiembre de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
17
Sea X la variable peso en Kg. Supóngase que se desea
obtener el peso promedio de un lote de 50 cajas de libros
para lo cual se obtiene una muestra de tres cajas del mismo,
siendo sus valores observados : 54, 59 y 63.
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIA
Datos Simples:
1
n
i
i
X
X
n
667
.
58
3
63
59
54
X
18. septiembre de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
18
En una investigación sobre la mortalidad de personas con
seguro de vida de la compañía X, en la ciudad de Orizaba
durante el año de 2009. Se obtuvo una muestra
encontrándose los siguientes valores:
Grupos
de Edad
Número de
Muertes
50 - 54 16
55 – 59 58
60 – 64 180
65 – 69 513
767
Marca de
Clase (mi)
(fi) (mi)
52.5 840
57.5 3,335
62.5 11,250
67.5 34,627.5
50,052.5
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIA
n
m
f
X
k
i
i
i
1
26
.
65
767
5
.
052
,
50
X
Datos Agrupados:
19. Se utiliza para determinar cual es el valor que ocurre con
más frecuencia en los datos. Es el único estimador que
puede no existir, existir una o existir mas de una vez.
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MODA
septiembre de 2011
19
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Para Datos Simples: Sólo se contabiliza la ocurrencia de cada valor,
aquel que ocurra más veces ese será la moda.
Para Datos Agrupados:
Donde:
LRI = Límite Real Inferior de la clase modal
fmodal = frecuencia de la clase modal
fmodal-1 = frecuencia de la clase anterior a la clase modal
fmodal+1 = frecuencia de la clase posterior a la clase modal
LC = longitud de clase
LC
f
f
f
f
f
f
LRI
XMODA
1
modal
modal
1
modal
modal
1
modal
modal
20. Clases m1 fi
33 - 43 38 7
44 - 54 49 9
55 - 65 60 17
66 - 76 71 26
77 - 87 82 18
88 - 98 93 6
Identificar a la clase modal, la de fi mayor, para a partir
de ahí obtener las frecuencias para aplicar la fórmula
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MODA
septiembre de 2011
20
Datos Agrupados:
Frec. Modal
26
Clase Modal
4
LRI
65.5
Moda
71.32
11
18
26
17
26
17
26
5
.
65
MODA
X
LC
f
f
f
f
f
f
LRI
XMODA
1
modal
modal
1
modal
modal
1
modal
modal
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
21. Permite obtener el valor que se encuentra exactamente en
la posición central de una serie de datos.
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIANA
septiembre de 2011
21
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Para Datos Simples: Ordenar los valores de menor a mayor y elegir
al que se encuentra en la posición central.
Impar: Par:
Para Datos Agrupados:
Donde:
LRI = Límite Real Inferior de la clase mediana
n = Tamaño de muestra
fi = Frecuencia de la clase i
fm = Frecuencia de la clase mediana
LC = Longitud de clase
LC
f
f
n
LRI
X
m
m
i
i
MED
1
1
2
2
1
X
n
MED X 2
X
1
2
2
n
n
MED X
X
22. Identificar a la clase mediana, en la columna Fi, la que tiene
el dato en la posición (n+1)/2, si es impar o n/2 si es par, y
aplicar la fórmula
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIANA
septiembre de 2011
22
Clases m1 fi Fi
33 - 43 38 7 7
44 - 54 49 9 16
55 - 65 60 17 33
66 - 76 71 26 59
77 - 87 82 18 77
88 - 98 93 6 83
Lugar Med.
42
Clase Med.
4
Fi-1
33
LRI
65.5
Mediana
69.096
LC
f
f
n
LRI
X
m
m
i
i
MED
1
1
2
11
26
33
2
83
5
.
65
MED
X
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
23. Es la medida mas burda de variabilidad. Permite tener una
idea muy general del grado de dispersión de un conjunto
de datos, sólo usa dos valores: el mayor y el menor de
ellos.
ESTIMADORES DE DISPERSIÓN: RANGO
23
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
septiembre de 2011
También se le conoce como recorrido.
Datos simples:
R=Xmax – Xmin
Datos Agrupados:
R=LSk – LI1
Estadística Descriptiva
24. Es el estimador mas utilizado para medir la dispersión de
conjunto de datos, la varianza (S2) no es fácil de interpretar,
la desviación estándar (S) si.
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: VARIANZA / DESVIACIÓN
ESTÁNDAR
septiembre de 2011
24
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Para Datos Simples:
Donde:
Xi = i-ésimo dato
= Media aritmética
n = tamaño de muestra
Para Datos Agrupados:
Donde:
mi = Marca de la clase i
fi = Frecuencia de la clase i
2
2 1
1
n
i
i
X X
S
n
2
2 1
1
k
i i
i
f m X
S
n
2
S
S
X
25. septiembre de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
25
Para Datos Simples:
Sea X la variable peso en Kg. Supóngase que se desea
obtener el peso promedio de un lote de 50 cajas de libros
para lo cual se obtiene una muestra de tres cajas del mismo,
siendo sus valores observados : 54, 59 y 63.
2
2 1
1
n
i
i
X X
S
n
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: VARIANZA / DESVIACIÓN
ESTÁNDAR
S = 4.51
33
.
20
1
3
)
67
.
58
63
(
)
67
.
58
59
(
)
67
.
58
54
( 2
2
2
2
S
667
.
58
3
63
59
54
X
26. 26
ESTIMADORES DE DISPERSIÓN: VARIANZA / DESVIACIÓN
ESTÁNDAR
septiembre de 2011
Para Datos Agrupados:
2
2 1
1
k
i i
i
f m X
S
n
Lím. Inf. Lím. Sup. mi fi (mi-media)2 fi(mi-media)2
33 43 38 7 873.45 6,114.16
44 54 49 9 344.26 3,098.33
55 65 60 17 57.07 970.13
66 76 71 26 11.87 308.71
77 87 82 18 208.68 3,756.25
88 98 93 6 647.49 3,884.93
18,132.51
Varianza
Desviación
Estándar
221.13 14.870
Se recomienda calcular columnas adicionales en la tabla de
frecuencia para aplicar la fórmula
1
83
51
.
132
,
18
2
S
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
27. Este estimador de variabilidad no es muy popular, sin
embargo proporciona una medida que es fácil de
interpretar.
Para Datos Simples:
Donde:
Xi = i-ésimo dato
= Media aritmética
n = tamaño de muestra
Para Datos Agrupados:
Donde:
mi = Marca de la clase i
fi = Frecuencia de la clase i
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: DESVIACIÓN MEDIA
X
1
1
n
X
X
DM
n
i
i
1
1
n
X
m
f
DM
k
i
i
i
septiembre de 2011
27
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
28. 28
septiembre de 2011
ESTIMADORES DE DISPERSIÓN: DESVIACIÓN MEDIA
Para Datos Agrupados:
Lím. Inf. Lím. Sup. mi fi |mi-media| fi|mi-media|
33 43 38 7 29.554 206.88
44 54 49 9 18.554 166.99
55 65 60 17 7.5542 128.42
66 76 71 26 3.4458 89.59
77 87 82 18 14.446 260.02
88 98 93 6 25.446 152.67
1,004.6
Desviación
Media
12.251
Se recomienda calcular columnas adicionales en la tabla de
frecuencia para aplicar la fórmula
1
83
6
.
004
,
1
DM
1
1
n
X
m
f
DM
k
i
i
i
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
29. septiembre de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
29
Para Datos Simples:
Sea X la variable peso en Kg. Supóngase que se desea
obtener el peso promedio de un lote de 50 cajas de libros
para lo cual se obtiene una muestra de tres cajas del mismo,
siendo sus valores observados : 54, 59 y 63.
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: DESVIACIÓN MEDIA
1
1
n
X
X
DM
n
i
i
67
.
4
2
33
.
9
1
3
67
.
58
63
67
.
58
59
67
.
58
54
DM
667
.
58
3
63
59
54
X
30. Es una medida de variabilidad que se utiliza cuando la
medida de posición central empleada es la mediana. Se
define como la diferencia entre el tercer cuartil (Q3) y el
primer cuartil (Q1). Es un estadístico más adecuado para
medir la variabilidad que el rango.
Sólo se calcula para datos agrupados:
ESTIMADORES DE DISPERSIÓN: desviación intercuartilar
septiembre de 2011
30
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
2
2
1
3 Q
Q
RQ
DQ
1,2,3
k
)
4
/
( 1
LC
f
F
k
n
LRI
Q
k
k
k
k
Estadística Descriptiva
31. Clases m1 fi Fi Fi%
33 - 43 38 7 16 8.43
44 - 54 49 9 33 19.28
55 - 65 60 17 59 39.76
66 - 76 71 26 77 71.08
77 - 87 82 18 83 92.77
88 - 98 93 6 7 100
ESTIMADORES DE dispersión: desviación intercuartilar
septiembre de 2011
31
Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Identificar a las clases de los cuartiles 1 y 3, en la columna
Fi%, las que tienes los datos en la posición 25% y 75%,
posteriormente aplicar la fórmula
1,2,3
k
)
4
/
( 1
LC
f
F
k
n
LRI
Q
k
k
k
k
86
.
57
11
17
16
1
4
83
5
.
54
1
Q
48
.
78
11
18
59
3
4
83
5
.
76
3
Q
31
.
10
2
86
.
57
48
.
78
DQ
Estadística Descriptiva
32. EJERCICIOS RECOMENDADOS
● Ejemplos de un problema que requiera de la obtención de datos
por censo y uno que requiera muestreo
● Análisis Crítico de Cuadros / Tablas y de Gráficas en libros, revistas
e Internet
● Prácticas:
o DE-EB-01 Elaboración de la Tabla de Datos I (Unifactorial y Bifactorial)
o DE-EB-02 Elaboración de la Tabla de Datos III (Trifactorial)
o ED-TF-01y ED-TF-02 Tabla de Frecuencia
o ED-GR-01y ED-GR-02 Construcción de gráficas
o ED-EP-01 Cálculo de estimadores de tendencia central de datos simples
o ED-EP-02 Cálculo de estimadores de dispersión de datos simples
o ED-EP-03 Cálculo de estimadores de tendencia central de datos
agrupados
o ED-EP-04 Cálculo de estimadores de dispersión de datos agrupados
● Resolver ejercicios utilizando el ejercitador ó el verificador de
estimaciones
32
septiembre de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com