2. ESTADÍSTICA DESCRIPTIVA
Es el estudio de las técnicas para recopila, organizar y representar datos obtenidos en un estudio estadístico
para facilitar su análisis y aplicación.
RECOPILACIÓN DE DATOS
Fuentes de datos
1. Investigación en registros administrativos: INEC, Banco Central, Cámaras de Producción, Universidades,
etc.(Para obtener índices de empleos, índices de precios, datos de salud, datos de eficiencia, etc.)
2. Obtención de datos mediante encuestas de investigación. Por ejemplo. Estudios de Mercado, Estudios de
preferencia Electoral.
3. Realización de experimentos estadísticos.
3. ESTADÍSTICA DESCRIPTIVA
Criterios para diseñar una encuesta de investigación
1. Definir el objetivo del estudio
2. Definir la población de interés
3. Determinar el tamaño de la muestra
4. Seleccionar el tipo de muestreo
5. Elegir temas generales
6. Elaborar el formulario para la encuesta. Preguntas cortas, claras y de opciones.
7. Realizar pruebas
8. Realizar la encuesta
4. ESTADÍSTICA DESCRIPTIVA
Tipos de Datos
Los resultados que se obtienen pueden ser
1. Datos cualitativos: corresponden a respuestas categóricas
Ejemplo. Estado civil de una persona
2. Datos cuantitativos: corresponden a respuestas numéricas
Ejemplo. La edad en años
Los datos cuantitativos pueden ser.
• Discretos: Se obtiene mediante conteo
• Continuos: Se obtiene mediante mediciones
DESCRIPCIÓN DE CONJUNTOS DE DATOS
Los datos obtenidos se los puede representar de diferentes formas:
1. Tabularmente
2. Gráficamente
3. Mediante números que caracterizan al grupo de datos
5. ESTADÍSTICA DESCRIPTIVA
TABLA DE FRECUENCIAS
Es un dispositivo para agrupación de datos y facilitar su interpretación.
Recomendaciones para construir tablas de frecuencias
Sea X una muestra de tamaño n
1. Identificar la unidad de medida de los datos
2. Obtener el rango de los datos: Distancia entre el mayor y el menor valor de los datos(𝑅 = 𝑋 𝑛 − 𝑋1)
3. Seleccionar el número de clases(o intervalos) k, para agrupar los datos.
4. Obtener la longitud de las clases. 𝐿 = 𝑅
𝑘
5. Realizar el conteo de datos para obtener la frecuencia en cada clase
6. ESTADÍSTICA DESCRIPTIVA
Notación - Tabla de frecuencia
n: número de datos
k: número de clases
𝐟𝐢: frecuencia de la clase i, i=1,2,3,…..,k
𝐟𝒊
𝒏
: frecuencia relativa de la clase i
𝐅𝐢: frecuencia acumulada de la clase i: FI = f1 + f2 + f3 + ⋯ + fi
𝐅𝐢
𝐧
: frecuencia acumulada relativa de la clase i
𝒎𝒊: marca de clase i(es el valor central del intervalo de la clase i)
7. ESTADÍSTICA DESCRIPTIVA
Ejemplo
Obtenga la tabla de frecuencias para los siguientes 40 datos de una muestra, correspondientes al tiempo que se
utilizó para atender a las personas en una estación de servicio:
Desarrollo
1. Precisión: un decimal
2. Rango: R = 6.2 − 1.8 = 4.4
3. Número de clases : k=6
4. Longitud: R/k=0.733(Por simplicidad se redefine la longitud como 1 y se usan
números enteros para los extremos de las clases
5. Conteo de los datos( puede hacerse en un recorrido), n=40
Número
i
Clase
(Intervalo)
[a,b)
Marca
de clase
m
Frecuencia
Absoluta
f
Frecuencia
relativa
f/n
Frecuencia
absoluta
acumulada
F
1 [1,2) 1.5 1 0.03 1
2 [2,3) 2.5 9 0.23 10
3 [3,4) 3.5 11 0.28 21
4 [4,5) 4.5 12 0.30 33
5 [5,6) 5.5 5 0.13 38
6 [6,7) 6.5 2 0.05 40
40
1.00
Frecuencia
relativa
acumulada
F/n
0.03
0.25
0.53
0.83
0.95
Número Frecuencia absoluta
1
2
3
4
5
6
12
5
2
1
9
11
Clase(Intervalo)
1 2
2
4
4
6
6
8. ESTADÍSTICA DESCRIPTIVA
PRESENTACIÓN GRÁFICA DE CONJUNTOS DE DATOS
HISTOGRAMA DE FRECUENCIAS
Es la manera más común de representar
gráficamente la distribución de frecuencia
de los datos.
Se construye dibujando rectángulos cuya
base corresponde a cada intervalo de clase,
y su altura según el valor de la frecuencia.
9. ESTADÍSTICA DESCRIPTIVA
PRESENTACIÓN GRÁFICA DE CONJUNTOS DE DATOS
POLÍGONO DE FRECUENCIAS
Es una manera de representar el perfil de la
distribución de los datos. Se obtiene
uniendo mediante segmentos de recta los
puntos(marca de clase, frecuencia).
Para cerrar el polígono se puede agregar un
punto a cada lado con frecuencia 0).
10. ESTADÍSTICA DESCRIPTIVA
PRESENTACIÓN GRÁFICA DE CONJUNTOS DE DATOS
OJIVA
Este gráfico se usa para representar la
frecuencia acumulada absoluta o relativa. Se
lo obtiene uniendo segmentos de recta que
se extienden entre los extremos de las clases
y usando los valores de la frecuencia
acumulada.
La ojiva permite responder preguntas
“cuantos datos son menores que”
11. ESTADÍSTICA DESCRIPTIVA
GRÁFICOS DE FRECUENCIAS CON FORMAS ESPECIALES
Los gráficos pueden tomar otros aspectos, usando barras, colores, efectos tridimensionales, sombreado, etc.
O usando una representación tipo pastel. Como ilustración se muestran algunos:
12. ESTADÍSTICA DESCRIPTIVA
Media Muestral( 𝐱)
Definición
Si X: X1 X2 … . Xn es una muestra de n datos, entonces la media muestral es el promedio aritmético
simple de los datos:
𝑥 =
𝑥1 + 𝑥2 + ⋯ 𝑥 𝑛
𝑛
=
1
𝑛 𝑖=1
𝑛
𝑥𝑖
MEDIDAS DE TENDENCIA CENTRAL
Son números que definen cual es el valor alrededor del que se concentran los datos. Se indican a
continuación los más utilizados.
Ejemplo.
Si los datos son 2,6,11,8,11,4,7,5
Entonces 𝑥 =
2+6+11+8+11+4+7+5
8
= 6.
NOTA: La media es de uso común, sin embargo
algunos datos puede hacer cambios significativos.
13. ESTADÍSTICA DESCRIPTIVA
Moda Muestral(Mo)
Es el dato que ocurre con mayor frecuencia en una muestra. Puede ser que no exista la moda y también es
posible que exista mas de una moda.
Ejemplo
Si los datos son 2,6,11,8,11,4,7,5
Entonces Mo=11
14. ESTADÍSTICA DESCRIPTIVA
Ejemplo.
Si los datos son 2,6,11,8,11,4,7,5
Los datos ordenados 2,4,5,6,7,8,11,11,
entonces
𝑥 =
1
2
6 + = 6.
Mediana Muestral( 𝒙)
Es el valor ubicado en el centro de los datos ordenados
Sean X: X1 X2 … Xn una muestra de tamaño n
X(1 X(2 … X(n los elementos de la muestra ordenados en forma creciente
𝑥 =
𝑥 𝑛+1
2
𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
1
2
𝑥 𝑛
2
+ 𝑥 𝑛
2
+1
𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
NOTA: Las medidas de tendencia central no son
suficientes para describir de manera completa el
comportamiento de los datos de una muestra.
Se necesitan otras medidas.
15. ESTADÍSTICA DESCRIPTIVA
MEDIDAS DE DISPERSIÓN
Son números que proveen información adicional acerca del comportamiento de los datos, describiendo
numéricamente su dispersión.
RANGO
Es la diferencia entre el mayor valor y menor valor de los datos de la muestra.
𝑹 = 𝒙(𝒏 − 𝒙(𝟏
Ejemplo: Si los datos son 2,6,11,8,11,4,7,5
Entonces el rango es: 𝑹 = 𝟏𝟏 − 𝟐 = 𝟗
VARIANZA MUESTRAL
Esta medida cuantifica las distancias de los datos con respecto al valor de la media muestral.
𝑺 𝟐 = 𝒊=𝟏
𝒏
(𝒙𝒊− 𝒙 𝟐
𝒏−𝟏
𝑺 𝟐 =
𝒏 𝒊=𝟏
𝒏
𝒙𝒊
𝟐− 𝒊=𝟏
𝒏
𝒙𝒊
𝟐
𝒏(𝒏−𝟏
16. ESTADÍSTICA DESCRIPTIVA
Ejemplo: Si los datos son 2,6,11,8,11,4,7,5 y se ha calculado que 𝑥 = 6.
Entonces la varianza es
𝑆2 =
(2 − 6. 2
+(6 − 6. 2
+ ⋯ + ( − 6. 2
= 10.214
DESVIACIÓN ESTÁNDAR MUESTRAL
La raíz cuadrada positiva de la varianza. La desviación estándar muestral o desviación típica está expresada
en las mismas unidades de medida que los datos de la muestra.
𝑺 = + 𝑺 𝟐
17. ESTADÍSTICA DESCRIPTIVA
MEDIDAS DE POSICIÓN
Son números que distribuyen los datos ordenados de la muestra en grupos con el propósito de resaltar su
ubicación relativa. Estos números se denominan cuantiles en forma genérica.
CUARTILES
Son números que dividen a los datos de la muestra en grupos de tamaño aproximado de 25%.
Primer Cuartil(𝐐 𝟏
A la izquierda de 𝑄1están incluidos 25% de los datos( aproximadamente)
A la derecha de 𝑄1 están incluidos 75% de los datos(aproximadamente)
Segundo Cuartil(𝐐 𝟐
Igual que la mediana divide al grupo de datos en dos partes, cada una con el 50% de los
datos(aproximadamente)
Tercer Cuartil(𝐐 𝟑
A la izquierda de 𝑄3están incluidos 75% de los datos( aproximadamente)
A la derecha de 𝑄3 están incluidos 25% de los datos(aproximadamente)
18. ESTADÍSTICA DESCRIPTIVA
Ejemplo: Suponer que una muestra contiene 40 datos ordenados:
𝒙 𝟏 𝒙 𝟐 … . . 𝒙(𝒏 . Calcular 𝑸 𝟏 𝑸 𝟐 𝑸 𝟑
Desarrollo
𝑄1: 2 % 𝑑𝑒 40 = 10
Por lo tanto: 𝑄1 = (𝑥10 + 𝑥11 /2
𝑄2: 0% 𝑑𝑒 40 = 20 es igual a la mediana
𝑄2 = (𝑥20 + 𝑥21 /2
𝑄3: % 𝑑𝑒 40 = 0 es igual a la mediana
𝑄3 = (𝑥30 + 𝑥31 /2
19. ESTADÍSTICA DESCRIPTIVA
DECILES
Son números que dividen los datos de la muestran en grupos de tamaño aproximado de 10%
Primer Decil (𝐃 𝟏
A la izquierda de D1 están incluidos 10% de los datos(aproximadamente)
A la derecha de D1 están incluidos 90% de los datos(aproximadamente)
Segundo Decil (𝐃 𝟐
A la izquierda de D2 están incluidos 20% de los datos(aproximadamente)
A la derecha de D2 están incluidos 80% de los datos(aproximadamente)
Ejemplo: Suponer que una muestra contiene 40 datos ordenados:
𝑥(1 𝑥(2 … . . 𝑥(40 . Calcular D1
D1: 10% 𝑑𝑒 40 = 4
Por lo tanto: D1 = (𝑥 4 + 𝑥 5 /2
20. ESTADÍSTICA DESCRIPTIVA
PERCENTILES (O PORCENTILES)
Son números que dividen a los datos de la muestra en grupos de tamaño aproximado de 1%
Primer Percentil (𝐏𝟏
A la izquierda de P1 están incluidos 1% de los datos(aproximadamente)
A la derecha de P1 están el 99% de los datos(aproximadamente)
Segundo Percentiles (𝐏𝟐
A la izquierda de P2 están incluidos 2% de los datos(aproximadamente)
A la derecha de P2 están incluidos 98% de los datos(aproximadamente)
Ejemplo: Suponer que una muestra contiene 400 datos ordenados:
𝑥(1 𝑥(2 … . . 𝑥(400 . Calcular P1 P82
P1: 1% 𝑑𝑒 400 = 4 P82: 82% de 400 = 28
Por lo tanto: P1 = (𝑥 4 + 𝑥 5 /2 𝑃82 = 𝑥 328 + 𝑥 329 /2
21. ESTADÍSTICA DESCRIPTIVA
COEFICIENTE DE VARIACIÓN
Es un número que se usa para comparar la variabilidad de los datos de diferentes grupos. Es una medida
adimensional.
𝑉 =
𝑆
𝑥
Ejemplo
Para un grupo de datos 𝑥 = 20 𝑆 = 4, entonces 𝑉 =
4
20
= 0.2 = 20%
Para un grupo de datos 𝑥 = 48 𝑆 = 6, entonces 𝑉 =
6
48
= 0.12 = 12. %
En conclusión podemos decir que el primer grupo tiene mayor variabilidad relativa con respecto a su media
22. ESTADÍSTICA DESCRIPTIVA
FÓRMULAS PARA DATOS AGRUPADOS
“Si los datos de una muestra están disponibles únicamente en una tabla de frecuencias, se
pueden usar formulas para calcular las medidas estadísticas, en forma aproximada”
Número Clase Marca f F f/n F/n
1 𝑎1 𝑏1 𝑚1 𝑓1 𝐹1 𝑓1/𝑛 𝐹1/𝑛
2 𝑎2 𝑏2 𝑚2 𝑓2 𝐹2 𝑓2/𝑛 𝐹2/𝑛
….. ….. ….. ….. ….. ….. …..
k 𝑎 𝑘 𝑏 𝑘 𝑚 𝑘 𝑓𝑘 𝐹𝑘 𝑓𝑘/𝑛 𝐹𝑘/𝑛
Medias de datos agrupados
𝑥 =
1
𝑛
𝑖=1
𝑘
𝑚𝑖 𝑓𝑖
Varianza de datos agrupados
𝑆2 =
1
𝑛 − 1
𝑖=1
𝑘
𝑓𝑖 𝑚𝑖 − 𝑥 2
23. ESTADÍSTICA DESCRIPTIVA
FÓRMULAS PARA DATOS AGRUPADOS
Ejemplo: La Tabla de frecuencias siguiente contiene los datos agrupados en 6 clases del número
de artículos vendidos por un almacén en 50 días. Calcule la media y la varianza.
Número Clase Marca f F f/n F/n
1 10 20 1 2 2 0.04 0.04
2 20 0 25 10 12 0.2 0.24
3 0 40 35 12 24 0.24 0.48
4 40 0 45 14 38 0.28 0.76
5 0 60 55 9 47 0.18 0.94
6 60 0 65 3 50 0.06 1
24. ESTADÍSTICA DESCRIPTIVA
INSTRUMENTOS GRÁFICOS ADICIONALES
DIAGRAMA DE CAJA
Es un dispositivo gráfico que se usa para expresar en forma resumida, algunas medidas estadísticas de
posición:
El diagrama de caja describe gráficamente el rango, el rango intercuartílico (Q3 − Q1 , valores extremos y la
ubicación de los cuartiles. Es una representación útil para comparar grupos de datos.
DIAGRAMA DE PUNTOS
Si la cantidad de datos es pequeña,(alrededor de 20 o menos), se los puede representar mediante puntos
directamente sin agruparlos en intervalos.
25. ESTADÍSTICA DESCRIPTIVA
INSTRUMENTOS GRÁFICOS ADICIONALES
DIAGRAMA DE PARETO
Es un gráfico útil para identificar las causas principales que producen cierto tipo de resultados.
Procedimiento para construir el diagrama de Pareto
1. Categorice los datos por tipo de problema
2. Determine la frecuencia y ordene en forma decreciente
3. Represente la frecuencia relativa con barras
4. Superponga la ojiva de la frecuencia relativa acumulada
5. Analice cuales son las causas mas importantes que inciden en el suceso de interés.
26. ESTADÍSTICA DESCRIPTIVA
Ejemplo
Un fabricante ha realizado un conteo de los tipos de defectos de sus productos y ha registrado su
frecuencia. Se desea analizar su incidencia en la población con un Diagrama de Pareto.
Los resultados, tabulados según el procedimiento anterior son:
Notas del editor
MEDIDAS DE TENDENCIA CENTRAL
La media de una muestra o cualquier otra medición basada en una muestra de datos recibe el nombre de estadístico (Valor que me define la característica de una muestra).
MEDIDAS DE TENDENCIA CENTRAL
Son números que definen cual es el valor alrededor del que se concentran los datos. Se indican a continuación los más utilizados.