2. Introduccion
• Precision Vs Exactitud
• Ejemplo: Como analizar el desempeño de un curso?
Descriptive Statistics 2
3. Metricas Numericas Descriptivas
•Tendencia central o de centralización: media, mediana
y moda.
•Posición: cuantiles (cuartiIes, deciles o percentiles).
•Variabilidad: rango, rango intercuartílico, desviación
estándar, varianza, coeficiente de variación.
•Forma: coeficiente de asimetría y de apuntamiento
Descriptive Statistics 3
4. Medidas de Tendencia Central: Media
• Para un conjunto de 𝑛 valores 𝑥1, 𝑥2, … , 𝑥𝑛 que representan una
muestra, la media está dada por:
• Para un conjunto de 𝑁 valores que representan una población,
la media está dada por:
Descriptive Statistics 4
5. Media aritmética o promedio
La media representa el punto de equilibrio del conjunto,
lo que debería ser para que el conjunto fuera
totalmente homogéneo.
Descriptive Statistics 5
6. Ejemplo 1: Promedio
Si los valores otorgados a los empleados fueran 600, 650,
700, 1050 miles de pesos, calcule la suma de las
diferencias entre la media y las observaciones:
Descriptive Statistics 6
7. Observaciones acerca de la Media
•La media se ve afectada por valores extremos.
•En algunos casos se calcula una media recortada (se
ordenan los datos y se elimina cierto porcentaje de
datos en los extremos).
•Se analizan puntos extremos y se eliminan.
•Se puede estimar la media recortada removiendo un
porcentaje de los superiores e inferiores
Descriptive Statistics 7
8. Problema 1
Las siguientes mediciones capturan el tiempo de secado en horas
de una marca de pintura.
3.4 2.5 4.8 2.9 3.6
2.8 3.3 5.6 3.7 2.8
4.4 4.0 5.2 3.0 4.8
(a) Cual es el tamaño de muestra?
(b) Estime la media muestral.
(c) Calcule la media recortada en un 20%.
Descriptive Statistics 8
9. Medidas de Tendencia Central: Moda
La moda en un conjunto de datos es el dato que más se
repite. Los conjuntos pueden ser unimodaIes, bimodales
o muItimodaIes. Aplica para datos cualitativos y
cuantitativos.
Ejemplo: Estimar la moda {6, 3, 9, 6, 6, 5, 9, 3}
Descriptive Statistics 9
10. Medidas de Tendencia Central: Mediana
La mediana se denotará como 𝜇 para la población y 𝑥 para la
muestra. Para un conjunto de valores ordenados se tiene:
• Ejemplo: 1.7, 2.2, 3.9, 4.11, 14.7
Descriptive Statistics 10
Si n es impar
Si n es par
11. Problema 2: Mediana
Encuentre la media para ambos conjuntos de datos:
Set 1 (3, 8, 6, 11, 1, 16)
Set 2 (3, 20, 8, 6, 11, 1, 16)
Descriptive Statistics 11
12. Position Metrics
Un punto de posición es aquel valor para el cual un porcentaje específico
de valores queda en o por debajo de él y el complemento en o por encima
de él. Se le denominan en general cuantiles y pueden ser cuartiles, deciles
y percentiles.
1.Los cuartiles son aquellos valores que dividen al conjunto en 4 partes,
cada uno contiene aproximadamente el 25% de los datos (𝑄1, 𝑄2, 𝑄3).
2.Los deciles son aquellos valores que dividen al conjunto en 10 partes,
cada uno contiene aproximadamente el 10% de los datos (𝐷1, 𝐷2, …, 𝐷9).
3.Los percentiles son aquellos valores que dividen al conjunto en 100
partes, cada uno contiene aproximadamente el 1% de los datos (𝑃1, …,
𝑃99).
Descriptive Statistics 12
13. Medidas de Posición
Para ubicar cualquier cuantiI, se deben ordenar los datos y
ubicar la posición del cuantiI deseado. Si 𝑛 es el total de datos:
Cuartiles
Deciles
Percentiles
Descriptive Statistics 13
𝑃𝑜𝑠 𝑄𝑖 = 𝑖 ∗
𝑛 + 1
4
, 𝑖 = 1, 2, 3
𝑃𝑜𝑠 𝐷𝑖 = 𝑖 ∗
𝑛 + 1
10
, 𝑖 = 1, … , 9
𝑃𝑜𝑠 𝑃𝑖 = 𝑖 ∗
𝑛 + 1
100
, 𝑖 = 1, … , 99
14. Medidas de Posición
•Si la posición es un número entero, el cuantiI es el valor que
está en esa posición.
•Si la posición es un número decimal, se toman los valores en
las posiciones antes (𝑥𝑖 ) y después (𝑥𝑖+1 ), se calcula la
diferencia entre la posición hallada y la posición 𝑥𝑖 y se
multiplica por 𝑥i+1 − 𝑥𝑖. El valor del cuantiI será este resultado
sumado al valor 𝑥𝑖:
Descriptive Statistics 14
𝑐𝑢𝑎𝑛𝑡𝑖𝑙 = 𝑥𝑖 + 𝑃𝑜𝑠 ℎ𝑎𝑙𝑙𝑎𝑑𝑎 − 𝑃𝑜𝑠 𝑥𝑖 𝑥i+1 − 𝑥𝑖
15. Ejemplo Medidas de Posición
Calcule e interprete 𝑄1, 𝑄2, 𝑄3, 𝐷3, 𝐷8
Descriptive Statistics 15
16. Problema 3: Medidas de Posición
La siguiente tabla representa la distancia recorrida en millas por
galón para un conjunto de automóviles con diferentes
características. Calcule e interprete 𝑄2, 𝐷1, 𝐷6.
Descriptive Statistics 16
17. Métricas de Dispersión
•Siempre hay que tomar decisiones en presencia de
variabilidad o “ruido”. Es imposible de eliminar, se desea
eliminar.
•Causas de variabilidad: mano de obra, métodos, máquinas,
materia prima, medio ambiente, medición.
•Medidas de variabilidad: rango, rango intercuartílico,
desviación estándar, varianza, coeficiente de variación.
•Miden la magnitud de las desviaciones de los valores con
respecto a un valor central.
Descriptive Statistics 17
18. Rango
El rando (R) mide la distancia entre el valor maximo y el menor:
R = 5-1 = 4
El rango es una medida débil para comparar variabilidad
Descriptive Statistics 18
19. Varianza
• La varianza se denota 𝜎2
para una población y 𝑠2
para
una muestra. Se calculan respectivamente como:
• 𝑁 y 𝑛 representan los tamaños de la población y de la
muestra respectivamente.
Descriptive Statistics 19
20. Varianza
• La varianza mide que tan alejados se encuentran los datos
con respecto a la media.
• La varianza está en unidades cuadradas.
• A mayor varianza, mayor variabilidad.
• La varianza es una medida “muda”. Se puede utilizar para
comparar la variabilidad de conjuntos de datos que
satisfacen las siguientes condiciones:
• Están en las mismas unidades (tiempo vs. longitud).
• Sean de la misma “dimensión” (unidades vs. unidades mil).
Descriptive Statistics 20
21. Varianza
• Se considerará que siempre se está trabajando con muestras
y se puede calcular 𝑠2 de una forma más simple desarrollando el
cuadrado, así:
21
23. Ejemplo : Varianza
• Set 1: 1, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5
• Set 2: 1, 2, 2, 2, 3, 3, 4, 4, 5, 5, 5, 5
Donde 𝑓𝑖 es el número de veces que se repite el dato 𝑖 y 𝑘 es el
número de datos diferentes.
Descriptive Statistics 23
27. Coeficiente de Variación
•Es una medida de variabilidad que es independiente de
la unidad de medida.
•Puede utilizarse para comparar la variabilidad de
conjuntos de datos que están en unidades diferentes.
•Es la medida más fuerte al momento de comparar. Se
calcula como:
𝐶𝑉 =
𝜎
𝑋
Descriptive Statistics 27
28. Problema: Coeficiente de Variación
Compare la variabilidad de dos productos:
Descriptive Statistics 28
Item 1 Item 2
5 20
7 25
10 18
9 22
4 21
8 17
29. Problem
Happy Lights and Shiny Lights are two companies manufacturing bulb lights for the South
American market. The industry has a standard of an expected product lifetime equal or
higher than 2000 hours. Small variability is as important as the expected lifetime because
it is perceived as product reliability by the customer. The following datasets measure the
lifespan of 14 bulbs in hours.
Happy Lights
Shiny Lights
Compare the brands products lifetimes and dispersion performance. Which company is
offering a better product? What are your recommendations for both companies?
Descriptive Statistics 29
1620 1738 1769 1800 1863 1888 1971 1983 1999 2110 2148 2180 2349 2440
1811 1832 1894 1913 1919 1921 1933 1943 1948 1967 1968 1975 2012 2022