2. Capítulo 1: Estadística Básica
Sesión 1: Herramientas básicas de calidad
• Conceptos básicos de Estadística
• Histograma
• Diagrama de Pareto y Causa y efecto
• Análisis de regresión lineal simple
3. Al término de esta sesión, Ud. podrá:
Aplicar los conceptos de:
• Conceptos básicos de Estadística
• Histograma
• Diagrama de Pareto y Causa y efecto
• Análisis de regresión lineal simple
• Usar Minitab para analizar datos
4. Tipos de datos
• Los datos cuantitativos se dividen en dos tipos:
– Continuos, también conocidos como variables
– Discretos, también conocidos como atributos
• Los datos continuos son resultado de mediciones en una
escala continua como longitud, peso o temperatura. Se les
llama escalas continuas porque entre dos valores existe un
número infinito de valores.
• Los datos discretos se utilizan al contar las veces que ocurre
un evento. Por ejemplo al contar el número de veces que la
pintura se corre por lote de piezas pintadas, el número de
válvulas con fuga o el número de burbujas en un metro
cuadrado de vidrio flotado.
5. Tipos de datos
Ejemplos
Datos continuos
• Mediciones de una
escala continua.
• Dimensión
• Peso
• Fuerza
• Tiempo
• Costo
Datos discretos
• Datos obtenidos por conteo
Ejemplos
• Cantidad de piezas que
fallan una prueba
• Número de defectos en
un lote de piezas
6. Ejercicio
Determinar para cada una de las salidas de proceso listados a
continuación, si el tipo de datos es continuo (C) o discreto (D).
Tipo de Datos (C o D)
1. Cantidad de engranes defectuosos. __________
2. El número de terminales invertidas en una tarjeta. __________
3. Diámetro de un perno en milímetros. __________
4. El número de soldaduras malas. __________
5. El número de veces que falla un producto . __________
6. La altura de un cilindro. __________
7. El número de motores que fallan en inspección. __________
8. Fuerza necesaria para levantar un carro en Kg. __________
7. Ejercicio
Determinar para cada una de las salidas de proceso listados a
continuación, si el tipo de datos es continuo (C) o discreto (D).
Tipo de Datos (C o D)
1. Cantidad de engranes defectuosos. __________
2. El número de terminales invertidas en una tarjeta. __________
3. Diámetro de un perno en milímetros. __________
4. El número de soldaduras malas. __________
5. El número de veces que falla un producto . __________
6. La altura de un cilindro. __________
7. El número de motores que fallan en inspección. __________
8. Fuerza necesaria para levantar un carro en Kg. __________
D
D
C
D
D
C
D
C
8. Población vs. Muestra
8
Una población es la recopilación
completa de todos los elementos
que se están estudiando.
Una muestra es un subconjunto
de elementos tomados de una
población.
Muestra:
50 diámetros
de barreno
Población:
Todos los diámetros
de barreno
9. Estadística Descriptiva vs Inferencial
9
Tomando una muestra de datos
podemos…
• Describir y resumir el conjunto
de datos:
Estadística Descriptiva
• Realizar pronósticos sobre la
población:
Estadística Inferencial.
Población:
Todos los diámetros
de barreno
Muestra:
50 diámetros
de barreno
10. Estadísticos de muestra vs. parámetros de
población
2
Población
Muestra
s s2
Los estadísticos son mediciones
descriptivas de la muestra:
x = Media de la muestra
s = Desviación estandar muestral
s2 = Varianza muestral
Los parámetros son mediciones
descriptivas de la población:
= Media de la Población
= Desviación Estandar Poblacional
2 = Varianza Poblacional
𝑥
11. Medidas de tendencia central para datos
discretos
En este lote hay...
• Cantidad de defectuosos np =3 piezas defectuosas
• Fracción defectuosa p =np/n = 3/12 = 0.25 fracción defectuosa
• Cantidad de defectos c = 6 defectos
• Defectos por unidad u = c/n =6/12 =0.5 dpu
12. Medidas de tendencia central para datos
discretos
• Distribución binomial:
𝑝 =
Total de piezas defectuosas
Total de piezas probadas
p=
Cantidad de piezas defectuosas
Cantidad de piezas probadas
13. Medidas de dispersión para datos discretos
• Distribución binomial:
• Para tamaños de grupo variable:
𝑝 =
Total de piezas defectuosas
Total de piezas probadas
s=
𝑝(1−𝑝)
𝑛
n=número de observaciones presentes
s=
𝑝(1−𝑝)
𝑛
15. Descripción de datos continuos
• Las siguientes tres características de un conjunto de datos
pueden darnos información importante:
– Tendencia central (Media, mediana, moda)
– Variación (Rango, desviación estándar, varianza)
– Forma (Asimetría, curtosis)
Datos Varaibles 15
16. Medidas de tendencia central para datos
continuos
• El centro de la muestra se puede medir de tres maneras:
– La media es el promedio aritmético de una serie de datos
– La mediana es el valor en la posición central de una serie ordenada de datos.
Si hay un número impar de datos, la mediana es el valor central. Si hay un
número par de datos la mediana es el promedio de los dos valores centrales.
– La moda es el valor que más se repite en una serie de datos. Puede existir
más de un valor de la moda.
• Estos tres términos se conocen como medidas de tendencia
central
𝑋 =
𝑋𝑖
𝑛
17. Medidas de tendencia central para datos
continuos
• Ejemplo: Calcular la media de los siguientes datos:
• 53, 56, 50, 49, 50, 54, 52
• Calcular la mediana de los datos anteriores.
• 49, 50, 50, 52, 53, 54, 56
• Mediana=52
• ¿Cuál es la moda de los datos anteriores?
• Moda=50
𝑥 =
𝑥𝑖
𝑛
= 52
18. Medidas de dispersión para datos continuos
• La dispersión de la muestra también se conoce como
variación y usualmente se cuantifica el rango, el rango móvil,
la varianza y la desviación estándar de la muestra.
– El rango de un conjunto de mediciones, es la diferencia entre el valor
mayor y el menor del conjunto
– Ejemplo: El rango de los valores 1, 3, 5, 7 y 8 es 8-1=7
– El rango móvil de dos valores, es la diferencia absoluta entre dos valores
consecutivos.
– Ejemplo: El rango móvil de los valores 1 y 3 es 2.
𝑅 = 𝑀á𝑥𝑖𝑚𝑜 − 𝑀í𝑛𝑖𝑚𝑜
19. Medidas de dispersión para datos continuos
• La varianza de la muestra se calcula de la siguiente manera:
Donde = media de la muestra
n = tamaño de la muestra
• La desviación estándar de la muestra se calcula de esta
manera:
donde = media de la muestra
n = tamaño de la muestra
𝑥
𝑠2 =
(xi − 𝑥 )2
n
i=1
𝑛 − 1
𝑠 =
(xi − 𝑥 )2
n
i=1
n−1
𝑥
20. 53 52 1 1
56 52 4 16
50 52 -2 4
49 52 -3 9
50 52 -2 4
54 52 2 4
52 52 0 0
Medidas de dispersión para datos continuos
• Calcular la varianza y desviación estándar de los siguientes
datos:
53, 56, 50, 49, 50, 54, 52
• Varianza:
• Desviación estándar:
𝑥=52
𝑥 xi − 𝑥 (xi−𝑥 )2
Suma: 38
𝑠2
=
(xi−𝑥 )2
n
i=1
𝑛−1
=
38
6
=6.33
𝑠 =
(xi−𝑥 )2
n
i=1
n−1
= 6.33=2.52
𝑥𝑖
21. Los histogramas muestran la forma de la
distribución de los datos
Asimetría negativa: sesgada hacia la Izquierda
Distribución uniforme
Distribución bimodal
Forma de campana: Distribución Normal
Asimetría positiva: sesgada hacia la derecha
22. Medidas de forma de distribución: asimetría
• La asimetría es una medida de la condición asimétrica. Un
valor negativo indica asimetría a la izquierda y un valor
positivo indica asimetría a la derecha. Un valor de cero no
necesariamente indica simetría.
Referencia: Minitab® Software Estadístico
23. Medidas de forma de distribución: curtosis
• La curtosis es una medida de qué tan diferente es una
distribución con respecto a la distribución normal.
• Un valor positivo por lo general indica que la distribución
tiene un pico más pronunciado que la distribución normal.
• Un valor negativo indica que la distribución tiene un pico más
plano que la distribución normal.
Referencia: Minitab® Software Estadístico
24. Uso de Minitab®
• Ejemplo: Calcular las medidas de tendencia central y
dispersión de los siguientes datos usando Minitab®:
• 53, 56, 50, 49, 50, 54, 52
"MINITAB® and all other trademarks and logos for the Company's products and services are the exclusive property of
Minitab Inc. All other marks referenced remain the property of their respective owners. See minitab.com for more
information."
25. Uso de Minitab®
Estadísticos descriptivos: Datos
Estadísticas
Variable N N* Media Desv.Est. Varianza Mediana Rango Modo
N para
moda Asimetría
Datos 7 0 52.000 2.517 6.333 52.000 7.000 50
2 0.44
Variable Curtosis
Datos -0.91
27. Histograma
• El histograma muestra la forma y dispersión de los datos.
• Un histograma divide los valores de la muestra entre muchos
intervalos y representa la frecuencia de los valores de datos
en cada intervalo con una barra.
Histograma de diámetro
15
10
Frecuencia
5
1
Diámetro
4
2
1 1
1 1
7
11
13
9
70 80 90 100
10 20 30 40 50 60
28. Los histogramas muestran la forma de la
distribución de los datos
Sesgada hacia la Izquierda
Distribución Uniforme
Distribución Bimodal
Forma de Campana – Distribución Normal
Sesgada hacia la Derecha
29. Cómo hacer un histograma:
1. Colectar datos y contar el total
2. Determinar el rango (R = X mayor - X menor)
(el valor más alto - el más bajo)
3. Seleccionar el número de barras o celdas (k):
Número de Número de celdas
Puntos o datos Recomendadas
20 - 49 5 -7
50 - 100 8 -10
100 - 250 10 - 15
Más de 250 16 -20
Histograma
30. 4. Calcular el ancho de la celda (H = R/k)
Ancho de la celda = Rango/número de celdas.
5. Redondear la celda a un número conveniente.
6. Construir celdas poniendo celdas límites
• Primer celda: dato de menor valor (X menor) como
punto medio.
• Límites de Celdas: X medio +/- H/2.
• La distancia entre puntos medios de celdas es H.
7. Repartir el número de datos en cada celda.
Histograma
31. 8. Dibujar y poner nombre al eje horizontal “X”
9. Dibujar y poner nombre al eje vertical “Y”
10. Contar la cantidad de valores en cada celda
11. Colocar en las barras la cantidad de valores en cada
celda.
12. Dibujar el alto de cada barra representando la cantidad
de valores en cada celda o frecuencia.
Histograma
32. Para la siguiente serie de datos graficar el histograma
46 31 37 33 69
36 27 28 96 61
54 71 64 49 50
63 45 39 36 19
73 65 10 62 54
44 57 45 76 47
38 48 45 91 38
50 45 64 77 33
56 35 25 37 64
42 31 59 48 40
Ejemplo de histograma
# de datos= 50
Mínimo= 10
Máximo= 96
Rango= 86
# de celdas= 10
Ancho= 8.6 9
Clase Frecuencia Total
5-14:
15-24:
25-34:
35-44:
45-54:
55-64:
65-74:
75-84:
85-94:
95-105:
33. Para la siguiente serie de datos graficar el histograma
46 31 37 33 69
36 27 28 96 61
54 71 64 49 50
63 45 39 36 19
73 65 10 62 54
44 57 45 76 47
38 48 45 91 38
50 45 64 77 33
56 35 25 37 64
42 31 59 48 40
Clase Frecuencia Total
5-14: I 1
15-24: I 1
25-34: IIII II 7
35-44: IIII IIII I 11
45-54: IIII IIII III 13
55-64: IIII IIII 9
65-74: IIII 4
75-84: II 2
85-94: I 1
95-105: I 1
Ejemplo de histograma