1. Tema 1
La estadística: definiciones básicas
Deming: ahora se va a dar inicio al módulo Medición y mejora de los sistemas de gestión de la
calidad en el sector público. Se trabajará principalmente con la estadística, que quizá, para algunos
de ustedes es familiar; Nosotros, haremos que retome los conocimientos de la estadística de
manera amigable y agradable, pues solo así, podrá ver lo útil que resulta manejar sus
herramientas.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
2. Chulo: Yo he escuchado que en la actualidad el uso de las herramientas estadísticas se hace cada
día más generalizado, especialmente para apoyar el seguimiento de la implementación del sistema
de gestión de calidad.
Deming: Es correcto, todo el sistema de gestión de calidad debe medirse y controlarse y, no hay
otra manera, que haciendo uso de dichas herramientas.
Chulo: Pero bueno, ¿Qué es la estadística?
Deming: es un instrumento relativamente sencillo para tomar información, visualizarla, interpretarla,
analizarla y tomar decisiones a tiempo. ¿Sencillo, verdad?
Chulo: Y desde hace cuánto se utiliza la estadística
Deming: La estadística fue primeramente un método de descripción de datos en los estados.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
3. El Estadístico se encarga del ordenamiento y manejo de datos presentándolos en tablas y gráficos
que facilitan el análisis, para establecer conclusiones y recomendaciones para toma de decisiones
oportunas
Ejemplos de estadística Fisher Ronald Galton Francis (regresión)
Análisis de varianza
QUESTELE,
“frecuencia relativa” y Kart Pearson
Fundo Dpto. de Estadística U. Londres
“probabilidad matemática”
El Estadista es una persona versada en un negocio, conoce la evolución diaria del país en términos
de valores.
DATO CURIOSO: ¿Qué personaje de Colombia en recuerda usted que se haya hecho
notar como estadista?
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
4. Carlos Lleras Restrepo Albero Lleras Camargo
Deming: El primer paso para poder hacer estadística es la recopilación de información,
que debe ser bien recopilada en datos o variables y, presentadas de manera oportuna y
correctas
Apreciado estudiante, le recomendamos ir al glosario para que pueda entender e
identificar los términos que se usarán de aquí en adelante.
Variable: son los datos en términos numéricos
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
5. Variable Cuantitativa: Son aquellas que se pueden medir y de las que podemos esperar
un resultado numérico, se pueden clasificar en discreta y continua
Discreta: es aquella que se representa por números enteros sin fracciones, como por
ejemplo número de personas (128 personas), número de pupitres en el salón (35
pupitres), numero de cajas de 12 unidades, numero de hijos que tiene una familia, número
de alumnos que tiene un salón de clase
Continuas: Son aquellas que representan cantidades muy dispersas en valores
fraccionarios como por ejemplo la edad (58, 6 años), el peso (58,7 kilos), estatura (1,68
m).
Variables Cualitativas: son aquellas que expresan distintas cualidades, característica o
modalidad, cada modalidad que se presenta se determina atributo.
Atributos: cuando la verificación de calidad no se puede medir en términos de variables se
usa el concepto de aceptada o rechazada, pasa o no pasa, defectuosa o no defectuosa,
adecuada o inadecuada, el sistema de clasificación es por intermedio de
- sentidos humanos: vista, olfato, tacto, gusto, oído.
- calibradores o galgas: pasa – no pasa
- Conteo: número de piezas malas en un lote.
Proceso: como definió en el módulo uno, es un conjunto de actividades mutuamente
relacionadas que transforman entradas en salidas.
Control: todas aquellas actividades dirigidas a mantener un proceso en estado deseado. Es,
también, la vigilancia periódica y continua sobre el desarrollo de un proceso o la calidad de un
producto para comprobar que cumple con las especificaciones establecidas
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
6. Apreciado estudiante: le sugerimos que vaya a la semana 3 del módulo uno, allí podrá recordar lo
concerniente a proceso.
Por intermedio del control estadístico de los procesos se puede mantener el proceso dentro de
normas establecidas.
Deming: Hay un término muy importante que se debe tener en cuenta: Población (se representa
con la letra “N); corresponde a la totalidad de los elementos que forman el universo de interés.;
pertenecen a la población todos aquellos elementos que poseen la característica que se desea
estudiar.
Chulo: y, ¿A qué se le llama muestra?
Deming: Cuando se presentan cantidades poblacionales resulta poco práctico y costoso analizar la
totalidad de los elementos o partes que compone una dicha población, es preferible seleccionar
unas cuantas partes para estudiarlas. Estas partes o piezas seleccionadas generalmente de
manera aleatoria se le llaman muestra.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
7. Hacer cuadro, fotografía de una población y luego fotografía de una muestra
Deming: La muestra (Se representa con la letra “n”), Está integrada por algunos elementos de la
población, estas muestras para efectos de análisis estadístico debe cumplir con características
como la de ser representativa de la población.
Chulo, eso quiere decir que, los elementos que la integran son escogidos de manera aleatoria o al
azar, lo que significa que todos tienen la misma probabilidad de ser escogidos.
Deming: ¡Exacto! Decimos, entonces, que cuando no es fácil o posible observar a toda la
población, y se necesita tomar información para decidir o tener una evidencia que apoye una
decisión, se debe extraer una o unas pocas muestras representativas de la población.
Chulo: Yo he escuchado hablar de la estadística descriptiva, esto qué es.
Deming: La estadística descriptiva; es una parte de la estadística que se dedica a analizar y
representar los datos. Este análisis es básico, pero fundamental en todo estudio.
Deming: Para hacer un buen estudio con las herramientas que nos brinda la estadística, es
necesario conocer algunos términos.
• Medidas de tendencia central: moda, mediana, media
• Medidas de dispersión o de variación: rango, varianza y desviación estándar
• Organización y procesamiento de datos: serie estadística simple, agrupada en frecuencias
y agrupada en clases
• Presentación gráfica de datos: histograma
Deming: Pasaremos a ver la aplicación de estos términos con un ejemplo.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
8. Ejemplo.
Las edades en términos de variables discretas (años completos) de un grupo de funcionarios de
una entidad pública son:
1. Recopilación o tabulación de la información: edades de funcionarios públicos
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
2. Organizar los datos de menor valor a mayor valor de cada variable discreta
24, 24, 28, 28, 29, 30, 33, 33, 33, 33, 33, 38, 38, 38, 38, 38, 45, 53, 55, 57, 57
3. Uso de la estadística
Existen diferentes tipos de medidas de centralización, las más comunes son la media, la Mediana y
la Moda
Deming: Vayamos contestando algunas preguntas y vamos avanzando en recordar estos tipos de
medidas.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
9. 3.1 ¿Cuántos empleados se incluyeron en el estudio?
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
Respuesta: 21
3.2 La edad más frecuente: 33 años es la moda (valor presentado con mayor frecuencia en una
serie de datos)
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
^
Moda X
Deming: La moda de una serie de números es aquel valor que más se repite, es decir, es el valor
más común. La moda puede no existir, incluso si existe puede no ser única. La moda se indica con
^X
Ejemplo 1.1
El sistema de números 3, 5, 6, 6, 7, 8, 9, 9, 9, 10, 11
Tiene de moda el 9
El sistema de números 3, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9, 10
Tiene dos modas: 7 y 9
Chulo: Eso quiere decir que, si se obtiene una sola moda es unimodal, si son 2 es bimodal y más
de 2 multimodal.
Deming: Eso es correcto.
3.3 ¿Cuál fue el valor encontrado en la mitad de los datos?
Respuesta: 33, esto es la mediana, que es el valor o variable medio de una secuencia de datos
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
10. Para obtener la mediana, se ordenan los datos de menor a mayor, si el numero de muestras es
par, la posición de la mediana será entre dos variables que corresponde a la posición central, si N
es impar la posición de la mediana es la posición media.
La mediana es el conjunto de datos ordenados en orden de magnitud ya sea ascendente o
descendente, el valor que ocupa la posición central dentro del conjunto de datos (cuando se tiene
un número impar de datos), o el promedio de los dos valores medios (cuando el número de datos
es par)
Ejemplo 1
Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 10, 11 tiene de mediana el valor o variable 7
Ejemplo 2
Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 9, 10
Su mediana será ½ (7 + 8) = 7.5
3.4 ¿Cuál es el valor promedio?
Respuesta: edad promedio: 35.57 años
Esto es la media que es la suma de todos los valores de una variable específica (en este caso
edad) dividida por el total de datos
∑ Xi
n La formula de la media es X
X
De un conjunto de N números X1, X2, X3,……, XN, es el valor promedio de una muestra o
población y es igual a la suma del conjunto de datos dividido entre el número de datos
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
11. X = X1 + X2 + X3+...………+ Xn =
N
Veamos otro ejemplo, la media de los números 8 + 9 + 7 + 12 + 10 + 3 y 11 es
X = 8 + 9 + 7 + 12 + 10 + 3 + 11
n
8.57
Donde ∑ (sigma mayúscula / letra griega) significa sumatoria
Xi: representa observaciones individuales
n : es el número de observaciones
Xi: 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
La media se ilustra con una X y sobre ella una pequeña línea
Xmedia = 773 = 36,8095 años
21
Deming: Bueno ahora como hemos agrupado las diferentes edades que se repiten, esa repetición
es lo que se denomina frecuencia (fr)
Agrupadas las edades multiplicamos cada edad (Xi) por las veces que se presentan (fr.) y tenemos
el valor (fr. * Xi)
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
Tabla agrupada en frecuencias
Xi frecuencia fr. * Xi
24 2 48
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
12. 28 2 56
29 1 29
30 1 30
33 5 165
38 5 190
45 2 90
53 1 53
55 1 55
57 1 57
21 773
Deming: Si sumamos los resultados de fr.*Xi da como resultado el total de edades, como cuando
en un grupo de personas mayores alguien dice:
“Entre nosotros sumamos más de 300 años, así es, aquí entre todos suman 773 años”
Chulo: (Asombrado) ¡Uy! O sea que el promedio de 773 años entre 21 funcionarios es de
36,809 años
Deming: ¡Ojo! a propósito de los promedios, hay que tener cuidado, pues un valor muy alto o unos
valores muy bajos, pueden dar resultados que deben analizarse antes de accionar; existe un
anécdota interesante sobre el concepto de un promedio.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
13. HISTORIA PARA ANALIZAR: Profundidad promedio de 70 centímetros
“ En una oportunidad un joven de 1,58 m de estatura, estudiante de estadística de una prestigiosa
universidad, en sus vacaciones quiso conocer la belleza del llano, pues escuchaba – el llano es lindo
– se dio al recorrido, pero ya estando en el llano, se encontró con que se terminó la carretera, pues
seguía un río, su situación era muy difícil pues no sabia nadar y tenia que tomar la decisión de seguir
adelante pasando el río; en la orilla se encontraba un anciano se le acerco y le pregunto ¿En
promedio cuánto tiene de profundidad el río?, el señor anciano quien conocía el río en épocas de
verano y que también conocía de estadística le respondió: “ El río en promedio tiene 70 cm. de
profundidad”. El estudiante muy alegre por el dato que el anciano le había dado, pues 70 cm eran
una profundidad pasable, se dio a la tarea de pasar el río, pero cuando iba bien adentro en el
recorrido del río, se encontró con una profundidad de 2,00 m y se ahogó”
Charles Belt Little
Chulo: Pobre joven, no tuvo en cuenta que los valores de las medias de dispersión son mayores
cuando están muy disgregadas y son menores cuando los datos están cercanamente agrupados
3.5 ¿Qué tan separados están los datos?
Respuesta: 33, ya que la edad mayor 57 menos la edad menor 24 = 33. Esto se llama rango o
amplitud.
3.6 ¿Qué tanto están separados los datos del promedio o media?
Esto se obtiene con la desviación estándar (S) que expresa que tanto se dispersan los datos en
relación a la media
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
14. La S es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz
cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada
valor
1
S= ∑( xi − x ) 2
n −1
Serie agrupada en clases
Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en
subconjuntos o subclases.
El número de clases o pisos o niveles (NC) se puede calcular
NC = 1 + 3.3 log n (n es el tamaño de la muestra)
Bueno no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con base
en el siguiente criterio entrenado
Usted puede utilizar la tabla que relaciono a continuación, es una guía que nos muestra para
diferentes cantidades de datos, el número recomendado de clases a utilizar así
Número de datos Número de clases (k)
Menos de 50 5-7
50 - 100 6 - 10
101 - 250 7 - 12
Más de 250 10 - 20
Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que
componen la muestra de variables y aproximando el resultado al número entero inmediatamente
superior
Ejemplo n = 90 datos
Raíz cuadrada de 90 = 9, 4868
Número de clases 10
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
15. Intervalo de clase “IC” es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie
dividida por el número de clase o pisos que se ha determinado con anticipación
Ejemplo: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos
agruparlos en 8 niveles o números de clase (NC)
El intervalo de clase de cada nivel o piso es IC = DM - dm
8 niveles
IC = 57 – 24
21
IC = 4,125
Clase valor base IC Inter. de clase
1 24,000 4,125 28,125
2 28,126 4,125 32,250
3 32,251 4,125 36,375
4 36,376 4,125 40,500
5 40,501 4,125 44,625
6 44,626 4,125 48,750
7 48,751 4,125 52,875
8 52,876 4,125 57,000
Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda
incluida en 8 niveles.
Qué observa usted?
- Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de
clase” de 4.125 y se logra el primer rango o sea hasta 28,125
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
16. - Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior
mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en
este caso 57,00 años.
- Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior
y sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del
anterior rango
Tema 2
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
17. Evolución histórica de la Estadística en su aplicación de la calidad
Evolución cronológica
De 1920 a 1930 Shewarth precursor que inicia a utilizar métodos estadísticos en Bell Telephone
En 1941 Harol Dodge y Henry Raming propusieron uso de tablas simplificadas de muestreo para
inspección de entradas.
En el año 1950 Armand Feigenbaun, desarrolla el Control Total de Calidad (TQC), en el que se
involucra a todos los integrantes de una organización
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
18. En 1950 uno de los alumnos de Juran y de Deming, Genichi Taguchi hace aportes sobre Métodos
estadísticos
En el año 1951, La revolución de la calidad en el Japón, se establece el premio Deming de la
Calidad, Deming propone Métodos de muestreo y recomienda 14 principios sobre el uso de
herramientas estadísticas y la calidad
En 1955, Ishikawa difunde por primera vez en Japón el concepto de Gráfico de Control.
En 1962, Con Ishikawa aparece el Movimiento de los Círculos de Calidad (mejorar la calidad,
estandarizar la operación y lograr resultados significativos en la mejora de la calidad, reducción de
costos, productividad y seguridad)
En 1968, Shigeo Shingo. El sistema de producción de Toyota y el Justo a tiempo, el Kam-Ban,
Poca -Yore, la Cultura de las Cinco S´s
1970, un comité de la Unión Japonesa de Científicos e Ingenieros (JUSE) analizaron un gran
conjunto de técnicas herramientas y las denominaron las “Siete Nuevas Herramientas de Gestión y
Planificación”
En 1971 Ishikawa expone una herramienta muy útil, el Diagrama Causa-Efecto
En 1979, Philip B. Crosby. “Hacer bien las cosas a la primera vez”, se le responsabiliza al operario
acerca de la calidad y el debe llevar e interpretar las medidas y variables usando gráficas de
control
En 1980 Creación de grupos de trabajo, formación para la calidad, Normas internacionales ISO
9000
En 1990, Globalización de la Calidad, Normas Automotrices QS 900, normas internacionales ISO
14000 y TQM (Total Quiality Management)
Tema 3
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
19. Estadística descriptiva
Distribución de frecuencias
Chulo: En este tema se trabajarán las frecuencias, absoluta, relativa y sus componentes
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
20. Deming: lo primero que se debe hacer es determinar la frecuencia de cada clase (fr.), sumando de cada clase
uno de los valores de la clase, así se construye una tabla de dos columnas, en la primera se relacionan las
clases y en la segunda su frecuencia.
Chulo: Tenga en cuenta apreciado estudiante que existen dos tipos de frecuencias: relativas y acumuladas.
Frecuencias relativas: cuando la frecuencia de cada valor o clase, llamada frecuencia absoluta (fr. abs.), se
divide entre el número total de valores (N) se obtiene la frecuencia relativa (Fr. R)
Se calcula con la ecuación fr.R = fr. abs. Para proporciones y se multiplica por 100 para porcentaje
N
Fr.R= fr.abs. x 100
N
Frecuencias relativas acumuladas: se obtienen sumando las fr. de cada valor o clase y de las anteriores, las
cuales pueden expresarse como proporción (fracción de 1) o porcentajes (%)
Xi frecuencia
frecuencia frecuencia frecuencia porcentaje grados
Relativa
absoluta acumulada relativa % ángulo
acumulada
24 2 2 0,0952381 0,0952381 9,52380952 34,2857143
28 2 4 0,0952381 0,1904762 9,52380952 34,2857143
29 1 5 0,04761905 0,2380952 4,76190476 17,1428571
30 1 6 0,04761905 0,2857142 4,761905 17,142858
33 5 11 0,23809524 0,5238094 23,8095238 85,7142857
38 5 16 0,23809524 0,7619046 23,8095238 85,7142857
45 2 18 0,0952381 0,8571427 9,52381 34,285716
53 1 19 0,04761905 0,9047617 4,761905 17,142858
55 1 20 0,04761905 0,9523807 4,761905 17,142858
57 1 21 0,04761905 1 4,761905 17,142858
Total 21 1,00000001 100,000001 360,000005
Bueno ya que llegamos a este punto y con base en este ejercicio, aprovechemos para ver las propiedades de
las frecuencias, para cada propiedad usted mismo verifique su cumplimiento, si o no cumple.
Propiedad Descripción de la propiedad ¿Cumple?
Primera La suma de las frecuencias absolutas ordinarias es igual al tamaño de la muestra Si
Segunda La suma de las frecuencias relativas o porcentuales es igual a 1 o sea al 100% Si,
de las observaciones.
Tercera Las frecuencias absolutas son siempre valores enteros. Si
Cuarta Las frecuencias relativas son siempre valores fraccionarios Si
Quinta El último valor de las frecuencias absolutas acumuladas es igual al total de las Si,
observaciones n
Sexta El último valor de las frecuencias relativas acumuladas debe ser igual a 1 o el Si,
100% de observaciones
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
21. Agrupada en clases
Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en subconjuntos o
subclases
El número de clases o pisos o niveles (NC) se puede calcular
NC = 1 + 3.3 log n
n es el tamaño de la muestra
Deming: Pero bueno, no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con
base en el siguiente criterio entrenado, o en la experiencia.
Usted puede utilizar la siguiente tabla, es una guía que muestra para diferentes cantidades de datos, el número
recomendado de clases o pisos a utilizar así.
Número de datos Número de clases (k)
Menos de 50 5-8
50 - 100 6 - 10
101 - 250 7 - 12
Más de 250 10 - 20
Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la
muestra de variables y aproximando el resultado al número entero inmediatamente superior.
Chulo: para la extracción de la raíz cuadrada puede utilizar la calculadora, que puede ser una barata.
Ejemplo:
n = 90 datos
Raíz cuadrada de 90 = 9, 4868
Número de clases 10
Deming: Ahora veremos el Intervalo de clase “IC”, el cual es la diferencia entre el dato mayor (DM) y el dato
menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación
Deming: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en
8 niveles o números de clase (NC)
Chulo: El intervalo de clase de cada nivel o piso es IC = DM - dm
n
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33= 21personas
IC = 57 – 24
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
22. 21
IC = 4,125
Clase valor base IC Inter. de clase
1 24,000 4,125 28,125
2 28,126 4,125 32,250 Deming: Observe
usted que
3 32,251 4,125 36,375
precisamente la
4 36,376 4,125 40,500
información de las
5 40,501 4,125 44,625 edades de los 21
6 44,626 4,125 48,750 funcionarios quedó
7 48,751 4,125 52,875 toda incluida en 8
8 52,876 4,125 57,000 niveles.
Deming: ¿Qué observa usted?
Chulo:
- Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125
y se logra el primer rango o sea hasta 28,125
- Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior mayor
valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en este caso 57,00
años.
- Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y
sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del anterior rango
Deming: Muy bien, ahora trabajemos la desviación estándar
Chulo: ¿Qué tanto están separados los datos del promedio o media?
Deming: Esto se puede saber con la desviación estándar (S) que expresa qué tanto se dispersan los datos en
relación a la media
La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. Es el
valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de
cada valor
Chulo: Bueno nos tratamos de confundir ¿verdad? Será que lo podemos hacer más fácil
Deming: por supuesto, tomemos la fórmula nos sirve y nos servirá muchísimo.
1
S= ∑( xi − x) 2
n −1
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
23. Deming: Con base en esta formula definamos la desviación estándar, usted por su parte trate de
definirla, no se la aprenda, analícela y entiéndala
Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la
media o promedio de todas las variables (X con palito), todo dividido por el número de las muestras.
Deming: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n o sea el
total de la población
Bueno sigamos con la misma información para calcular la desviación estándar
Xi frec. absol fr. * Xi (Xi-media) (Xi-media)2 fr.(Xi- Xmedia)2
fr.
1 2 3 4 5 6
24 2 48 -12,809 164,070481 328,140962
28 2 56 -8,809 77,598481 155,196962
29 1 29 -7,809 60,980481 60,980481
30 1 30 -6,809 46,362481 46,362481
33 5 165 -3,809 14,508481 72,542405
38 5 190 1,191 1,418481 7,092405
45 2 90 8,191 67,092481 134,184962
53 1 53 16,191 262,148481 262,148481
55 1 55 18,191 330,912481 330,912481
57 1 57 20,191 407,676481 407,676481
Sumatorias 21 773 1805,2381
Media = 773/21 = 36,809
Media = 36,809
2
(fr.(Xi-media) )n-1 1805,2381/21-1
1805,2381/20
90,2619051
Raíz cuadrada 9,5006
Desviación estándar = 9,5 años
Observemos los siguientes aspectos
El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es
para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5)
Estudiante, tenga en cuenta que para el ejercicio en particular las edades tomadas no es el de la
totalidad de los funcionarios de la entidad sino que corresponde a unas muestras, por lo tanto así la
cantidad de 21 es superior a 20, los resultados corresponden a unas muestras, por lo tanto se le
descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1)
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
24. Ahora, ya ha llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor
corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación
Una de las ventajas de la estadística, es que debe ser fácilmente interpretada por las partes interesadas, la
representación gráfica debe ayudar a cumplir con dicho objetivo, son varias las gráficas que se recomiendan
utilizar.
Representación gráfica
1. Histograma de frecuencias o Diagrama de distribución
Estos diagramas constan de dos líneas:
a. una llamada abscisa que normalmente corresponde a las variables de Xi
b. otra llamada ordenada normalmente corresponde a las variables de Yi
Volvamos a tomar la distribución de frecuencias de la información de las edades de los funcionarios de una
entidad pública
Para las edades de los 21 funcionarios lo tomamos como valores de Xi
Para mostrar la cantidad de funcionarios de cada edad lo tomamos como valores de Yi
Hacemos entonces la gráfica
EDADES Frecuencia
Xi Yi Histogram a
24 2
28 2 6
29 1
5
30 1
33 5 4
38 5
3 Fr ecuencia
45 2
53 1 2
55 1
1
57 1
0
24 28 29 30 33 38 45 53 55 57
e
Chulo: ¡Qué fácil de entender la información de manera gráfica! ¿Verdad?
Ahora podemos observar con esta gráfica que la mayoría de los funcionarios están en la edad de 33 años y de
38 años, se pueden hacer varios análisis que facilitarán la toma de decisiones
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
25. Chulo: sigamos aprovechando esta información para utilizar otra gráfica u otras gráficas:
2. La gráfica de pastel o circular
Como su nombre lo indica, haga de cuenta que el 100% de la información es el total del pastel, cada una de
las edades tiene una frecuencia o cantidad de funcionarios que tienen esa edad y corresponde a un porcentaje
del total
SERIE EDADES Frecuencia Porcentaje
1 24 2 9,524
2 28 2 9,524
3 29 1 4,762
4 30 1 4,762
5 33 5 23,810
6 38 5 23,810
7 45 2 9,524
8 53 1 4,762
9 55 1 4,762
10 57 1 4,762
Porcentaje
9
10 1
4,762
4,762 9,524
8 2
4,762 9,524
7
3
9,524
4,762
4
4,762
6
23,810 5
23,810
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
26. Deming: ¿Cómo le parece? Verdad qué es una gran ayuda visual, es una herramienta que visualiza toda la
información
Usted puede también utilizar otras gráficas como la de una barra horizontal donde muestra del total del 100%
los diferentes porcentajes para cada edad
24 28 29 30 33 38 45 53 55 57
9,52 9,52 4,76 4,76 23,81 23,81 9,52 4,76 4,76 4,76
El anterior diagrama es poco utilizado, pero es muy práctico cuando en un informe ejecutivo a falta de espacio
para hacer un histograma o un círculo llamado pastel, puede utilizar este diagrama
Chulo: Es ¡súper fácil!, además, las gráficas nos ayudan a comprender mejor la información.
Tema 4: Herramientas estadísticas para aseguramiento de la calidad
Deming: Estas herramientas, son muy sencillas y muy importantes, pocas de ellas son conocidas
en la industria y menos en actividades de servicios, se trata de herramientas estadísticas y análisis
de uso general, tales como:
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
27. a. Diagrama causa-efecto.
b. Diagramas de Pareto
c. Diagramas de flujo de procesos
d. Plantillas para recolección de datos.
e. Control estadístico de procesos
a. Diagramas de causa – efecto
Ley de Mecánica Clásica (Isaac Newton)
A toda acción corresponde una reacción
Deming: En muchos casos se resuelven los problemas sin conocer las causas de los mismos y
mucho menos, se tiene en cuenta a las personas que hacen los procesos, lo cual es una práctica
perjudicial.
El buen uso de esta herramienta corresponde a “Administración por causas vs. Administración por
efectos”
Para el buen uso de este diagrama se recomienda la práctica del Breakstorming, que corresponde
a la participación activa de todo el personal involucrado directa e indirectamente, donde con base
en la gráfica, previamente establecida, se va escuchando el comentario que va haciendo el
personal, se plantean las causas y se van clasificando de acuerdo al grupo de una causa principal,
lo más común es de acuerdo a las llamadas cinco Ms, que como que las reúne o clasifica.
• Las causas que potencialmente van generando un determinado efecto se presentan en
forma jerarquizada.
• Este diagrama por su forma, se denomina, también, diagrama de espina de pescado
Deming: Los pasos para la construcción del diagrama espina de pescado son:
• Determinar claramente el efecto o problema a estudiar.
• Reunir a las personas que conocen del problema y realizar una lluvia de ideas.
• Seleccionar las causas aportadas por todos los participantes, relacionándolas en las
causas principales, eliminando repeticiones(esto se puede hacer mediante tarjetas)
• Dibujar el diagrama resultante
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
28. b. Diagrama de Pareto
Son representaciones de la densidad y la distribución de variables aleatorias nominales,
usualmente causas de falla en sistemas o, defectos en productos o servicios
Las causas se ordenan de modo de distinguir cuales son las más importantes.
Deming: Usualmente opera la regla del 80 – 20, el 80% de los problemas se deben al 20% de las
causas
Chulo: Que conocimientos de estadística tenemos que tener para diseñar una gráfica de pareto
1. Recopilación de la información sobre las diferentes causas o motivos de un problema, por
ejemplo, los tipos de defectos por los cuales un producto es rechazado por mala calidad o
en caso práctico, las causas por las cuales los funcionarios de una entidad dejaron de
asistir al trabajo en los primeros seis meses del año 2008.
2. Con base en la estadística, relacione la frecuencia o repetición de cada causa en un
periodo determinado.
3. Organice las causas por orden de frecuencia o costos, pues también lo puede hacer por
los costos que originan esas causas
En desorden
Causa cantidad de
número
ausencia casos
1 Se enfermó la suegra 10
2 Se enfermó un hijo 13
3 Se enfermó el perro 8
4 Accidente casero 35
5 Enfermedad de gripa 75
6 Citación juzgado 5
7 Enfermedad migraña 53
8 Inundación de la casa 7
9 Guayabo 3
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
29. 10 Robo en la casa 1
11 Otros 6
Total 216
Chulo: Las causas están en desorden con relación a las frecuencias de ocurrencias
Ahora hay que ordenar las causas de acuerdo al peso o cantidad de frecuencias. El ítem “otros”
debe ubicarse en el último renglón, independiente de su magnitud de frecuencias o de costos,
cuando se hace con costos.
En orden
Numero Causa cantidad de Total frecuencia Composición Porcentaje
causa Ausencia casos acumulado relativa porcentual acumulado
Enfermedad
5 de gripa 75 75 0,3472 34,72 34,72
Enfermedad
7 migraña 53 128 0,2453 24,53 59,25
Accidente
4 casero 35 163 0,162 16,2 75,45
Se enfermó
2 un hijo 13 176 0,0602 6,02 81,47
Se enfermó
1 la suegra 10 186 0,04629 4,629 86,1
Se enfermó
3 el perro 8 194 0,037 3,7 89,8
Inundación
8 de la casa 7 201 0,0324 3,24 93,04
Citación
6 juzgado 5 206 0,02315 2,315 95,35
9 Guayabo 3 209 0,01389 1,389 96,74
Robo en la
10 casa 1 210 0,004629 0,4629 97,2
11 Otros 6 216 0,02778 2,778 99,98
216 0,999839 99,9839
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
30. 80 120
70
100
60
80
50
%
40 60
Acumu…
30
40
20
20
10
0 0
Tema 5: REGRESIÓN
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
31. Deming: La magia de la estadística radica en que se puede predecir un tiempo futuro a partir de
unas variables conocidas en tiempo presente. Es decir, partiendo de datos conocidos o sea de
años ya pasados se puede calcular lo esperado en una fecha futura.
Para empezar, se utilizan dos variables, X e Y como una relación de tipo funcional; si la función
que liga X e Y fuese de tipo lineal, responde a la forma general
Y=aX+b
a y b: son constantes que tienen un significado particular para
analizar
b: determina el punto donde la línea corta al eje de las Y
a: determina la pendiente de la recta
a = n Σ XY – (Σ X) (Σ Y)
(n Σ x2) – (Σ X)2
Si el resultado de a es negativo la tendencia es que X aumenta y, Y disminuye, o sea, es
inversamente proporcional. Si el resultado de a es positivo la tendencia es que X aumenta y, Y
aumenta.
b=ΣY–aΣX
n
Deming: Observe el siguiente ejemplo para efectuar el cálculo de una regresión.
Supongamos que queremos analizar la variable Nivel de Colesterol con relación a la edad de las
personas, ajustándolo a un modelo lineal. Disponemos de 20 pacientes de quienes se ha
registrado:
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
32. • Nivel de colesterol en plasma sanguíneo (mg/100ml)
• Edad (años)
paciente Edad Colesterol
n Xi Yi Xi * Yi X2
1 80 350 28000 6400
2 30 190 5700 900
3 42 263 11046 1764
4 50 320 16000 2500
5 45 280 12600 2025
6 35 198 6930 1225
7 18 232 4176 324
8 32 320 10240 1024
9 49 303 14847 2401
10 35 220 7700 1225
11 50 405 20250 2500
12 20 190 3800 400
13 40 230 9200 1600
14 30 227 6810 900
15 30 440 13200 900
16 23 318 7314 529
17 35 212 7420 1225
18 18 340 6120 324
19 22 195 4290 484
20 41 223 9143 1681
∑ 725 5456 204786 30331
n∑X*Y 204786
(∑X)(∑Y) 3955600
n∑X2 606020
(∑X)2 (725)2
a = (n(∑X*Y)-(∑X)(Y))/((n∑X2) - (∑X)2)
a = 1,742894
b = ((∑Y) - (a∑X))/n)
b= ((5456) - (1,74289446)(725))/20
b = 4539.9 / 20
b= 226,99
Cuál será el valor de colesterol para una persona de 61 años, o sea el X es 61 años
y = aX + b
y = aX + b 1,74 X, + b
1,74 * 61 + 226.99
y = aX + b 333,13
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
33. Gráfica
500
450
400
y = 1,73x + 210,09
350 Serie1
R2 = 0,1172
300 Lineal (Serie1)
250
200
150
0 20 40 60 80 100
Recomendación:
Cuando se tiene la información se debe presentar un informe que sirva para tomar decisiones, para
lo cual se recomienda analizar los datos e investigar sobre el tema de la información, para nuestro
caso:
Colesterol es una grasa orgánica llamada liproteína de alta densidad o LDL, medición que
debe hacerse por lo menos una vez cada año
Los valores:
• Deseables debe ser < 130 mg/100 ml de sangre
• Riesgo potencial: 130 – 160 mg/100ml de sangre
• Riesgo alto: > 160 mg/100ml de sangre
HDL; Colesterol bueno, son los encargados de remover y retirar el exceso de colesterol
LDL y llevarlo al hígado para su eliminación.
La relación colesterol total dividida por el HDL debe ser inferior a 5 para estar exento de
riesgo coronario
Ejemplo: si se tiene un colesterol total de 260mg/100ml de sangre y un HDL de 30mg/100ml de
sangre, su relación o índice (en la semana 3 desarrollaremos con mayor detalle el concepto de
Índice) es 260/30 = 8,6 uno se encuentra en franco riesgo de sufrir un ataque cardiaco.
Ojo Ataque cardiaco
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
34. Se debe estar en valor inferior a 3 para estar libre de sufrir infarto
Ejemplo, si se tiene un LDL de 130mg/ml de sangre y HDL de 45mg/100ml de sangre el índice es
de 2,88 se encuentra en que no se tiene mayor riesgo de sufrir un ataque cardiaco
Chulo: Nos damos cuenta de la importancia de la estadística y sobretodo de entender los
resultados para tomar decisiones y sobre todo acciones a tiempo.
Deming: La importancia de utilizar la regresión es muy grande, con ella puede el estadístico que
somos nosotros encontrar valores del futuro o valores que no se tienen con el uso de valores
conocidos, ¡eso es buenísimo!
Chulo: Por ejemplo, se puede hacer proyección de producción para un futuro con base en los datos
conocidos y establecer presupuestos de recursos sabiendo los elementos que se necesitan para
un solo producto, a esto se le llama “explosión de materiales”
4.1 Desviación estándar
Chulo: ¿Recuerda lo que vimos anteriormente sobre el concepto de desviación estándar?, bueno
recordémoslo
Deming: La desviación estándar es la medida de dispersión más adecuada para la estadística
descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con
respecto a la media de cada valor
Deming: Para que lo entienda mejor, lo haremos más fácil, tomemos la fórmula
1
S= ∑ i−x 2
(x )
n−1
Deming: Con base en esta fórmula definamos la desviación estándar, haber usted por su parte
trate de definirla, no se la aprenda, analícela, entiéndala
Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la
media o promedio de todas las variables (Xi con palito), todo dividido por el número de las
muestras.
Deming: La desviación estándar es una medida del grado de dispersión de los datos del valor
promedio. Dicho de otra manera, la desviación estándar es, simplemente, el "promedio" o variación
esperada con respecto de la media aritmética.
Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación
pequeña indica que los datos están agrupados cerca a la media.
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
35. Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de
7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una
desviación mucho menor que las otras dos porque sus valores están más cerca de 7.
Chulo: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n
Sigamos con la misma información para calcular la desviación estándar
Xi frec. absol fr. * Xi (Xi-media) (Xi-media)2 fr.(Xi-media)2
fr.
1 2 3 4 5 6
24 2 48 -12,809 164,070481 328,140962
28 2 56 -8,809 77,598481 155,196962
29 1 29 -7,809 60,980481 60,980481
30 1 30 -6,809 46,362481 46,362481
33 5 165 -3,809 14,508481 72,542405
38 5 190 1,191 1,418481 7,092405
45 2 90 8,191 67,092481 134,184962
53 1 53 16,191 262,148481 262,148481
55 1 55 18,191 330,912481 330,912481
57 1 57 20,191 407,676481 407,676481
Sumatorias 21 773 1805,2381
Media = 773/21 = 36,809
Media = 36,809
(fr.(Xi-media)2)n-1 1805,2381/21-1
1805,2381/20
90,2619051
Raíz cuadrada 9,5006
Desviación estándar = 9,5 años
Observemos los siguientes aspectos
El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es
para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5)
Chulo: Para el ejercicio en particular las edades tomadas no son de la totalidad de los funcionarios
de la entidad, sino que, corresponden a unas muestras, por lo tanto, si la cantidad es 21 se le
descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1).
Bueno ya hemos llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor
corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación
Veamos una gráfica de las desviaciones estándar bajo la curva normal
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
36. La información total de las variables se encuentra dentro de esta curva
Media aritmética, Xmedia + 1 S = 34,135 %; o sea cubre el 34,135% de todas las variables
tomadas
Media aritmética, X media - 1S = 34,135 %; o sea cubre también el 34, 135 % de las variable
Esto quiere decir que, si al valor del promedio le agregamos una desviación y también le quitamos
una desviación, cubre todo un 68,27% de todas las variables, claro está que, eso sucede cuando la
curva es completamente normal, es decir, que la mitad de la curva que tiene la forma de una
campana, es exactamente igual a la otra mitad de la campana.
Deming: Ahora cubramos dos desviaciones, vea la gráfica de la distribución que usted tiene atrás
Media aritmética, Xmedia + 2 S = 47,725 %; o sea cubre el 47,725% de todas las variables
tomadas
Media aritmética, X media – 2S = 47,725 %; o sea cubre el 47,725 % de las variables tomadas
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
37. Esto quiere decir que si al valor del promedio le agregamos 2 desviaciones y también le quitamos
dos desviaciones, cubre todo un 95,45% de todas las variables, claro está que eso sucede cuando
la curva es completamente normal.
Deming: Ahora con tres desviaciones, tanto a la izquierda como a la derecha de la media o sea del
centro de la curva normal de forma de campana.
Media aritmética, Xmedia + 3 S = 47,725 %; o sea cubre el 49,865% de todas las variables
tomadas
Media aritmética, X media – 3S = 47,725 %; o sea cubre el 49,865 % de las variables tomadas
Esto quiere decir que si al valor del promedio le agregamos 3 desviaciones y también le quitamos
tres desviaciones, cubre todo un 99,73% de todas las variables, claro está que eso sucede cuando
la curva es completamente normal.
Deming: Como nos damos cuenta, queda un 0,27% por fuera del cubrimiento de control, esto es
preocupante, pues cada día el cliente o los clientes tanto internos como externos son y deben ser
más exigentes.
Deming: Por ejemplo, tenemos la necesidad de comprarle a la abuela un marcapasos cuyo tiempo
esperado de que funcione es de diez años.
Hagamos el cálculo de un error de 0,27% o sea que el marcapasos que le compramos a la abuela
sea de los que quedaron por fuera de control o sea que tiene una probabilidad de error del 0,27%
10 años x 365 días x 24 horas x 60 min. = 5´256.000 minutos que se espera funcione
correctamente
De los 5´256.000 minutos tenemos la probabilidad del 0,27% de que el marcapasos no funcione y
eso corresponde a un tiempo de 236,52 horas o sea 9,85 días, y en esos días sin marcapasos la
abuela se murió.
Si usted hace reclamo ante la empresa que le vendió el marcapasos, el fabricante puede
contestarle “En la producción de los marcapasos de hizo control de calidad y el rango de
desviación cubriendo tres desviaciones a la izquierda del valor nominal (valor exacto esperado) y
tres desviaciones a la derecha del valor nominal, el control cubrió el 99,73 de los marcapasos
elaborados o sea que estuvimos muy de malas.
Chulo: Verifiquemos a ver si la tendencia esperada se presenta en el ejemplo que estamos
desarrollando.
El promedio de las variables del caso que estamos desarrollando es X media = 36,809 y la
desviación estándar es igual a 9,5 años
Xmedia + 1S =
36,809 + 1(9,5) = 46,309
Xmedia – 1S
36,809 - 1(9,5) = 27,308
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
38. Preguntémonos entonces ¿Cuántos funcionarios están entre la edad de 27,308 y 46,309 años
Xi frec. absol
edad fr.
24 2
28 2
29 1
30 1
33 5
38 5
45 2
53 1
55 1
57 1
21
De acuerdo a la información recopilada en el cuadro anterior son 16 los funcionarios del total de 21
o sea 16/21 corresponde a un 76%; la tendencia para una distribución completamente normal
seria el 68,27 %, pero la distribución nuestra no es completamente normal así que cumple la
tendencia.
¡Bueno!, una nueva pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le
quitamos al mismo momento dos desviaciones
Xmedia + 2S =
36,809 + 2(9,5) = 55,08 años
Xmedia – 2S
36,809 - 2(9,5) = 17,08 años
Los funcionarios que están entre 17,08 y 55,08 años son 20
Xi frec. absol
fr.
24 2
28 2
29 1
30 1
33 5
38 5
45 2
53 1
55 1
57 1
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010
39. Deming: El porcentaje de funcionarios que estén en este rango corresponden a 20 personas y esta
cantidad corresponde a 20/21 = 95.2381%; el valor esperado para una distribución
completamente normal es de 95,45%, se cumple entonces la tendencia ¿verdad?
¡Bueno!, una tercer pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le
quitamos al mismo momento tres desviaciones
Xmedia + 3S =
36,809 + 3(9,5) = 36,809 + 28.5 = 65,305 años
Xmedia – 3S
36,809 - 3(9,5) = 7,59 años
Los funcionarios que están entre 7,59 años y 65,39 años son todos o sea el 100% del total de
funcionarios, el valor esperado era del 99,73%
Chulo: Bueno hemos entendido ¿verdad?
Servicio Nacional de Prendizaje
SENA todos los derechos reservados 2010