SlideShare una empresa de Scribd logo
1 de 39
Tema 1
La estadística: definiciones básicas

Deming: ahora se va a dar inicio al módulo Medición y mejora de los sistemas de gestión de la
calidad en el sector público. Se trabajará principalmente con la estadística, que quizá, para algunos
de ustedes es familiar; Nosotros, haremos que retome los conocimientos de la estadística de
manera amigable y agradable, pues solo así, podrá ver lo útil que resulta manejar sus
herramientas.




                             Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
Chulo: Yo he escuchado que en la actualidad el uso de las herramientas estadísticas se hace cada
día más generalizado, especialmente para apoyar el seguimiento de la implementación del sistema
de gestión de calidad.


Deming: Es correcto, todo el sistema de gestión de calidad debe medirse y controlarse y, no hay
otra manera, que haciendo uso de dichas herramientas.




Chulo: Pero bueno, ¿Qué es la estadística?


Deming: es un instrumento relativamente sencillo para tomar información, visualizarla, interpretarla,
analizarla y tomar decisiones a tiempo. ¿Sencillo, verdad?


Chulo: Y desde hace cuánto se utiliza la estadística


Deming: La estadística fue primeramente un método de descripción de datos en los estados.
                               Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
El Estadístico se encarga del ordenamiento y manejo de datos presentándolos en tablas y gráficos
que facilitan el análisis, para establecer conclusiones y recomendaciones para toma de decisiones
oportunas




Ejemplos de estadística          Fisher Ronald      Galton Francis (regresión)
                                       Análisis de varianza




QUESTELE,
“frecuencia relativa” y          Kart Pearson
                              Fundo Dpto. de Estadística U. Londres
“probabilidad matemática”


El Estadista es una persona versada en un negocio, conoce la evolución diaria del país en términos
de valores.


DATO CURIOSO: ¿Qué personaje de Colombia en recuerda usted que se haya hecho
notar como estadista?




                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
Carlos Lleras Restrepo                 Albero Lleras Camargo



Deming: El primer paso para poder hacer estadística es la recopilación de información,
que debe ser bien recopilada en datos o variables y, presentadas de manera oportuna y
correctas




Apreciado estudiante, le recomendamos ir al glosario para que pueda entender e
identificar los términos que se usarán de aquí en adelante.


Variable: son los datos en términos numéricos


                          Servicio Nacional de Prendizaje
                      SENA todos los derechos reservados 2010
Variable Cuantitativa: Son aquellas que se pueden medir y de las que podemos esperar
un resultado numérico, se pueden clasificar en discreta y continua


 Discreta: es aquella que se representa por números enteros sin fracciones, como por
ejemplo número de personas (128 personas), número de pupitres en el salón (35
pupitres), numero de cajas de 12 unidades, numero de hijos que tiene una familia, número
de alumnos que tiene un salón de clase


Continuas: Son aquellas que representan cantidades muy dispersas en valores
fraccionarios como por ejemplo la edad (58, 6 años), el peso (58,7 kilos), estatura (1,68
m).


Variables Cualitativas: son aquellas que expresan distintas cualidades, característica o
modalidad, cada modalidad que se presenta se determina atributo.


Atributos: cuando la verificación de calidad no se puede medir en términos de variables se
usa el concepto de aceptada o rechazada, pasa o no pasa, defectuosa o no defectuosa,
adecuada o inadecuada, el sistema de clasificación es por intermedio de


       - sentidos humanos: vista, olfato, tacto, gusto, oído.
       - calibradores o galgas: pasa – no pasa
       - Conteo: número de piezas malas en un lote.


Proceso: como definió en el módulo uno, es un conjunto de actividades mutuamente
relacionadas que transforman entradas en salidas.



Control: todas aquellas actividades dirigidas a mantener un proceso en estado deseado. Es,
también, la vigilancia periódica y continua sobre el desarrollo de un proceso o la calidad de un
producto para comprobar que cumple con las especificaciones establecidas


                           Servicio Nacional de Prendizaje
                       SENA todos los derechos reservados 2010
Apreciado estudiante: le sugerimos que vaya a la semana 3 del módulo uno, allí podrá recordar lo
concerniente a proceso.


Por intermedio del control estadístico de los procesos se puede mantener el proceso dentro de
normas establecidas.


Deming: Hay un término muy importante que se debe tener en cuenta: Población (se representa
con la letra “N); corresponde a la totalidad de los elementos que forman el universo de interés.;
pertenecen a la población todos aquellos elementos que poseen la característica que se desea
estudiar.




Chulo: y, ¿A qué se le llama muestra?


Deming: Cuando se presentan cantidades poblacionales resulta poco práctico y costoso analizar la
totalidad de los elementos o partes que compone una dicha población, es preferible seleccionar
unas cuantas partes para estudiarlas. Estas partes o piezas seleccionadas generalmente de

manera aleatoria se le llaman muestra.




                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
Hacer cuadro, fotografía de una población y luego fotografía de una muestra


Deming: La muestra (Se representa con la letra “n”), Está integrada por algunos elementos de la
población, estas muestras para efectos de análisis estadístico debe cumplir con características
como la de ser representativa de la población.


Chulo, eso quiere decir que, los elementos que la integran son escogidos de manera aleatoria o al
azar, lo que significa que todos tienen la misma probabilidad de ser escogidos.


Deming: ¡Exacto! Decimos, entonces, que cuando no es fácil o posible observar a toda la
población, y se necesita tomar información para decidir o tener una evidencia que apoye una
decisión, se debe extraer una o unas pocas muestras representativas de la población.


Chulo: Yo he escuchado hablar de la estadística descriptiva, esto qué es.


Deming: La estadística descriptiva; es una parte de la estadística que se dedica a analizar y
representar los datos. Este análisis es básico, pero fundamental en todo estudio.



Deming: Para hacer un buen estudio con las herramientas que nos brinda la estadística, es
necesario conocer algunos términos.


    •   Medidas de tendencia central: moda, mediana, media


    •   Medidas de dispersión o de variación: rango, varianza y desviación estándar


    •   Organización y procesamiento de datos: serie estadística simple, agrupada en frecuencias
        y agrupada en clases


    •   Presentación gráfica de datos: histograma


Deming: Pasaremos a ver la aplicación de estos términos con un ejemplo.

                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
Ejemplo.
Las edades en términos de variables discretas (años completos) de un grupo de funcionarios de
una entidad pública son:


1. Recopilación o tabulación de la información: edades de funcionarios públicos


33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33


2. Organizar los datos de menor valor a mayor valor de cada variable discreta


24, 24, 28, 28, 29, 30, 33, 33, 33, 33, 33, 38, 38, 38, 38, 38, 45, 53, 55, 57, 57


3. Uso de la estadística




Existen diferentes tipos de medidas de centralización, las más comunes son la media, la Mediana y
la Moda


Deming: Vayamos contestando algunas preguntas y vamos avanzando en recordar estos tipos de
medidas.


                               Servicio Nacional de Prendizaje
                           SENA todos los derechos reservados 2010
3.1 ¿Cuántos empleados se incluyeron en el estudio?


33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33


Respuesta: 21


3.2 La edad más frecuente: 33 años es la moda (valor presentado con mayor frecuencia en una
serie de datos)
33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33

        ^
Moda    X


Deming: La moda de una serie de números es aquel valor que más se repite, es decir, es el valor
más común. La moda puede no existir, incluso si existe puede no ser única. La moda se indica con
^X


Ejemplo 1.1


El sistema de números 3, 5, 6, 6, 7, 8, 9, 9, 9, 10, 11


Tiene de moda el 9


El sistema de números 3, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9, 10
Tiene dos modas: 7 y 9


Chulo: Eso quiere decir que, si se obtiene una sola moda es unimodal, si son 2 es bimodal y más
de 2 multimodal.


Deming: Eso es correcto.


3.3 ¿Cuál fue el valor encontrado en la mitad de los datos?


Respuesta: 33, esto es la mediana, que es el valor o variable medio de una secuencia de datos
                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
Para obtener la mediana, se ordenan los datos de menor a mayor, si el numero de muestras es
par, la posición de la mediana será entre dos variables que corresponde a la posición central, si N
es impar la posición de la mediana es la posición media.


La mediana es el conjunto de datos ordenados en orden de magnitud ya sea ascendente o
descendente, el valor que ocupa la posición central dentro del conjunto de datos (cuando se tiene
un número impar de datos), o el promedio de los dos valores medios (cuando el número de datos
es par)


Ejemplo 1


Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 10, 11 tiene de mediana el valor o variable 7


Ejemplo 2
Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 9, 10
Su mediana será ½ (7 + 8) = 7.5




3.4 ¿Cuál es el valor promedio?


Respuesta: edad promedio: 35.57 años


Esto es la media que es la suma de todos los valores de una variable específica (en este caso
edad) dividida por el total de datos

                                          ∑ Xi
                                           n     La formula de la media es    X




                            X


De un conjunto de N números X1, X2, X3,……, XN, es el valor promedio de una muestra o
población y es igual a la suma del conjunto de datos dividido entre el número de datos


                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
X = X1 + X2 + X3+...………+ Xn =
            N


Veamos otro ejemplo, la media de los números 8 + 9 + 7 + 12 + 10 + 3 y 11 es


X = 8 + 9 + 7 + 12 + 10 + 3 + 11
                      n


                      8.57


Donde ∑ (sigma mayúscula / letra griega) significa sumatoria


Xi: representa observaciones individuales


n : es el número de observaciones


Xi:   33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33
La media se ilustra con una X y sobre ella una pequeña línea


Xmedia =        773       = 36,8095 años
                 21


Deming: Bueno ahora como hemos agrupado las diferentes edades que se repiten, esa repetición
es lo que se denomina frecuencia (fr)


Agrupadas las edades multiplicamos cada edad (Xi) por las veces que se presentan (fr.) y tenemos
el valor (fr. * Xi)


33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33


Tabla agrupada en frecuencias


Xi               frecuencia     fr. * Xi
24               2              48
                                    Servicio Nacional de Prendizaje
                              SENA todos los derechos reservados 2010
28            2            56
29            1            29
30            1            30
33            5            165
38            5            190
45            2            90
53            1            53
55            1            55
57            1            57
              21           773




Deming: Si sumamos los resultados de fr.*Xi da como resultado el total de edades, como cuando
en un grupo de personas mayores alguien dice:


       “Entre nosotros sumamos más de 300 años, así es, aquí entre todos suman 773 años”


       Chulo: (Asombrado) ¡Uy! O sea que el promedio de 773 años entre 21 funcionarios es de
36,809 años


Deming: ¡Ojo! a propósito de los promedios, hay que tener cuidado, pues un valor muy alto o unos
valores muy bajos, pueden dar resultados que deben analizarse antes de accionar; existe un
anécdota interesante sobre el concepto de un promedio.




                           Servicio Nacional de Prendizaje
                       SENA todos los derechos reservados 2010
HISTORIA PARA ANALIZAR: Profundidad promedio de 70 centímetros


“ En una oportunidad un joven de 1,58 m de estatura, estudiante de estadística de una prestigiosa
universidad, en sus vacaciones quiso conocer la belleza del llano, pues escuchaba – el llano es lindo
– se dio al recorrido, pero ya estando en el llano, se encontró con que se terminó la carretera, pues
seguía un río, su situación era muy difícil pues no sabia nadar y tenia que tomar la decisión de seguir
adelante pasando el río; en la orilla se encontraba un anciano se le acerco y le pregunto ¿En
promedio cuánto tiene de profundidad el río?, el señor anciano quien conocía el río en épocas de
verano y que también conocía de estadística le respondió: “ El río en promedio tiene 70 cm. de
profundidad”. El estudiante muy alegre por el dato que el anciano le había dado, pues 70 cm eran
una profundidad pasable, se dio a la tarea de pasar el río, pero cuando iba bien adentro en el
recorrido del río, se encontró con una profundidad de 2,00 m y se ahogó”
                                                                            Charles Belt Little




 Chulo: Pobre joven, no tuvo en cuenta que los valores de las medias de dispersión son mayores
 cuando están muy disgregadas y son menores cuando los datos están cercanamente agrupados


 3.5 ¿Qué tan separados están los datos?


 Respuesta: 33, ya que la edad mayor 57 menos la edad menor 24 = 33. Esto se llama rango o
 amplitud.


 3.6 ¿Qué tanto están separados los datos del promedio o media?
 Esto se obtiene con la desviación estándar (S) que expresa que tanto se dispersan los datos en
 relación a la media




                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
La S es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz
cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada
valor


          1
S=           ∑( xi − x ) 2
        n −1



Serie agrupada en clases

Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en
subconjuntos o subclases.


El número de clases o pisos o niveles (NC) se puede calcular

NC = 1 + 3.3 log n (n es el tamaño de la muestra)


Bueno no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con base
en el siguiente criterio entrenado


Usted puede utilizar la tabla que relaciono a continuación, es una guía que nos muestra para
diferentes cantidades de datos, el número recomendado de clases a utilizar así


            Número de datos          Número de clases (k)
            Menos de 50              5-7
            50 - 100                 6 - 10
            101 - 250                7 - 12
            Más de 250               10 - 20

Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que
componen la muestra de variables y aproximando el resultado al número entero inmediatamente
superior


          Ejemplo n = 90 datos
          Raíz cuadrada de 90 = 9, 4868
          Número de clases 10
                                 Servicio Nacional de Prendizaje
                             SENA todos los derechos reservados 2010
Intervalo de clase “IC” es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie
dividida por el número de clase o pisos que se ha determinado con anticipación


Ejemplo: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos
agruparlos en 8 niveles o números de clase (NC)


El intervalo de clase de cada nivel o piso es IC = DM - dm
                                                          8 niveles




IC = 57 – 24
         21


IC = 4,125


Clase         valor base     IC         Inter. de clase
1             24,000         4,125      28,125
2             28,126         4,125      32,250
3             32,251         4,125      36,375
4             36,376         4,125      40,500
5             40,501         4,125      44,625
6             44,626         4,125      48,750
7             48,751         4,125      52,875
8             52,876         4,125      57,000

Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda
incluida en 8 niveles.


Qué observa usted?


-   Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de
    clase” de 4.125 y se logra el primer rango o sea hasta 28,125




                               Servicio Nacional de Prendizaje
                           SENA todos los derechos reservados 2010
-   Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior
     mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en
     este caso 57,00 años.


 -   Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior
     y sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del
     anterior rango




Tema 2

                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
Evolución histórica de la Estadística en su aplicación de la calidad


Evolución cronológica

De 1920 a 1930 Shewarth precursor que inicia a utilizar métodos estadísticos en Bell Telephone

En 1941 Harol Dodge y Henry Raming propusieron uso de tablas simplificadas de muestreo para
inspección de entradas.

En el año 1950 Armand Feigenbaun, desarrolla el Control Total de Calidad (TQC), en el que se
involucra a todos los integrantes de una organización


                             Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
En 1950 uno de los alumnos de Juran y de Deming, Genichi Taguchi hace aportes sobre Métodos
estadísticos

En el año 1951, La revolución de la calidad en el Japón, se establece el premio Deming de la
Calidad, Deming propone Métodos de muestreo y recomienda 14 principios sobre el uso de
herramientas estadísticas y la calidad

En 1955, Ishikawa difunde por primera vez en Japón el concepto de Gráfico de Control.

En 1962, Con Ishikawa aparece el Movimiento de los Círculos de Calidad (mejorar la calidad,
estandarizar la operación y lograr resultados significativos en la mejora de la calidad, reducción de
costos, productividad y seguridad)

En 1968, Shigeo Shingo. El sistema de producción de Toyota y el Justo a tiempo, el Kam-Ban,
Poca -Yore, la Cultura de las Cinco S´s

1970, un comité de la Unión Japonesa de Científicos e Ingenieros (JUSE) analizaron un gran
conjunto de técnicas herramientas y las denominaron las “Siete Nuevas Herramientas de Gestión y
Planificación”

En 1971 Ishikawa expone una herramienta muy útil, el Diagrama Causa-Efecto

En 1979, Philip B. Crosby. “Hacer bien las cosas a la primera vez”, se le responsabiliza al operario
acerca de la calidad y el debe llevar e interpretar las medidas y variables usando gráficas de
control

En 1980 Creación de grupos de trabajo, formación para la calidad, Normas internacionales ISO
9000

En 1990, Globalización de la Calidad, Normas Automotrices QS 900, normas internacionales ISO
14000 y TQM (Total Quiality Management)




Tema 3

                             Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
Estadística descriptiva

Distribución de frecuencias

Chulo: En este tema se trabajarán las frecuencias, absoluta, relativa y sus componentes




                                  Servicio Nacional de Prendizaje
                              SENA todos los derechos reservados 2010
Deming: lo primero que se debe hacer es determinar la frecuencia de cada clase (fr.), sumando de cada clase
uno de los valores de la clase, así se construye una tabla de dos columnas, en la primera se relacionan las
clases y en la segunda su frecuencia.

Chulo: Tenga en cuenta apreciado estudiante que existen dos tipos de frecuencias: relativas y acumuladas.

Frecuencias relativas: cuando la frecuencia de cada valor o clase, llamada frecuencia absoluta (fr. abs.), se
divide entre el número total de valores (N) se obtiene la frecuencia relativa (Fr. R)

Se calcula con la ecuación fr.R = fr. abs. Para proporciones y se multiplica por 100 para porcentaje
                                             N
                                Fr.R= fr.abs. x 100
                                         N



Frecuencias relativas acumuladas: se obtienen sumando las fr. de cada valor o clase y de las anteriores, las
cuales pueden expresarse como proporción (fracción de 1) o porcentajes (%)

        Xi                                                     frecuencia
                frecuencia      frecuencia      frecuencia                     porcentaje        grados
                                                                 Relativa
                 absoluta       acumulada         relativa                         %             ángulo
                                                               acumulada
     24               2             2          0,0952381       0,0952381      9,52380952      34,2857143
     28               2             4          0,0952381       0,1904762      9,52380952      34,2857143
     29               1             5          0,04761905      0,2380952      4,76190476      17,1428571
     30               1             6          0,04761905      0,2857142       4,761905        17,142858
     33               5             11         0,23809524      0,5238094      23,8095238      85,7142857
     38               5             16         0,23809524      0,7619046      23,8095238      85,7142857
     45               2             18         0,0952381       0,8571427        9,52381        34,285716
     53               1             19         0,04761905      0,9047617       4,761905        17,142858
     55               1             20         0,04761905      0,9523807       4,761905        17,142858
     57               1             21         0,04761905           1          4,761905        17,142858
    Total            21                        1,00000001                     100,000001      360,000005

Bueno ya que llegamos a este punto y con base en este ejercicio, aprovechemos para ver las propiedades de
las frecuencias, para cada propiedad usted mismo verifique su cumplimiento, si o no cumple.


Propiedad        Descripción de la propiedad                                                           ¿Cumple?
Primera          La suma de las frecuencias absolutas ordinarias es igual al tamaño de la muestra      Si
Segunda          La suma de las frecuencias relativas o porcentuales es igual a 1 o sea al 100%        Si,
                 de las observaciones.
Tercera          Las frecuencias absolutas son siempre valores enteros.                                Si
Cuarta           Las frecuencias relativas son siempre valores fraccionarios                           Si
Quinta           El último valor de las frecuencias absolutas acumuladas es igual al total de las      Si,
                 observaciones  n
Sexta             El último valor de las frecuencias relativas acumuladas debe ser igual a 1 o el      Si,
                                              100% de observaciones
                                Servicio Nacional de Prendizaje
                            SENA todos los derechos reservados 2010
Agrupada en clases

Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en subconjuntos o
subclases

El número de clases o pisos o niveles (NC) se puede calcular
NC = 1 + 3.3 log n
n es el tamaño de la muestra

Deming: Pero bueno, no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con
base en el siguiente criterio entrenado, o en la experiencia.

Usted puede utilizar la siguiente tabla, es una guía que muestra para diferentes cantidades de datos, el número
recomendado de clases o pisos a utilizar así.

              Número de datos               Número de clases (k)
               Menos de 50                        5-8
                 50 - 100                        6 - 10
                101 - 250                        7 - 12
                Más de 250                      10 - 20


Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la
muestra de variables y aproximando el resultado al número entero inmediatamente superior.

Chulo: para la extracción de la raíz cuadrada puede utilizar la calculadora, que puede ser una barata.

         Ejemplo:
         n = 90 datos
         Raíz cuadrada de 90 = 9, 4868
         Número de clases 10

Deming: Ahora veremos el Intervalo de clase “IC”, el cual es la diferencia entre el dato mayor (DM) y el dato
menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación



Deming: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en
8 niveles o números de clase (NC)


Chulo: El intervalo de clase de cada nivel o piso es IC = DM - dm
                                                                            n

33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33= 21personas


IC = 57 – 24
                                Servicio Nacional de Prendizaje
                            SENA todos los derechos reservados 2010
21

IC = 4,125

                           Clase        valor base         IC         Inter. de clase
                             1           24,000          4,125            28,125
                             2           28,126          4,125            32,250           Deming: Observe
                                                                                           usted que
                             3           32,251          4,125            36,375
                                                                                           precisamente la
                             4           36,376          4,125            40,500
                                                                                           información de las
                             5           40,501          4,125            44,625           edades de los 21
                             6           44,626          4,125            48,750           funcionarios quedó
                             7           48,751          4,125            52,875           toda incluida en 8
                             8           52,876          4,125            57,000           niveles.


Deming: ¿Qué observa usted?

Chulo:

 -    Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125
      y se logra el primer rango o sea hasta 28,125

 -    Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior mayor
      valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en este caso 57,00
      años.

 -     Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y
      sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del anterior rango

Deming: Muy bien, ahora trabajemos la desviación estándar

Chulo: ¿Qué tanto están separados los datos del promedio o media?

Deming: Esto se puede saber con la desviación estándar (S) que expresa qué tanto se dispersan los datos en
relación a la media

La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. Es el
valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de
cada valor

Chulo: Bueno nos tratamos de confundir ¿verdad? Será que lo podemos hacer más fácil

Deming: por supuesto, tomemos la fórmula nos sirve y nos servirá muchísimo.


                      1
              S=         ∑( xi − x) 2
                    n −1

                               Servicio Nacional de Prendizaje
                           SENA todos los derechos reservados 2010
Deming: Con base en esta formula definamos la desviación estándar, usted por su parte trate de
definirla, no se la aprenda, analícela y entiéndala

Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la
media o promedio de todas las variables (X con palito), todo dividido por el número de las muestras.

Deming: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n o sea el
total de la población

Bueno sigamos con la misma información para calcular la desviación estándar

         Xi            frec. absol     fr. * Xi     (Xi-media)    (Xi-media)2    fr.(Xi- Xmedia)2
                            fr.
        1                    2             3             4             5               6
       24                    2            48         -12,809     164,070481       328,140962
       28                    2            56          -8,809      77,598481       155,196962
       29                    1            29          -7,809      60,980481        60,980481
       30                    1            30          -6,809      46,362481        46,362481
       33                    5           165          -3,809      14,508481        72,542405
       38                    5           190          1,191        1,418481        7,092405
       45                    2            90          8,191       67,092481       134,184962
       53                    1            53          16,191     262,148481       262,148481
       55                    1            55          18,191     330,912481       330,912481
       57                    1            57          20,191     407,676481       407,676481
    Sumatorias             21            773                                       1805,2381

Media = 773/21 = 36,809
Media =             36,809
              2
(fr.(Xi-media) )n-1 1805,2381/21-1
                    1805,2381/20
                    90,2619051
Raíz cuadrada       9,5006
        Desviación estándar = 9,5 años

Observemos los siguientes aspectos

El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es
para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5)

Estudiante, tenga en cuenta que para el ejercicio en particular las edades tomadas no es el de la
totalidad de los funcionarios de la entidad sino que corresponde a unas muestras, por lo tanto así la
cantidad de 21 es superior a 20, los resultados corresponden a unas muestras, por lo tanto se le
descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1)



                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
Ahora, ya ha llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor
corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación


Una de las ventajas de la estadística, es que debe ser fácilmente interpretada por las partes interesadas, la
representación gráfica debe ayudar a cumplir con dicho objetivo, son varias las gráficas que se recomiendan
utilizar.

Representación gráfica

1. Histograma de frecuencias o Diagrama de distribución

Estos diagramas constan de dos líneas:
    a. una llamada abscisa que normalmente corresponde a las variables de Xi
    b. otra llamada ordenada normalmente corresponde a las variables de Yi

Volvamos a tomar la distribución de frecuencias de la información de las edades de los funcionarios de una
entidad pública
Para las edades de los 21 funcionarios lo tomamos como valores de Xi
Para mostrar la cantidad de funcionarios de cada edad lo tomamos como valores de Yi

Hacemos entonces la gráfica


  EDADES        Frecuencia
    Xi              Yi                                   Histogram a
    24              2
    28              2                  6

    29              1
                                       5
    30              1
    33              5                  4
    38              5
                                       3                                          Fr ecuencia
    45              2
    53              1                  2
    55              1
                                       1
    57              1
                                       0
                                           24 28 29   30 33 38 45 53   55 57

                                                          e




Chulo: ¡Qué fácil de entender la información de manera gráfica!        ¿Verdad?

Ahora podemos observar con esta gráfica que la mayoría de los funcionarios están en la edad de 33 años y de
38 años, se pueden hacer varios análisis que facilitarán la toma de decisiones
                                 Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
Chulo: sigamos aprovechando esta información para utilizar otra gráfica u otras gráficas:

2. La gráfica de pastel o circular

Como su nombre lo indica, haga de cuenta que el 100% de la información es el total del pastel, cada una de
las edades tiene una frecuencia o cantidad de funcionarios que tienen esa edad y corresponde a un porcentaje
del total


    SERIE           EDADES Frecuencia Porcentaje
      1                  24         2       9,524
      2                  28         2       9,524
      3                  29         1       4,762
      4                  30         1       4,762
      5                  33         5      23,810
      6                  38         5      23,810
      7                  45         2       9,524
      8                  53         1       4,762
      9                  55         1       4,762
     10                  57         1       4,762




                                                       Porcentaje



                                                9
                                                        10        1
                                              4,762
                                                      4,762     9,524
                                          8                               2
                                        4,762                           9,524
                                        7
                                                                               3
                                      9,524
                                                                             4,762
                                                                                  4
                                                                                4,762



                                          6
                                       23,810                          5
                                                                    23,810




                                 Servicio Nacional de Prendizaje
                             SENA todos los derechos reservados 2010
Deming: ¿Cómo le parece? Verdad qué es una gran ayuda visual, es una herramienta que visualiza toda la
información

Usted puede también utilizar otras gráficas como la de una barra horizontal donde muestra del total del 100%
los diferentes porcentajes para cada edad




   24   28   29   30    33    38   45   53   55   57
 9,52 9,52 4,76 4,76 23,81 23,81 9,52 4,76 4,76 4,76



El anterior diagrama es poco utilizado, pero es muy práctico cuando en un informe ejecutivo a falta de espacio
para hacer un histograma o un círculo llamado pastel, puede utilizar este diagrama

Chulo: Es ¡súper fácil!, además, las gráficas nos ayudan a comprender mejor la información.



Tema 4: Herramientas estadísticas para aseguramiento de la calidad




Deming: Estas herramientas, son muy sencillas y muy importantes, pocas de ellas son conocidas
en la industria y menos en actividades de servicios, se trata de herramientas estadísticas y análisis
de uso general, tales como:
                               Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
a.   Diagrama causa-efecto.
   b.   Diagramas de Pareto
   c.   Diagramas de flujo de procesos
   d.   Plantillas para recolección de datos.
   e.   Control estadístico de procesos


   a. Diagramas de causa – efecto

Ley de Mecánica Clásica (Isaac Newton)
A toda acción corresponde una reacción

Deming: En muchos casos se resuelven los problemas sin conocer las causas de los mismos y
mucho menos, se tiene en cuenta a las personas que hacen los procesos, lo cual es una práctica
perjudicial.

El buen uso de esta herramienta corresponde a “Administración por causas vs. Administración por
efectos”

Para el buen uso de este diagrama se recomienda la práctica del Breakstorming, que corresponde
a la participación activa de todo el personal involucrado directa e indirectamente, donde con base
en la gráfica, previamente establecida, se va escuchando el comentario que va haciendo el
personal, se plantean las causas y se van clasificando de acuerdo al grupo de una causa principal,
lo más común es de acuerdo a las llamadas cinco Ms, que como que las reúne o clasifica.




   •    Las causas que potencialmente van generando un determinado efecto se presentan en
        forma jerarquizada.

   •    Este diagrama por su forma, se denomina, también, diagrama de espina de pescado

Deming: Los pasos para la construcción del diagrama espina de pescado son:

   •    Determinar claramente el efecto o problema a estudiar.
   •    Reunir a las personas que conocen del problema y realizar una lluvia de ideas.
   •    Seleccionar las causas aportadas por todos los participantes, relacionándolas en las
        causas principales, eliminando repeticiones(esto se puede hacer mediante tarjetas)
   •    Dibujar el diagrama resultante




                             Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
b. Diagrama de Pareto

Son representaciones de la densidad y la distribución de variables aleatorias nominales,
usualmente causas de falla en sistemas o, defectos en productos o servicios

Las causas se ordenan de modo de distinguir cuales son las más importantes.
Deming: Usualmente opera la regla del 80 – 20, el 80% de los problemas se deben al 20% de las
causas

Chulo: Que conocimientos de estadística tenemos que tener para diseñar una gráfica de pareto

   1. Recopilación de la información sobre las diferentes causas o motivos de un problema, por
      ejemplo, los tipos de defectos por los cuales un producto es rechazado por mala calidad o
      en caso práctico, las causas por las cuales los funcionarios de una entidad dejaron de
      asistir al trabajo en los primeros seis meses del año 2008.
   2. Con base en la estadística, relacione la frecuencia o repetición de cada causa en un
      periodo determinado.
   3. Organice las causas por orden de frecuencia o costos, pues también lo puede hacer por
      los costos que originan esas causas

En desorden
                    Causa            cantidad de
  número
                   ausencia            casos
     1        Se enfermó la suegra        10
     2          Se enfermó un hijo        13
     3         Se enfermó el perro         8
     4           Accidente casero         35
     5         Enfermedad de gripa        75
     6           Citación juzgado          5
     7         Enfermedad migraña         53
     8        Inundación de la casa        7
     9               Guayabo               3
                               Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
10         Robo en la casa           1
          11             Otros                 6
         Total                                216

     Chulo: Las causas están en desorden con relación a las frecuencias de ocurrencias

     Ahora hay que ordenar las causas de acuerdo al peso o cantidad de frecuencias. El ítem “otros”
     debe ubicarse en el último renglón, independiente de su magnitud de frecuencias o de costos,
     cuando se hace con costos.

             En orden




Numero     Causa         cantidad de    Total        frecuencia    Composición      Porcentaje
causa      Ausencia      casos          acumulado    relativa      porcentual       acumulado
           Enfermedad
5          de gripa      75             75           0,3472        34,72            34,72
           Enfermedad
7          migraña       53             128          0,2453        24,53            59,25
           Accidente
4          casero        35             163          0,162         16,2             75,45
           Se enfermó
2          un hijo       13             176          0,0602        6,02             81,47
           Se enfermó
1          la suegra     10             186          0,04629       4,629            86,1
           Se enfermó
3          el perro      8              194          0,037         3,7              89,8
           Inundación
8          de la casa    7              201          0,0324        3,24             93,04
           Citación
6          juzgado       5              206          0,02315       2,315            95,35
9          Guayabo       3              209          0,01389       1,389            96,74
           Robo en la
10         casa          1              210          0,004629      0,4629           97,2
11         Otros         6              216          0,02778       2,778            99,98
                                  216                0,999839      99,9839




                                  Servicio Nacional de Prendizaje
                              SENA todos los derechos reservados 2010
80                                                         120

   70
                                                              100
   60
                                                              80
   50

                                                                    %
   40                                                         60
                                                                    Acumu…

   30
                                                              40
   20
                                                              20
   10

    0                                                         0




Tema 5: REGRESIÓN




                        Servicio Nacional de Prendizaje
                    SENA todos los derechos reservados 2010
Deming: La magia de la estadística radica en que se puede predecir un tiempo futuro a partir de
unas variables conocidas en tiempo presente. Es decir, partiendo de datos conocidos o sea de
años ya pasados se puede calcular lo esperado en una fecha futura.

Para empezar, se utilizan dos variables, X e Y como una relación de tipo funcional; si la función
que liga X e Y fuese de tipo lineal, responde a la forma general

                       Y=aX+b

                       a y b: son constantes que tienen un significado particular para
                            analizar
                       b: determina el punto donde la línea corta al eje de las Y

                       a: determina la pendiente de la recta

                       a = n Σ XY – (Σ X) (Σ Y)
                               (n Σ x2) – (Σ X)2

Si el resultado de a es negativo la tendencia es que X aumenta y, Y disminuye, o sea, es
inversamente proporcional. Si el resultado de a es positivo la tendencia es que X aumenta y, Y
aumenta.

                       b=ΣY–aΣX
                            n

Deming: Observe el siguiente ejemplo para efectuar el cálculo de una regresión.

Supongamos que queremos analizar la variable Nivel de Colesterol con relación a la edad de las
personas, ajustándolo a un modelo lineal. Disponemos de 20 pacientes de quienes se ha
registrado:
                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
•   Nivel de colesterol en plasma sanguíneo (mg/100ml)
   •   Edad (años)

                       paciente Edad Colesterol
                          n      Xi      Yi      Xi * Yi          X2
                          1      80     350     28000            6400
                          2      30     190      5700            900
                          3      42     263     11046            1764
                          4      50     320     16000            2500
                          5      45     280     12600            2025
                          6      35     198      6930            1225
                          7      18     232      4176            324
                          8      32     320     10240            1024
                          9      49     303     14847            2401
                         10      35     220      7700            1225
                         11      50     405     20250            2500
                         12      20     190      3800            400
                         13      40     230      9200            1600
                         14      30     227      6810            900
                         15      30     440     13200            900
                         16      23     318      7314            529
                         17      35     212      7420            1225
                         18      18     340      6120            324
                         19      22     195      4290            484
                         20      41     223      9143            1681
                          ∑     725    5456     204786          30331


n∑X*Y       204786
(∑X)(∑Y)    3955600
n∑X2        606020
(∑X)2       (725)2
a =         (n(∑X*Y)-(∑X)(Y))/((n∑X2) - (∑X)2)
a =         1,742894

b =         ((∑Y) - (a∑X))/n)
b=          ((5456) - (1,74289446)(725))/20
b =         4539.9 / 20
b=          226,99

Cuál será el valor de colesterol para una persona de 61 años, o sea el X es 61 años

y = aX + b
y = aX + b 1,74 X, + b
           1,74 * 61 + 226.99
y = aX + b 333,13

                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
Gráfica



  500

  450

  400
                                 y = 1,73x + 210,09
  350                                                                 Serie1
                                     R2 = 0,1172
  300                                                                 Lineal (Serie1)

  250

  200

  150
          0       20        40          60            80   100


Recomendación:

Cuando se tiene la información se debe presentar un informe que sirva para tomar decisiones, para
lo cual se recomienda analizar los datos e investigar sobre el tema de la información, para nuestro
caso:

     Colesterol es una grasa orgánica llamada liproteína de alta densidad o LDL, medición que
      debe hacerse por lo menos una vez cada año

         Los valores:
    •     Deseables debe ser < 130 mg/100 ml de sangre
    •     Riesgo potencial: 130 – 160 mg/100ml de sangre
    •     Riesgo alto: > 160 mg/100ml de sangre

     HDL; Colesterol bueno, son los encargados de remover y retirar el exceso de colesterol
      LDL y llevarlo al hígado para su eliminación.

     La relación colesterol total dividida por el HDL debe ser inferior a 5 para estar exento de
      riesgo coronario

Ejemplo: si se tiene un colesterol total de 260mg/100ml de sangre y un HDL de 30mg/100ml de
sangre, su relación o índice (en la semana 3 desarrollaremos con mayor detalle el concepto de
Índice) es 260/30 = 8,6 uno se encuentra en franco riesgo de sufrir un ataque cardiaco.

Ojo Ataque cardiaco

                             Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
 Se debe estar en valor inferior a 3 para estar libre de sufrir infarto

Ejemplo, si se tiene un LDL de 130mg/ml de sangre y HDL de 45mg/100ml de sangre el índice es
de 2,88 se encuentra en que no se tiene mayor riesgo de sufrir un ataque cardiaco

Chulo: Nos damos cuenta de la importancia de la estadística y sobretodo de entender los
resultados para tomar decisiones y sobre todo acciones a tiempo.

Deming: La importancia de utilizar la regresión es muy grande, con ella puede el estadístico que
somos nosotros encontrar valores del futuro o valores que no se tienen con el uso de valores
conocidos, ¡eso es buenísimo!

Chulo: Por ejemplo, se puede hacer proyección de producción para un futuro con base en los datos
conocidos y establecer presupuestos de recursos sabiendo los elementos que se necesitan para
un solo producto, a esto se le llama “explosión de materiales”

4.1 Desviación estándar

Chulo: ¿Recuerda lo que vimos anteriormente sobre el concepto de desviación estándar?, bueno
recordémoslo

Deming: La desviación estándar es la medida de dispersión más adecuada para la estadística
descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con
respecto a la media de cada valor

Deming: Para que lo entienda mejor, lo haremos más fácil, tomemos la fórmula

                  1
           S=       ∑ i−x 2
                     (x )
                 n−1
Deming: Con base en esta fórmula definamos la desviación estándar, haber usted por su parte
trate de definirla, no se la aprenda, analícela, entiéndala

Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la
media o promedio de todas las variables (Xi con palito), todo dividido por el número de las
muestras.


Deming: La desviación estándar es una medida del grado de dispersión de los datos del valor
promedio. Dicho de otra manera, la desviación estándar es, simplemente, el "promedio" o variación
esperada con respecto de la media aritmética.

Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación
pequeña indica que los datos están agrupados cerca a la media.



                              Servicio Nacional de Prendizaje
                          SENA todos los derechos reservados 2010
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de
7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una
desviación mucho menor que las otras dos porque sus valores están más cerca de 7.

Chulo: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n

Sigamos con la misma información para calcular la desviación estándar

         Xi           frec. absol     fr. * Xi    (Xi-media)    (Xi-media)2   fr.(Xi-media)2
                           fr.
        1                   2            3             4             5              6
       24                   2           48         -12,809     164,070481      328,140962
       28                   2           56          -8,809      77,598481      155,196962
       29                   1           29          -7,809      60,980481       60,980481
       30                   1           30          -6,809      46,362481       46,362481
       33                   5          165          -3,809      14,508481       72,542405
       38                   5          190          1,191        1,418481       7,092405
       45                   2           90          8,191       67,092481      134,184962
       53                   1           53          16,191     262,148481      262,148481
       55                   1           55          18,191     330,912481      330,912481
       57                   1           57          20,191     407,676481      407,676481
    Sumatorias            21           773                                      1805,2381

Media = 773/21 = 36,809
Media =             36,809
(fr.(Xi-media)2)n-1 1805,2381/21-1
                    1805,2381/20
                    90,2619051
Raíz cuadrada       9,5006
Desviación estándar = 9,5 años

Observemos los siguientes aspectos

El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es
para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5)

Chulo: Para el ejercicio en particular las edades tomadas no son de la totalidad de los funcionarios
de la entidad, sino que, corresponden a unas muestras, por lo tanto, si la cantidad es 21 se le
descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1).

Bueno ya hemos llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor
corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación


Veamos una gráfica de las desviaciones estándar bajo la curva normal



                             Servicio Nacional de Prendizaje
                         SENA todos los derechos reservados 2010
La información total de las variables se encuentra dentro de esta curva

Media aritmética, Xmedia + 1 S = 34,135 %; o sea cubre el 34,135% de todas las variables
tomadas

Media aritmética, X media - 1S = 34,135 %; o sea cubre también el 34, 135 % de las variable

Esto quiere decir que, si al valor del promedio le agregamos una desviación y también le quitamos
una desviación, cubre todo un 68,27% de todas las variables, claro está que, eso sucede cuando la
curva es completamente normal, es decir, que la mitad de la curva que tiene la forma de una
campana, es exactamente igual a la otra mitad de la campana.

Deming: Ahora cubramos dos desviaciones, vea la gráfica de la distribución que usted tiene atrás


Media aritmética, Xmedia + 2 S = 47,725 %; o sea cubre el 47,725% de todas las variables
tomadas

Media aritmética, X media – 2S = 47,725 %; o sea cubre el 47,725 % de las variables tomadas




                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
Esto quiere decir que si al valor del promedio le agregamos 2 desviaciones y también le quitamos
dos desviaciones, cubre todo un 95,45% de todas las variables, claro está que eso sucede cuando
la curva es completamente normal.

Deming: Ahora con tres desviaciones, tanto a la izquierda como a la derecha de la media o sea del
centro de la curva normal de forma de campana.

Media aritmética, Xmedia + 3 S = 47,725 %; o sea cubre el 49,865% de todas las variables
tomadas

Media aritmética, X media – 3S = 47,725 %; o sea cubre el 49,865 % de las variables tomadas

Esto quiere decir que si al valor del promedio le agregamos 3 desviaciones y también le quitamos
tres desviaciones, cubre todo un 99,73% de todas las variables, claro está que eso sucede cuando
la curva es completamente normal.

Deming: Como nos damos cuenta, queda un 0,27% por fuera del cubrimiento de control, esto es
preocupante, pues cada día el cliente o los clientes tanto internos como externos son y deben ser
más exigentes.

Deming: Por ejemplo, tenemos la necesidad de comprarle a la abuela un marcapasos cuyo tiempo
esperado de que funcione es de diez años.

Hagamos el cálculo de un error de 0,27% o sea que el marcapasos que le compramos a la abuela
sea de los que quedaron por fuera de control o sea que tiene una probabilidad de error del 0,27%

10 años x 365 días x 24 horas x 60 min. = 5´256.000 minutos que se espera funcione
correctamente

De los 5´256.000 minutos tenemos la probabilidad del 0,27% de que el marcapasos no funcione y
eso corresponde a un tiempo de 236,52 horas o sea 9,85 días, y en esos días sin marcapasos la
abuela se murió.

Si usted hace reclamo ante la empresa que le vendió el marcapasos, el fabricante puede
contestarle “En la producción de los marcapasos de hizo control de calidad y el rango de
desviación cubriendo tres desviaciones a la izquierda del valor nominal (valor exacto esperado) y
tres desviaciones a la derecha del valor nominal, el control cubrió el 99,73 de los marcapasos
elaborados o sea que estuvimos muy de malas.

Chulo: Verifiquemos a ver si la tendencia esperada se presenta en el ejemplo que estamos
desarrollando.

El promedio de las variables del caso que estamos desarrollando es X media = 36,809 y la
desviación estándar es igual a 9,5 años

Xmedia + 1S =
36,809 + 1(9,5) = 46,309

Xmedia – 1S
36,809 - 1(9,5) = 27,308
                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
Preguntémonos entonces ¿Cuántos funcionarios están entre la edad de 27,308 y 46,309 años


                                          Xi     frec. absol
                                         edad         fr.
                                          24           2
                                          28           2
                                          29           1
                                          30           1
                                          33           5
                                          38           5
                                          45           2
                                          53           1
                                          55           1
                                          57           1
                                                 21

De acuerdo a la información recopilada en el cuadro anterior son 16 los funcionarios del total de 21
o sea 16/21 corresponde a un 76%; la tendencia para una distribución completamente normal
seria el 68,27 %, pero la distribución nuestra no es completamente normal así que cumple la
tendencia.

¡Bueno!, una nueva pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le
quitamos al mismo momento dos desviaciones

       Xmedia + 2S =
36,809 + 2(9,5) = 55,08 años

Xmedia – 2S
36,809 - 2(9,5) = 17,08 años

Los funcionarios que están entre 17,08 y 55,08 años son 20


Xi      frec. absol
        fr.
24      2
28      2
29      1
30      1
33      5
38      5
45      2
53      1
55      1
57      1

                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010
Deming: El porcentaje de funcionarios que estén en este rango corresponden a 20 personas y esta
cantidad corresponde a 20/21 =           95.2381%; el valor esperado para una distribución
completamente normal es de 95,45%, se cumple entonces la tendencia ¿verdad?

¡Bueno!, una tercer pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le
quitamos al mismo momento tres desviaciones

       Xmedia + 3S =
36,809 + 3(9,5) = 36,809 + 28.5 = 65,305 años

Xmedia – 3S
36,809 - 3(9,5) = 7,59 años

Los funcionarios que están entre 7,59 años y 65,39 años son todos o sea el 100% del total de
funcionarios, el valor esperado era del 99,73%

Chulo: Bueno hemos entendido ¿verdad?




                            Servicio Nacional de Prendizaje
                        SENA todos los derechos reservados 2010

Más contenido relacionado

La actualidad más candente

Elementos de estadistica descriptiva
Elementos de estadistica descriptivaElementos de estadistica descriptiva
Elementos de estadistica descriptivasitayanis
 
Estadistica basica I .doc
Estadistica basica I .docEstadistica basica I .doc
Estadistica basica I .docguestbf8866d8
 
1.1. Conceptos BáSicos De Estadistica
1.1.  Conceptos BáSicos De Estadistica1.1.  Conceptos BáSicos De Estadistica
1.1. Conceptos BáSicos De EstadisticaITCM
 
Conceptos basicos
Conceptos basicosConceptos basicos
Conceptos basicosjavier
 
Guias 1 de estadistica
Guias 1 de estadisticaGuias 1 de estadistica
Guias 1 de estadisticaClaudia150499
 
08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación570727
 
Estadistica cuarto medio
Estadistica cuarto medioEstadistica cuarto medio
Estadistica cuarto mediositayanis
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables stefany_90
 
Metodos estadisticos tecnologia
Metodos estadisticos tecnologiaMetodos estadisticos tecnologia
Metodos estadisticos tecnologiaValentinaGarcia127
 
Términos Básicos en Estadística
Términos Básicos en EstadísticaTérminos Básicos en Estadística
Términos Básicos en EstadísticaRafael Brito
 
Estadística aplicada clases
Estadística aplicada clases Estadística aplicada clases
Estadística aplicada clases Liliana Jiménez
 
Estadística elemental
Estadística elementalEstadística elemental
Estadística elementalAsarely1
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011cesarzatta
 

La actualidad más candente (19)

Estadistica basica
Estadistica basicaEstadistica basica
Estadistica basica
 
1e
1e1e
1e
 
Elementos de estadistica descriptiva
Elementos de estadistica descriptivaElementos de estadistica descriptiva
Elementos de estadistica descriptiva
 
Estadistica basica I .doc
Estadistica basica I .docEstadistica basica I .doc
Estadistica basica I .doc
 
Tecnologia 11 6
Tecnologia 11 6Tecnologia 11 6
Tecnologia 11 6
 
1.1. Conceptos BáSicos De Estadistica
1.1.  Conceptos BáSicos De Estadistica1.1.  Conceptos BáSicos De Estadistica
1.1. Conceptos BáSicos De Estadistica
 
Conceptos basicos
Conceptos basicosConceptos basicos
Conceptos basicos
 
Guias 1 de estadistica
Guias 1 de estadisticaGuias 1 de estadistica
Guias 1 de estadistica
 
I unidad Estadistica General
I unidad Estadistica GeneralI unidad Estadistica General
I unidad Estadistica General
 
08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación
 
Estadistica cuarto medio
Estadistica cuarto medioEstadistica cuarto medio
Estadistica cuarto medio
 
Tegno
TegnoTegno
Tegno
 
Web quest distribución de frecuencias 5o. d 1
Web quest distribución de frecuencias 5o. d 1Web quest distribución de frecuencias 5o. d 1
Web quest distribución de frecuencias 5o. d 1
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables
 
Metodos estadisticos tecnologia
Metodos estadisticos tecnologiaMetodos estadisticos tecnologia
Metodos estadisticos tecnologia
 
Términos Básicos en Estadística
Términos Básicos en EstadísticaTérminos Básicos en Estadística
Términos Básicos en Estadística
 
Estadística aplicada clases
Estadística aplicada clases Estadística aplicada clases
Estadística aplicada clases
 
Estadística elemental
Estadística elementalEstadística elemental
Estadística elemental
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011
 

Destacado

Informática na educação trabalho revisado- grupo-fátima, cristina, mariana e...
Informática na educação  trabalho revisado- grupo-fátima, cristina, mariana e...Informática na educação  trabalho revisado- grupo-fátima, cristina, mariana e...
Informática na educação trabalho revisado- grupo-fátima, cristina, mariana e...Cris Amaral
 
Guillem d’ockham i nicolau maquiavel
Guillem d’ockham i nicolau maquiavelGuillem d’ockham i nicolau maquiavel
Guillem d’ockham i nicolau maquiavelespaifilo
 
Juegos de aqui_y_de_alli
Juegos de aqui_y_de_alliJuegos de aqui_y_de_alli
Juegos de aqui_y_de_alliluzsamirna
 
Ensino bom eh_para_todos_epoca
Ensino bom eh_para_todos_epocaEnsino bom eh_para_todos_epoca
Ensino bom eh_para_todos_epocaLuciane Rosenbaum
 
Centro de promocion san jose
Centro de promocion san joseCentro de promocion san jose
Centro de promocion san joseantonioangel333
 
Las mujeres en la lírica medieval galaico portuguesa
Las mujeres en la lírica medieval galaico portuguesaLas mujeres en la lírica medieval galaico portuguesa
Las mujeres en la lírica medieval galaico portuguesaMaria Villar
 
Es los rituales_funebres_en_el_islam
Es los rituales_funebres_en_el_islamEs los rituales_funebres_en_el_islam
Es los rituales_funebres_en_el_islamLoveofpeople
 

Destacado (20)

Informática na educação trabalho revisado- grupo-fátima, cristina, mariana e...
Informática na educação  trabalho revisado- grupo-fátima, cristina, mariana e...Informática na educação  trabalho revisado- grupo-fátima, cristina, mariana e...
Informática na educação trabalho revisado- grupo-fátima, cristina, mariana e...
 
1984 (2)
1984 (2)1984 (2)
1984 (2)
 
First XI
First XIFirst XI
First XI
 
Blog
BlogBlog
Blog
 
Guillem d’ockham i nicolau maquiavel
Guillem d’ockham i nicolau maquiavelGuillem d’ockham i nicolau maquiavel
Guillem d’ockham i nicolau maquiavel
 
Criação de empresas que exploram o nicho da sustentabilidade
Criação de empresas que exploram o nicho da sustentabilidadeCriação de empresas que exploram o nicho da sustentabilidade
Criação de empresas que exploram o nicho da sustentabilidade
 
N Cycle Poster
N Cycle PosterN Cycle Poster
N Cycle Poster
 
Juegos de aqui_y_de_alli
Juegos de aqui_y_de_alliJuegos de aqui_y_de_alli
Juegos de aqui_y_de_alli
 
Hobbies
HobbiesHobbies
Hobbies
 
Wordpress esquema-2010
Wordpress esquema-2010Wordpress esquema-2010
Wordpress esquema-2010
 
Presentation1
Presentation1Presentation1
Presentation1
 
Redes sociales.
Redes sociales.Redes sociales.
Redes sociales.
 
Ensino bom eh_para_todos_epoca
Ensino bom eh_para_todos_epocaEnsino bom eh_para_todos_epoca
Ensino bom eh_para_todos_epoca
 
PORTFOLIO LUIZ ALBERTO MACHADO
PORTFOLIO LUIZ ALBERTO MACHADOPORTFOLIO LUIZ ALBERTO MACHADO
PORTFOLIO LUIZ ALBERTO MACHADO
 
Centro de promocion san jose
Centro de promocion san joseCentro de promocion san jose
Centro de promocion san jose
 
Observacion y descripcion
Observacion y descripcionObservacion y descripcion
Observacion y descripcion
 
Las mujeres en la lírica medieval galaico portuguesa
Las mujeres en la lírica medieval galaico portuguesaLas mujeres en la lírica medieval galaico portuguesa
Las mujeres en la lírica medieval galaico portuguesa
 
Edital do 1º concurso cara de um focinho do outro
Edital do 1º concurso cara de um focinho do outroEdital do 1º concurso cara de um focinho do outro
Edital do 1º concurso cara de um focinho do outro
 
Es los rituales_funebres_en_el_islam
Es los rituales_funebres_en_el_islamEs los rituales_funebres_en_el_islam
Es los rituales_funebres_en_el_islam
 
Actividad número 6 ciencias politicas
Actividad número 6 ciencias politicasActividad número 6 ciencias politicas
Actividad número 6 ciencias politicas
 

Similar a Estadística descriptiva básica

Expo De Estadistica
Expo De EstadisticaExpo De Estadistica
Expo De EstadisticaUNAD
 
Expo De Estadistica
Expo De EstadisticaExpo De Estadistica
Expo De Estadisticaguest241335
 
Capitulo 1. estadistica ciencia y datos
Capitulo 1. estadistica  ciencia y datosCapitulo 1. estadistica  ciencia y datos
Capitulo 1. estadistica ciencia y datosDeysi Lorena Ruiz Cruz
 
Conceptos de programación y métodos estadísticos 11 2
Conceptos de programación y métodos estadísticos 11 2Conceptos de programación y métodos estadísticos 11 2
Conceptos de programación y métodos estadísticos 11 2sofiadaza2
 
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrTECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrLaura225304
 
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdfACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdfnathalietruque
 
Estadistica Conceptos Basicos
Estadistica  Conceptos BasicosEstadistica  Conceptos Basicos
Estadistica Conceptos Basicoscarl_moron
 
Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos DanielCeronMelendez2
 
Tecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadooooooooooooooooooooooooTecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadoooooooooooooooooooooooogeladinemeneses
 
Métodos estadísticos tecnología
Métodos estadísticos tecnologíaMétodos estadísticos tecnología
Métodos estadísticos tecnologíaTamaraOchoa2
 
Metodos estadisticos tecnologia
Metodos estadisticos tecnologiaMetodos estadisticos tecnologia
Metodos estadisticos tecnologiaAnaSofia328
 
Conceptos de programacion y estadistica 11 5 (1)
Conceptos de programacion y estadistica 11 5  (1)Conceptos de programacion y estadistica 11 5  (1)
Conceptos de programacion y estadistica 11 5 (1)DanielCeronMelendez2
 
Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5 Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5 DanielCeronMelendez2
 
Conceptos de programacion y estadistica 11 5 (2)
Conceptos de programacion y estadistica 11 5  (2)Conceptos de programacion y estadistica 11 5  (2)
Conceptos de programacion y estadistica 11 5 (2)NataliaGarcia721165
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística DescriptivaEduardo Lysak
 
Descriptivo y variables.
Descriptivo y variables.Descriptivo y variables.
Descriptivo y variables.patriciax
 

Similar a Estadística descriptiva básica (20)

Tema Estadística
Tema EstadísticaTema Estadística
Tema Estadística
 
Expo De Estadistica
Expo De EstadisticaExpo De Estadistica
Expo De Estadistica
 
Expo De Estadistica
Expo De EstadisticaExpo De Estadistica
Expo De Estadistica
 
Capitulo 1. estadistica ciencia y datos
Capitulo 1. estadistica  ciencia y datosCapitulo 1. estadistica  ciencia y datos
Capitulo 1. estadistica ciencia y datos
 
Conceptos de programación y métodos estadísticos 11 2
Conceptos de programación y métodos estadísticos 11 2Conceptos de programación y métodos estadísticos 11 2
Conceptos de programación y métodos estadísticos 11 2
 
tecnologia .pdf
tecnologia .pdftecnologia .pdf
tecnologia .pdf
 
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrTECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
 
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdfACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
 
Estadística 1
Estadística                                                         1Estadística                                                         1
Estadística 1
 
Estadistica I 01
Estadistica  I 01Estadistica  I 01
Estadistica I 01
 
Estadistica Conceptos Basicos
Estadistica  Conceptos BasicosEstadistica  Conceptos Basicos
Estadistica Conceptos Basicos
 
Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos
 
Tecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadooooooooooooooooooooooooTecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadoooooooooooooooooooooooo
 
Métodos estadísticos tecnología
Métodos estadísticos tecnologíaMétodos estadísticos tecnología
Métodos estadísticos tecnología
 
Metodos estadisticos tecnologia
Metodos estadisticos tecnologiaMetodos estadisticos tecnologia
Metodos estadisticos tecnologia
 
Conceptos de programacion y estadistica 11 5 (1)
Conceptos de programacion y estadistica 11 5  (1)Conceptos de programacion y estadistica 11 5  (1)
Conceptos de programacion y estadistica 11 5 (1)
 
Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5 Conceptos de programacion y estadistica 11 5
Conceptos de programacion y estadistica 11 5
 
Conceptos de programacion y estadistica 11 5 (2)
Conceptos de programacion y estadistica 11 5  (2)Conceptos de programacion y estadistica 11 5  (2)
Conceptos de programacion y estadistica 11 5 (2)
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística Descriptiva
 
Descriptivo y variables.
Descriptivo y variables.Descriptivo y variables.
Descriptivo y variables.
 

Estadística descriptiva básica

  • 1. Tema 1 La estadística: definiciones básicas Deming: ahora se va a dar inicio al módulo Medición y mejora de los sistemas de gestión de la calidad en el sector público. Se trabajará principalmente con la estadística, que quizá, para algunos de ustedes es familiar; Nosotros, haremos que retome los conocimientos de la estadística de manera amigable y agradable, pues solo así, podrá ver lo útil que resulta manejar sus herramientas. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 2. Chulo: Yo he escuchado que en la actualidad el uso de las herramientas estadísticas se hace cada día más generalizado, especialmente para apoyar el seguimiento de la implementación del sistema de gestión de calidad. Deming: Es correcto, todo el sistema de gestión de calidad debe medirse y controlarse y, no hay otra manera, que haciendo uso de dichas herramientas. Chulo: Pero bueno, ¿Qué es la estadística? Deming: es un instrumento relativamente sencillo para tomar información, visualizarla, interpretarla, analizarla y tomar decisiones a tiempo. ¿Sencillo, verdad? Chulo: Y desde hace cuánto se utiliza la estadística Deming: La estadística fue primeramente un método de descripción de datos en los estados. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 3. El Estadístico se encarga del ordenamiento y manejo de datos presentándolos en tablas y gráficos que facilitan el análisis, para establecer conclusiones y recomendaciones para toma de decisiones oportunas Ejemplos de estadística Fisher Ronald Galton Francis (regresión) Análisis de varianza QUESTELE, “frecuencia relativa” y Kart Pearson Fundo Dpto. de Estadística U. Londres “probabilidad matemática” El Estadista es una persona versada en un negocio, conoce la evolución diaria del país en términos de valores. DATO CURIOSO: ¿Qué personaje de Colombia en recuerda usted que se haya hecho notar como estadista? Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 4. Carlos Lleras Restrepo Albero Lleras Camargo Deming: El primer paso para poder hacer estadística es la recopilación de información, que debe ser bien recopilada en datos o variables y, presentadas de manera oportuna y correctas Apreciado estudiante, le recomendamos ir al glosario para que pueda entender e identificar los términos que se usarán de aquí en adelante. Variable: son los datos en términos numéricos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 5. Variable Cuantitativa: Son aquellas que se pueden medir y de las que podemos esperar un resultado numérico, se pueden clasificar en discreta y continua Discreta: es aquella que se representa por números enteros sin fracciones, como por ejemplo número de personas (128 personas), número de pupitres en el salón (35 pupitres), numero de cajas de 12 unidades, numero de hijos que tiene una familia, número de alumnos que tiene un salón de clase Continuas: Son aquellas que representan cantidades muy dispersas en valores fraccionarios como por ejemplo la edad (58, 6 años), el peso (58,7 kilos), estatura (1,68 m). Variables Cualitativas: son aquellas que expresan distintas cualidades, característica o modalidad, cada modalidad que se presenta se determina atributo. Atributos: cuando la verificación de calidad no se puede medir en términos de variables se usa el concepto de aceptada o rechazada, pasa o no pasa, defectuosa o no defectuosa, adecuada o inadecuada, el sistema de clasificación es por intermedio de - sentidos humanos: vista, olfato, tacto, gusto, oído. - calibradores o galgas: pasa – no pasa - Conteo: número de piezas malas en un lote. Proceso: como definió en el módulo uno, es un conjunto de actividades mutuamente relacionadas que transforman entradas en salidas. Control: todas aquellas actividades dirigidas a mantener un proceso en estado deseado. Es, también, la vigilancia periódica y continua sobre el desarrollo de un proceso o la calidad de un producto para comprobar que cumple con las especificaciones establecidas Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 6. Apreciado estudiante: le sugerimos que vaya a la semana 3 del módulo uno, allí podrá recordar lo concerniente a proceso. Por intermedio del control estadístico de los procesos se puede mantener el proceso dentro de normas establecidas. Deming: Hay un término muy importante que se debe tener en cuenta: Población (se representa con la letra “N); corresponde a la totalidad de los elementos que forman el universo de interés.; pertenecen a la población todos aquellos elementos que poseen la característica que se desea estudiar. Chulo: y, ¿A qué se le llama muestra? Deming: Cuando se presentan cantidades poblacionales resulta poco práctico y costoso analizar la totalidad de los elementos o partes que compone una dicha población, es preferible seleccionar unas cuantas partes para estudiarlas. Estas partes o piezas seleccionadas generalmente de manera aleatoria se le llaman muestra. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 7. Hacer cuadro, fotografía de una población y luego fotografía de una muestra Deming: La muestra (Se representa con la letra “n”), Está integrada por algunos elementos de la población, estas muestras para efectos de análisis estadístico debe cumplir con características como la de ser representativa de la población. Chulo, eso quiere decir que, los elementos que la integran son escogidos de manera aleatoria o al azar, lo que significa que todos tienen la misma probabilidad de ser escogidos. Deming: ¡Exacto! Decimos, entonces, que cuando no es fácil o posible observar a toda la población, y se necesita tomar información para decidir o tener una evidencia que apoye una decisión, se debe extraer una o unas pocas muestras representativas de la población. Chulo: Yo he escuchado hablar de la estadística descriptiva, esto qué es. Deming: La estadística descriptiva; es una parte de la estadística que se dedica a analizar y representar los datos. Este análisis es básico, pero fundamental en todo estudio. Deming: Para hacer un buen estudio con las herramientas que nos brinda la estadística, es necesario conocer algunos términos. • Medidas de tendencia central: moda, mediana, media • Medidas de dispersión o de variación: rango, varianza y desviación estándar • Organización y procesamiento de datos: serie estadística simple, agrupada en frecuencias y agrupada en clases • Presentación gráfica de datos: histograma Deming: Pasaremos a ver la aplicación de estos términos con un ejemplo. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 8. Ejemplo. Las edades en términos de variables discretas (años completos) de un grupo de funcionarios de una entidad pública son: 1. Recopilación o tabulación de la información: edades de funcionarios públicos 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 2. Organizar los datos de menor valor a mayor valor de cada variable discreta 24, 24, 28, 28, 29, 30, 33, 33, 33, 33, 33, 38, 38, 38, 38, 38, 45, 53, 55, 57, 57 3. Uso de la estadística Existen diferentes tipos de medidas de centralización, las más comunes son la media, la Mediana y la Moda Deming: Vayamos contestando algunas preguntas y vamos avanzando en recordar estos tipos de medidas. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 9. 3.1 ¿Cuántos empleados se incluyeron en el estudio? 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 Respuesta: 21 3.2 La edad más frecuente: 33 años es la moda (valor presentado con mayor frecuencia en una serie de datos) 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 ^ Moda X Deming: La moda de una serie de números es aquel valor que más se repite, es decir, es el valor más común. La moda puede no existir, incluso si existe puede no ser única. La moda se indica con ^X Ejemplo 1.1 El sistema de números 3, 5, 6, 6, 7, 8, 9, 9, 9, 10, 11 Tiene de moda el 9 El sistema de números 3, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9, 10 Tiene dos modas: 7 y 9 Chulo: Eso quiere decir que, si se obtiene una sola moda es unimodal, si son 2 es bimodal y más de 2 multimodal. Deming: Eso es correcto. 3.3 ¿Cuál fue el valor encontrado en la mitad de los datos? Respuesta: 33, esto es la mediana, que es el valor o variable medio de una secuencia de datos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 10. Para obtener la mediana, se ordenan los datos de menor a mayor, si el numero de muestras es par, la posición de la mediana será entre dos variables que corresponde a la posición central, si N es impar la posición de la mediana es la posición media. La mediana es el conjunto de datos ordenados en orden de magnitud ya sea ascendente o descendente, el valor que ocupa la posición central dentro del conjunto de datos (cuando se tiene un número impar de datos), o el promedio de los dos valores medios (cuando el número de datos es par) Ejemplo 1 Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 10, 11 tiene de mediana el valor o variable 7 Ejemplo 2 Los números 3, 4, 4, 5, 6, 7, 8, 8, 9, 9, 10 Su mediana será ½ (7 + 8) = 7.5 3.4 ¿Cuál es el valor promedio? Respuesta: edad promedio: 35.57 años Esto es la media que es la suma de todos los valores de una variable específica (en este caso edad) dividida por el total de datos ∑ Xi n La formula de la media es X X De un conjunto de N números X1, X2, X3,……, XN, es el valor promedio de una muestra o población y es igual a la suma del conjunto de datos dividido entre el número de datos Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 11. X = X1 + X2 + X3+...………+ Xn = N Veamos otro ejemplo, la media de los números 8 + 9 + 7 + 12 + 10 + 3 y 11 es X = 8 + 9 + 7 + 12 + 10 + 3 + 11 n 8.57 Donde ∑ (sigma mayúscula / letra griega) significa sumatoria Xi: representa observaciones individuales n : es el número de observaciones Xi: 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 La media se ilustra con una X y sobre ella una pequeña línea Xmedia = 773 = 36,8095 años 21 Deming: Bueno ahora como hemos agrupado las diferentes edades que se repiten, esa repetición es lo que se denomina frecuencia (fr) Agrupadas las edades multiplicamos cada edad (Xi) por las veces que se presentan (fr.) y tenemos el valor (fr. * Xi) 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33 Tabla agrupada en frecuencias Xi frecuencia fr. * Xi 24 2 48 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 12. 28 2 56 29 1 29 30 1 30 33 5 165 38 5 190 45 2 90 53 1 53 55 1 55 57 1 57 21 773 Deming: Si sumamos los resultados de fr.*Xi da como resultado el total de edades, como cuando en un grupo de personas mayores alguien dice: “Entre nosotros sumamos más de 300 años, así es, aquí entre todos suman 773 años” Chulo: (Asombrado) ¡Uy! O sea que el promedio de 773 años entre 21 funcionarios es de 36,809 años Deming: ¡Ojo! a propósito de los promedios, hay que tener cuidado, pues un valor muy alto o unos valores muy bajos, pueden dar resultados que deben analizarse antes de accionar; existe un anécdota interesante sobre el concepto de un promedio. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 13. HISTORIA PARA ANALIZAR: Profundidad promedio de 70 centímetros “ En una oportunidad un joven de 1,58 m de estatura, estudiante de estadística de una prestigiosa universidad, en sus vacaciones quiso conocer la belleza del llano, pues escuchaba – el llano es lindo – se dio al recorrido, pero ya estando en el llano, se encontró con que se terminó la carretera, pues seguía un río, su situación era muy difícil pues no sabia nadar y tenia que tomar la decisión de seguir adelante pasando el río; en la orilla se encontraba un anciano se le acerco y le pregunto ¿En promedio cuánto tiene de profundidad el río?, el señor anciano quien conocía el río en épocas de verano y que también conocía de estadística le respondió: “ El río en promedio tiene 70 cm. de profundidad”. El estudiante muy alegre por el dato que el anciano le había dado, pues 70 cm eran una profundidad pasable, se dio a la tarea de pasar el río, pero cuando iba bien adentro en el recorrido del río, se encontró con una profundidad de 2,00 m y se ahogó” Charles Belt Little Chulo: Pobre joven, no tuvo en cuenta que los valores de las medias de dispersión son mayores cuando están muy disgregadas y son menores cuando los datos están cercanamente agrupados 3.5 ¿Qué tan separados están los datos? Respuesta: 33, ya que la edad mayor 57 menos la edad menor 24 = 33. Esto se llama rango o amplitud. 3.6 ¿Qué tanto están separados los datos del promedio o media? Esto se obtiene con la desviación estándar (S) que expresa que tanto se dispersan los datos en relación a la media Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 14. La S es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor 1 S= ∑( xi − x ) 2 n −1 Serie agrupada en clases Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en subconjuntos o subclases. El número de clases o pisos o niveles (NC) se puede calcular NC = 1 + 3.3 log n (n es el tamaño de la muestra) Bueno no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado Usted puede utilizar la tabla que relaciono a continuación, es una guía que nos muestra para diferentes cantidades de datos, el número recomendado de clases a utilizar así Número de datos Número de clases (k) Menos de 50 5-7 50 - 100 6 - 10 101 - 250 7 - 12 Más de 250 10 - 20 Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al número entero inmediatamente superior Ejemplo n = 90 datos Raíz cuadrada de 90 = 9, 4868 Número de clases 10 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 15. Intervalo de clase “IC” es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación Ejemplo: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o números de clase (NC) El intervalo de clase de cada nivel o piso es IC = DM - dm 8 niveles IC = 57 – 24 21 IC = 4,125 Clase valor base IC Inter. de clase 1 24,000 4,125 28,125 2 28,126 4,125 32,250 3 32,251 4,125 36,375 4 36,376 4,125 40,500 5 40,501 4,125 44,625 6 44,626 4,125 48,750 7 48,751 4,125 52,875 8 52,876 4,125 57,000 Observe usted que precisamente la información de las edades de los 21 funcionarios quedó toda incluida en 8 niveles. Qué observa usted? - Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125 y se logra el primer rango o sea hasta 28,125 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 16. - Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en este caso 57,00 años. - Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del anterior rango Tema 2 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 17. Evolución histórica de la Estadística en su aplicación de la calidad Evolución cronológica De 1920 a 1930 Shewarth precursor que inicia a utilizar métodos estadísticos en Bell Telephone En 1941 Harol Dodge y Henry Raming propusieron uso de tablas simplificadas de muestreo para inspección de entradas. En el año 1950 Armand Feigenbaun, desarrolla el Control Total de Calidad (TQC), en el que se involucra a todos los integrantes de una organización Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 18. En 1950 uno de los alumnos de Juran y de Deming, Genichi Taguchi hace aportes sobre Métodos estadísticos En el año 1951, La revolución de la calidad en el Japón, se establece el premio Deming de la Calidad, Deming propone Métodos de muestreo y recomienda 14 principios sobre el uso de herramientas estadísticas y la calidad En 1955, Ishikawa difunde por primera vez en Japón el concepto de Gráfico de Control. En 1962, Con Ishikawa aparece el Movimiento de los Círculos de Calidad (mejorar la calidad, estandarizar la operación y lograr resultados significativos en la mejora de la calidad, reducción de costos, productividad y seguridad) En 1968, Shigeo Shingo. El sistema de producción de Toyota y el Justo a tiempo, el Kam-Ban, Poca -Yore, la Cultura de las Cinco S´s 1970, un comité de la Unión Japonesa de Científicos e Ingenieros (JUSE) analizaron un gran conjunto de técnicas herramientas y las denominaron las “Siete Nuevas Herramientas de Gestión y Planificación” En 1971 Ishikawa expone una herramienta muy útil, el Diagrama Causa-Efecto En 1979, Philip B. Crosby. “Hacer bien las cosas a la primera vez”, se le responsabiliza al operario acerca de la calidad y el debe llevar e interpretar las medidas y variables usando gráficas de control En 1980 Creación de grupos de trabajo, formación para la calidad, Normas internacionales ISO 9000 En 1990, Globalización de la Calidad, Normas Automotrices QS 900, normas internacionales ISO 14000 y TQM (Total Quiality Management) Tema 3 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 19. Estadística descriptiva Distribución de frecuencias Chulo: En este tema se trabajarán las frecuencias, absoluta, relativa y sus componentes Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 20. Deming: lo primero que se debe hacer es determinar la frecuencia de cada clase (fr.), sumando de cada clase uno de los valores de la clase, así se construye una tabla de dos columnas, en la primera se relacionan las clases y en la segunda su frecuencia. Chulo: Tenga en cuenta apreciado estudiante que existen dos tipos de frecuencias: relativas y acumuladas. Frecuencias relativas: cuando la frecuencia de cada valor o clase, llamada frecuencia absoluta (fr. abs.), se divide entre el número total de valores (N) se obtiene la frecuencia relativa (Fr. R) Se calcula con la ecuación fr.R = fr. abs. Para proporciones y se multiplica por 100 para porcentaje N Fr.R= fr.abs. x 100 N Frecuencias relativas acumuladas: se obtienen sumando las fr. de cada valor o clase y de las anteriores, las cuales pueden expresarse como proporción (fracción de 1) o porcentajes (%) Xi frecuencia frecuencia frecuencia frecuencia porcentaje grados Relativa absoluta acumulada relativa % ángulo acumulada 24 2 2 0,0952381 0,0952381 9,52380952 34,2857143 28 2 4 0,0952381 0,1904762 9,52380952 34,2857143 29 1 5 0,04761905 0,2380952 4,76190476 17,1428571 30 1 6 0,04761905 0,2857142 4,761905 17,142858 33 5 11 0,23809524 0,5238094 23,8095238 85,7142857 38 5 16 0,23809524 0,7619046 23,8095238 85,7142857 45 2 18 0,0952381 0,8571427 9,52381 34,285716 53 1 19 0,04761905 0,9047617 4,761905 17,142858 55 1 20 0,04761905 0,9523807 4,761905 17,142858 57 1 21 0,04761905 1 4,761905 17,142858 Total 21 1,00000001 100,000001 360,000005 Bueno ya que llegamos a este punto y con base en este ejercicio, aprovechemos para ver las propiedades de las frecuencias, para cada propiedad usted mismo verifique su cumplimiento, si o no cumple. Propiedad Descripción de la propiedad ¿Cumple? Primera La suma de las frecuencias absolutas ordinarias es igual al tamaño de la muestra Si Segunda La suma de las frecuencias relativas o porcentuales es igual a 1 o sea al 100% Si, de las observaciones. Tercera Las frecuencias absolutas son siempre valores enteros. Si Cuarta Las frecuencias relativas son siempre valores fraccionarios Si Quinta El último valor de las frecuencias absolutas acumuladas es igual al total de las Si, observaciones n Sexta El último valor de las frecuencias relativas acumuladas debe ser igual a 1 o el Si, 100% de observaciones Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 21. Agrupada en clases Cuando la muestra está integrada por un número mayor de datos, estos datos se agrupan en subconjuntos o subclases El número de clases o pisos o niveles (NC) se puede calcular NC = 1 + 3.3 log n n es el tamaño de la muestra Deming: Pero bueno, no nos compliquemos la vida, el número de pisos o clases lo podemos determinar con base en el siguiente criterio entrenado, o en la experiencia. Usted puede utilizar la siguiente tabla, es una guía que muestra para diferentes cantidades de datos, el número recomendado de clases o pisos a utilizar así. Número de datos Número de clases (k) Menos de 50 5-8 50 - 100 6 - 10 101 - 250 7 - 12 Más de 250 10 - 20 Otra forma muy práctica es tomando la raíz cuadrada del numero de muestras o elementos que componen la muestra de variables y aproximando el resultado al número entero inmediatamente superior. Chulo: para la extracción de la raíz cuadrada puede utilizar la calculadora, que puede ser una barata. Ejemplo: n = 90 datos Raíz cuadrada de 90 = 9, 4868 Número de clases 10 Deming: Ahora veremos el Intervalo de clase “IC”, el cual es la diferencia entre el dato mayor (DM) y el dato menor (dm) de la serie dividida por el número de clase o pisos que se ha determinado con anticipación Deming: para las muestras de las 21 edades del ejercicio que estamos desarrollando queremos agruparlos en 8 niveles o números de clase (NC) Chulo: El intervalo de clase de cada nivel o piso es IC = DM - dm n 33, 24, 38, 45, 38, 29, 45, 33, 30, 38, 33, 28, 33, 38, 28, 38, 53, 24, 55, 57, 33= 21personas IC = 57 – 24 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 22. 21 IC = 4,125 Clase valor base IC Inter. de clase 1 24,000 4,125 28,125 2 28,126 4,125 32,250 Deming: Observe usted que 3 32,251 4,125 36,375 precisamente la 4 36,376 4,125 40,500 información de las 5 40,501 4,125 44,625 edades de los 21 6 44,626 4,125 48,750 funcionarios quedó 7 48,751 4,125 52,875 toda incluida en 8 8 52,876 4,125 57,000 niveles. Deming: ¿Qué observa usted? Chulo: - Que en la primera clase inicia con la menor edad 24 años y se le agrega el “intervalo de clase” de 4.125 y se logra el primer rango o sea hasta 28,125 - Los siguientes niveles se va sumando el “Índice de confianza”, en este caso 4,125 al anterior mayor valor del rango y se le sigue sumando hasta llegar al valor de la variable máxima, en este caso 57,00 años. - Que para el valor de la columna izquierda se establece tomando el intervalo de clase anterior y sumándole una unidad, o una centésima, o una milésima o valor que haga diferenciar del anterior rango Deming: Muy bien, ahora trabajemos la desviación estándar Chulo: ¿Qué tanto están separados los datos del promedio o media? Deming: Esto se puede saber con la desviación estándar (S) que expresa qué tanto se dispersan los datos en relación a la media La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor Chulo: Bueno nos tratamos de confundir ¿verdad? Será que lo podemos hacer más fácil Deming: por supuesto, tomemos la fórmula nos sirve y nos servirá muchísimo. 1 S= ∑( xi − x) 2 n −1 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 23. Deming: Con base en esta formula definamos la desviación estándar, usted por su parte trate de definirla, no se la aprenda, analícela y entiéndala Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (X con palito), todo dividido por el número de las muestras. Deming: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n o sea el total de la población Bueno sigamos con la misma información para calcular la desviación estándar Xi frec. absol fr. * Xi (Xi-media) (Xi-media)2 fr.(Xi- Xmedia)2 fr. 1 2 3 4 5 6 24 2 48 -12,809 164,070481 328,140962 28 2 56 -8,809 77,598481 155,196962 29 1 29 -7,809 60,980481 60,980481 30 1 30 -6,809 46,362481 46,362481 33 5 165 -3,809 14,508481 72,542405 38 5 190 1,191 1,418481 7,092405 45 2 90 8,191 67,092481 134,184962 53 1 53 16,191 262,148481 262,148481 55 1 55 18,191 330,912481 330,912481 57 1 57 20,191 407,676481 407,676481 Sumatorias 21 773 1805,2381 Media = 773/21 = 36,809 Media = 36,809 2 (fr.(Xi-media) )n-1 1805,2381/21-1 1805,2381/20 90,2619051 Raíz cuadrada 9,5006 Desviación estándar = 9,5 años Observemos los siguientes aspectos El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5) Estudiante, tenga en cuenta que para el ejercicio en particular las edades tomadas no es el de la totalidad de los funcionarios de la entidad sino que corresponde a unas muestras, por lo tanto así la cantidad de 21 es superior a 20, los resultados corresponden a unas muestras, por lo tanto se le descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1) Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 24. Ahora, ya ha llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación Una de las ventajas de la estadística, es que debe ser fácilmente interpretada por las partes interesadas, la representación gráfica debe ayudar a cumplir con dicho objetivo, son varias las gráficas que se recomiendan utilizar. Representación gráfica 1. Histograma de frecuencias o Diagrama de distribución Estos diagramas constan de dos líneas: a. una llamada abscisa que normalmente corresponde a las variables de Xi b. otra llamada ordenada normalmente corresponde a las variables de Yi Volvamos a tomar la distribución de frecuencias de la información de las edades de los funcionarios de una entidad pública Para las edades de los 21 funcionarios lo tomamos como valores de Xi Para mostrar la cantidad de funcionarios de cada edad lo tomamos como valores de Yi Hacemos entonces la gráfica EDADES Frecuencia Xi Yi Histogram a 24 2 28 2 6 29 1 5 30 1 33 5 4 38 5 3 Fr ecuencia 45 2 53 1 2 55 1 1 57 1 0 24 28 29 30 33 38 45 53 55 57 e Chulo: ¡Qué fácil de entender la información de manera gráfica! ¿Verdad? Ahora podemos observar con esta gráfica que la mayoría de los funcionarios están en la edad de 33 años y de 38 años, se pueden hacer varios análisis que facilitarán la toma de decisiones Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 25. Chulo: sigamos aprovechando esta información para utilizar otra gráfica u otras gráficas: 2. La gráfica de pastel o circular Como su nombre lo indica, haga de cuenta que el 100% de la información es el total del pastel, cada una de las edades tiene una frecuencia o cantidad de funcionarios que tienen esa edad y corresponde a un porcentaje del total SERIE EDADES Frecuencia Porcentaje 1 24 2 9,524 2 28 2 9,524 3 29 1 4,762 4 30 1 4,762 5 33 5 23,810 6 38 5 23,810 7 45 2 9,524 8 53 1 4,762 9 55 1 4,762 10 57 1 4,762 Porcentaje 9 10 1 4,762 4,762 9,524 8 2 4,762 9,524 7 3 9,524 4,762 4 4,762 6 23,810 5 23,810 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 26. Deming: ¿Cómo le parece? Verdad qué es una gran ayuda visual, es una herramienta que visualiza toda la información Usted puede también utilizar otras gráficas como la de una barra horizontal donde muestra del total del 100% los diferentes porcentajes para cada edad 24 28 29 30 33 38 45 53 55 57 9,52 9,52 4,76 4,76 23,81 23,81 9,52 4,76 4,76 4,76 El anterior diagrama es poco utilizado, pero es muy práctico cuando en un informe ejecutivo a falta de espacio para hacer un histograma o un círculo llamado pastel, puede utilizar este diagrama Chulo: Es ¡súper fácil!, además, las gráficas nos ayudan a comprender mejor la información. Tema 4: Herramientas estadísticas para aseguramiento de la calidad Deming: Estas herramientas, son muy sencillas y muy importantes, pocas de ellas son conocidas en la industria y menos en actividades de servicios, se trata de herramientas estadísticas y análisis de uso general, tales como: Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 27. a. Diagrama causa-efecto. b. Diagramas de Pareto c. Diagramas de flujo de procesos d. Plantillas para recolección de datos. e. Control estadístico de procesos a. Diagramas de causa – efecto Ley de Mecánica Clásica (Isaac Newton) A toda acción corresponde una reacción Deming: En muchos casos se resuelven los problemas sin conocer las causas de los mismos y mucho menos, se tiene en cuenta a las personas que hacen los procesos, lo cual es una práctica perjudicial. El buen uso de esta herramienta corresponde a “Administración por causas vs. Administración por efectos” Para el buen uso de este diagrama se recomienda la práctica del Breakstorming, que corresponde a la participación activa de todo el personal involucrado directa e indirectamente, donde con base en la gráfica, previamente establecida, se va escuchando el comentario que va haciendo el personal, se plantean las causas y se van clasificando de acuerdo al grupo de una causa principal, lo más común es de acuerdo a las llamadas cinco Ms, que como que las reúne o clasifica. • Las causas que potencialmente van generando un determinado efecto se presentan en forma jerarquizada. • Este diagrama por su forma, se denomina, también, diagrama de espina de pescado Deming: Los pasos para la construcción del diagrama espina de pescado son: • Determinar claramente el efecto o problema a estudiar. • Reunir a las personas que conocen del problema y realizar una lluvia de ideas. • Seleccionar las causas aportadas por todos los participantes, relacionándolas en las causas principales, eliminando repeticiones(esto se puede hacer mediante tarjetas) • Dibujar el diagrama resultante Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 28. b. Diagrama de Pareto Son representaciones de la densidad y la distribución de variables aleatorias nominales, usualmente causas de falla en sistemas o, defectos en productos o servicios Las causas se ordenan de modo de distinguir cuales son las más importantes. Deming: Usualmente opera la regla del 80 – 20, el 80% de los problemas se deben al 20% de las causas Chulo: Que conocimientos de estadística tenemos que tener para diseñar una gráfica de pareto 1. Recopilación de la información sobre las diferentes causas o motivos de un problema, por ejemplo, los tipos de defectos por los cuales un producto es rechazado por mala calidad o en caso práctico, las causas por las cuales los funcionarios de una entidad dejaron de asistir al trabajo en los primeros seis meses del año 2008. 2. Con base en la estadística, relacione la frecuencia o repetición de cada causa en un periodo determinado. 3. Organice las causas por orden de frecuencia o costos, pues también lo puede hacer por los costos que originan esas causas En desorden Causa cantidad de número ausencia casos 1 Se enfermó la suegra 10 2 Se enfermó un hijo 13 3 Se enfermó el perro 8 4 Accidente casero 35 5 Enfermedad de gripa 75 6 Citación juzgado 5 7 Enfermedad migraña 53 8 Inundación de la casa 7 9 Guayabo 3 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 29. 10 Robo en la casa 1 11 Otros 6 Total 216 Chulo: Las causas están en desorden con relación a las frecuencias de ocurrencias Ahora hay que ordenar las causas de acuerdo al peso o cantidad de frecuencias. El ítem “otros” debe ubicarse en el último renglón, independiente de su magnitud de frecuencias o de costos, cuando se hace con costos. En orden Numero Causa cantidad de Total frecuencia Composición Porcentaje causa Ausencia casos acumulado relativa porcentual acumulado Enfermedad 5 de gripa 75 75 0,3472 34,72 34,72 Enfermedad 7 migraña 53 128 0,2453 24,53 59,25 Accidente 4 casero 35 163 0,162 16,2 75,45 Se enfermó 2 un hijo 13 176 0,0602 6,02 81,47 Se enfermó 1 la suegra 10 186 0,04629 4,629 86,1 Se enfermó 3 el perro 8 194 0,037 3,7 89,8 Inundación 8 de la casa 7 201 0,0324 3,24 93,04 Citación 6 juzgado 5 206 0,02315 2,315 95,35 9 Guayabo 3 209 0,01389 1,389 96,74 Robo en la 10 casa 1 210 0,004629 0,4629 97,2 11 Otros 6 216 0,02778 2,778 99,98 216 0,999839 99,9839 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 30. 80 120 70 100 60 80 50 % 40 60 Acumu… 30 40 20 20 10 0 0 Tema 5: REGRESIÓN Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 31. Deming: La magia de la estadística radica en que se puede predecir un tiempo futuro a partir de unas variables conocidas en tiempo presente. Es decir, partiendo de datos conocidos o sea de años ya pasados se puede calcular lo esperado en una fecha futura. Para empezar, se utilizan dos variables, X e Y como una relación de tipo funcional; si la función que liga X e Y fuese de tipo lineal, responde a la forma general Y=aX+b a y b: son constantes que tienen un significado particular para analizar b: determina el punto donde la línea corta al eje de las Y a: determina la pendiente de la recta a = n Σ XY – (Σ X) (Σ Y) (n Σ x2) – (Σ X)2 Si el resultado de a es negativo la tendencia es que X aumenta y, Y disminuye, o sea, es inversamente proporcional. Si el resultado de a es positivo la tendencia es que X aumenta y, Y aumenta. b=ΣY–aΣX n Deming: Observe el siguiente ejemplo para efectuar el cálculo de una regresión. Supongamos que queremos analizar la variable Nivel de Colesterol con relación a la edad de las personas, ajustándolo a un modelo lineal. Disponemos de 20 pacientes de quienes se ha registrado: Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 32. Nivel de colesterol en plasma sanguíneo (mg/100ml) • Edad (años) paciente Edad Colesterol n Xi Yi Xi * Yi X2 1 80 350 28000 6400 2 30 190 5700 900 3 42 263 11046 1764 4 50 320 16000 2500 5 45 280 12600 2025 6 35 198 6930 1225 7 18 232 4176 324 8 32 320 10240 1024 9 49 303 14847 2401 10 35 220 7700 1225 11 50 405 20250 2500 12 20 190 3800 400 13 40 230 9200 1600 14 30 227 6810 900 15 30 440 13200 900 16 23 318 7314 529 17 35 212 7420 1225 18 18 340 6120 324 19 22 195 4290 484 20 41 223 9143 1681 ∑ 725 5456 204786 30331 n∑X*Y 204786 (∑X)(∑Y) 3955600 n∑X2 606020 (∑X)2 (725)2 a = (n(∑X*Y)-(∑X)(Y))/((n∑X2) - (∑X)2) a = 1,742894 b = ((∑Y) - (a∑X))/n) b= ((5456) - (1,74289446)(725))/20 b = 4539.9 / 20 b= 226,99 Cuál será el valor de colesterol para una persona de 61 años, o sea el X es 61 años y = aX + b y = aX + b 1,74 X, + b 1,74 * 61 + 226.99 y = aX + b 333,13 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 33. Gráfica 500 450 400 y = 1,73x + 210,09 350 Serie1 R2 = 0,1172 300 Lineal (Serie1) 250 200 150 0 20 40 60 80 100 Recomendación: Cuando se tiene la información se debe presentar un informe que sirva para tomar decisiones, para lo cual se recomienda analizar los datos e investigar sobre el tema de la información, para nuestro caso:  Colesterol es una grasa orgánica llamada liproteína de alta densidad o LDL, medición que debe hacerse por lo menos una vez cada año  Los valores: • Deseables debe ser < 130 mg/100 ml de sangre • Riesgo potencial: 130 – 160 mg/100ml de sangre • Riesgo alto: > 160 mg/100ml de sangre  HDL; Colesterol bueno, son los encargados de remover y retirar el exceso de colesterol LDL y llevarlo al hígado para su eliminación.  La relación colesterol total dividida por el HDL debe ser inferior a 5 para estar exento de riesgo coronario Ejemplo: si se tiene un colesterol total de 260mg/100ml de sangre y un HDL de 30mg/100ml de sangre, su relación o índice (en la semana 3 desarrollaremos con mayor detalle el concepto de Índice) es 260/30 = 8,6 uno se encuentra en franco riesgo de sufrir un ataque cardiaco. Ojo Ataque cardiaco Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 34.  Se debe estar en valor inferior a 3 para estar libre de sufrir infarto Ejemplo, si se tiene un LDL de 130mg/ml de sangre y HDL de 45mg/100ml de sangre el índice es de 2,88 se encuentra en que no se tiene mayor riesgo de sufrir un ataque cardiaco Chulo: Nos damos cuenta de la importancia de la estadística y sobretodo de entender los resultados para tomar decisiones y sobre todo acciones a tiempo. Deming: La importancia de utilizar la regresión es muy grande, con ella puede el estadístico que somos nosotros encontrar valores del futuro o valores que no se tienen con el uso de valores conocidos, ¡eso es buenísimo! Chulo: Por ejemplo, se puede hacer proyección de producción para un futuro con base en los datos conocidos y establecer presupuestos de recursos sabiendo los elementos que se necesitan para un solo producto, a esto se le llama “explosión de materiales” 4.1 Desviación estándar Chulo: ¿Recuerda lo que vimos anteriormente sobre el concepto de desviación estándar?, bueno recordémoslo Deming: La desviación estándar es la medida de dispersión más adecuada para la estadística descriptiva. Es el valor de la raíz cuadrada del promedio de los cuadrados de las desviaciones con respecto a la media de cada valor Deming: Para que lo entienda mejor, lo haremos más fácil, tomemos la fórmula 1 S= ∑ i−x 2 (x ) n−1 Deming: Con base en esta fórmula definamos la desviación estándar, haber usted por su parte trate de definirla, no se la aprenda, analícela, entiéndala Chulo: Es la raíz cuadrada de la sumatoria de la diferencia de cada valor o variable (xi) con la media o promedio de todas las variables (Xi con palito), todo dividido por el número de las muestras. Deming: La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. Dicho de otra manera, la desviación estándar es, simplemente, el "promedio" o variación esperada con respecto de la media aritmética. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca a la media. Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 35. Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. Chulo: Cuando la desviación estándar es para población se toma toda la cantidad como valor de n Sigamos con la misma información para calcular la desviación estándar Xi frec. absol fr. * Xi (Xi-media) (Xi-media)2 fr.(Xi-media)2 fr. 1 2 3 4 5 6 24 2 48 -12,809 164,070481 328,140962 28 2 56 -8,809 77,598481 155,196962 29 1 29 -7,809 60,980481 60,980481 30 1 30 -6,809 46,362481 46,362481 33 5 165 -3,809 14,508481 72,542405 38 5 190 1,191 1,418481 7,092405 45 2 90 8,191 67,092481 134,184962 53 1 53 16,191 262,148481 262,148481 55 1 55 18,191 330,912481 330,912481 57 1 57 20,191 407,676481 407,676481 Sumatorias 21 773 1805,2381 Media = 773/21 = 36,809 Media = 36,809 (fr.(Xi-media)2)n-1 1805,2381/21-1 1805,2381/20 90,2619051 Raíz cuadrada 9,5006 Desviación estándar = 9,5 años Observemos los siguientes aspectos El valor o resultado de Xi-media (columna 4) en algunos casos puede dar valor negativo, no es para preocuparse cuando lo eleve al cuadrado quedará positivo (ver columna 5) Chulo: Para el ejercicio en particular las edades tomadas no son de la totalidad de los funcionarios de la entidad, sino que, corresponden a unas muestras, por lo tanto, si la cantidad es 21 se le descuenta una muestra, por eso el cálculo de la desviación se hizo con n= 20 (21 – 1). Bueno ya hemos llegado a saber calcular la desviación estándar, el resultado es 9,5 años ese valor corresponde al valor de lo que está separado del promedio y corresponde a una sola desviación Veamos una gráfica de las desviaciones estándar bajo la curva normal Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 36. La información total de las variables se encuentra dentro de esta curva Media aritmética, Xmedia + 1 S = 34,135 %; o sea cubre el 34,135% de todas las variables tomadas Media aritmética, X media - 1S = 34,135 %; o sea cubre también el 34, 135 % de las variable Esto quiere decir que, si al valor del promedio le agregamos una desviación y también le quitamos una desviación, cubre todo un 68,27% de todas las variables, claro está que, eso sucede cuando la curva es completamente normal, es decir, que la mitad de la curva que tiene la forma de una campana, es exactamente igual a la otra mitad de la campana. Deming: Ahora cubramos dos desviaciones, vea la gráfica de la distribución que usted tiene atrás Media aritmética, Xmedia + 2 S = 47,725 %; o sea cubre el 47,725% de todas las variables tomadas Media aritmética, X media – 2S = 47,725 %; o sea cubre el 47,725 % de las variables tomadas Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 37. Esto quiere decir que si al valor del promedio le agregamos 2 desviaciones y también le quitamos dos desviaciones, cubre todo un 95,45% de todas las variables, claro está que eso sucede cuando la curva es completamente normal. Deming: Ahora con tres desviaciones, tanto a la izquierda como a la derecha de la media o sea del centro de la curva normal de forma de campana. Media aritmética, Xmedia + 3 S = 47,725 %; o sea cubre el 49,865% de todas las variables tomadas Media aritmética, X media – 3S = 47,725 %; o sea cubre el 49,865 % de las variables tomadas Esto quiere decir que si al valor del promedio le agregamos 3 desviaciones y también le quitamos tres desviaciones, cubre todo un 99,73% de todas las variables, claro está que eso sucede cuando la curva es completamente normal. Deming: Como nos damos cuenta, queda un 0,27% por fuera del cubrimiento de control, esto es preocupante, pues cada día el cliente o los clientes tanto internos como externos son y deben ser más exigentes. Deming: Por ejemplo, tenemos la necesidad de comprarle a la abuela un marcapasos cuyo tiempo esperado de que funcione es de diez años. Hagamos el cálculo de un error de 0,27% o sea que el marcapasos que le compramos a la abuela sea de los que quedaron por fuera de control o sea que tiene una probabilidad de error del 0,27% 10 años x 365 días x 24 horas x 60 min. = 5´256.000 minutos que se espera funcione correctamente De los 5´256.000 minutos tenemos la probabilidad del 0,27% de que el marcapasos no funcione y eso corresponde a un tiempo de 236,52 horas o sea 9,85 días, y en esos días sin marcapasos la abuela se murió. Si usted hace reclamo ante la empresa que le vendió el marcapasos, el fabricante puede contestarle “En la producción de los marcapasos de hizo control de calidad y el rango de desviación cubriendo tres desviaciones a la izquierda del valor nominal (valor exacto esperado) y tres desviaciones a la derecha del valor nominal, el control cubrió el 99,73 de los marcapasos elaborados o sea que estuvimos muy de malas. Chulo: Verifiquemos a ver si la tendencia esperada se presenta en el ejemplo que estamos desarrollando. El promedio de las variables del caso que estamos desarrollando es X media = 36,809 y la desviación estándar es igual a 9,5 años Xmedia + 1S = 36,809 + 1(9,5) = 46,309 Xmedia – 1S 36,809 - 1(9,5) = 27,308 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 38. Preguntémonos entonces ¿Cuántos funcionarios están entre la edad de 27,308 y 46,309 años Xi frec. absol edad fr. 24 2 28 2 29 1 30 1 33 5 38 5 45 2 53 1 55 1 57 1 21 De acuerdo a la información recopilada en el cuadro anterior son 16 los funcionarios del total de 21 o sea 16/21 corresponde a un 76%; la tendencia para una distribución completamente normal seria el 68,27 %, pero la distribución nuestra no es completamente normal así que cumple la tendencia. ¡Bueno!, una nueva pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le quitamos al mismo momento dos desviaciones Xmedia + 2S = 36,809 + 2(9,5) = 55,08 años Xmedia – 2S 36,809 - 2(9,5) = 17,08 años Los funcionarios que están entre 17,08 y 55,08 años son 20 Xi frec. absol fr. 24 2 28 2 29 1 30 1 33 5 38 5 45 2 53 1 55 1 57 1 Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010
  • 39. Deming: El porcentaje de funcionarios que estén en este rango corresponden a 20 personas y esta cantidad corresponde a 20/21 = 95.2381%; el valor esperado para una distribución completamente normal es de 95,45%, se cumple entonces la tendencia ¿verdad? ¡Bueno!, una tercer pregunta ¿cuántos funcionarios están? , si a la información le agregamos y le quitamos al mismo momento tres desviaciones Xmedia + 3S = 36,809 + 3(9,5) = 36,809 + 28.5 = 65,305 años Xmedia – 3S 36,809 - 3(9,5) = 7,59 años Los funcionarios que están entre 7,59 años y 65,39 años son todos o sea el 100% del total de funcionarios, el valor esperado era del 99,73% Chulo: Bueno hemos entendido ¿verdad? Servicio Nacional de Prendizaje SENA todos los derechos reservados 2010