Este documento describe las fases del análisis de datos para resolver problemas. La fase II incluye determinar las causas del problema mediante diagramas de Ishikawa, identificar variables discretas y continuas, y realizar pruebas de hipótesis usando métodos como correlación, regresión y análisis de varianza para determinar qué variables afectan los resultados. También presenta ejemplos de aplicar estas técnicas para analizar datos de una empresa de mensajería.
1. 11
5. Fase II: Analizar
5.1 Determinar las causas del problema
5.2 Variables Discretas y Continuas
5.3 Prueba hipótesis
5.4 Procedimiento de prueba hipótesis
5.5 Ejemplos
2. 22
Y (KPOV)
X (KPIV)
CTQs
FMEA, Mapa de Procesos
Cp, Cpk
Prueba de Hipótesis
Correlación
Regresión
DOE Simulación
SPC
5 Ss
Poka Yoke
X Key Process Input Variables (KPIV) variable claves del proceso
Y Key Process Ouptput Variables (KPOV)
variables clave de salida del proceso
para el cliente
X (KPIV) significativas
X (KPIV) que afectan al proceso
X (KPIV) que afectan al proceso
Controladas
3. 33
Determinar las causas5.1
Con la finalidad de determinar las posibles causas generalmente que afectan a nuestro
poblewma (Y o KPOV), usaremos el Diagrama Causa – Efecto, o Ishikawa.
Listar por tormenta de ideas las
causas generales que afectan
al indicador.
Agrupar las causas en 4 o 6
grupos. Se suele usar:
Por 4M Por 6M
Mano O. Mano O
Material Material
Maquinaria Maquinaria
Método Método
Medición
Medio amb.
CONSTRUCCION
causa
causa
causa
causa
causa
causa
causa
causa
causa
causa
causa causa
causa
causa
causa
causa
causa
causa
Criterio de
agrupación 3
Criterio de
agrupación 4
Criterio de
agrupación 6
Criterio de
agrupación 5
Criterio de
agrupación 1
Criterio de
agrupación 2
causa
causa
PROBLEMA
Nota: Si las causas vienen de los KPIV, se deben señalar si son E,C,N
Diagrama de Causa-Efecto (Ishikawa)
4. 44
Posteriormente se validaran cuales
causas son definitivamente las que
son las responsables del Problema
Se ha visto que la KPIV, puede impactar en las KPOV:
Matriz Causa-Efecto
Número de Contratos
Conocimientos norma de créditos
Numero de Analistas
Tiempo de entrega de Contratos
Tiempo de Calificación
% de créditos rechazados
Costo Evaluación.
X Y
afecta
Ejemplos:
Para mejorar el proceso, se debe identificar cuáles son las X que más
afectan a las Y para determinar cuáles deben ser atacadas.
Determinar las causas5.1
6. 66
5.2 Variables Discretas y Continuas
tienen un número fijo de valores
Ejemplos: estado civil, tipo
sanguíneo, número de niños
Datos
Discretos
tienen un número infinito de valores
Ejemplos: estatura, peso,
temperatura
Datos
Continuos
7. 77
Para conocer si un factor ( X: KPIV ) influye sobre nuestro
indicador ( Y: KPOV ) del proceso; se suele variar este
factor de manera de ver si su variación afecta al indicador.
La manera de ver esta variación es a través de las
pruebas de hipótesis que nos permitirán concluir si el factor
en estudio afecta significativamente al indicador.
PRUEBA DE HIPOTESIS
Prueba Hipótesis5.3
8. 88
Errores posibles al evaluar una hipótesis
Verdad de H0
V
(no hay diferencia)
F
(si hay diferencia)
Decisión correcta
1 -
(nivel de significan
cía)
Error tipo 1
α
Error tipo 2
β
Decisión correcta
1 –
(poder la prueba)
F V
Aceptar H0
(no hay
diferencia)
Aceptar Ha
(si hay
diferencia)
P(Error Tipo) =
:Probabilidad de
encontrar una
diferencia cuándo
esta no existe.
= 0.01, 0.05
P(Error Tipo2) =
: Probabilidad de no
encontrar una
diferencia cuando
esta si existe.
Verdad de Ha
Prueba Hipótesis5.3
9. 99
Ho : El factor no generó diferencias Antes Vs Después (X no afecta Y)
Ha : El factor si generó diferencias Antes Vs Después (X si afecta Y)
RECORDANDO
Si p – val > 0.05 () NO se rechaza H0
VOCABULARIO
Conclusión Robusta:
Rechazar H0. Ello pues el valor de se ha fijado en la prueba (usualmente en
0.05)
Conclusión Débil:
Aceptar H0 sin conocer el valor de . En estos casos se suele decir “No puede
rechazarse H0”
Potencia de una prueba estadística:
Es la probabilidad de rechazar correctamente una H0
Potencia = 1 -
Prueba Hipótesis5.3
10. 1010
Prueba Anova
ONE SAMPLE t – TAMAÑO DE MUESTRA
(Si la Población es Normal)
Prueba t (One Sample t)
Estadístico t = X-
s / n
Hipótesis Nula H0: = 0
Hipótesis Alterna
Ha: <0 ; t < t , n-1
> 0; t > t , n-1
0 ; | t | > t /2 , n-1
Minitab
Stat-Basic Statisc- 1sample t
Prueba Hipótesis5.3
11. 1111
Prueba Hipótesis5.3
TIPO LOTE
HUEVOSINCUBADOS
VIEJOJOVENADULTO
16000
14000
12000
10000
8000
6000
4000
2000
0
Boxplot of HUEVOS INCUBADOS by TIPO LOTE
Source DF SS MS F P
TIPO LOTE 2 177886860 88943430 6.46 0.002
Error 118 1625812015 13778068
Total 120 1803698874
S = 3712 R-Sq = 9.86% R-Sq(adj) = 8.33%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev --------+---------+---------+---------+-
ADULTO 52 6158 3863 (----*----)
JOVEN 17 9055 4226 (--------*--------)
VIEJO 52 5331 3369 (----*----)
6000 8000 10000 12000
12. 1212
Correlación y Regresión
INTRODUCCIÓN:
Al interior de un proceso, usualmente existe una relación entre 2
variables.
Si una Y (KPOV) se correlaciona con una X; podremos decir que X es
una KPIV.
De esta manera diremos que existe una ecuación que liga a ambas Y
= f (x). Esta ecuación se denomina “Modelo matemático”.
Esta ecuación se calcula usando técnicas de regresión.
Usualmente la correlación para determinar la fuerza que liga a 2
variables sin necesidad de alterar el proceso como se hizo en las
Pruebas de hipótesis o como hará en los DOE (Fase 3).
Prueba Hipótesis5.3
13. 1313
-1 r < 0
Correlación Negativa
r = 0
No hay Correlación
0 < r 1
Correlación Positiva
Correlación
Es la Fuerza de Asociación entre 2 Variables.
Se mide con el Coeficiente de Pearson (r)
-1 r 1
Cuánto más cercano esté el coeficiente de Correlación de Pearson
a –1 o 1; mayor probabilidad de Correlación
Prueba Hipótesis5.3
14. 1414
Precauciones:
Dado que no estamos modificando el proceso ( variando x) y
midiendo su efecto ( en Y) : encontrar que “hay correlación”
no siempre significa que al variar X, variará Y (Causa –
Efecto)
Solo debemos usar correlación cuando hay una persuasión
razonable que X podría afectar Y
Correlación
Prueba Hipótesis5.3
15. 1515
PROCESO
Indicador (Y)
Variables
Experimentales
Y1 , Y2
X1 X2 X3 X4
Y = f ( X1,X2,....Xn)
Con la regresión se determina el Modelo Matemático que relacione las
Variables X con Y.
Estas Xi, son la
que se han
obtenido
después de:
Prueba de
Hipótesis.
Correlación.
LOS MODELOS MATEMATICOS PUEDEN SER
Y = 0 + 1 X LINEAL
Y = 0 + 1X + 2X2 CUADRÁTICO
Y = 0 + 1X + 2X2 + 3X3 CÚBICO
Y = 0 + 1X1 + 2X2+... +nXn) LINEAL
MÚLTIPLE
Regresión
Prueba Hipótesis5.3
16. 1616
Procedimiento para la Prueba Hipótesis
1. Identificar de acuerdo al tipo de variable discreta o continua tanto para KPIV
como KPOV el tipo de Prueba Estadística a utilizar.
2. Establecer la Hipótesis Nula Ho.
3. Especificar una hipótesis alternativa apropiada Ha.
4. Elegir un nivel de significación (Usualmente: 0.05).
5. Establecer un estadístico de prueba apropiado.
6. Establecer la región de rechazo del estadístico.
7. Calcular las cantidades muestrales necesarias, sustituirlas en la ecuación del
estadístico de la prueba y calcular es valor.
8. Decidir si deberá rechazarse o no Ho.
9. Traducir la decisión en términos de proceso.
Acción
Procedimiento de pruebas5.4
17. 1717
FLUJOGRAMA PRUEBA HIPÓTESIS
Inicio
Ubicar las variables importantes
( Fase 1 )
Seleccionar la
prueba de hipótesis
a usar
Variar el factor de
manera de tener 2
Situaciones :
“Antes”
“Después”
Recopilar data
Aplicar la prueba
de hipótesis
H0 no hay variación antes vs después
Ha si hay variación antes vs después
p –val > 0.05
1Factor si afecta
Fin
Si
No
Rechazo H0
1
Factor no afecta
Acepto H0
Procedimiento de pruebas5.4
18. 1818
Y Continua Y Discreta
X
Continua
Correlacion-Regresion Correlacion-Regresion
X
Discreta
Para distribucion normal de Y
Prueba T1
Prueba T2
Prueba Anova
Para distribucion no normal de Y
Prueba W
Prueba xxxx
Prueba kk
Chi cuadrado
Procedimiento de pruebas5.4
Selección de la Prueba Hipótesis
19. 1919
5.4
¿Es normal?
Prueba F
para Y agrupada según las X
SI
Agrupar
prueba Normalidad para"Y"
¿Es
normal?
NO
SI
¿P>α ?
Transformar Datos
prueba Normalidad para"Y"
NO
NO
¿Es normal?
SI
NO
Prueba F
para Y agrupada según las X
¿P>α ?
SI
NO
Prueba KW
Prueba de Anova
Prueba de Normalidad
para "Y"
SI
Y continua /
X discreta
Con más de 2
muestras
Procedimiento de Pruebas
20. 2020
5.4
Y continua /
X discreta
Con 2 muestras
¿Es normal?
Prueba F
para Y agrupada según las X
SI
Agrupar
prueba Normalidad para"Y"
¿Es normal?
NO
SI
¿P>α ?
Transformar Datos
prueba Normalidad para"Y"
NO
NO
¿Es normal?
SI
NO
Prueba F
para Y agrupada según las X
¿P>α ?
SI
NO
Prueba KW
Prueba T2
Prueba de Normalidad
para "Y"
SI
Procedimiento de Pruebas
21. 2121
5.4
Y continua /
X discreta
Con 1 muestra
¿Es
normal?
SI
Agrupar
prueba Normalidad para"Y"
¿Es normal?
NO
SI
Transformar Datos
prueba Normalidad para"Y"
NO
¿Es
normal?
SI
NO
Prueba de Normalidad
para "Y"
Prueba T 1
Prueba One Sample
Sign
Procedimiento de Pruebas
22. 2222
5.4
Y continua o
discreta /
X Continua
Probar la correlacion
de todos los x con y
¿r = 0?
¿es lineal
o curva?
No Si
¿Y es
continua
?
SiNo
¿Hay
mas de
una x?
No Si
curva
¿es
lineal o
curva?
lineal
curva
lineal
No hay correlacion
Prueba Regresion
Multiple
Prueba Regresion
Superficie de Respuesta
Prueba de Regresion
curva lineal
Prueba de Regresion
lineal
Prueba Regresion
Logistica
Procedimiento de Pruebas
23. 2323
X Y
cantidad pedido
devueltos semanal
¿Qué tipo de
prueba?
X1= Zona Geografica 20
30
.
.
.
10
20
40
.
.
.
30
30
50
.
.
.
20
X1= Discreta, tiene 10
valores (menos de 30)
Y= continua
Por lo tanto se utiliza la
Prueba de Anova para
probar la significancia de
X en Y.
Nota: no se utiliza T1 ni
T2 porque son más de 1
y 2 muestras
respectivamente.
48 datos (48 semanas)
48 datos (48 semanas)
48 datos (48 semanas)
Zona 1
Zona 2
.
.
.
.
.
Zona 10
Ejemplos: EMPRESA COURIER “EL RAPIDO”5.5
24. 2424
X2= Repartidores
Repartidor 1
Repartidor 2
.
.
.
.
.
.
.
.
Repartidor 50
X2= inicialmente es
discreta, pero por tener
más de 30 valores se
le considera continua.
Y= continua
Por lo tanto se utiliza la
Prueba de Regresion.
X Y
cantidad pedido
devueltos semanal
¿Qué tipo de
prueba?
20
30
.
.
.
10
20
40
.
.
.
30
30
50
.
.
.
20
48 datos (48 semanas)
48 datos (48 semanas)
48 datos (48 semanas)
Ejemplos: EMPRESA COURIER “EL RAPIDO”5.5
25. 2525
X3= ¿El repartidor usa
Guia ?
Si
No
50
10
.
.
.
20
10
20
.
.
.
30
X3= Discreta
Y= Continua
Por lo tanto se utiliza la
Prueba T2 para probar
la significancia de X en
Y
Nota: no Anova porque
solo son 2 muestras.
X Y
cantidad pedido
devueltos semanal
¿Qué tipo de
prueba?
Ejemplos: EMPRESA COURIER “EL RAPIDO”5.5
26. 2626
X1= Presion en el
cabezal (Bar)
X Y
cantidad de
pasta quemada
¿Qué tipo de
prueba?
Ejemplos: FABRICA DE PASTAS “NAPOLITANO”5.5
40 bar
65 bar
50 bar
30 bar
.
.
.
.
.
.
60 bar
100 datos
10 kg
15 kg
12 kg
8 kg
.
.
.
.
.
.
14kg
X1= es continua
Tiene mas de 30 datos
Y= continua
Por lo tanto se utiiliza la
Prueba de Regresion
27. 2727
Ejemplos: FABRICA DE PASTAS “NAPOLITANO”5.5
X2= Temperatura de
cocido (ºC)
X Y
cantidad de
pasta quemada
¿Qué tipo de
prueba?
45 ºC
35 ºC
55 ºC
32 ºC
.
.
.
.
.
.
50 ºC
105 datos
15 kg
10 kg
20 kg
8 kg
.
.
.
.
.
.
25kg
X2= es continua
Tiene mas de 30 datos
Y= continua
Por lo tanto se utiiliza la
Prueba de Regresion
28. 2828
Ejemplos: FABRICA DE PASTAS “NAPOLITANO”5.5
X3= Humedad relativa
(%)
X Y
cantidad de
pasta quemada
¿Qué tipo de
prueba?
60%
55%
70%
45%
.
.
.
.
.
.
72%
103 datos
15 kg
10 kg
20 kg
8 kg
.
.
.
.
.
.
25kg
X3= es continua
Tiene mas de 30 datos
Y= continua
Por lo tanto se utiiliza la
Prueba de Regresion