2. Objetivo: Monitorear simultáneamente varias variables de control con
una gráfica
Una gráfica construida con el estadístico T^2 de Hotelling que
permite identificar la interacción de las variables y detectar el
lote defectuoso
27% de equivocación de encontrar correctamente el
defectuoso
0.95% de equivocación de encontrar correctamente el
defectuoso
3. ¿Cuándo es adecuado la construcción de un
sistema de control multivariado?
Especificar los puntos críticos o variables a las cuáles se les debe aplicar los gráficos de control. Esto se hace a
partir de un consenso con los expertos del proceso en la empresa
Recolectar y evaluar el conjunto de datos preliminares para verificar la calidad de los datos, los errores en las
mediciones e identificar aquellos problemas que pueden afectar el uso y desempeño del estadístico T^2
Se deben cumplir los siguientes supuestos:
Ausencia de colinealidad es decir las variables no pueden estar correlacionadas perfectamente
Independencia de las observaciones: aunque no se prohíbe el uso del procedimiento T^2
Se utilizan dos Fases: la primera construir los límites de control con un conjunto de datos retrospectivos que
muestren estar en control
La segunda fase: se ejecuta el script para que pueda calcular el estadístico con todas las variables
4. Primera Técnica de control multivariado:
Reducción de la complejidad de los datos a partir
de un análisis de componentes principales
Se utiliza sobretodo cuando en la
primera componente del análisis
factorial se explica una gran cantidad de
la varianza
5. Análisis Factorial de Componentes
Principales
-4 -2 0 2 4
-2
-1
0
1
2
PC 1
PC
2
Africa
America
Europe
Austria
Belgium
Denmark
Finland
France
Germany
Greece
Iceland
Ireland
Italy
Holland
Norway
Portugal
Spain
Sweden
Switzerland
Britain
Botswana
Burkina Faso
Burundi
Cameroon
R.Centroafri
Ethiopia
Gabon
Gambia
Kenya
Liberia
Morocco
Nigeria
Rwanda
Senegal
Somalia
SouthAfrica
Tanzania
Uganda
Zambia
Argentina
Barbados
Bolivia
Brazil
Chile
Colombia
Costa Rica
Cuba
DominicanR.
Ecuador
El Salvador
Guatemala
Haiti
Honduras
Mexico
Nicaragua
Panama
Paraguay
Peru
Uruguay
Venezuela
Mortinf
LifeExpF
Fertility
Birthrate
LifeExpM
LiteracyM
LiteracyF
COMPONENTES PRINCIPALES
6. Interpretación del análisis de componentes
principales
Definición
Transformación lineal de las variables; todas las variables conservan la información
de la variabilidad de las otras, sin embargo la cantidad de la variabilidad explicada
por componentes elevados es tan pequeña que puede ser ignorada
Ventaja
Análisis con capacidad de reducción de la complejidad de los datos, al pasar de
muchas variables a pocas: estas variables pueden ser representadas gráficamente
Desventaja: pérdida de la
información real
¿Qué debemos
seleccionar?
-Criterio de Varianza: Seleccionar las componentes que explican el 80 – 90% varianza
-Mantener únicamente dos componentes lo que permite construir un gráfico en dos
dimensiones
Condiciones del
análisis - Las variables sean cuantitativas. En este caso intentamos establecer si en la
primera componente se puede explicar de manera muy significativa la varianza
7. Objetivos del análisis
Técnica que permite la
reducción de las
variables
Reducir la complejidad de los
datos obtenidos
Obtener la estructura subyacente en las
variables de control
Identificar los factores en
los cuáles se agrupan las
diferentes variables
En un proceso puedo medir 100 variables y estas se pueden agrupar
en 2 factores que explican del 80% al 90% de la varianza
En pocos factores tengo una
descripción completa de
todos los ítems que tengo en
una encuesta
Este es el análisis que
me permite hacer
estadística con una
encuesta en Google
Drive
8. Después de reducir la complejidad de las variables
Se hace la gráfica de control de
la media o de los atributos en
caso de que se requiera
Ejercicio Práctico
en R
En una planta de procesamiento de coque se
miden el diámetro interno, el grosor y la
longitud en 8 muestreos conformados por 30
unidades de coque. Haga un análisis completo
de control estadístico del proceso utilizando
técnicas multivariadas y univariadas
Base de Datos
https://drive.google.com/open?id=1y63P
edv3A0Aq6kgLorhg22hDIpk0CIpm
10. Group
Group
summary
statistics
1 2 3 4 5 6 7 8
0.15
0.30
S Chart
for Measurement
LCL
UCL
CL
Number of groups = 8
Center = 0.2387554
StdDev = 0.2408221
LCL = 0.1443076
UCL = 0.3332032
Number beyond limits = 0
Number violating runs = 0
Group
Group
summary
statistics
1 2 3 4 5 6 7 8
0.08
0.14
S Chart
for Measurement
LCL
UCL
CL
Number of groups = 8
Center = 0.119188
StdDev = 0.1202197
LCL = 0.07203914
UCL = 0.1663368
Number beyond limits = 0
Number violating runs = 0
Group
Group
summary
statistics
1 2 3 4 5 6 7 8
0.03
0.06
S Chart
for Measurement
LCL
UCL
CL
Number of groups = 8
Center = 0.05074543
StdDev = 0.05118469
LCL = 0.03067136
UCL = 0.0708195
Number beyond limits = 0
Number violating runs = 0
11.
12. Diametro interno
Group
Group
summary
statistics
1 2 3 4 5 6 7 8
0.98
1.00
1.02
1.04
1.06
1.08
1.10
xbar Chart
for Measurement
LCL
UCL
CL
Number of groups = 8
Center = 1.037208
StdDev = 0.1210644
LCL = 0.9708986
UCL = 1.103518
Number beyond limits = 0
Number violating runs = 0
Grosor
Group
summary
statistics
0.20
0.25
0.30
S Chart
for Measurement
UCL
CL
Longitud
14. Segundo Método: es a partir del estadístico
de Hotteling
Distribución de probabilidad multivariada que toma la media de medias de todas las
variables y las covariables de todas las variables
15. Ejemplo de aplicación en R
Se toma una muestra de 10
elementos y se miden 6
variables tipificadas con las
letras A, B, C, D,e y F. Estos
datos corresponden a un
proceso de producción para un
vaso térmico
A B C D E F
48.37 94.01 80.75 2.92 74.85 16.445
47.88 94.06 80.85 2.99 74.98 16.361
48.24 93.82 80.38 2.86 74.39 16.775
47.62 94.18 80.71 3.25 75.09 15.773
47.92 93.95 80.81 2.89 75.4 16.026
47.94 94.3 81.1 3.24 75.12 15.788
48.14 94.11 814.18 3.1 75.47 17.003
47.52 93.64 79.77 3.15 73.81 15.66
48.08 93.47 80.56 2.99 75.19 16.523
47.84 93.64 81.35 3.06 75.35 16.892
16. Group
Group
summary
statistics
1 2 3 4 5
47.5
48.0
48.5
xbar Chart
for data1
LCL
UCL
CL
Number of groups = 5
Center = 47.955
StdDev = 0.3528369
LCL = 47.20652
UCL = 48.70348
Number beyond limits = 0
Number violating runs = 0
47.0 47.5 48.0 48.5 49.0
Process Capability Analysis
for data1
LSL USL
Target
Number of obs = 10
Center = 47.955
StdDev = 0.3528369
Target = 48
LSL = 47.2
USL = 48.8
Cp = 0.756
Cp_l = 0.713
Cp_u = 0.798
Cp_k = 0.713
Cpm = 0.75
Exp<LSL 1.6%
Exp>USL 0.83%
Obs<LSL 0%
Obs>USL 0%
Group
Group
summary
statistics
1 2 3 4 5
93.4
93.6
93.8
94.0
94.2
94.4
xbar Chart
for data1
LCL
UCL
CL
Number of groups = 5
Center = 93.919
StdDev = 0.2464539
LCL = 93.39619
UCL = 94.44181
Number beyond limits = 0
Number violating runs = 0
Group
Group
summary
statistics
1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
R Chart
for data1
LCL
UCL
CL
Number of groups = 5
Center = 0.278
StdDev = 0.2464539
LCL = 0
UCL = 0.9083083
Number beyond limits = 0
Number violating runs = 0
93.4 93.6 93.8 94.0 94.2 94.4
Process Capability Analysis
for data1
LSL USL
Target
Number of obs = 10
Center = 93.919
StdDev = 0.2464539
Target = 93.9
LSL = 93.4
USL = 94.4
Cp = 0.676
Cp_l = 0.702
Cp_u = 0.651
Cp_k = 0.651
Cpm = 0.674
Exp<LSL 1.8%
Exp>USL 2.5%
Obs<LSL 0%
Obs>USL 0%
A
B
18. Procedimiento 2: 2) Determinación de la
normalidad de los datos
Nombres Variable n Asimetría D de K-S Valor-p K-S D de K-S Lilliefors
Valor-p K-S Lilliefors
W de Shapiro Valor-p Shapiro
A A 10 -0.10 0.13 0.99 0.13 0.90 0.98 0.94
B B 10 -0.26 0.15 0.98 0.15 0.75 0.96 0.76
C C 10 0.52 0.00 0.52 0.86 0.37 0.12
D D 10 0.26 0.16 0.97 0.16 0.70 0.95 0.66
E E 10 -0.99 0.21 0.72 0.21 0.27 0.88 0.14
F F 10 -0.04 0.16 0.92 0.16 0.63 0.92 0.40
LA NORMALIDAD ES ESENCIAL PARA QUE FUNCIONE EL MODELO MULTIVARIADO
19. Planteamos las gráficas de control simple para
cada una de las variables donde se muestre
control
20. Ejecuto el script y observo que la muestra 7 está
fuera de los límites de control
###Script de Control Multivariado
require(MSQC)
require(qcc)
###Cargar la base de datos
data<-read.csv("C:/Users/jgutierrez/Google
Drive/Control Estadístico de
PRocesos/Control.Multivariado.csv",header=
TRUE,encoding="latin1")
###El archivo se llama data
####attach(data) poner como base de datos
principal la matriz de trabajo
attach(data)
q = mqcc(data, type = "T2")