SlideShare una empresa de Scribd logo
1 de 26
Descargar para leer sin conexión
Revisión general del Análisis exploratorio de
datos
véase también
Los métodos de Análisis exploratorio de datos (EDA) se utilizan principalmente para explorar los
datos antes de utilizar métodos más tradicionales, o para examinar los residuos de un modelo. Estos
métodos son particularmente útiles para identificar observaciones extraordinarias y notar violaciones
de supuestos tradicionales, tales como la no linealidad o la varianza no constante.
Tallo y hoja muestra una gráfica de tallo y hoja basada en caracteres.
Gráfica de caja muestra una gráfica de caja y bigotes.
Valores de letras genera una presentación de valores de letras. Utilice este procedimiento para
describir la ubicación y la dispersión de distribuciones de muestra.
Método "Median Polish" ajusta un modelo aditivo a un diseño de dos factores e identifica
patrones de datos no explicados por los efectos de fila y de columna. Este procedimiento es similar al
análisis de varianza excepto por el hecho de que se utilizan medianas en lugar de medias, agregando
así fuerza contra el efecto de los valores atípicos.
Línea resistente utiliza un método que es resistente a los valores atípicos para ajustar una línea
recta a sus datos. Usted puede ajustar una línea resistente antes de utilizar una regresión de cuadrados
mínimos para determinar si la relación es lineal para hallar re-expresiones para linealizar la relación
si es necesario y para identificar valores
Suavización de resistentes suaviza una secuencia ordenada de datos, comúnmente recolectados
en el tiempo, para eliminar las fluctuaciones aleatorias. La suavización es útil para descubrir y
resumir tanto tendencias de datos como valores atípicos.
Rootograma muestra un rootograma suspendido de sus datos. Un rootograma suspendido es un
histograma con una distribución normal ajustada al mismo, el cual muestra las desviaciones de la
distribución normal ajustada.
Referencias de EDA
[1] P.F. Velleman (1980). "Definition and Comparison of Robust Nonlinear Data Smoothing
Algorithms", Revista de la American Statistical Association, Volumen 75, Número 371, páginas
609 615.
[2] P.F. Velleman y D.C. Hoaglin (1981). ABC's of EDA, Duxbury Press.
Página 1 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Tallo y hoja
revisión general véase también
Gráfica > Tallo y hoja
Estadísticas > EDA > Tallo y hoja
Gráficas de caracteres > Tallo y hoja
Utilice para examinar la forma y dispersión de los datos de muestra. Minitab muestra una gráfica de
tallo y hoja en la ventana Sesión. La gráfica es similar un histograma por un lado; sin embargo, en
lugar de barras, son las cifras de los valores de datos reales los que indican la frecuencia de cada
sección (fila).
La siguiente es una gráfica de tallo y hoja correspondiente a un conjunto de datos con los cinco
valores siguientes: 3, 4, 8, 8 y 10.
Tallo y hoja de C1 N = 5
Unidad de hoja = 1.0
1 0 3
2 0 4
2 0
(2) 0 88
1 1 0
La pantalla tiene tres columnas:
Las hojas (derecha) Cada uno de los valores en la columna de hoja representa un dígito de una
observación. La "unidad de hoja" (declarada encima de la gráfica) especifica la cifra que se utiliza.
En el ejemplo, la unidad de hoja es 1.0. De este modo, el valor de hoja de una observación de 8 es 8,
mientras que el valor de hoja de una observación de 10 es 0.
El tallo (centro) El valor de tallo representa la cifra ubicada inmediatamente a la izquierda de la
cifra de hoja. En el ejemplo, el valor de tallo de 0 indica que las hojas de esa fila pertenecen a
observaciones con valores mayores que o iguales a cero, pero menores que 10. El valor de talla de 1
indica observaciones mayores que, o iguales a, 10, pero menores que 20.
Conteos (izquierda) Si el valor de la mediana de la muestra está incluido en una fila, el conteo
correspondiente a esa fila se encierra entre paréntesis. Los valores de las filas por encima y por
Página 2 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
debajo de la mediana son acumulativos. El conteo de una fila por encima de la mediana representa el
conteo total para esa fila y las filas que se encuentran por encima de ésta. El valor de una fila que se
encuentra por debajo de la mediana representa el conteo total para esa fila y las filas que se
encuentran por debajo de ésta.
En el ejemplo, la mediana de la muestra es 8, por lo que el conteo de la cuarta fila está entre
paréntesis. El conteo de la segunda fila representa el número total de observaciones en las dos
primeras filas.
Elementos del cuadro de diálogo
Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra una gráfica separada
para cada columna.
Por variable: Ingrese una columna que contenga una variable de agrupación. Los valores en la
columna Por variable deben ser enteros entre -10000 y +10000 o el símbolo de datos faltantes (*).
Minitab produce una gráfica separada para cada grupo. Esta opción no funciona con la opción
Recortar valores atípicos.
Recortar valores atípicos: Marque esta opción para recortar todos los valores atípicos y mostrarlos
en líneas especiales con las etiquetas BAJO y ALTO. Esta opción no funciona con la opción Por
variable.
Incremento: Ingrese un número para controlar el escalado vertical al establecer el incremento entre
las líneas de la presentación (la diferencia entre los valores más pequeños posibles en líneas
adyacentes).
Gráficas de caja
revisiones generales procedimiento ejemplos datos véase también
Gráfica > Gráfica de caja
Estadísticas > EDA > Gráfica de caja
Utilice las gráficas de caja (también denominadas gráficas de caja y bigotes) para evaluar y comparar
las distribuciones de la muestra. La figura siguiente ilustra los componentes de una gráfica de caja
predeterminada.
Valor atípico una
observación inusualmente
grande o pequeña. Los
valores ubicados más allá
de los bigotes son valores
atípicos.
Por opción
predeterminada, el bigote
superior se extiende
hasta el valor de datos
más alto dentro del límite
superior.
Página 3 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Elementos del cuadro de diálogo
Una Y: Elija una de estas opciones para mostrar una gráfica separada para cada columna.
Múltiples Y: Elija una de estas opciones para mostrar múltiples columnas de datos en la misma
gráfica.
<Aceptar>
Por opción predeterminada,
la parte superior de la caja
es el tercer cuartil (Q3)
75% de los valores de datos
son menores que o iguales a
este valor.
Por opción predeterminada,
la parte inferior de la caja es
el primer cuartil (Q1)
25% de los valores de datos
son menores que o iguales a
este valor.
Límite superior = Q3 +
1.5 (Q3 Q1)
Mediana el centro de
los datos. La mitad de las
observaciones son
menores que o iguales a
la mediana.
Por opción
predeterminada, el bigote
inferior se extiende hasta
el valor más bajo dentro
del límite inferior.
Límite inferior = Q1 1.5
(Q3 Q1)
Nota Por opción predeterminada, Minitab utiliza el método del cuartil para calcular las cotas de la
caja. Para cambiar el método para una gráfica específica a bisagra o percentil, utilice Editor
> Editar caja de rango intercuartil > Opciones. Para cambiar el método para todas las
gráficas de caja futuras, utilice Herramientas > Opciones > Gráficas individuales > Gráficas
de caja.
Simple Con
grupos
Simple Con
grupos
Página 4 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Datos Gráfica de caja
tema principal
Usted necesita una o más columnas de datos numéricos o de fecha/hora. Usted también puede
utilizar hasta cuatro columnas de datos categóricos para agrupación.
Gráfica de caja Una Y, Simple
tema principal procedimiento ejemplo datos véase también
Gráfica > Gráfica de caja > elija Una Y Simple > Aceptar
Estadísticas > EDA > Gráfica de caja > elija Una Y Simple > Aceptar
Utilice para mostrar una gráfica de caja simple.
Elementos del cuadro de diálogo
Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra una gráfica separada
para cada columna. (Para mostrar todas las gráficas en la misma página, utilice Variables múltiples.)
<Escala>
<Etiquetas>
<Mostrar datos>
<Gráficas múltiples>
<Opciones de los datos>
Ejemplo de una gráfica de caja simple
tema principal interpretación de los resultados comandos de sesión véase también
Usted desea examinar la durabilidad general de sus productos de alfombra. Las muestras de los
productos para alfombras se colocan en cuatro hogares y usted mide la durabilidad después de 60
días. Cree una gráfica de caja para examinar la distribución de las puntuaciones de durabilidad.
Más Para otras opciones de datos (dividir en subconjuntos, uso de columnas de frecuencia y
manejo de datos faltantes), véase Revisión general de opciones de datos. Para cambiar el
orden de presentación de las categorías de texto, véase Ordenamiento de las categorías de
texto.
Página 5 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
1 Abra la hoja de trabajo ALFOMBRA.MTW.
2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
3 En Una Y, elija Simple. Haga clic en Aceptar.
4 En Variables de graficas, ingrese Durabilidad. Haga clic en Aceptar.
Salida de la ventana Gráfica
Interpretación de los resultados
La gráfica de caja muestra:
La puntuación mediana de durabilidad es 12.95.
El rango intercuartil es de 10.575 a 17.24.
No están presentes valores atípicos.
El rango es de 7.03 a 22.5.
El bigote superior más largo y el área de caja grande ubicada sobre la mediana indican que los
datos tienen una asimetría ligeramente positiva la cola derecha de la distribución es más larga que
la cola izquierda.
Para mostrar una gráfica de caja simple
tema principal ejemplo datos véase también
1 Elija Gráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N,
coloque el cursor sobre cualquier parte de la gráfica de caja.
Página 6 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
2 En Una Y, elija Simple. Haga clic en Aceptar.
3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra una gráfica
separada para cada columna.
4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.
Gráfica de caja Una Y, Con grupos
tema principal procedimiento ejemplo datos véase también
Gráfica > Gráfica de caja > elija Una Y Con grupos > Aceptar
Estadísticas > EDA > Gráfica de caja > elija Una Y Con grupos > Aceptar
Utilice para mostrar una gráfica de caja con grupos.
Elementos del cuadro de diálogo
Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra una gráfica separada
para cada columna. Para mostrar todas las gráficas en la misma página, utilice Múltiples variables.
Variables categóricas para agrupación (1 a 4, la más externa primero): Ingrese de una a cuatro
columnas de variables (categóricas ) de agrupación. Minitab muestra todos los grupos en la misma
gráfica. (Para mostrar en paneles de una o más variables, utilice Por Variables. La primera variable
es la más externa en la escala y la última variable es la más interna .
<Escala>
<Etiquetas>
<Mostrar datos>
<Gráficas múltiples>
<Opciones de los datos>
Ejemplo de una gráfica de caja con grupos
tema principal interpretación de los resultados comandos de sesión véase también
Usted desea evaluar la durabilidad de cuatro productos de alfombra experimentales. Las muestras de
los productos para alfombras se colocan en cuatro hogares y usted mide la durabilidad después de 60
días. Cree una gráfica de caja con etiquetas de mediana y cajas codificadas por color para examinar
la distribución de durabilidad de cada producto de alfombra.
1 Abra la hoja de trabajo ALFOMBRA.MTW.
Página 7 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
3 En Una Y, elija Con grupos. Haga clic en Aceptar.
4 En Variables de graficas, ingrese Durabilidad.
5 En Variables categóricas para agrupación (1 a 4, la más externa primero), ingrese Alfombra.
6 Haga clic en Etiquetas, luego haga clic en la ficha Etiquetas de datos.
7 En Etiqueta, elija Medianas. Elija Usar etiquetas de valor y. Haga clic en Aceptar.
8 Haga clic en Mostrar datos.
9 En Variables categóricas para asignación de atributos, ingrese Alfombra. Haga clic en
Aceptar en cada cuadro de diálogo.
Salida de la ventana Gráfica
Interpretación de los resultados
La mediana de durabilidad es más alta para Alfombra 4 (19.75). Sin embargo, este producto también
demuestra la mayor variabilidad, con un rango intercuartil de 9.855. Además, la distribución tiene
una asimetría negativa, con al menos una medición de durabilidad de aproximadamente 10.
Alfombras 1 y 3 tienen medianas de durabilidad similares (13.52 y 12.895, respectivamente).
Alfombra 3 también muestra la menor variabilidad, con un rango intercuartil de sólo 2.8925.
La mediana de durabilidad de Alfombra 2 es solamente 8.625. Esta distribución y la de la Alfombra
1 tienen asimetría positiva, con rangos intercuartiles de aproximadamente 5-6.
Para mostrar una gráfica de caja con grupos
SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N,
coloque el cursor sobre cualquier parte de la gráfica de caja.
Página 8 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
tema principal ejemplo datos véase también
1 Elija Estadísticas > EDA > Gráfica de caja o Gráfica > Gráfica de caja.
2 En Una Y, elija Con grupos. Haga clic en Aceptar.
3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra una gráfica
separada para cada columna.
4 En Variables categóricas para agrupación (1 a 4, la más externa primero), ingrese de una a
cuatro columnas de variables (categóricas ) de agrupación. La primera variable es la más externa en
la escala y la última variable es la más interna .
5 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.
Gráfica de caja Múltiples Y, Simple
tema principal procedimiento ejemplo datos véase también
Gráfica > Gráfica de caja > elija Múltiples Y Simple > Aceptar
Estadísticas > EDA > Gráfica de caja > elija Múltiples Y Simple > Aceptar
Utilice esta opción para mostrar gráficas de caja de múltiples variables en la misma gráfica.
Elementos del cuadro de diálogo
Variables de gráficas: Ingrese una o más columnas de datos para graficar. Minitab muestra todas
las columnas en la misma gráfica.
<Escala>
<Etiquetas>
<Mostrar datos>
<Gráficas múltiples>
<Opciones de los datos>
Ejemplo de una gráfica de caja con
múltiples Y
tema principal interpretación de los resultados comandos de sesión véase también
Página 9 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Su compañía fabrica tubos plásticos y a usted le interesa la uniformidad de los diámetros. Usted
mide diez tubos por semana durante tres semanas. Cree una gráfica de caja para examinar las
distribuciones.
1 Abra la hoja de trabajo TUBERÍA.MTW.
2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
3 En Múltiples Y, elija Simple. Haga clic en Aceptar.
4 En Variables de gráficas, ingrese 'Semana 1' 'Semana 2' 'Semana 3'. Haga clic en Aceptar.
Salida de la ventana Gráfica
Interpretación de los resultados
La gráfica de caja muestra:
La mediana de la Semana 1 es 4.985, y el rango intercuartil es de 4.4525 a 5.5575.
La mediana de la Semana 2 es 5.275, y el rango intercuartil es de 5.08 a 5.6775. Aparece un
valor atípico en 7.0.
La mediana de la Semana 3 es 5.43, y el rango intercuartil es de 4.99 a 6.975. Los datos están
asimétricos positivamente.
Las medianas de las tres semanas son similares. Sin embargo, durante la Semana 2, se fabricó un
tubo anormalmente ancho, y durante la Semana 3, se fabricaron varios tubos anormalmente anchos.
Para mostrar una gráfica de caja simple con
múltiples y
SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N,
coloque el cursor sobre cualquier parte de la gráfica de caja.
Página 10 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
tema principal ejemplo datos véase también
1 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
2 En Múltiples Y, elijaSimple. Haga clic en Aceptar.
3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra todas las
columnas en la misma gráfica.
4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.
Gráfica de caja Múltiples Y, Con grupos
tema principal procedimiento ejemplo datos véase también
Gráfica > Gráfica de caja > elija Múltiples Y Con grupos Aceptar
Estadísticas > EDA > Gráfica de caja > elija Múltiples Y Con grupos > Aceptar
Utilice para mostrar gráficas de caja de múltiples variables con grupos en la misma gráfica.
Elementos del cuadro de diálogo
Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra todas las columnas en
la misma gráfica.
Variables categóricas para agrupación (1 a 3, la más externa primero): Ingrese de una a tres
columnas de variables (categóricas ) de agrupación. Minitab muestra todos los grupos en la misma
gráfica. (Para mostrar en paneles de una o más variables, utilice Por Variables. La primera variable
es la más externa de las variables de agrupación en la escala.
Nivel de escala para las variables de gráficas
Las variables de gráficas se muestran más hacia fuera en la escala: Elija esta opción para hacer
de las variables de gráfica los grupos más externos.
Las variables de gráficas se muestran más hacia dentro en la escala: Elija esta opción para hacer
de las variables de gráficas los grupos más internos.
<Escala>
<Etiquetas>
<Mostrar datos>
<Gráficas múltiples>
<Opciones de los datos>
Página 11 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Ejemplo de una gráfica de caja con
múltiples Y y grupos
tema principal interpretación de los resultados comandos de sesión véase también
Su compañía fabrica tubos plásticos y a usted le interesa la uniformidad de los diámetros. Usted
mide diez tubos de cada máquina por semana durante tres semanas. Cree una gráfica de caja para
examinar las distribuciones.
1 Abra la hoja de trabajo TUBERÍA.MTW.
2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
3 En Múltiples Y, elija Con grupos. Haga clic en Aceptar.
4 En Variables de gráficas, ingrese 'Semana 1' 'Semana 2' 'Semana 3'.
5 En Variables categóricas para agrupación (1 a 3, la más externa primero), ingrese Máquina.
6 En Nivel de escala para variables de gráficas, elija Las variables de gráficas se muestran
más hacia dentro en la escala. Haga clic en Aceptar.
Salida de la ventana Gráfica
Interpretación de los resultados
La gráfica de caja muestra:
Para la máquina 1, la mediana de diámetro y variabilidad parece aumentar cada semana.
Para la máquina 2, la mediana de diámetro y variabilidad parece ser más estable entre las
semanas.
Se recomienda realizar análisis estadísticos, tales como MANOVA balanceado, para examinar más a
Página 12 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
fondo la relación entre los factores.
Para mostrar una gráfica de caja con
múltiples Y y grupos
tema principal ejemplo datos véase también
1 Elija Gráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja.
2 En Múltiples Y, elijaCon grupos. Haga clic en Aceptar.
3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra todas las
columnas en la misma gráfica.
4 En Variables categóricas para agrupación (1 a 3, la más externa primero), ingrese de una a
tres columnas de variables (categóricas ) de agrupación. La primera variable que usted ingresa es la
variable categórica más externa en la escala y la última será la más interna .
5 En Nivel de escala para variables de gráficas, elija una de las siguientes opciones:
Las variables de gráficas se muestran más hacia fuera en la escala para hacer de las variables
de gráficas los grupos más externos .
Las variables de gráficas se muestran más hacia dentro en la escala para hacer de las
variables de gráficas los grupos más internos .
6 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.
Valores de letras
revisión general procedimiento ejemplo datos véase también
Estadísticas > EDA > Valores de letras
Utilice presentaciones de valores de letras para describir la ubicación y la dispersión de
distribuciones de muestra. Las estadísticas dadas dependen del tamaño de la muestra, e incluyen
mediana , bisagras , octavos y más.
Elementos del cuadro de diálogo
Variable: Seleccione la columna que contenga la variable cuyos valores de letras desea obtener.
SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N,
coloque el cursor sobre cualquier parte de la gráfica de caja. Para ver el valor del eje Y y
el número de fila de un valor atípico, coloque el cursor sobre el valor atípico.
Página 13 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Almacenar valores de letras: Marque esta opción para almacenar los valores de letras. La columna
de almacenamiento contendrá todos los números en la salida que se muestra debajo de INFERIOR
(comenzando de abajo hacia arriba), luego la mediana y después los números que se muestran debajo
de SUPERIOR (comenzando de arriba hacia bajo).
Almacenar puntos medios: Marque esta opción para almacenar el punto medio de cada valor de
letra.
Almacenar dispersiones: Marque esta opción para almacenar las dispersiones de cada valor de
letra.
Datos Valores de letras
tema principal
Usted necesita una columna que contenga datos numéricos o de fecha/hora, pero no valores faltantes.
Elimine los valores faltantes de la hoja de trabajo antes de mostrar los valores de letras.
Ejemplo de presentación de valores de letras
tema principal interpretación de los resultados comando de sesión véase también
Los estudiantes de una clase introductoria de estadística participaron en un sencillo experimento.
Antes de comenzar el experimento, cada estudiante registro su propio pulso en reposo. Utilizaremos
una presentación de valores de letras para describir la ubicación y la dispersión de los datos de las
tasas de pulso en reposo.
1 Abra la hoja de trabajo PULSO.MTW.
2 Elija Estadísticas > EDA > Valores de letras.
3 En Variable, ingrese Pulso1. Haga clic en Aceptar.
Salida de la ventana Sesión
Presentación de valores de letras: Pulso1
Profundidad Inferior Superior Mid Dispersión
N= 92
M 46.5 71.000 71.000 71.000
Página 14 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Interpretación de los resultados
Pulso1 contiene 92 observaciones (N = 92). Los valores de letras mostrados se encuentran al
moverse hacia dentro desde cada extremo de las observaciones ordenadas hasta una posición dada
dentro de las observaciones ordenadas (profundidad especificada). Para obtener más información
sobre cómo se calculan las profundidades, consulte Métodos y fórmulas - Valores de letras.
Si la profundidad no coincide con un valor de datos, se toma el promedio de los vecinos más
cercanos.
La mediana de estos datos es el promedio de las observaciones ordenadas cuarentiséis y
cuarentisiete y es de 71.
Las bisagras son el promedio de las observaciones veintidós y veintitrés desde cada extremo, con
valores de 64 y 80, siendo el promedio de éstos el Punto medio, o sea, 72. La diferencia entre las
bisagras superior e inferior es la Dispersión, o sea, 16.
Los octavos (E), dieciseisavos (D) y otros valores de letras se calculan de forma similar.
Para mostrar valores de letras
tema principal véase también
1 Elija Estadísticas > EDA > Valores de letras.
2 En Variable, ingrese la columna que contiene los datos cuyos valores de letras desea obtener.
3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en
Aceptar.
Método "Median Polish"
revisión general procedimiento ejemplo datos véase también
Estadísticas > EDA > Método "Median Polish"
H 23.5 64.000 80.000 72.000 16.000
E 12.0 62.000 88.000 75.000 26.000
D 6.5 59.000 91.000 75.000 32.000
C 3.5 56.000 95.000 75.500 39.000
B 2.0 54.000 96.000 75.000 42.000
1 48.000 100.000 74.000 52.000
Página 15 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Método "Median Polish" ajusta un modelo aditivo a un diseño de dos factores e identifica patrones
de datos no explicados por los efectos de fila y de columna. Este procedimiento es similar al análisis
de varianza excepto por el hecho de que se utilizan medianas en lugar de medias, agregando así
fuerza contra el efecto de los valores atípicos. Para una explicación completa, véase [1] y [2].
El método "Median Polish" no imprime resultados. Para mostrar los datos, ajustes almacenados o
residuos, utilice Estadísticas > Tablas > Estadísticas descriptivas.
Elementos del cuadro de diálogo
Respuesta: Seleccione la columna que contiene la variable de respuesta
Factor de la fila: Seleccione la columna que contiene el factor de fila. Los niveles del factor de fila
deben ser enteros consecutivos comenzando por 1
Factor de columna: Seleccione la columna que contiene el factor de columna. Los niveles del factor
de columna deben ser enteros consecutivos comenzando por 1.
Número de iteraciones: Ingrese el número de iteraciones para encontrar la solución. El valor
predeterminado es cuatro.
Las columnas primero: Marque esta opción para utilizar las medianas de columna en lugar de las
medianas de fila para la primera iteración. Comenzar por las filas y comenzar por las columnas no
necesariamente produce los mismos ajustes, aunque se realicen muchas iteraciones.
Almacenamiento
Efecto común: Especifique una constante para almacenar los efectos comunes .
Efectos de fila: Especifique una columna para almacenar los efectos de fila .
Efectos de columna: Especifique una columna para almacenar los efectos de columna .
Valores de comparación: Especifique una columna para almacenar los valores de comparación .
Residuos: Marque esta opción para almacenar los residuos
Ajustes: Marque esta opción para almacenar los valores ajustados
Datos Método "Median Polish"
tema principal
Organice sus datos en tres columnas numéricas en la hoja de trabajo una respuesta, un factor de fila
y un factor de columna. Cada fila representa una observación. Los niveles de fila y los niveles de
columna deben ser enteros consecutivos comenzando por uno. La tabla puede ser no balanceada y
puede tener celdas vacías, pero no puede haber valores faltantes. Elimine los valores faltantes de la
hoja de trabajo antes de ejecutar el método "median polish".
Página 16 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Ejemplo de Median Polish
tema principal interpretación de los resultados comando de sesión véase también
Supongamos que usted desea ajustar un modelo a datos experimentales en un diseño de dos factores.
El experimento incluyó tres tipos de cascos, donde se aplicó fuerza a la parte frontal y la parte
posterior del casco. Los dos factores de interés son el tipo de casco y la ubicación de la fuerza
aplicada, mientras que la medida de respuesta es el impacto. El impacto se midió para determinar si
existen o no patrones de datos identificables que indiquen una diferencia entre los tres tipos de
cascos y la parte frontal y posterior del casco, con el nivel de protección provisto (medido por
Impacto). En este ejemplo, se ajusta un modelo aditivo a un diseño de dos factores utilizando una
median polish.
Dado que el método "Median Polish" no muestra resultados, utilice Mostrar datos y Estadísticas
descriptivas para mostrar los resultados en la ventana Sesión.
Paso 1: Ejecutar el método "median polish"
1 Abra la hoja de trabajo EJA_ESTAD.MTW. Elija Estadísticas > EDA > Método "Median
Polish".
2 En Respuesta, ingrese Impacto.
3 En Factor de la fila, ingrese TipoCasco. En Factor de la columna, ingrese Ubicación.
4 En Efecto común, ingrese EfectoComún. En Efectos de fila, ingrese EfectoFila. En Efectos de
columna, ingrese EfectoColumna.
5 Marque Residuos. Haga clic en Aceptar.
Salida de la ventana Sesión
Paso 2: Muestre los efectos común, de fila y de columna
1 Elija Datos > Mostrar datos.
2 En Columnas, constantes y matrices que se mostrarán, ingrese EfectoComún, EfectoFila, y
EfectoColumna. Haga clic en Aceptar.
Salida de la ventana Sesión
* NOTA * Esta versión de MPOLISH no muestra resultados. Almacene los resultados
y utilice Mostrar datos y Tabulación cruzada.
Presentación de datos
EfectoComún 44.5000
Página 17 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Paso 3: Muestre los datos y los residuos
1 Elija Estadísticas > Tablas > Estadísticas descriptivas.
2 En Variables categóricas, en Para filas, ingrese TipoCasco. En Para columnas, ingrese
Ubicación.
3 En Mostrar resúmenes de, haga clic en Variables asociadas.
4 En Variables asociadas, ingrese Resi1. En Mostrar, marque Datos. Haga clic en Aceptar.
5 En Mostrar resúmenes de, haga clic en Variables categóricas.
6 En Mostrar, desmarque Conteos. Haga clic en Aceptar.
7 Haga clic en Opciones. En Mostrar estadísticas marginales de, elija No hay variables. Haga
clic en Aceptar en cada cuadro de diálogo.
Salida de la ventana Sesión
Fila EfectoFila EfectoColumna
1 0 -1
2 23 1
3 -3
Estadísticas tabuladas: TipoCasco, Ubicación
Filas: TipoCasco Columnas: Ubicación
1 2
1 3.5 0.5
-0.5 -5.5
2 -4.5 -1.5
1.5 2.5
Página 18 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Interpretación de los resultados
Esta sección se basa en la salida de los pasos 2 y 3. El efecto común, que resume el nivel general de
Impacto, es 44.5.
Los efectos de fila representan los cambios en el Impacto de fila a fila en relación con el valor
común. Los efectos de fila son 0, 23, 3 para el tipo de casco 1, 2 y 3, respectivamente, lo que indica
que el impacto para el tipo de casco 2 fue mucho mayor que el nivel común, mientras que el tipo de
casco 3 fue ligeramente menor.
Los efectos de columna representan cambios en el Impacto de columna a columna en relación con el
valor común. Los efectos de columna son 1, 1 para las ubicaciones 1 y 2, respectivamente, lo que
indica que el impacto fue ligeramente menor que el efecto común para la parte frontal del casco y
ligeramente mayor para la parte posterior del casco.
Los residuos de los dos observaciones por celda se muestran en la tabla impresa. Son de 3.5 y 0.5
para la celda 1,1, y así sucesivamente. Usted puede usar los residuos para identificar valores
extraordinarios.
Para obtener más información sobre cómo mejorar el ajuste de un modelo aditivo , véase Mejorar el
ajuste de un modelo aditivo.
Mejorar el ajuste de un modelo aditivo
tema principal
Cuando un modelo aditivo no describe los datos apropiadamente, éstos se pueden hacer más aditivos
al expresar los datos nuevamente o transformarlos. Usted puede utilizar valores de comparación para
elegir una transformación de datos apropiada.
1 Calcule los valores de comparación para cada observación. Para una observación en la fila i y
columna j:
valor de comparación = [(efecto de fila i) x (efecto de columna j)] / efecto común
2 Grafique cada residuo en función de su valor de comparación para la inspección visual de los
datos.
3 0.5 -0.5
-1.5 3.5
Contenido de la celda: RESIDUOS1 : DATOS
Página 19 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
3 Ajuste una línea recta a los datos utilizando Línea resistente.
4 Determine si una transformación mejorará o no el ajuste del modelo aditivo.
Permita que p = 1 - (pendiente de la línea resistente).
Si p = 1 (la línea es horizontal), ninguna transformación simple mejorará el modelo.
Si p = ½, SQRT(Y), donde Y son los datos, es probable que sea más casi aditivo (y por lo tanto
mejor analizado por el método "median polish").
Si p = 0, log Y será más casi aditivo.
Si p está entre 0 y 1, entonces Yp
será más casi aditivo.
La técnica exploratoria descrita arriba es similar a la de un grado de libertad de Tukey para el
método de no aditividad.
Para ejecutar el método "median polish"
tema principal véase también
1 Elija Estadísticas > EDA > Método "Median Polish".
2 En Respuesta, ingrese la columna que contiene los datos de medición.
3 En Factor de fila, ingrese la columna que contiene los niveles del factor de fila.
4 En Factor de columna, ingrese la columna que contiene los niveles del factor de columna.
5 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en
Aceptar.
Línea resistente
revisión general procedimiento datos véase también
Estadísticas > EDA > Línea resistente
La línea resistente ajusta una línea recta a sus datos utilizando un método que es resistente a los
valores atípicos. Velleman y Hoaglin [2] sugieren ajustar una línea resistente antes de utilizar la
regresión de cuadrados mínimos para determinar si la relación es lineal , para hallar reexperiencias
para linealizar la relación si es necesario y para identificar valores atípicos.
Elementos del cuadro de diálogo
Respuesta: Seleccione la columna que contiene la variable de respuesta (Y). Se necesitan por lo
menos seis observaciones, pero preferiblemente nueve o más.
Página 20 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Predictor: Seleccione la columna que contiene la variable predictora (X).
Número máximo de iteraciones: Especifique el número máximo de iteraciones utilizadas para
encontrar una solución. El valor predeterminado es 10. Este procedimiento se detendrá antes del
número especificado de iteraciones si el valor de la pendiente no cambia mucho.
Almacenamiento
Residuos: Marque esta opción para almacenar los residuos .
Ajustes: Marque esta opción para almacenar los valores ajustados.
Coeficientes: Marque esta opción para almacenar los coeficientes .
<Resultados>
Datos Línea resistente
tema principal
Usted debe tener dos columnas numéricas una columna de variables de respuesta y una columna de
variables predictoras con por lo menos seis, pero preferiblemente nueve o más, observaciones.
Minitab omite automáticamente de los cálculos los datos faltantes.
Línea resistente Resultados
tema principal véase también
Estadísticas > EDA > Línea resistente > Resultados
Controle la presentación de la salida de la ventana Sesión.
Elementos del cuadro de diálogo
Controlar la presentación de resultados
No mostrar nada: Elija esta opción para suprimir la presentación de todos los resultados.
Pendiente, nivel y relación de la mitad de la pendiente: Elija esta opción para mostrar la
pendiente, el nivel y la relación de semipendiente (valor predeterminado).
Además, la pendiente para cada iteración: Elija esta opción para mostrar la pendiente, el nivel, la
relación de semipendiente y la pendiente para cada iteración.
Página 21 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Para ajustar una línea resistente
tema principal véase también
1 Elija Estadísticas > EDA > Línea resistente.
2 En Respuesta, ingrese la columna que contiene los datos de medición (Y).
3 En Predictor, ingrese la columna que contiene los datos de variables predictoras (X).
4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en
Aceptar.
Suavización resistente
revisión general procedimiento datos véase también
Estadísticas > EDA > Suavización resistente
La suavización resistente suaviza las series de datos ordenadas, comúnmente recolectadas en el
tiempo, para eliminar las fluctuaciones aleatorias. La suavización es útil para descubrir y resumir
tanto tendencias de datos como valores atípicos. La suavización resistente ofrece dos métodos de
suavización: 4253H, dos veces y 3RSSH, dos veces. Véase Método.
Elementos del cuadro de diálogo
Variable: Seleccione la columna que contiene la variable que se suavizará. La suavización resistente
requiere por lo menos siete observaciones.
Almacenamiento
Áspero: Especifique una columna para almacenar los datos ásperos; datos ásperos = datos sin
procesar datos suavizados.
Suave: Especifique una columna para almacenar los datos suavizados.
Método de suavización: Permite escoger uno de los dos métodos para suavizar los datos.
4253H, dos veces: Elija esta opción para ejecutar un suavizador 4253H dos veces.
3RSSH, dos veces: Elija esta opción para ejecutar un suavizador 3RSSH dos veces
Datos Suave resistente
tema principal
Página 22 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Usted debe tener una columna numérica por lo menos con siete observaciones. Puede tener datos
faltantes al principio y al final de la columna, pero no en el medio.
Para ejecutar una suavización resistente
tema principal véase también
1 Elija Estadísticas > EDA > Suavización resistente.
2 En Variable, ingrese la columna que contiene los datos sin procesar que se suavizarán.
3 En Áspero, ingrese una columna para almacenar los datos ásperos (datos ásperos = datos sin
procesar - datos suavizados).
4 En Suave, ingrese una columna para almacenar los datos suavizados.
5 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en
Aceptar.
Rootograma
revisión general procedimiento ejemplo datos véase también
Estadísticas > EDA > Rootograma
Un rootograma suspendido es un histograma con una distribución normal ajustada al mismo, el cual
muestra las desviaciones de la distribución normal ajustada. Dado que un rootograma se ajusta
utilizando percentiles, protege contra valores atípicos y conteos de secciones extraordinarios. Para
obtener más detalles, véase [2].
Elementos del cuadro de diálogo
Fuente de datos
Variable: Elija esta opción para que se utilicen datos sin procesar para formar el rootograma, luego
especifique la columna que contiene los datos sin procesar.
Frecuencias: Elija esta opción para utilizar conteos (frecuencias) para formar el rootograma, luego
especifique la columna que contiene las frecuencias. El primer conteo corresponde a la sección
semiabierta por debajo del límite de sección inferior y debe ser cero si ninguna observación se ubica
por debajo del primer límite de sección. De forma similar, el último conteo corresponde a la sección
semiabierta por encima del límite de sección más alto. Por lo tanto, la columna de conteos tiene una
entrada más que la columna de límites de sección.
Utilice límites de sección en: Marque esta opción para especificar los límites de sección, luego
especifique la columna que contiene los límites de sección. Ingrese los límites de sección desde el
más pequeño hasta el más grande hacia abajo en la columna. Si no se especifican límites de sección,
Página 23 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
los límites se toman para que tengan un ancho = 1.
Utilice la media___ y desv. est.___: Marque esta opción para anular la estimación automática de la
media y la desviación estándar utilizadas en el ajuste de la curva de comparación Normal. Luego
especifique la media y la desviación estándar que desee utilizar.
Almacenamiento
Límites de sección: Especifique una columna de almacenamiento para los límites de sección.
Conteos: Especifique una columna de almacenamiento para las frecuencias.
Residuos de raíz doble: Especifique una columna de almacenamiento para los residuos de raíz
doble (DRRes) . El rootograma suspendido es una gráfica de los residuos de raíz doble, que utiliza el
signo de éstos para el símbolo de graficación.
Ajustes: Especifique una columna para almacenar los conteos ajustados. El conteo ajustado, fi, es N
x (área debajo de la curva normal con la media y la desv.est. especificadas, en la sección i).
Datos Rootograma
tema principal
Sus datos pueden ser de dos formas: sin procesar o de frecuencia. Para utilizar:
datos sin procesar, necesita una columna de datos numéricos o de fecha/hora. Por opción
predeterminada, el procedimiento de rootograma determinará los límites de sección.
datos de frecuencia, necesita una columna numérica que contenga el conteo (frecuencia) de las
observaciones para cada sección. Las frecuencias se deben ordenar de forma descendente en la
columna desde la sección más alta hasta la sección más baja (equivalente a las secciones más a la
izquierda y más a la derecha en un histograma, respectivamente). Por opción predeterminada, las
secciones tienen un ancho de 1.
Opcionalmente, usted puede especificar los límites de sección tanto para los datos sin procesar como
para los datos de frecuencia en otra columna. En la columna de límites de sección, ingrese los límites
de sección desde el más pequeño hasta el más grande.
Si está utilizando límites de sección con datos de frecuencia, la primera fila de la columna de datos
de frecuencia es el conteo del número de observaciones que se ubican por debajo del límite de
sección más pequeño. Si ninguna observación está por debajo del primer límite de sección, el conteo
en la primera fila es cero. De forma similar, la última fila de la columna de datos de frecuencia
contiene el conteo del número de observaciones ubicadas por encima del límite de sección más
grande. La columna de datos de frecuencia tendrá una entrada más que la columna de límites de
sección.
Minitab omite automáticamente de los cálculos los datos faltantes.
Página 24 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Ejemplo de Rootograma
tema principal interpretación de los resultados comando de sesión véase también
En este ejemplo se utiliza un rootograma para determinar si las mediciones del peso de 92
estudiantes siguen o no una distribución normal.
1 Abra la hoja de trabajo PULSO.MTW.
2 Elija Estadísticas > EDA > Rootograma.
3 En Variable, ingrese Peso. Haga clic en Aceptar.
Salida de la ventana Sesión
Rootograma: Peso
Sección Conteo RawRes DRRes Rootograma suspendido
1 0.0 -0.7 -0.90 . ----- .
2 0.0 -1.2 -1.44 . -------- .
3 2.0 -0.8 -0.35 . -- .
4 5.0 -0.5 -0.10 . - .
5 12.0 3.0 0.99 . +++++ .
6 12.0 -0.5 -0.06 . - .
7 11.0 -3.7 -0.94 . ----- .
8 17.0 2.4 0.66 . ++++ .
9 16.0 3.7 1.03 . ++++++ .
10 5.0 -3.8 -1.34 . ------- .
11 5.0 -0.4 -0.04 . - .
12 5.0 2.2 1.23 . +++++++ .
13 1.0 -0.2 0.04 . + .
14 0.0 -0.4 -0.66 . ---- .
15 1.0 0.9 1.20 . +++++++ .
Página 25 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
Interpretación de los resultados
El rootograma suspendido grafica los residuos de raíz doble (DRRes) utilizando el signo de éstos
como el símbolo de graficación. Los residuos de raíz doble indican el grado en que los datos siguen
la distribución de comparación (normal).
Para la variable Peso, existe una concentración leve de signos negativos en las secciones inferiores,
mientras que la mayor concentración de signos positivos se encuentra en las secciones intermedia y
superior, lo que indica el punto en que la distribución tiende a separarse de la normalidad. Sin
embargo, no existe evidencia suficiente que sustente que no se pueda utilizar una distribución normal
para describir estos datos ya que los todos los residuos de raíz doble se encuentran dentro de los
límites de confianza.
Para mostrar un rootograma suspendido
tema principal véase también
1 Elija Estadísticas > EDA > Rootograma.
2 Realice uno de los siguientes procedimientos:
en Fuente de datos, elija Variable e ingrese la columna que contiene los datos sin procesar, o
elija Frecuencias e ingrese la columna que contiene los conteos.
3 Si lo desea, utilice una o más de las opciones del cuadro de diálogo y, a continuación, haga clic
en Aceptar.
16 0.0 -0.0 -0.09 . - .
En pantalla, el valor de un carácter es .2 OO
Página 26 de 26Revisión general, EDA
02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm

Más contenido relacionado

La actualidad más candente

La actualidad más candente (18)

Graficos
GraficosGraficos
Graficos
 
Matematicas (graf dispe)
Matematicas (graf dispe)Matematicas (graf dispe)
Matematicas (graf dispe)
 
Grafica
GraficaGrafica
Grafica
 
Gráficos en excel
Gráficos en excel Gráficos en excel
Gráficos en excel
 
Como hacer estadistica descriptiva con excel
Como hacer estadistica descriptiva con excelComo hacer estadistica descriptiva con excel
Como hacer estadistica descriptiva con excel
 
Unidad 2
Unidad 2 Unidad 2
Unidad 2
 
Que es graficar
Que es graficarQue es graficar
Que es graficar
 
Estadistica desciptiva 1
Estadistica desciptiva 1Estadistica desciptiva 1
Estadistica desciptiva 1
 
PRESENTACION DE DATOS (TABLAS Y GRAFICAS)
PRESENTACION DE DATOS (TABLAS Y GRAFICAS)PRESENTACION DE DATOS (TABLAS Y GRAFICAS)
PRESENTACION DE DATOS (TABLAS Y GRAFICAS)
 
Como crear un histograma con Excel
Como crear un histograma con ExcelComo crear un histograma con Excel
Como crear un histograma con Excel
 
02 tablas y graficos
02 tablas y graficos02 tablas y graficos
02 tablas y graficos
 
Hoja de calculo
Hoja de calculoHoja de calculo
Hoja de calculo
 
Trabajo final-de-informatica (1)
Trabajo final-de-informatica (1)Trabajo final-de-informatica (1)
Trabajo final-de-informatica (1)
 
Trabajo final-de-informatica (2)
Trabajo final-de-informatica (2)Trabajo final-de-informatica (2)
Trabajo final-de-informatica (2)
 
Representación tabular
Representación tabularRepresentación tabular
Representación tabular
 
Graficos y filtros en excel
Graficos y filtros en excelGraficos y filtros en excel
Graficos y filtros en excel
 
Elaboración y configuración de gráficos estadísticos.
Elaboración y configuración de gráficos estadísticos.Elaboración y configuración de gráficos estadísticos.
Elaboración y configuración de gráficos estadísticos.
 
graficar
graficargraficar
graficar
 

Similar a 012 capitulo 12 eda

Similar a 012 capitulo 12 eda (20)

Hoja de calculo
Hoja de calculoHoja de calculo
Hoja de calculo
 
Entorno de trabajo informatica
Entorno de trabajo informaticaEntorno de trabajo informatica
Entorno de trabajo informatica
 
Instructivo tablas dinamicas en excel 2007
Instructivo tablas dinamicas en excel 2007Instructivo tablas dinamicas en excel 2007
Instructivo tablas dinamicas en excel 2007
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Tic´s
Tic´sTic´s
Tic´s
 
Graficos de excel
Graficos de excelGraficos de excel
Graficos de excel
 
Guion_Descriptiva.pdf
Guion_Descriptiva.pdfGuion_Descriptiva.pdf
Guion_Descriptiva.pdf
 
Informatica graficas
Informatica graficasInformatica graficas
Informatica graficas
 
Graficos parte ii
Graficos parte iiGraficos parte ii
Graficos parte ii
 
Presentacion Graficas
Presentacion GraficasPresentacion Graficas
Presentacion Graficas
 
Presentacion graficas
Presentacion graficasPresentacion graficas
Presentacion graficas
 
Liliana cardenas
Liliana cardenasLiliana cardenas
Liliana cardenas
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Tutorial de excel
Tutorial de excelTutorial de excel
Tutorial de excel
 
Spss
SpssSpss
Spss
 
10frec spss
10frec spss10frec spss
10frec spss
 
Ejemplos
EjemplosEjemplos
Ejemplos
 
Análisis exploratorio de datos.pptx
Análisis exploratorio de datos.pptxAnálisis exploratorio de datos.pptx
Análisis exploratorio de datos.pptx
 
Análisis Estadístico
Análisis EstadísticoAnálisis Estadístico
Análisis Estadístico
 
Estadistica descriptiva 1
Estadistica descriptiva 1Estadistica descriptiva 1
Estadistica descriptiva 1
 

Más de Mayra JY

obligaciones de los trabajadores
obligaciones de los trabajadoresobligaciones de los trabajadores
obligaciones de los trabajadoresMayra JY
 
Norma eia tia 568-b y 568a
Norma eia tia 568-b y 568aNorma eia tia 568-b y 568a
Norma eia tia 568-b y 568aMayra JY
 
no parametrico
no parametricono parametrico
no parametricoMayra JY
 
administración de proyecto
administración de proyectoadministración de proyecto
administración de proyectoMayra JY
 
Plantas para la bronquitis
Plantas para la bronquitisPlantas para la bronquitis
Plantas para la bronquitisMayra JY
 

Más de Mayra JY (6)

obligaciones de los trabajadores
obligaciones de los trabajadoresobligaciones de los trabajadores
obligaciones de los trabajadores
 
Norma eia tia 568-b y 568a
Norma eia tia 568-b y 568aNorma eia tia 568-b y 568a
Norma eia tia 568-b y 568a
 
Php
PhpPhp
Php
 
no parametrico
no parametricono parametrico
no parametrico
 
administración de proyecto
administración de proyectoadministración de proyecto
administración de proyecto
 
Plantas para la bronquitis
Plantas para la bronquitisPlantas para la bronquitis
Plantas para la bronquitis
 

Último

Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para PlataformasSegundo Silva Maguiña
 
TEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptx
TEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptxTEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptx
TEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptxYEDSONJACINTOBUSTAMA
 
Biología molecular ADN recombinante.pptx
Biología molecular ADN recombinante.pptxBiología molecular ADN recombinante.pptx
Biología molecular ADN recombinante.pptxluisvalero46
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
Electromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfElectromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfAnonymous0pBRsQXfnx
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfIsbelRodrguez
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)ssuser6958b11
 
SOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidadSOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidadANDECE
 
Simbología de Soldadura, interpretacion y aplicacion en dibujo tecnico indus...
Simbología de Soldadura,  interpretacion y aplicacion en dibujo tecnico indus...Simbología de Soldadura,  interpretacion y aplicacion en dibujo tecnico indus...
Simbología de Soldadura, interpretacion y aplicacion en dibujo tecnico indus...esandoval7
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilDissneredwinPaivahua
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciazacariasd49
 
Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...
Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...
Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...ssuser646243
 
Descubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialDescubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialyajhairatapia
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxLuisvila35
 
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBRQUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBRyanimarca23
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023ANDECE
 
Final Ashto método mecánica de suelos info
Final Ashto método mecánica de suelos infoFinal Ashto método mecánica de suelos info
Final Ashto método mecánica de suelos infoMEYERQuitoSalas
 
3.3 Tipos de conexiones en los transformadores trifasicos.pdf
3.3 Tipos de conexiones en los transformadores trifasicos.pdf3.3 Tipos de conexiones en los transformadores trifasicos.pdf
3.3 Tipos de conexiones en los transformadores trifasicos.pdfRicardoRomeroUrbano
 
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfManual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfSandXmovex
 
Fe_C_Tratamientos termicos_uap _3_.ppt
Fe_C_Tratamientos termicos_uap   _3_.pptFe_C_Tratamientos termicos_uap   _3_.ppt
Fe_C_Tratamientos termicos_uap _3_.pptVitobailon
 

Último (20)

Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para Plataformas
 
TEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptx
TEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptxTEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptx
TEC-SEMANA 9-GRUPO1 SENATI SEGURIDAD Y PREVENCIÓN DE RIESGOS.pptx
 
Biología molecular ADN recombinante.pptx
Biología molecular ADN recombinante.pptxBiología molecular ADN recombinante.pptx
Biología molecular ADN recombinante.pptx
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
Electromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfElectromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdf
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdf
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
 
SOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidadSOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidad
 
Simbología de Soldadura, interpretacion y aplicacion en dibujo tecnico indus...
Simbología de Soldadura,  interpretacion y aplicacion en dibujo tecnico indus...Simbología de Soldadura,  interpretacion y aplicacion en dibujo tecnico indus...
Simbología de Soldadura, interpretacion y aplicacion en dibujo tecnico indus...
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civil
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potencia
 
Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...
Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...
Como de produjo la penicilina de manera masiva en plena guerra mundial Biotec...
 
Descubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialDescubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundial
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
 
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBRQUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
 
Final Ashto método mecánica de suelos info
Final Ashto método mecánica de suelos infoFinal Ashto método mecánica de suelos info
Final Ashto método mecánica de suelos info
 
3.3 Tipos de conexiones en los transformadores trifasicos.pdf
3.3 Tipos de conexiones en los transformadores trifasicos.pdf3.3 Tipos de conexiones en los transformadores trifasicos.pdf
3.3 Tipos de conexiones en los transformadores trifasicos.pdf
 
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfManual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
 
Fe_C_Tratamientos termicos_uap _3_.ppt
Fe_C_Tratamientos termicos_uap   _3_.pptFe_C_Tratamientos termicos_uap   _3_.ppt
Fe_C_Tratamientos termicos_uap _3_.ppt
 

012 capitulo 12 eda

  • 1. Revisión general del Análisis exploratorio de datos véase también Los métodos de Análisis exploratorio de datos (EDA) se utilizan principalmente para explorar los datos antes de utilizar métodos más tradicionales, o para examinar los residuos de un modelo. Estos métodos son particularmente útiles para identificar observaciones extraordinarias y notar violaciones de supuestos tradicionales, tales como la no linealidad o la varianza no constante. Tallo y hoja muestra una gráfica de tallo y hoja basada en caracteres. Gráfica de caja muestra una gráfica de caja y bigotes. Valores de letras genera una presentación de valores de letras. Utilice este procedimiento para describir la ubicación y la dispersión de distribuciones de muestra. Método "Median Polish" ajusta un modelo aditivo a un diseño de dos factores e identifica patrones de datos no explicados por los efectos de fila y de columna. Este procedimiento es similar al análisis de varianza excepto por el hecho de que se utilizan medianas en lugar de medias, agregando así fuerza contra el efecto de los valores atípicos. Línea resistente utiliza un método que es resistente a los valores atípicos para ajustar una línea recta a sus datos. Usted puede ajustar una línea resistente antes de utilizar una regresión de cuadrados mínimos para determinar si la relación es lineal para hallar re-expresiones para linealizar la relación si es necesario y para identificar valores Suavización de resistentes suaviza una secuencia ordenada de datos, comúnmente recolectados en el tiempo, para eliminar las fluctuaciones aleatorias. La suavización es útil para descubrir y resumir tanto tendencias de datos como valores atípicos. Rootograma muestra un rootograma suspendido de sus datos. Un rootograma suspendido es un histograma con una distribución normal ajustada al mismo, el cual muestra las desviaciones de la distribución normal ajustada. Referencias de EDA [1] P.F. Velleman (1980). "Definition and Comparison of Robust Nonlinear Data Smoothing Algorithms", Revista de la American Statistical Association, Volumen 75, Número 371, páginas 609 615. [2] P.F. Velleman y D.C. Hoaglin (1981). ABC's of EDA, Duxbury Press. Página 1 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 2. Tallo y hoja revisión general véase también Gráfica > Tallo y hoja Estadísticas > EDA > Tallo y hoja Gráficas de caracteres > Tallo y hoja Utilice para examinar la forma y dispersión de los datos de muestra. Minitab muestra una gráfica de tallo y hoja en la ventana Sesión. La gráfica es similar un histograma por un lado; sin embargo, en lugar de barras, son las cifras de los valores de datos reales los que indican la frecuencia de cada sección (fila). La siguiente es una gráfica de tallo y hoja correspondiente a un conjunto de datos con los cinco valores siguientes: 3, 4, 8, 8 y 10. Tallo y hoja de C1 N = 5 Unidad de hoja = 1.0 1 0 3 2 0 4 2 0 (2) 0 88 1 1 0 La pantalla tiene tres columnas: Las hojas (derecha) Cada uno de los valores en la columna de hoja representa un dígito de una observación. La "unidad de hoja" (declarada encima de la gráfica) especifica la cifra que se utiliza. En el ejemplo, la unidad de hoja es 1.0. De este modo, el valor de hoja de una observación de 8 es 8, mientras que el valor de hoja de una observación de 10 es 0. El tallo (centro) El valor de tallo representa la cifra ubicada inmediatamente a la izquierda de la cifra de hoja. En el ejemplo, el valor de tallo de 0 indica que las hojas de esa fila pertenecen a observaciones con valores mayores que o iguales a cero, pero menores que 10. El valor de talla de 1 indica observaciones mayores que, o iguales a, 10, pero menores que 20. Conteos (izquierda) Si el valor de la mediana de la muestra está incluido en una fila, el conteo correspondiente a esa fila se encierra entre paréntesis. Los valores de las filas por encima y por Página 2 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 3. debajo de la mediana son acumulativos. El conteo de una fila por encima de la mediana representa el conteo total para esa fila y las filas que se encuentran por encima de ésta. El valor de una fila que se encuentra por debajo de la mediana representa el conteo total para esa fila y las filas que se encuentran por debajo de ésta. En el ejemplo, la mediana de la muestra es 8, por lo que el conteo de la cuarta fila está entre paréntesis. El conteo de la segunda fila representa el número total de observaciones en las dos primeras filas. Elementos del cuadro de diálogo Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra una gráfica separada para cada columna. Por variable: Ingrese una columna que contenga una variable de agrupación. Los valores en la columna Por variable deben ser enteros entre -10000 y +10000 o el símbolo de datos faltantes (*). Minitab produce una gráfica separada para cada grupo. Esta opción no funciona con la opción Recortar valores atípicos. Recortar valores atípicos: Marque esta opción para recortar todos los valores atípicos y mostrarlos en líneas especiales con las etiquetas BAJO y ALTO. Esta opción no funciona con la opción Por variable. Incremento: Ingrese un número para controlar el escalado vertical al establecer el incremento entre las líneas de la presentación (la diferencia entre los valores más pequeños posibles en líneas adyacentes). Gráficas de caja revisiones generales procedimiento ejemplos datos véase también Gráfica > Gráfica de caja Estadísticas > EDA > Gráfica de caja Utilice las gráficas de caja (también denominadas gráficas de caja y bigotes) para evaluar y comparar las distribuciones de la muestra. La figura siguiente ilustra los componentes de una gráfica de caja predeterminada. Valor atípico una observación inusualmente grande o pequeña. Los valores ubicados más allá de los bigotes son valores atípicos. Por opción predeterminada, el bigote superior se extiende hasta el valor de datos más alto dentro del límite superior. Página 3 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 4. Elementos del cuadro de diálogo Una Y: Elija una de estas opciones para mostrar una gráfica separada para cada columna. Múltiples Y: Elija una de estas opciones para mostrar múltiples columnas de datos en la misma gráfica. <Aceptar> Por opción predeterminada, la parte superior de la caja es el tercer cuartil (Q3) 75% de los valores de datos son menores que o iguales a este valor. Por opción predeterminada, la parte inferior de la caja es el primer cuartil (Q1) 25% de los valores de datos son menores que o iguales a este valor. Límite superior = Q3 + 1.5 (Q3 Q1) Mediana el centro de los datos. La mitad de las observaciones son menores que o iguales a la mediana. Por opción predeterminada, el bigote inferior se extiende hasta el valor más bajo dentro del límite inferior. Límite inferior = Q1 1.5 (Q3 Q1) Nota Por opción predeterminada, Minitab utiliza el método del cuartil para calcular las cotas de la caja. Para cambiar el método para una gráfica específica a bisagra o percentil, utilice Editor > Editar caja de rango intercuartil > Opciones. Para cambiar el método para todas las gráficas de caja futuras, utilice Herramientas > Opciones > Gráficas individuales > Gráficas de caja. Simple Con grupos Simple Con grupos Página 4 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 5. Datos Gráfica de caja tema principal Usted necesita una o más columnas de datos numéricos o de fecha/hora. Usted también puede utilizar hasta cuatro columnas de datos categóricos para agrupación. Gráfica de caja Una Y, Simple tema principal procedimiento ejemplo datos véase también Gráfica > Gráfica de caja > elija Una Y Simple > Aceptar Estadísticas > EDA > Gráfica de caja > elija Una Y Simple > Aceptar Utilice para mostrar una gráfica de caja simple. Elementos del cuadro de diálogo Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra una gráfica separada para cada columna. (Para mostrar todas las gráficas en la misma página, utilice Variables múltiples.) <Escala> <Etiquetas> <Mostrar datos> <Gráficas múltiples> <Opciones de los datos> Ejemplo de una gráfica de caja simple tema principal interpretación de los resultados comandos de sesión véase también Usted desea examinar la durabilidad general de sus productos de alfombra. Las muestras de los productos para alfombras se colocan en cuatro hogares y usted mide la durabilidad después de 60 días. Cree una gráfica de caja para examinar la distribución de las puntuaciones de durabilidad. Más Para otras opciones de datos (dividir en subconjuntos, uso de columnas de frecuencia y manejo de datos faltantes), véase Revisión general de opciones de datos. Para cambiar el orden de presentación de las categorías de texto, véase Ordenamiento de las categorías de texto. Página 5 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 6. 1 Abra la hoja de trabajo ALFOMBRA.MTW. 2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. 3 En Una Y, elija Simple. Haga clic en Aceptar. 4 En Variables de graficas, ingrese Durabilidad. Haga clic en Aceptar. Salida de la ventana Gráfica Interpretación de los resultados La gráfica de caja muestra: La puntuación mediana de durabilidad es 12.95. El rango intercuartil es de 10.575 a 17.24. No están presentes valores atípicos. El rango es de 7.03 a 22.5. El bigote superior más largo y el área de caja grande ubicada sobre la mediana indican que los datos tienen una asimetría ligeramente positiva la cola derecha de la distribución es más larga que la cola izquierda. Para mostrar una gráfica de caja simple tema principal ejemplo datos véase también 1 Elija Gráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N, coloque el cursor sobre cualquier parte de la gráfica de caja. Página 6 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 7. 2 En Una Y, elija Simple. Haga clic en Aceptar. 3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra una gráfica separada para cada columna. 4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Gráfica de caja Una Y, Con grupos tema principal procedimiento ejemplo datos véase también Gráfica > Gráfica de caja > elija Una Y Con grupos > Aceptar Estadísticas > EDA > Gráfica de caja > elija Una Y Con grupos > Aceptar Utilice para mostrar una gráfica de caja con grupos. Elementos del cuadro de diálogo Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra una gráfica separada para cada columna. Para mostrar todas las gráficas en la misma página, utilice Múltiples variables. Variables categóricas para agrupación (1 a 4, la más externa primero): Ingrese de una a cuatro columnas de variables (categóricas ) de agrupación. Minitab muestra todos los grupos en la misma gráfica. (Para mostrar en paneles de una o más variables, utilice Por Variables. La primera variable es la más externa en la escala y la última variable es la más interna . <Escala> <Etiquetas> <Mostrar datos> <Gráficas múltiples> <Opciones de los datos> Ejemplo de una gráfica de caja con grupos tema principal interpretación de los resultados comandos de sesión véase también Usted desea evaluar la durabilidad de cuatro productos de alfombra experimentales. Las muestras de los productos para alfombras se colocan en cuatro hogares y usted mide la durabilidad después de 60 días. Cree una gráfica de caja con etiquetas de mediana y cajas codificadas por color para examinar la distribución de durabilidad de cada producto de alfombra. 1 Abra la hoja de trabajo ALFOMBRA.MTW. Página 7 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 8. 2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. 3 En Una Y, elija Con grupos. Haga clic en Aceptar. 4 En Variables de graficas, ingrese Durabilidad. 5 En Variables categóricas para agrupación (1 a 4, la más externa primero), ingrese Alfombra. 6 Haga clic en Etiquetas, luego haga clic en la ficha Etiquetas de datos. 7 En Etiqueta, elija Medianas. Elija Usar etiquetas de valor y. Haga clic en Aceptar. 8 Haga clic en Mostrar datos. 9 En Variables categóricas para asignación de atributos, ingrese Alfombra. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Gráfica Interpretación de los resultados La mediana de durabilidad es más alta para Alfombra 4 (19.75). Sin embargo, este producto también demuestra la mayor variabilidad, con un rango intercuartil de 9.855. Además, la distribución tiene una asimetría negativa, con al menos una medición de durabilidad de aproximadamente 10. Alfombras 1 y 3 tienen medianas de durabilidad similares (13.52 y 12.895, respectivamente). Alfombra 3 también muestra la menor variabilidad, con un rango intercuartil de sólo 2.8925. La mediana de durabilidad de Alfombra 2 es solamente 8.625. Esta distribución y la de la Alfombra 1 tienen asimetría positiva, con rangos intercuartiles de aproximadamente 5-6. Para mostrar una gráfica de caja con grupos SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N, coloque el cursor sobre cualquier parte de la gráfica de caja. Página 8 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 9. tema principal ejemplo datos véase también 1 Elija Estadísticas > EDA > Gráfica de caja o Gráfica > Gráfica de caja. 2 En Una Y, elija Con grupos. Haga clic en Aceptar. 3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra una gráfica separada para cada columna. 4 En Variables categóricas para agrupación (1 a 4, la más externa primero), ingrese de una a cuatro columnas de variables (categóricas ) de agrupación. La primera variable es la más externa en la escala y la última variable es la más interna . 5 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Gráfica de caja Múltiples Y, Simple tema principal procedimiento ejemplo datos véase también Gráfica > Gráfica de caja > elija Múltiples Y Simple > Aceptar Estadísticas > EDA > Gráfica de caja > elija Múltiples Y Simple > Aceptar Utilice esta opción para mostrar gráficas de caja de múltiples variables en la misma gráfica. Elementos del cuadro de diálogo Variables de gráficas: Ingrese una o más columnas de datos para graficar. Minitab muestra todas las columnas en la misma gráfica. <Escala> <Etiquetas> <Mostrar datos> <Gráficas múltiples> <Opciones de los datos> Ejemplo de una gráfica de caja con múltiples Y tema principal interpretación de los resultados comandos de sesión véase también Página 9 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 10. Su compañía fabrica tubos plásticos y a usted le interesa la uniformidad de los diámetros. Usted mide diez tubos por semana durante tres semanas. Cree una gráfica de caja para examinar las distribuciones. 1 Abra la hoja de trabajo TUBERÍA.MTW. 2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. 3 En Múltiples Y, elija Simple. Haga clic en Aceptar. 4 En Variables de gráficas, ingrese 'Semana 1' 'Semana 2' 'Semana 3'. Haga clic en Aceptar. Salida de la ventana Gráfica Interpretación de los resultados La gráfica de caja muestra: La mediana de la Semana 1 es 4.985, y el rango intercuartil es de 4.4525 a 5.5575. La mediana de la Semana 2 es 5.275, y el rango intercuartil es de 5.08 a 5.6775. Aparece un valor atípico en 7.0. La mediana de la Semana 3 es 5.43, y el rango intercuartil es de 4.99 a 6.975. Los datos están asimétricos positivamente. Las medianas de las tres semanas son similares. Sin embargo, durante la Semana 2, se fabricó un tubo anormalmente ancho, y durante la Semana 3, se fabricaron varios tubos anormalmente anchos. Para mostrar una gráfica de caja simple con múltiples y SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N, coloque el cursor sobre cualquier parte de la gráfica de caja. Página 10 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 11. tema principal ejemplo datos véase también 1 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. 2 En Múltiples Y, elijaSimple. Haga clic en Aceptar. 3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra todas las columnas en la misma gráfica. 4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Gráfica de caja Múltiples Y, Con grupos tema principal procedimiento ejemplo datos véase también Gráfica > Gráfica de caja > elija Múltiples Y Con grupos Aceptar Estadísticas > EDA > Gráfica de caja > elija Múltiples Y Con grupos > Aceptar Utilice para mostrar gráficas de caja de múltiples variables con grupos en la misma gráfica. Elementos del cuadro de diálogo Variables de gráficas: Ingrese una o más columnas de datos. Minitab muestra todas las columnas en la misma gráfica. Variables categóricas para agrupación (1 a 3, la más externa primero): Ingrese de una a tres columnas de variables (categóricas ) de agrupación. Minitab muestra todos los grupos en la misma gráfica. (Para mostrar en paneles de una o más variables, utilice Por Variables. La primera variable es la más externa de las variables de agrupación en la escala. Nivel de escala para las variables de gráficas Las variables de gráficas se muestran más hacia fuera en la escala: Elija esta opción para hacer de las variables de gráfica los grupos más externos. Las variables de gráficas se muestran más hacia dentro en la escala: Elija esta opción para hacer de las variables de gráficas los grupos más internos. <Escala> <Etiquetas> <Mostrar datos> <Gráficas múltiples> <Opciones de los datos> Página 11 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 12. Ejemplo de una gráfica de caja con múltiples Y y grupos tema principal interpretación de los resultados comandos de sesión véase también Su compañía fabrica tubos plásticos y a usted le interesa la uniformidad de los diámetros. Usted mide diez tubos de cada máquina por semana durante tres semanas. Cree una gráfica de caja para examinar las distribuciones. 1 Abra la hoja de trabajo TUBERÍA.MTW. 2 ElijaGráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. 3 En Múltiples Y, elija Con grupos. Haga clic en Aceptar. 4 En Variables de gráficas, ingrese 'Semana 1' 'Semana 2' 'Semana 3'. 5 En Variables categóricas para agrupación (1 a 3, la más externa primero), ingrese Máquina. 6 En Nivel de escala para variables de gráficas, elija Las variables de gráficas se muestran más hacia dentro en la escala. Haga clic en Aceptar. Salida de la ventana Gráfica Interpretación de los resultados La gráfica de caja muestra: Para la máquina 1, la mediana de diámetro y variabilidad parece aumentar cada semana. Para la máquina 2, la mediana de diámetro y variabilidad parece ser más estable entre las semanas. Se recomienda realizar análisis estadísticos, tales como MANOVA balanceado, para examinar más a Página 12 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 13. fondo la relación entre los factores. Para mostrar una gráfica de caja con múltiples Y y grupos tema principal ejemplo datos véase también 1 Elija Gráfica > Gráfica de caja o Estadísticas > EDA > Gráfica de caja. 2 En Múltiples Y, elijaCon grupos. Haga clic en Aceptar. 3 En Variables de gráficas, ingrese una o más columnas de datos. Minitab muestra todas las columnas en la misma gráfica. 4 En Variables categóricas para agrupación (1 a 3, la más externa primero), ingrese de una a tres columnas de variables (categóricas ) de agrupación. La primera variable que usted ingresa es la variable categórica más externa en la escala y la última será la más interna . 5 En Nivel de escala para variables de gráficas, elija una de las siguientes opciones: Las variables de gráficas se muestran más hacia fuera en la escala para hacer de las variables de gráficas los grupos más externos . Las variables de gráficas se muestran más hacia dentro en la escala para hacer de las variables de gráficas los grupos más internos . 6 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar. Valores de letras revisión general procedimiento ejemplo datos véase también Estadísticas > EDA > Valores de letras Utilice presentaciones de valores de letras para describir la ubicación y la dispersión de distribuciones de muestra. Las estadísticas dadas dependen del tamaño de la muestra, e incluyen mediana , bisagras , octavos y más. Elementos del cuadro de diálogo Variable: Seleccione la columna que contenga la variable cuyos valores de letras desea obtener. SugerenciaPara obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N, coloque el cursor sobre cualquier parte de la gráfica de caja. Para ver el valor del eje Y y el número de fila de un valor atípico, coloque el cursor sobre el valor atípico. Página 13 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 14. Almacenar valores de letras: Marque esta opción para almacenar los valores de letras. La columna de almacenamiento contendrá todos los números en la salida que se muestra debajo de INFERIOR (comenzando de abajo hacia arriba), luego la mediana y después los números que se muestran debajo de SUPERIOR (comenzando de arriba hacia bajo). Almacenar puntos medios: Marque esta opción para almacenar el punto medio de cada valor de letra. Almacenar dispersiones: Marque esta opción para almacenar las dispersiones de cada valor de letra. Datos Valores de letras tema principal Usted necesita una columna que contenga datos numéricos o de fecha/hora, pero no valores faltantes. Elimine los valores faltantes de la hoja de trabajo antes de mostrar los valores de letras. Ejemplo de presentación de valores de letras tema principal interpretación de los resultados comando de sesión véase también Los estudiantes de una clase introductoria de estadística participaron en un sencillo experimento. Antes de comenzar el experimento, cada estudiante registro su propio pulso en reposo. Utilizaremos una presentación de valores de letras para describir la ubicación y la dispersión de los datos de las tasas de pulso en reposo. 1 Abra la hoja de trabajo PULSO.MTW. 2 Elija Estadísticas > EDA > Valores de letras. 3 En Variable, ingrese Pulso1. Haga clic en Aceptar. Salida de la ventana Sesión Presentación de valores de letras: Pulso1 Profundidad Inferior Superior Mid Dispersión N= 92 M 46.5 71.000 71.000 71.000 Página 14 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 15. Interpretación de los resultados Pulso1 contiene 92 observaciones (N = 92). Los valores de letras mostrados se encuentran al moverse hacia dentro desde cada extremo de las observaciones ordenadas hasta una posición dada dentro de las observaciones ordenadas (profundidad especificada). Para obtener más información sobre cómo se calculan las profundidades, consulte Métodos y fórmulas - Valores de letras. Si la profundidad no coincide con un valor de datos, se toma el promedio de los vecinos más cercanos. La mediana de estos datos es el promedio de las observaciones ordenadas cuarentiséis y cuarentisiete y es de 71. Las bisagras son el promedio de las observaciones veintidós y veintitrés desde cada extremo, con valores de 64 y 80, siendo el promedio de éstos el Punto medio, o sea, 72. La diferencia entre las bisagras superior e inferior es la Dispersión, o sea, 16. Los octavos (E), dieciseisavos (D) y otros valores de letras se calculan de forma similar. Para mostrar valores de letras tema principal véase también 1 Elija Estadísticas > EDA > Valores de letras. 2 En Variable, ingrese la columna que contiene los datos cuyos valores de letras desea obtener. 3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en Aceptar. Método "Median Polish" revisión general procedimiento ejemplo datos véase también Estadísticas > EDA > Método "Median Polish" H 23.5 64.000 80.000 72.000 16.000 E 12.0 62.000 88.000 75.000 26.000 D 6.5 59.000 91.000 75.000 32.000 C 3.5 56.000 95.000 75.500 39.000 B 2.0 54.000 96.000 75.000 42.000 1 48.000 100.000 74.000 52.000 Página 15 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 16. Método "Median Polish" ajusta un modelo aditivo a un diseño de dos factores e identifica patrones de datos no explicados por los efectos de fila y de columna. Este procedimiento es similar al análisis de varianza excepto por el hecho de que se utilizan medianas en lugar de medias, agregando así fuerza contra el efecto de los valores atípicos. Para una explicación completa, véase [1] y [2]. El método "Median Polish" no imprime resultados. Para mostrar los datos, ajustes almacenados o residuos, utilice Estadísticas > Tablas > Estadísticas descriptivas. Elementos del cuadro de diálogo Respuesta: Seleccione la columna que contiene la variable de respuesta Factor de la fila: Seleccione la columna que contiene el factor de fila. Los niveles del factor de fila deben ser enteros consecutivos comenzando por 1 Factor de columna: Seleccione la columna que contiene el factor de columna. Los niveles del factor de columna deben ser enteros consecutivos comenzando por 1. Número de iteraciones: Ingrese el número de iteraciones para encontrar la solución. El valor predeterminado es cuatro. Las columnas primero: Marque esta opción para utilizar las medianas de columna en lugar de las medianas de fila para la primera iteración. Comenzar por las filas y comenzar por las columnas no necesariamente produce los mismos ajustes, aunque se realicen muchas iteraciones. Almacenamiento Efecto común: Especifique una constante para almacenar los efectos comunes . Efectos de fila: Especifique una columna para almacenar los efectos de fila . Efectos de columna: Especifique una columna para almacenar los efectos de columna . Valores de comparación: Especifique una columna para almacenar los valores de comparación . Residuos: Marque esta opción para almacenar los residuos Ajustes: Marque esta opción para almacenar los valores ajustados Datos Método "Median Polish" tema principal Organice sus datos en tres columnas numéricas en la hoja de trabajo una respuesta, un factor de fila y un factor de columna. Cada fila representa una observación. Los niveles de fila y los niveles de columna deben ser enteros consecutivos comenzando por uno. La tabla puede ser no balanceada y puede tener celdas vacías, pero no puede haber valores faltantes. Elimine los valores faltantes de la hoja de trabajo antes de ejecutar el método "median polish". Página 16 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 17. Ejemplo de Median Polish tema principal interpretación de los resultados comando de sesión véase también Supongamos que usted desea ajustar un modelo a datos experimentales en un diseño de dos factores. El experimento incluyó tres tipos de cascos, donde se aplicó fuerza a la parte frontal y la parte posterior del casco. Los dos factores de interés son el tipo de casco y la ubicación de la fuerza aplicada, mientras que la medida de respuesta es el impacto. El impacto se midió para determinar si existen o no patrones de datos identificables que indiquen una diferencia entre los tres tipos de cascos y la parte frontal y posterior del casco, con el nivel de protección provisto (medido por Impacto). En este ejemplo, se ajusta un modelo aditivo a un diseño de dos factores utilizando una median polish. Dado que el método "Median Polish" no muestra resultados, utilice Mostrar datos y Estadísticas descriptivas para mostrar los resultados en la ventana Sesión. Paso 1: Ejecutar el método "median polish" 1 Abra la hoja de trabajo EJA_ESTAD.MTW. Elija Estadísticas > EDA > Método "Median Polish". 2 En Respuesta, ingrese Impacto. 3 En Factor de la fila, ingrese TipoCasco. En Factor de la columna, ingrese Ubicación. 4 En Efecto común, ingrese EfectoComún. En Efectos de fila, ingrese EfectoFila. En Efectos de columna, ingrese EfectoColumna. 5 Marque Residuos. Haga clic en Aceptar. Salida de la ventana Sesión Paso 2: Muestre los efectos común, de fila y de columna 1 Elija Datos > Mostrar datos. 2 En Columnas, constantes y matrices que se mostrarán, ingrese EfectoComún, EfectoFila, y EfectoColumna. Haga clic en Aceptar. Salida de la ventana Sesión * NOTA * Esta versión de MPOLISH no muestra resultados. Almacene los resultados y utilice Mostrar datos y Tabulación cruzada. Presentación de datos EfectoComún 44.5000 Página 17 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 18. Paso 3: Muestre los datos y los residuos 1 Elija Estadísticas > Tablas > Estadísticas descriptivas. 2 En Variables categóricas, en Para filas, ingrese TipoCasco. En Para columnas, ingrese Ubicación. 3 En Mostrar resúmenes de, haga clic en Variables asociadas. 4 En Variables asociadas, ingrese Resi1. En Mostrar, marque Datos. Haga clic en Aceptar. 5 En Mostrar resúmenes de, haga clic en Variables categóricas. 6 En Mostrar, desmarque Conteos. Haga clic en Aceptar. 7 Haga clic en Opciones. En Mostrar estadísticas marginales de, elija No hay variables. Haga clic en Aceptar en cada cuadro de diálogo. Salida de la ventana Sesión Fila EfectoFila EfectoColumna 1 0 -1 2 23 1 3 -3 Estadísticas tabuladas: TipoCasco, Ubicación Filas: TipoCasco Columnas: Ubicación 1 2 1 3.5 0.5 -0.5 -5.5 2 -4.5 -1.5 1.5 2.5 Página 18 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 19. Interpretación de los resultados Esta sección se basa en la salida de los pasos 2 y 3. El efecto común, que resume el nivel general de Impacto, es 44.5. Los efectos de fila representan los cambios en el Impacto de fila a fila en relación con el valor común. Los efectos de fila son 0, 23, 3 para el tipo de casco 1, 2 y 3, respectivamente, lo que indica que el impacto para el tipo de casco 2 fue mucho mayor que el nivel común, mientras que el tipo de casco 3 fue ligeramente menor. Los efectos de columna representan cambios en el Impacto de columna a columna en relación con el valor común. Los efectos de columna son 1, 1 para las ubicaciones 1 y 2, respectivamente, lo que indica que el impacto fue ligeramente menor que el efecto común para la parte frontal del casco y ligeramente mayor para la parte posterior del casco. Los residuos de los dos observaciones por celda se muestran en la tabla impresa. Son de 3.5 y 0.5 para la celda 1,1, y así sucesivamente. Usted puede usar los residuos para identificar valores extraordinarios. Para obtener más información sobre cómo mejorar el ajuste de un modelo aditivo , véase Mejorar el ajuste de un modelo aditivo. Mejorar el ajuste de un modelo aditivo tema principal Cuando un modelo aditivo no describe los datos apropiadamente, éstos se pueden hacer más aditivos al expresar los datos nuevamente o transformarlos. Usted puede utilizar valores de comparación para elegir una transformación de datos apropiada. 1 Calcule los valores de comparación para cada observación. Para una observación en la fila i y columna j: valor de comparación = [(efecto de fila i) x (efecto de columna j)] / efecto común 2 Grafique cada residuo en función de su valor de comparación para la inspección visual de los datos. 3 0.5 -0.5 -1.5 3.5 Contenido de la celda: RESIDUOS1 : DATOS Página 19 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 20. 3 Ajuste una línea recta a los datos utilizando Línea resistente. 4 Determine si una transformación mejorará o no el ajuste del modelo aditivo. Permita que p = 1 - (pendiente de la línea resistente). Si p = 1 (la línea es horizontal), ninguna transformación simple mejorará el modelo. Si p = ½, SQRT(Y), donde Y son los datos, es probable que sea más casi aditivo (y por lo tanto mejor analizado por el método "median polish"). Si p = 0, log Y será más casi aditivo. Si p está entre 0 y 1, entonces Yp será más casi aditivo. La técnica exploratoria descrita arriba es similar a la de un grado de libertad de Tukey para el método de no aditividad. Para ejecutar el método "median polish" tema principal véase también 1 Elija Estadísticas > EDA > Método "Median Polish". 2 En Respuesta, ingrese la columna que contiene los datos de medición. 3 En Factor de fila, ingrese la columna que contiene los niveles del factor de fila. 4 En Factor de columna, ingrese la columna que contiene los niveles del factor de columna. 5 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en Aceptar. Línea resistente revisión general procedimiento datos véase también Estadísticas > EDA > Línea resistente La línea resistente ajusta una línea recta a sus datos utilizando un método que es resistente a los valores atípicos. Velleman y Hoaglin [2] sugieren ajustar una línea resistente antes de utilizar la regresión de cuadrados mínimos para determinar si la relación es lineal , para hallar reexperiencias para linealizar la relación si es necesario y para identificar valores atípicos. Elementos del cuadro de diálogo Respuesta: Seleccione la columna que contiene la variable de respuesta (Y). Se necesitan por lo menos seis observaciones, pero preferiblemente nueve o más. Página 20 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 21. Predictor: Seleccione la columna que contiene la variable predictora (X). Número máximo de iteraciones: Especifique el número máximo de iteraciones utilizadas para encontrar una solución. El valor predeterminado es 10. Este procedimiento se detendrá antes del número especificado de iteraciones si el valor de la pendiente no cambia mucho. Almacenamiento Residuos: Marque esta opción para almacenar los residuos . Ajustes: Marque esta opción para almacenar los valores ajustados. Coeficientes: Marque esta opción para almacenar los coeficientes . <Resultados> Datos Línea resistente tema principal Usted debe tener dos columnas numéricas una columna de variables de respuesta y una columna de variables predictoras con por lo menos seis, pero preferiblemente nueve o más, observaciones. Minitab omite automáticamente de los cálculos los datos faltantes. Línea resistente Resultados tema principal véase también Estadísticas > EDA > Línea resistente > Resultados Controle la presentación de la salida de la ventana Sesión. Elementos del cuadro de diálogo Controlar la presentación de resultados No mostrar nada: Elija esta opción para suprimir la presentación de todos los resultados. Pendiente, nivel y relación de la mitad de la pendiente: Elija esta opción para mostrar la pendiente, el nivel y la relación de semipendiente (valor predeterminado). Además, la pendiente para cada iteración: Elija esta opción para mostrar la pendiente, el nivel, la relación de semipendiente y la pendiente para cada iteración. Página 21 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 22. Para ajustar una línea resistente tema principal véase también 1 Elija Estadísticas > EDA > Línea resistente. 2 En Respuesta, ingrese la columna que contiene los datos de medición (Y). 3 En Predictor, ingrese la columna que contiene los datos de variables predictoras (X). 4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en Aceptar. Suavización resistente revisión general procedimiento datos véase también Estadísticas > EDA > Suavización resistente La suavización resistente suaviza las series de datos ordenadas, comúnmente recolectadas en el tiempo, para eliminar las fluctuaciones aleatorias. La suavización es útil para descubrir y resumir tanto tendencias de datos como valores atípicos. La suavización resistente ofrece dos métodos de suavización: 4253H, dos veces y 3RSSH, dos veces. Véase Método. Elementos del cuadro de diálogo Variable: Seleccione la columna que contiene la variable que se suavizará. La suavización resistente requiere por lo menos siete observaciones. Almacenamiento Áspero: Especifique una columna para almacenar los datos ásperos; datos ásperos = datos sin procesar datos suavizados. Suave: Especifique una columna para almacenar los datos suavizados. Método de suavización: Permite escoger uno de los dos métodos para suavizar los datos. 4253H, dos veces: Elija esta opción para ejecutar un suavizador 4253H dos veces. 3RSSH, dos veces: Elija esta opción para ejecutar un suavizador 3RSSH dos veces Datos Suave resistente tema principal Página 22 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 23. Usted debe tener una columna numérica por lo menos con siete observaciones. Puede tener datos faltantes al principio y al final de la columna, pero no en el medio. Para ejecutar una suavización resistente tema principal véase también 1 Elija Estadísticas > EDA > Suavización resistente. 2 En Variable, ingrese la columna que contiene los datos sin procesar que se suavizarán. 3 En Áspero, ingrese una columna para almacenar los datos ásperos (datos ásperos = datos sin procesar - datos suavizados). 4 En Suave, ingrese una columna para almacenar los datos suavizados. 5 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y luego haga clic en Aceptar. Rootograma revisión general procedimiento ejemplo datos véase también Estadísticas > EDA > Rootograma Un rootograma suspendido es un histograma con una distribución normal ajustada al mismo, el cual muestra las desviaciones de la distribución normal ajustada. Dado que un rootograma se ajusta utilizando percentiles, protege contra valores atípicos y conteos de secciones extraordinarios. Para obtener más detalles, véase [2]. Elementos del cuadro de diálogo Fuente de datos Variable: Elija esta opción para que se utilicen datos sin procesar para formar el rootograma, luego especifique la columna que contiene los datos sin procesar. Frecuencias: Elija esta opción para utilizar conteos (frecuencias) para formar el rootograma, luego especifique la columna que contiene las frecuencias. El primer conteo corresponde a la sección semiabierta por debajo del límite de sección inferior y debe ser cero si ninguna observación se ubica por debajo del primer límite de sección. De forma similar, el último conteo corresponde a la sección semiabierta por encima del límite de sección más alto. Por lo tanto, la columna de conteos tiene una entrada más que la columna de límites de sección. Utilice límites de sección en: Marque esta opción para especificar los límites de sección, luego especifique la columna que contiene los límites de sección. Ingrese los límites de sección desde el más pequeño hasta el más grande hacia abajo en la columna. Si no se especifican límites de sección, Página 23 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 24. los límites se toman para que tengan un ancho = 1. Utilice la media___ y desv. est.___: Marque esta opción para anular la estimación automática de la media y la desviación estándar utilizadas en el ajuste de la curva de comparación Normal. Luego especifique la media y la desviación estándar que desee utilizar. Almacenamiento Límites de sección: Especifique una columna de almacenamiento para los límites de sección. Conteos: Especifique una columna de almacenamiento para las frecuencias. Residuos de raíz doble: Especifique una columna de almacenamiento para los residuos de raíz doble (DRRes) . El rootograma suspendido es una gráfica de los residuos de raíz doble, que utiliza el signo de éstos para el símbolo de graficación. Ajustes: Especifique una columna para almacenar los conteos ajustados. El conteo ajustado, fi, es N x (área debajo de la curva normal con la media y la desv.est. especificadas, en la sección i). Datos Rootograma tema principal Sus datos pueden ser de dos formas: sin procesar o de frecuencia. Para utilizar: datos sin procesar, necesita una columna de datos numéricos o de fecha/hora. Por opción predeterminada, el procedimiento de rootograma determinará los límites de sección. datos de frecuencia, necesita una columna numérica que contenga el conteo (frecuencia) de las observaciones para cada sección. Las frecuencias se deben ordenar de forma descendente en la columna desde la sección más alta hasta la sección más baja (equivalente a las secciones más a la izquierda y más a la derecha en un histograma, respectivamente). Por opción predeterminada, las secciones tienen un ancho de 1. Opcionalmente, usted puede especificar los límites de sección tanto para los datos sin procesar como para los datos de frecuencia en otra columna. En la columna de límites de sección, ingrese los límites de sección desde el más pequeño hasta el más grande. Si está utilizando límites de sección con datos de frecuencia, la primera fila de la columna de datos de frecuencia es el conteo del número de observaciones que se ubican por debajo del límite de sección más pequeño. Si ninguna observación está por debajo del primer límite de sección, el conteo en la primera fila es cero. De forma similar, la última fila de la columna de datos de frecuencia contiene el conteo del número de observaciones ubicadas por encima del límite de sección más grande. La columna de datos de frecuencia tendrá una entrada más que la columna de límites de sección. Minitab omite automáticamente de los cálculos los datos faltantes. Página 24 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 25. Ejemplo de Rootograma tema principal interpretación de los resultados comando de sesión véase también En este ejemplo se utiliza un rootograma para determinar si las mediciones del peso de 92 estudiantes siguen o no una distribución normal. 1 Abra la hoja de trabajo PULSO.MTW. 2 Elija Estadísticas > EDA > Rootograma. 3 En Variable, ingrese Peso. Haga clic en Aceptar. Salida de la ventana Sesión Rootograma: Peso Sección Conteo RawRes DRRes Rootograma suspendido 1 0.0 -0.7 -0.90 . ----- . 2 0.0 -1.2 -1.44 . -------- . 3 2.0 -0.8 -0.35 . -- . 4 5.0 -0.5 -0.10 . - . 5 12.0 3.0 0.99 . +++++ . 6 12.0 -0.5 -0.06 . - . 7 11.0 -3.7 -0.94 . ----- . 8 17.0 2.4 0.66 . ++++ . 9 16.0 3.7 1.03 . ++++++ . 10 5.0 -3.8 -1.34 . ------- . 11 5.0 -0.4 -0.04 . - . 12 5.0 2.2 1.23 . +++++++ . 13 1.0 -0.2 0.04 . + . 14 0.0 -0.4 -0.66 . ---- . 15 1.0 0.9 1.20 . +++++++ . Página 25 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm
  • 26. Interpretación de los resultados El rootograma suspendido grafica los residuos de raíz doble (DRRes) utilizando el signo de éstos como el símbolo de graficación. Los residuos de raíz doble indican el grado en que los datos siguen la distribución de comparación (normal). Para la variable Peso, existe una concentración leve de signos negativos en las secciones inferiores, mientras que la mayor concentración de signos positivos se encuentra en las secciones intermedia y superior, lo que indica el punto en que la distribución tiende a separarse de la normalidad. Sin embargo, no existe evidencia suficiente que sustente que no se pueda utilizar una distribución normal para describir estos datos ya que los todos los residuos de raíz doble se encuentran dentro de los límites de confianza. Para mostrar un rootograma suspendido tema principal véase también 1 Elija Estadísticas > EDA > Rootograma. 2 Realice uno de los siguientes procedimientos: en Fuente de datos, elija Variable e ingrese la columna que contiene los datos sin procesar, o elija Frecuencias e ingrese la columna que contiene los conteos. 3 Si lo desea, utilice una o más de las opciones del cuadro de diálogo y, a continuación, haga clic en Aceptar. 16 0.0 -0.0 -0.09 . - . En pantalla, el valor de un carácter es .2 OO Página 26 de 26Revisión general, EDA 02/11/2015file:///C:/Users/Amador/AppData/Local/Temp/~hhDD66.htm