INTRODUCCIÓN
Dr. Raúl Benito Siche Jara
1
Curso: Métodos Estadísticos para la Investigación
ESCUELA ACADÉMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL
UNIVERSIDAD NACIONAL DE TRUJILLO
Conocimiento del problema
Tenga presente la importancia
del conocimiento del problema
para considerar y explorar
modelos provisionales y para
saber donde buscar ayuda.
Métodos estadísticos para la investigación 2
Dr. Raúl Siche
UNT
INTRODUCCIÓN
El camino hacia la solución no es único
Métodos estadísticos para la investigación 3
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Sin conocimiento de la ESTRATEGIA es posible jugar
Sin conocimiento del PROBLEMA es absolutamente imposible hacerlo
Grupo A
ESTRATEGIA = ESTADÍSTICA
El uso de los métodos estadísticos ACELERA la convergencia hacia la solución
De este modo un BUEN investigador se convierte aún en un MEJOR investigador
Métodos estadísticos para la investigación 4
Dr. Raúl Siche
UNT
INTRODUCCIÓN
El tener en cuenta todas estas posibilidades sitúa al
investigador frente a un DESAFÍO ABRUMADOR. Las
estrategias de realizar la experimentación por prueba y
ajuste, o la de realizar “cambiar un factor a la vez” hacen
que sea poco probable alcanzar un buen resultado
rápido y económicamente.
El uso del diseño estadístico de experimentos hace
posible, ensayar varios factores simultáneamente
proporcionado una clara imagen de cómo influyen sobre
la respuesta tanto aislados como conjuntamente.
Metodología de la Investigación Científica 6
Dr. Raúl Siche
UNT
INTRODUCCIÓN
El problema
Peter y Rita desarrollaron una nueva resina de intercambio
iónico que adsorbe el nitrato contaminante, es más
económica y fácil de regenerar que las otras resinas
actualmente disponibles en el mercado.
Desgraciadamente, en condiciones de laboratorio sólo se
puede preparar en cantidades experimentales. Se ha
decidido que sería un buen objetivo el realizar nuevas
investigaciones antes de que se pueda fabricar un
producto viable comercialmente.
Métodos estadísticos para la investigación 7
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Ciclos iterativos de investigación
ITERACIÓN I
Comentario
Peter cree – y Rita no - que, si se utiliza una calidad muy pura y más
costosa de la resina se mejorará el rendimiento.
Pregunta ¿Cómo comparar su resina común con la de alta pureza más costosa?
Respuesta Comparación de dos tratamientos.
Descubrimiento
El rendimiento de la resina de alta pureza, más costosa, es
prácticamente igual al de la resina común.
Métodos estadísticos para la investigación 8
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Ciclos iterativos de investigación
ITERACIÓN II
Comentario
Peter ha descubierto que estaba equivocado respecto a la resina de alta
pureza, pero la resina de calidad común todavía le parece prometedora.
Por eso ellos deciden comparar las muestras de laboratorio de su nueva
resina con cinco resinas estándar disponibles en el mercado.
Pregunta
¿Cómo comparar su resina común con las cinco resinas disponibles en
el mercado?
Respuesta Comparación de dos o más tratamientos.
Descubrimiento
Las muestras de laboratorio de su nueva resina son tan buenas como
las disponibles en el mercado y quizás mejores que alguna de ellas.
Métodos estadísticos para la investigación 9
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Ciclos iterativos de investigación
ITERACIÓN III
Comentario
Se ha comprobado que la nueva resina funciona tan bien como sus
competidoras. Sin embargo, en las condiciones que se ha
considerado para realizar una fabricación económicamente viable, la
eliminación de nitrato resulta insuficiente para alcanza el valor que
establece la normativa aplicable al agua potable.
Pregunta
¿Cuáles son los factores que más influyen en la eliminación de
nitrato? ¿Podrían mejorar la eliminación del nitrato algunas
modificaciones del equipo que afecten a factores como el caudal, la
profundidad del lecho y el tiempo de regeneración de la resina?
Respuesta Diseños fraccionados y factoriales.
Descubrimiento
Si se realizan las adecuadas modificaciones del equipo se pueden
obtener niveles de nitrato suficientemente bajos.
Métodos estadísticos para la investigación 10
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Ciclos iterativos de investigación
ITERACION IV
Comentario
La empresa de Peter y Rita llega a la conclusión de que la
fabricación de esa nueva resina es posible y de que podría ser
rentable. Para estudiarlo se construye una planta piloto.
Pregunta
¿Cómo afectan los niveles de las variables del proceso de
fabricación a la calidad y el coste de la nueva resina?
Respuesta
Método de mínimos cuadrados. Modelo multidimensional y ajuste
de superficies de respuesta.
Descubrimiento
La investigación en la planta piloto indica que, si se trabaja en los
niveles adecuados de las variables de proceso, se puede fabricar la
resina con una calidad satisfactoria y a un coste razonable.
Métodos estadísticos para la investigación 11
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Ciclos iterativos de investigación
ITERACIÓN V
Comentario
Antes de que el proceso sea transferido a la fase de producción
deben resolverse los problemas de muestreo y medición.
Pregunta
¿Cómo se pueden perfeccionar los métodos de muestreo y
medición para determinar de forma fiable valores de las
características de la nueva resina?
Respuesta Fuentes de variación múltiple
Descubrimiento
Es posible identificar y medir los componentes de variabilidad en el
muestreo y los análisis químicos del producto. Sobre esta
información se puede elaborar un protocolo de muestreo que
minimice la varianza de las determinaciones al mínimo coste.
Métodos estadísticos para la investigación 12
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Ciclos iterativos de investigación
ITERACIÓN VI
Comentario La planta a gran escala no es fácil de controlar.
Pregunta ¿Cómo se puede alcanzar un mejor control del proceso?
Respuesta Control de procesos, previsiones y series temporales.
Descubrimiento
Se puede alcanzar un adecuado control del proceso mediante
técnicas de depurado, seguimiento y retroalimentación simple del
proceso.
Métodos estadísticos para la investigación 13
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Cada nuevo problema se debe tratar por sí mismo y con
cierto cuidado. El precipitarse demasiado puede conducir a
errores, tales como obtener la solución CORRECTA del
problema EQUIVOCADO.
Averiguar todo cuanto se pueda del problema.
No olvidar el conocimiento no estadístico.
Definir los objetivos.
¿Qué hacer?
Métodos estadísticos para la investigación 14
Dr. Raúl Siche
UNT
INTRODUCCIÓN
Las técnicas estadísticas son inservibles a menos que se
combinen con el apropiado conocimiento del tema al que se
aplican y con la experiencia previa.
ES UN COMPLEMENTO AL CONOCIMIENTO DEL TEMA,
NUNCA UN SUSTITUTO
Métodos estadísticos para la investigación 15
Dr. Raúl Siche
UNT
INTRODUCCIÓN
“Una respuesta apropiada para un problema bien
formulado es mucho mejor que una respuesta
exacta para un problema aproximado”
John Wilder Tukey (1915-2000), estadístico estadounidense.
Métodos estadísticos para la investigación 16
Dr. Raúl Siche
UNT
REFLEXIÓN
Es la variabilidad de una respuesta NO ATRIBUIBLE
a influencias conocidas.
Responsables:
Error de medición
Variaciones en la materia prima
Muestreo
Condiciones de trabajo
ERROR EXPERIMENTAL
Métodos estadísticos para la investigación 17
Dr. Raúl Siche
UNT
Cuando se repite una operación o un experimento bajo
condiciones lo más similares posible, los resultados
obtenidos nunca son totalmente idénticos. La fluctuación
que se observa de una repetición a otra se denomina
ruido, variación experimental, error experimental o
simplemente error.
ERROR EXPERIMENTAL ERROR DEL EXPERIMENTO
ERROR EXPERIMENTAL
Métodos estadísticos para la investigación 18
Dr. Raúl Siche
UNT
DISEÑO DE INVESTIGACIÓN
TIPOS
Experimentales
- Preexperimentos
- Cuasi-experimentos
- Experimentos puros
Características
Recolección de datos en
un único momento
No
Experimentales
Grado de control mínimo
Grupos intactos
- Manipulación intencional de
variables independientes
- Medición de variables dependientes
- Control y validez
- Dos o más grupos
- Transeccionales
o transversales
- Longitudinales
o evolutivos
- Manipulación
de variables
Tipos
Exploratorios
Descriptivos
Correlacionales-causales
Propósito
Analiza cambios a través
del tiempo
Tipos
Diseño de tendencias
Diseños de análisis
evolutivo de grupos
Diseño panel
Métodos estadísticos para la investigación 19
Dr. Raúl Siche
UNT
MEDIDAS DE POSICIÓN Y DISPERSIÓN
Media
Varianza
Desviación Estándar
Coeficiente de variación
Métodos estadísticos para la investigación 21
Dr. Raúl Siche
UNT
DISTRIBUCIÓN NORMAL
Gráficos para determinar una distribución normal
Diagrama de Puntos Histograma de Frecuencias
Métodos estadísticos para la investigación 23
Dr. Raúl Siche
UNT
DISTRIBUCIÓN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Gráficas
Pruebas Formales
Histograma de Frecuencias
IQR/S
Gráficos de Probabilidad normal
Shapiro – Wilk
Kolmogorov – Smirnov
Test de D´Agostino
N < 50
N > 50
N ≥ 10
Métodos estadísticos para la investigación 24
Dr. Raúl Siche
UNT
DISTRIBUCIÓN NORMAL
Pruebas de Normalidad de una muestra
Ho = Los datos siguen una distribución normal
Ha = Los datos no siguen una distribución normal
p ≥ 0.05
p < 0.05
Pruebas Paramétricas
Pruebas No Paramétricas
Transformación
Prueba de
Normalidad
Sí
No
Sí
No
Distribución
normal
Métodos estadísticos para la investigación 25
Dr. Raúl Siche
UNT
DISTRIBUCIÓN NORMAL
Muestreo aleatorio, independencia y supuestos
Sería conveniente que siempre se pudiera admitir el modelo
de muestro aleatorio porque ello aseguraría la validez de la
hipótesis de IID y permitiría algunas simplificaciones
importantes.
Si además la distribución común de probabilidad fuera la
normal, estarían Normal, Idéntica e independientemente
distribuidas (NIID).
Métodos estadísticos para la investigación 26
Dr. Raúl Siche
UNT
DISTRIBUCIÓN NORMAL
Robustez al supuesto de la Normalidad
Aunque muchas técnicas descritas, implican la suposición
de normalidad, todo lo que requieren para ser útiles es
una normalidad aproximada.
En particular las técnicas para la comparación de medias
son generalmente robustas a la no normalidad.
A menos que se advierta específicamente, no debe
preocuparse excesivamente sobre la normalidad.
Métodos estadísticos para la investigación 27
Dr. Raúl Siche
UNT
PRUEBAS PARAMÉTRICAS
Las PRUEBAS PARAMÉTRICAS, generalmente
requieren para su uso, el SUPUESTO DE
NORMALIDAD, es decir, que las muestras aleatorias
se extraen de poblaciones que están normalmente
distribuidas, o aproximadamente normal.
Métodos estadísticos para la investigación 28
Dr. Raúl Siche
UNT
PRUEBAS NO PARAMÉTRICAS
Las PRUEBAS NO PARAMÉTRICAS, son métodos que
no suponen nada acerca de la distribución población
muestreada por eso también a los métodos de la
estadística no paramétrica se le llama de
distribución libre.
Estos métodos se basan más en el análisis de los
rangos de los datos que en las propias
observaciones.
Métodos estadísticos para la investigación 29
Dr. Raúl Siche
UNT
PRUEBAS ESTADÍSTICAS
Mann – Whitney
(Independientes)
Pruebas No Paramétricas
Prueba de Normalidad
Datos del Experimento
Distribución Normal
Sin Distribución Normal
Shapiro – Wilk n < 50
Kolmogorov – Smirnov n ≥ 50
Test de D´Agostino n ≥ 10
Transformación
Pruebas Paramétricas
2 muestras k muestras
Test de
Tamhane
Kruskal – Walis
(Independientes)
Wilcoxon
(Relacionadas)
Test de Friedman
(Relacionadas)
Comparación de medias
Test de Homogeneidad de
Varianzas
Test de Levene
Duncan y/o
Tuckey
Transformación
1 muestra
Prueba T
Kruskal – Walis ó
Test de Friedman
Si los datos vienen de muestras
transformadas, se debe
continuar con estos datos hasta
el final del análisis estadístico.
Si al menos un
trat. es
diferente
2 muestras
Prueb T
(Relacionada)
Prueb T
(Independ.)
Kruskal – Walis ó
Test de Friedman
Si al menos un
tratamiento es
diferente
2 muestras
Varianzas
iguales
k muestras
ANOVA
(1 Factor)
K muestras
Varianzas
distintas
Métodos estadísticos para la investigación 30
Dr. Raúl Siche
UNT
PRUEBAS PARAMÉTRICAS
PRUEBA T
Es la Prueba Paramétrica más poderosa que existe para determinar
diferencia entre dos poblaciones (ó tratamientos), sin embargo requiere
que los datos pertenezcan a una DISTRIBUCIÓN NORMAL y que LAS
VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para
varianzas distintas).
ANOVA
Requiere una DISTRIBUCIÓN NORMAL MODERADA (ROBUSTA), sin
embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre
las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o
el Test de Friedman (No Paramétricas)
DUNCAN
Y/O TUCKEY
Pruebas de Comparaciones múltiples de medias, son robustas a la falta
de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE
VARIANZAS, caso contrario usar la Prueba Paramétrica de Tamhane.
TAMHANE
Pruebas Paramétrica de Comparaciones múltiples de medias, robusta a la
falta de normalidad, no requiere que se cumpla la igualdad de varianzas.
Métodos estadísticos para la investigación 31
Dr. Raúl Siche
UNT
PRUEBAS NO PARAMÉTRICAS
WILCOXON
Prueba No Paramétrica, cuya finalidad es la misma que la Prueba
T para muestras relacionadas, por lo tanto requiere que los
individuos sean los mismos en ambos tratamientos.
MANN –
WHITNEY
Prueba No Paramétrica, cuya finalidad es la misma que la Prueba
T para muestras independientes, por lo tanto NO requiere que
los individuos sean los mismos en ambos tratamientos.
FRIEDMAN
Prueba de Comparación de medias para más de 2 poblaciones
(tratamientos), cuyos individuo deben haber sido los mismos en
todos los tratamientos.
KRUSKAL –
WALIS
Prueba de Comparación de medias para más de 2 poblaciones
(tratamientos), cuyos individuos no necesariamente deben
haber sido los mismos en todos los tratamientos.
Métodos estadísticos para la investigación 32
Dr. Raúl Siche
UNT
DISEÑO DE INVESTIGACIÓN
Prueba de Homogeneidad de Varianzas
• Uno de los pasos previos a la comprobación de si
existen diferencias entre las medias de varias
muestras es determinar si las varianzas en tales
muestras son iguales (es decir, si se cumple la
condición de homogeneidad de varianzas), ya que
de que se cumpla o no esta condición dependerá la
formulación que empleemos en el contraste de
medias.
• Test de Levene (valor de p = 0.05)
Métodos estadísticos para la investigación 33
Dr. Raúl Siche
UNT
DISEÑO DE INVESTIGACIÓN
Análisis de Varianza (ANOVA)
• Idea básica
Descomponer la variabilidad total en las partes asociadas a
cada factor, más una residual (no justificables por los
factores estudiados).
Variabilidad
total
=
Variabilidad debida a
diferencias entre
tratamientos
+
Variabilidad residual
(diferencias dentro
de cada tratamiento)
• Usos:
Determinar si existen diferencias significativas entre tratamiento.
Evaluar si los factores tienen efecto significativo sobre las respuestas.
• Nivel de significancia = 95% y valor de p = 0.05
Métodos estadísticos para la investigación 34
Dr. Raúl Siche
UNT
DISEÑO DE INVESTIGACIÓN
Pruebas Pot Hoc
• Pruebas que permiten determinar diferencias
estadísticas entre muestras o tratamientos
múltiples (más de dos).
• Test de Tukey
(Asumiendo varianzas iguales; p>0.05)
• Test de Tamanhe
(Asumiendo varianzas no iguales; p<0.05)
Métodos estadísticos para la investigación 35
Dr. Raúl Siche
UNT
DISEÑO DE INVESTIGACIÓN
Otros diseños
• Diseños de Cuadrado Latino
• Diseños Fraccionados
• Diseños de Placket y Burman
• Diseño Compuesto Central Rotable
• Diseño de Mezclas
• Diseños de Taguchi
• Otros
Métodos estadísticos para la investigación 36
Dr. Raúl Siche
UNT
DISEÑO DE INVESTIGACIÓN
Programas a utilizar
• Statistica 7.0
• SPSS v15
• Excel v 2010
• Otros
Métodos estadísticos para la investigación 37
Dr. Raúl Siche
UNT