Publicidad
Publicidad

Más contenido relacionado

Publicidad

Clase 1 - Introducción.pdf

  1. INTRODUCCIÓN Dr. Raúl Benito Siche Jara 1 Curso: Métodos Estadísticos para la Investigación ESCUELA ACADÉMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL UNIVERSIDAD NACIONAL DE TRUJILLO
  2. Conocimiento del problema Tenga presente la importancia del conocimiento del problema para considerar y explorar modelos provisionales y para saber donde buscar ayuda. Métodos estadísticos para la investigación 2 Dr. Raúl Siche UNT INTRODUCCIÓN
  3. El camino hacia la solución no es único Métodos estadísticos para la investigación 3 Dr. Raúl Siche UNT INTRODUCCIÓN
  4. Sin conocimiento de la ESTRATEGIA es posible jugar Sin conocimiento del PROBLEMA es absolutamente imposible hacerlo Grupo A ESTRATEGIA = ESTADÍSTICA El uso de los métodos estadísticos ACELERA la convergencia hacia la solución De este modo un BUEN investigador se convierte aún en un MEJOR investigador Métodos estadísticos para la investigación 4 Dr. Raúl Siche UNT INTRODUCCIÓN
  5. La complejidad Temperatura Velocidad de alimentación Concentración Catalizador Rendimiento Contenido de impurezas Coste económico PROCESO Tiempo Métodos estadísticos para la investigación 5 Dr. Raúl Siche UNT INTRODUCCIÓN
  6. El tener en cuenta todas estas posibilidades sitúa al investigador frente a un DESAFÍO ABRUMADOR. Las estrategias de realizar la experimentación por prueba y ajuste, o la de realizar “cambiar un factor a la vez” hacen que sea poco probable alcanzar un buen resultado rápido y económicamente. El uso del diseño estadístico de experimentos hace posible, ensayar varios factores simultáneamente proporcionado una clara imagen de cómo influyen sobre la respuesta tanto aislados como conjuntamente. Metodología de la Investigación Científica 6 Dr. Raúl Siche UNT INTRODUCCIÓN
  7. El problema Peter y Rita desarrollaron una nueva resina de intercambio iónico que adsorbe el nitrato contaminante, es más económica y fácil de regenerar que las otras resinas actualmente disponibles en el mercado. Desgraciadamente, en condiciones de laboratorio sólo se puede preparar en cantidades experimentales. Se ha decidido que sería un buen objetivo el realizar nuevas investigaciones antes de que se pueda fabricar un producto viable comercialmente. Métodos estadísticos para la investigación 7 Dr. Raúl Siche UNT INTRODUCCIÓN
  8. Ciclos iterativos de investigación ITERACIÓN I Comentario Peter cree – y Rita no - que, si se utiliza una calidad muy pura y más costosa de la resina se mejorará el rendimiento. Pregunta ¿Cómo comparar su resina común con la de alta pureza más costosa? Respuesta Comparación de dos tratamientos. Descubrimiento El rendimiento de la resina de alta pureza, más costosa, es prácticamente igual al de la resina común. Métodos estadísticos para la investigación 8 Dr. Raúl Siche UNT INTRODUCCIÓN
  9. Ciclos iterativos de investigación ITERACIÓN II Comentario Peter ha descubierto que estaba equivocado respecto a la resina de alta pureza, pero la resina de calidad común todavía le parece prometedora. Por eso ellos deciden comparar las muestras de laboratorio de su nueva resina con cinco resinas estándar disponibles en el mercado. Pregunta ¿Cómo comparar su resina común con las cinco resinas disponibles en el mercado? Respuesta Comparación de dos o más tratamientos. Descubrimiento Las muestras de laboratorio de su nueva resina son tan buenas como las disponibles en el mercado y quizás mejores que alguna de ellas. Métodos estadísticos para la investigación 9 Dr. Raúl Siche UNT INTRODUCCIÓN
  10. Ciclos iterativos de investigación ITERACIÓN III Comentario Se ha comprobado que la nueva resina funciona tan bien como sus competidoras. Sin embargo, en las condiciones que se ha considerado para realizar una fabricación económicamente viable, la eliminación de nitrato resulta insuficiente para alcanza el valor que establece la normativa aplicable al agua potable. Pregunta ¿Cuáles son los factores que más influyen en la eliminación de nitrato? ¿Podrían mejorar la eliminación del nitrato algunas modificaciones del equipo que afecten a factores como el caudal, la profundidad del lecho y el tiempo de regeneración de la resina? Respuesta Diseños fraccionados y factoriales. Descubrimiento Si se realizan las adecuadas modificaciones del equipo se pueden obtener niveles de nitrato suficientemente bajos. Métodos estadísticos para la investigación 10 Dr. Raúl Siche UNT INTRODUCCIÓN
  11. Ciclos iterativos de investigación ITERACION IV Comentario La empresa de Peter y Rita llega a la conclusión de que la fabricación de esa nueva resina es posible y de que podría ser rentable. Para estudiarlo se construye una planta piloto. Pregunta ¿Cómo afectan los niveles de las variables del proceso de fabricación a la calidad y el coste de la nueva resina? Respuesta Método de mínimos cuadrados. Modelo multidimensional y ajuste de superficies de respuesta. Descubrimiento La investigación en la planta piloto indica que, si se trabaja en los niveles adecuados de las variables de proceso, se puede fabricar la resina con una calidad satisfactoria y a un coste razonable. Métodos estadísticos para la investigación 11 Dr. Raúl Siche UNT INTRODUCCIÓN
  12. Ciclos iterativos de investigación ITERACIÓN V Comentario Antes de que el proceso sea transferido a la fase de producción deben resolverse los problemas de muestreo y medición. Pregunta ¿Cómo se pueden perfeccionar los métodos de muestreo y medición para determinar de forma fiable valores de las características de la nueva resina? Respuesta Fuentes de variación múltiple Descubrimiento Es posible identificar y medir los componentes de variabilidad en el muestreo y los análisis químicos del producto. Sobre esta información se puede elaborar un protocolo de muestreo que minimice la varianza de las determinaciones al mínimo coste. Métodos estadísticos para la investigación 12 Dr. Raúl Siche UNT INTRODUCCIÓN
  13. Ciclos iterativos de investigación ITERACIÓN VI Comentario La planta a gran escala no es fácil de controlar. Pregunta ¿Cómo se puede alcanzar un mejor control del proceso? Respuesta Control de procesos, previsiones y series temporales. Descubrimiento Se puede alcanzar un adecuado control del proceso mediante técnicas de depurado, seguimiento y retroalimentación simple del proceso. Métodos estadísticos para la investigación 13 Dr. Raúl Siche UNT INTRODUCCIÓN
  14. Cada nuevo problema se debe tratar por sí mismo y con cierto cuidado. El precipitarse demasiado puede conducir a errores, tales como obtener la solución CORRECTA del problema EQUIVOCADO. Averiguar todo cuanto se pueda del problema. No olvidar el conocimiento no estadístico. Definir los objetivos. ¿Qué hacer? Métodos estadísticos para la investigación 14 Dr. Raúl Siche UNT INTRODUCCIÓN
  15. Las técnicas estadísticas son inservibles a menos que se combinen con el apropiado conocimiento del tema al que se aplican y con la experiencia previa. ES UN COMPLEMENTO AL CONOCIMIENTO DEL TEMA, NUNCA UN SUSTITUTO Métodos estadísticos para la investigación 15 Dr. Raúl Siche UNT INTRODUCCIÓN
  16. “Una respuesta apropiada para un problema bien formulado es mucho mejor que una respuesta exacta para un problema aproximado” John Wilder Tukey (1915-2000), estadístico estadounidense. Métodos estadísticos para la investigación 16 Dr. Raúl Siche UNT REFLEXIÓN
  17. Es la variabilidad de una respuesta NO ATRIBUIBLE a influencias conocidas. Responsables: Error de medición Variaciones en la materia prima Muestreo Condiciones de trabajo ERROR EXPERIMENTAL Métodos estadísticos para la investigación 17 Dr. Raúl Siche UNT
  18. Cuando se repite una operación o un experimento bajo condiciones lo más similares posible, los resultados obtenidos nunca son totalmente idénticos. La fluctuación que se observa de una repetición a otra se denomina ruido, variación experimental, error experimental o simplemente error. ERROR EXPERIMENTAL ERROR DEL EXPERIMENTO ERROR EXPERIMENTAL Métodos estadísticos para la investigación 18 Dr. Raúl Siche UNT
  19. DISEÑO DE INVESTIGACIÓN TIPOS Experimentales - Preexperimentos - Cuasi-experimentos - Experimentos puros Características Recolección de datos en un único momento No Experimentales Grado de control mínimo Grupos intactos - Manipulación intencional de variables independientes - Medición de variables dependientes - Control y validez - Dos o más grupos - Transeccionales o transversales - Longitudinales o evolutivos - Manipulación de variables Tipos Exploratorios Descriptivos Correlacionales-causales Propósito Analiza cambios a través del tiempo Tipos Diseño de tendencias Diseños de análisis evolutivo de grupos Diseño panel Métodos estadísticos para la investigación 19 Dr. Raúl Siche UNT
  20. ANÁLISIS ESTADÍSTICO Métodos estadísticos para la investigación 20 Dr. Raúl Siche UNT
  21. MEDIDAS DE POSICIÓN Y DISPERSIÓN Media Varianza Desviación Estándar Coeficiente de variación Métodos estadísticos para la investigación 21 Dr. Raúl Siche UNT
  22. DISTRIBUCIÓN NORMAL Importancia Efecto del límite central Robustez a la no normalidad Métodos estadísticos para la investigación 22 Dr. Raúl Siche UNT
  23. DISTRIBUCIÓN NORMAL Gráficos para determinar una distribución normal Diagrama de Puntos Histograma de Frecuencias Métodos estadísticos para la investigación 23 Dr. Raúl Siche UNT
  24. DISTRIBUCIÓN NORMAL Pruebas de Normalidad de una muestra Pruebas Gráficas Pruebas Formales Histograma de Frecuencias IQR/S Gráficos de Probabilidad normal Shapiro – Wilk Kolmogorov – Smirnov Test de D´Agostino N < 50 N > 50 N ≥ 10 Métodos estadísticos para la investigación 24 Dr. Raúl Siche UNT
  25. DISTRIBUCIÓN NORMAL Pruebas de Normalidad de una muestra Ho = Los datos siguen una distribución normal Ha = Los datos no siguen una distribución normal p ≥ 0.05 p < 0.05 Pruebas Paramétricas Pruebas No Paramétricas Transformación Prueba de Normalidad Sí No Sí No Distribución normal Métodos estadísticos para la investigación 25 Dr. Raúl Siche UNT
  26. DISTRIBUCIÓN NORMAL Muestreo aleatorio, independencia y supuestos Sería conveniente que siempre se pudiera admitir el modelo de muestro aleatorio porque ello aseguraría la validez de la hipótesis de IID y permitiría algunas simplificaciones importantes. Si además la distribución común de probabilidad fuera la normal, estarían Normal, Idéntica e independientemente distribuidas (NIID). Métodos estadísticos para la investigación 26 Dr. Raúl Siche UNT
  27. DISTRIBUCIÓN NORMAL Robustez al supuesto de la Normalidad Aunque muchas técnicas descritas, implican la suposición de normalidad, todo lo que requieren para ser útiles es una normalidad aproximada. En particular las técnicas para la comparación de medias son generalmente robustas a la no normalidad. A menos que se advierta específicamente, no debe preocuparse excesivamente sobre la normalidad. Métodos estadísticos para la investigación 27 Dr. Raúl Siche UNT
  28. PRUEBAS PARAMÉTRICAS Las PRUEBAS PARAMÉTRICAS, generalmente requieren para su uso, el SUPUESTO DE NORMALIDAD, es decir, que las muestras aleatorias se extraen de poblaciones que están normalmente distribuidas, o aproximadamente normal. Métodos estadísticos para la investigación 28 Dr. Raúl Siche UNT
  29. PRUEBAS NO PARAMÉTRICAS Las PRUEBAS NO PARAMÉTRICAS, son métodos que no suponen nada acerca de la distribución población muestreada por eso también a los métodos de la estadística no paramétrica se le llama de distribución libre. Estos métodos se basan más en el análisis de los rangos de los datos que en las propias observaciones. Métodos estadísticos para la investigación 29 Dr. Raúl Siche UNT
  30. PRUEBAS ESTADÍSTICAS Mann – Whitney (Independientes) Pruebas No Paramétricas Prueba de Normalidad Datos del Experimento Distribución Normal Sin Distribución Normal Shapiro – Wilk n < 50 Kolmogorov – Smirnov n ≥ 50 Test de D´Agostino n ≥ 10 Transformación Pruebas Paramétricas 2 muestras k muestras Test de Tamhane Kruskal – Walis (Independientes) Wilcoxon (Relacionadas) Test de Friedman (Relacionadas) Comparación de medias Test de Homogeneidad de Varianzas Test de Levene Duncan y/o Tuckey Transformación 1 muestra Prueba T Kruskal – Walis ó Test de Friedman Si los datos vienen de muestras transformadas, se debe continuar con estos datos hasta el final del análisis estadístico. Si al menos un trat. es diferente 2 muestras Prueb T (Relacionada) Prueb T (Independ.) Kruskal – Walis ó Test de Friedman Si al menos un tratamiento es diferente 2 muestras Varianzas iguales k muestras ANOVA (1 Factor) K muestras Varianzas distintas Métodos estadísticos para la investigación 30 Dr. Raúl Siche UNT
  31. PRUEBAS PARAMÉTRICAS PRUEBA T Es la Prueba Paramétrica más poderosa que existe para determinar diferencia entre dos poblaciones (ó tratamientos), sin embargo requiere que los datos pertenezcan a una DISTRIBUCIÓN NORMAL y que LAS VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para varianzas distintas). ANOVA Requiere una DISTRIBUCIÓN NORMAL MODERADA (ROBUSTA), sin embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o el Test de Friedman (No Paramétricas) DUNCAN Y/O TUCKEY Pruebas de Comparaciones múltiples de medias, son robustas a la falta de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE VARIANZAS, caso contrario usar la Prueba Paramétrica de Tamhane. TAMHANE Pruebas Paramétrica de Comparaciones múltiples de medias, robusta a la falta de normalidad, no requiere que se cumpla la igualdad de varianzas. Métodos estadísticos para la investigación 31 Dr. Raúl Siche UNT
  32. PRUEBAS NO PARAMÉTRICAS WILCOXON Prueba No Paramétrica, cuya finalidad es la misma que la Prueba T para muestras relacionadas, por lo tanto requiere que los individuos sean los mismos en ambos tratamientos. MANN – WHITNEY Prueba No Paramétrica, cuya finalidad es la misma que la Prueba T para muestras independientes, por lo tanto NO requiere que los individuos sean los mismos en ambos tratamientos. FRIEDMAN Prueba de Comparación de medias para más de 2 poblaciones (tratamientos), cuyos individuo deben haber sido los mismos en todos los tratamientos. KRUSKAL – WALIS Prueba de Comparación de medias para más de 2 poblaciones (tratamientos), cuyos individuos no necesariamente deben haber sido los mismos en todos los tratamientos. Métodos estadísticos para la investigación 32 Dr. Raúl Siche UNT
  33. DISEÑO DE INVESTIGACIÓN Prueba de Homogeneidad de Varianzas • Uno de los pasos previos a la comprobación de si existen diferencias entre las medias de varias muestras es determinar si las varianzas en tales muestras son iguales (es decir, si se cumple la condición de homogeneidad de varianzas), ya que de que se cumpla o no esta condición dependerá la formulación que empleemos en el contraste de medias. • Test de Levene (valor de p = 0.05) Métodos estadísticos para la investigación 33 Dr. Raúl Siche UNT
  34. DISEÑO DE INVESTIGACIÓN Análisis de Varianza (ANOVA) • Idea básica Descomponer la variabilidad total en las partes asociadas a cada factor, más una residual (no justificables por los factores estudiados). Variabilidad total = Variabilidad debida a diferencias entre tratamientos + Variabilidad residual (diferencias dentro de cada tratamiento) • Usos:  Determinar si existen diferencias significativas entre tratamiento.  Evaluar si los factores tienen efecto significativo sobre las respuestas. • Nivel de significancia = 95% y valor de p = 0.05 Métodos estadísticos para la investigación 34 Dr. Raúl Siche UNT
  35. DISEÑO DE INVESTIGACIÓN Pruebas Pot Hoc • Pruebas que permiten determinar diferencias estadísticas entre muestras o tratamientos múltiples (más de dos). • Test de Tukey (Asumiendo varianzas iguales; p>0.05) • Test de Tamanhe (Asumiendo varianzas no iguales; p<0.05) Métodos estadísticos para la investigación 35 Dr. Raúl Siche UNT
  36. DISEÑO DE INVESTIGACIÓN Otros diseños • Diseños de Cuadrado Latino • Diseños Fraccionados • Diseños de Placket y Burman • Diseño Compuesto Central Rotable • Diseño de Mezclas • Diseños de Taguchi • Otros Métodos estadísticos para la investigación 36 Dr. Raúl Siche UNT
  37. DISEÑO DE INVESTIGACIÓN Programas a utilizar • Statistica 7.0 • SPSS v15 • Excel v 2010 • Otros Métodos estadísticos para la investigación 37 Dr. Raúl Siche UNT
Publicidad