• Compartir
  • Enviar por correo
  • Insertar
  • Me gusta
  • Guardar
  • Contenido privado
Introducción Al Diseño Experimental
 

Introducción Al Diseño Experimental

on

  • 7,913 reproducciones

 

Estadísticas

reproducciones

reproducciones totales
7,913
reproducciones en SlideShare
7,870
reproducciones incrustadas
43

Actions

Me gusta
0
Descargas
105
Comentarios
0

2 insertados 43

http://www.slideshare.net 36
http://wadar3.blogspot.com 7

Accesibilidad

Categorias

Detalles de carga

Uploaded via as Microsoft PowerPoint

Derechos de uso

© Todos los derechos reservados

Report content

Marcada como inapropiada Marcar como inapropiada
Marcar como inapropiada

Seleccione la razón para marcar esta presentación como inapropiada.

Cancelar
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Tu mensaje aparecerá aquí
    Processing...
Publicar comentario
Edite su comentario

    Introducción Al Diseño Experimental Introducción Al Diseño Experimental Presentation Transcript

    • INTRODUCCIÓN AL DISEÑO EXPERIMENTAL
      Curso de Estadística
      Prof. BalbinoGarcía Bernal
      WadiAdamesRomán
    • Introducción
      Durante esta presentación queremos estudiar las principales ideas que hacen falta para diseñar un experimento. El primer paso es decidir qué preguntas nos interesan. Esto es, qué es lo que queremos entender. Sin embargo, esta pregunta puede ser muy general, por lo cual muchas veces hay que simplificarla, o sea, especificarla.
    • La pregunta final debe ser lo suficientemente general para ser importante y lo suficientemente específica para que así algún experimento tenga posibilidades de contestarla.
      Hay que tener claro lo siguiente: las ideas que se estudian en un curso de Diseño Experimental tienen que ver con tomar una buena pregunta y convertirla en un buen experimento. Sin embargo la búsqueda de esa pregunta depende por entero del investigador.
    • Durante la siguiente presentación se utilizará el caso real de un experimento llevado a cabo por una estudiante de Biología, la cual deseaba comprender qué cambios en el medio ambiente de un animal lo inducen a comenzar el proceso de hibernación (esta era la Pregunta General).
    • AL MOMENTO DE PENSAR UN EXPERIMENTO
    • 1. Contenido
      En el proceso inicial de diseñar un experimento se distinguen tres preguntas que tienen que ver con el contenido del mismo:
      Los Tratamientos
      ¿Qué condiciones se van a estudiar?
      La Respuesta
      ¿Qué mediciones llevar a cabo?
      Las Unidades
      ¿Qué material experimental se utilizará?
    • En el caso del experimento sobre hibernación la investigadora decidió lo siguiente:
      Los Tratamientos
      Estudiar el efecto de los cambios en el fotoperiodo (i.e., el largo de los días). Recuérdese que en invierno los días son más cortos, lo cual hace de esto una selección razonable.
      La Respuesta
      Medir la concentración de la enzima Na+K+ATP-asa.
    • Ella decidió que iba a medir cambios en la actividad del sistema nervioso. Esta enzima se relaciona con la transmisión de impulsos nerviosos.
      El Material (Unidades): Se seleccionaron hamstersdorados.
    • Nota
      Nótese que estas decisiones aún no tienen que ver con la Estadística. Son obviamente importantes, pero dependen del conocimiento del investigador en su área de trabajo.
    • 2. Fuentes de Variabilidad
      Las fuentes de variabilidad en un experimento corresponden a las tres decisiones antes expuestas, o sea, a aquellas que tratan sobre el contenido.
      Variabilidad debida a las condiciones (se relaciona por tanto con los Tratamientos)
      Variabilidad en la Respuesta(errores de medición)
      Variabilidad debida al material (a las unidades)
    • Variabilidad debida a las condiciones (a los Tratamientos)
      Esta es la variabilidad que se desea estudiar en el experimento.
      En nuestro caso concreto se refiere al largo de los días. Evidentemente este número varía. No olvidemos que el propósito del experimento era ver precisamente cómo esta variación afecta la hibernación de los animales.
    • Variabilidad en la Respuesta(errores de medición)
      Esta variabilidad es indeseada pero esperada. Se refiere al hecho de que nunca dos mediciones resultan iguales, no importa que tanto se logren recrear las mismas condiciones en ambos casos.
      En el caso de nuestra investigadora, esta variabilidad se debía a:
    • las medidas en el espectrómetro (por ejemplo, cada vez que este se calibraba se introducía esta forma de variabilidad)
      obtención de tejido puro
      otras
    • Variabilidad debida al material (a las unidades)
      Este tipo de variabilidad también es indeseada pero esperada e inevitable.
      En nuestro caso, cada hámster es diferente del otro. No hay dos que sean idénticos.
    • Nota
      Un buen diseño permite saber aproximadamente la variabilidad que se debe a cada una de estas fuentes.
    • 3. Tipos de Variabilidad
      Distinguimos entre:
      Variabilidad Planeada y Sistemática – buena
      Variabilidad relacionada al chance (“Chance-Like” Variation) – tolerable
      Variabilidad Sistemática y NO Planeada – mala
    • Variabilidad Planeada y Sistemática (la queremos)
      Es precisamente lo que se desea estudiar. Incluye las diferencias debidas a las condiciones de interés.
      Las diferencias que se debían a los cambios en el largo de los días eran planeadas y sistemáticas.
      Cuando esta variabilidad está presente, la información tiende a asociarse en “grupos”.
    • Por ejemplo
    • El promedio para los de días largos es 1.59 mg/ml.
      El promedio para los de días cortos es 1.32 mg/ml.
    • Es importante que cuando la variabilidad sistemática es planeada, seamos capaces de decir de antemano qué valores esperamos que se agrupen.
      Por ejemplo, se le había asignado a cada hámster un tipo de día, largo o corto.
    • Nota
      La variabilidad puede ser sistemática y no planeada. Además, las fuentes de este tipo de variabilidad no siempre serán las condiciones de interés, ya que las diferencias debidas a las calibraciones y los hamsters son sistemáticas, pero no necesariamente deseadas o planeadas.
    • Variabilidad relacionada al chance “Chance-LikeVariation”.
      Con esta se puede vivir.
      Este tipo de variaciones se pueden entender si pensamos en uno que saca 100 números de una caja. Es imposible conocer de antemano qué número va a salir y si se repite el proceso es muy probable que se obtenga otro número. Sin embargo, hay un patrón detrás de este caos. O sea, cada número tiene una probabilidad de 1/100 de ser sacado de la caja.
    • Los resultados tienden a fluctuar alrededor de un valor específico, así como cuando se lanza una moneda, la probabilidad de que salga cara es 50%.
      Esta forma de variación generalmente tiene un componente no planeado (que llamamos el error en las mediciones (“measurement error”) y muchas veces hay un componente planeado.
    • Este error es como el ruido en una señal. No permite que la medida alcance su verdadero valor, aunque fluctúa alrededor del mismo. O sea, hay un patrón dentro del caos.
      Este error viene dentro de la realidad misma del experimento, por lo cual no es una equivocación de parte del investigador. Es inevitable.
    • La variación que se debe al chance conlleva dos propiedades que posibilitan la extracción de información útil:
      Algunos valores serán positivos y otros negativos. Entonces cuando se calculan promedios, tienden a cancelarse, al menos parcialmente. Por tanto, a mayor número de repeticiones, se estará más cercano al verdadero valor.
      Si el experimento se ha diseñado bien, se podrá estimar el tamaño de esta variación, y así se puede saber qué tan preciso puede ser este promedio.
    • Por tanto, para saber el tamaño típico de estos errores, hay que realizar más de una medida manteniendo constantes las condiciones.
      Así, en el experimento con hamsters, se realizaron las medidas muchas veces y siempre los valores fluctuaron alrededor de los 1.53 mg/ml para los de días largos y alrededor de los 1.39 mg/ml para los de días cortos. Solo entonces se podía concluir que la foto-periodicidad sí afecta el proceso de hibernación.
    • Variabilidad Sistemática y NO Planeada
      Esta puede destruir el experimento.
      Lleva a conclusiones equívocas.
      Esta variabilidad sesga (“bias”) los resultados, elevándolos o disminuyéndolos, muchas veces sin que el investigador se percate.
    • Para lidiar con esa variabilidad hay dos estrategias:
      “Blocking”
      esta convierte los sesgos en variaciones sistemáticas y planeadas
      Aleatorización
      esta torna los sesgos en variaciones planeadas de tipo “chance-like”
    • Ejemplos de sesgos
      Si a unos hamsters se les hubiera dado un trato preferencial sobre a otros.
      Si sus dietas hubieran sido diferentes, etc.
      Si las mediciones en los hamsters hubieran sido llevadas a cabo en tiempos muy apartados.
    • 4. Error en las Mediciones (“Measurement Error”)
      Todo experimento científico contiene “error”. Para medir o estimar este error, se deben realizar varias veces las mediciones manteniendo constantes las condiciones. Esto es, el experimento se debe repetir más de una vez. Estos errores, se suelen comportar de forma aleatoria. El análisis estadístico descansa sobre regularidades predecibles del comportamiento aleatorio (probabilidades).
    • Por ejemplo, los errores debidos al comportamiento aleatorio debido al chance tienden a moverse en direcciones opuestas y así cancelarse al calcular promedios.
    • 5. Sesgos (“Bias”)
      Estos errores tienden a ir todos en la misma dirección, provocando que cada medida del experimento sea mayor que su verdadero valor, o menor que el mismo.
    • ¿Cómo comparan el sesgo y el error por chance?
      Imaginemos que hay un francotirador con dos rifles: uno en buenas condicione y el otro con un defecto de fábrica, el cual él desconoce. Con el rifle bueno ocurre que la mayoría de los tiros rodean el centro del cartón, aunque no necesariamente dan todos en el mismísimo centro, mientras que con el otro cada disparo está lejos de la marca central. El caso del rifle bueno es el error debido al chance (a la izquierda en la figura), y el otro es debido a sesgos (a la derecha en la figura).
    • 6. Muestreo de la población
      Población
      Es todo el conjunto de valores sobre los que se desea conocer, alrededor de los cuales gira el experimento. O sea, el conjunto de todos los posibles resultados de interés.
      Muestra
      Conjunto (subconjunto de la población) que el investigador observa.
    • Parámetro (valor verdadero)
      Propiedad numérica de la población.
      Estadístico
      Propiedad numérica de la muestra.
    • En el caso de los hamsters, había dos poblaciones, una de hamsters criados durante días largos y otra de los que se crían durante los días cortos. (Aquí nos referimos a todos los hamsters del mundo.)
      Los que ellos criaron en el laboratorio, son las muestras tomadas de cada población.
    • Población es lo que deseas observar. Muestra es lo que puedes observar en la realidad.
      Se debe (al menos idealmente) tomar esta muestra aleatoriamente, de forma que todos los valores tengan el mismo “chance” de ser seleccionados.
      El proceso de selección de la muestra no es sesgado.
    • 7. Aislamiento de los efectos de interés
      Hay que controlar todo aquello que se pueda, y volver aleatorio todo lo demás.
      Volver aleatorio todo esto reduce el riesgo de que la variabilidad en el material parcialice (o sesgue) los resultados.
      Además, de esta forma la variabilidad se comporta de manera “chance-like”, lo cual permite confiar en las regularidades del comportamiento por “chance” al momento de analizar la información.
    • La Investigadora principal del trabajo sobre hibernación hizo precisamente esto. Cuando era posible, ella trataba de convertir la variación sistemática y no planeada en variabilidad sistemática planeada. Si esto no era posible, utilizaba un artificio de chance para tornar esa “mala” variabilidad en una de tipo debido al chance, que si recordamos bien, es la tolerable.
    • En resumen ella lo que hizo fue criar 4 hamsters con días cortos y 4 con días largos (realizando la selección mediante un artificio de chance), mientras todas las otras condiciones se mantenían constantes (lo más posible), como la dieta. Los cuatro seleccionados para días cortos recibían 8 horas de luz y 16 de oscuridad, mientras que los otros recibieron 16 horas de luz y 8 de oscuridad.
    • Principios de Diseño
    • Primer Principio de Diseño (Asignación Aleatoria)
      ¿A qué nos referimos al decir artificio de chance?
      La cuestión era cómo la investigadora debía escoger los hamstersde días cortos y los de días largos. Una forma podría ser la siguiente: escribir en 4 papeles la palabra “cortos” y en otros 4 la palabra “largos”. Luego habría que poner los papeles en una caja y mezclarlos bien. Entonces, tomando un hámster a la vez, ella debería sacar un papel de la caja y asignarle a ese hámster la condición que indique el papel.
    • Ella no necesariamente siguió esta técnica, pues las cajas con papeles no permiten bien el sorteo apropiado de los papeles, pero sirve para mostrar la idea.
       
      Nótese que no es suficiente con seleccionarlos al azar, o sea, escogiéndolos uno mismo pero al azar. Esto se debe a que el criterio de uno puede verse comprometido. El investigador sin darse cuenta podría seleccionar aquellos que le parecen más bonitos para los días largos. Esto, aunque parece una tontería, suele pasar y provoca sesgos en los resultados.
    • A este tipo de asignación se le llama Asignación Aleatoria.
      A esto se le conoce como Experimento de Base Factorial “Aleatorizado” (RBF por sus siglas en inglés).
      Como había la misma cantidad de hamsters para días cortos y para días largos, se dice que es un RBF balanceado (RBF[1]) o simple direccional.
    • Resumiendo
      Para un Experimento de Base Factorial “Aleatorizado” (RBF), el científico asigna tratamientos aleatoriamente a las unidades, considerando las unidades como intercambiables.
      En un RBF balanceado, cada tratamiento se asigna al mismo número de unidades.
    • ¿Qué se consigue con la asignación aleatoria?
      Primero:
      Convierte la variabilidad no planeada y sistemática en variabilidad debida al chance (“chance-likevariability”).
      Por tanto protege contra posibles sesgos. ¿Por qué?
    • Porque si hubiera algunos hamsters que tuvieran de forma natural una concentración mayor de la enzima, entonces al realizar esta asignación aleatoria, es muy factible (probable) que algunos de estos serán asignados a días cortos y otros a días largos.
      O sea, es poco probable que todos aquellos que por su naturaleza tienen una mayor concentración de la enzima, acaben asignados a días cortos (o largos).
    • Segundo:
      La aleatorización hace posible el análisis estadístico.
      Esto se debe a que al aleatorizar se obtienen dos tipos de errores debidos al chance:
      error en las mediciones – este tiende a comportarse como si fuera error debido al chance (“chance-like error”)
      error provocado por las unidades – se vuelve “chance-like” gracias a la asignación aleatoria
    • Segundo Principio de Diseño: Blocking
      Aquí se sortea o subdivide el material experimental en grupos (los bloques) de unidades similares. Luego se asignan condiciones a las unidades de manera separada dentro de cada bloque.
    • Ejemplo:
      Asumir que sabemos de una característica significativa que nos permita separar los 8 hamsters en grupos de dos, o sea en 4 grupos (bloques) y que realizamos esta separación antes de asignar los días largos y cortos. Entonces asignamos aleatoriamente dentro de cada bloque los días largos y cortos.
      A esto se le conoce como Diseño Completo de Bloques (CB).
    • Ventajas del Blocking
      Convierte la variabilidad sistemática y no planeada en variabilidad sistemática y planeada.
    • En resumen
      Para un experimento de Bloque Completo (CB, por sus siglas en inglés), primero se sortea elmaterial experimental en bloques que contengan unidades similares y luego se asignan aleatoriamente los tratamientos a unidades de forma separada en cada bloque, considerando las unidades en cada bloque como intercambiables.
      En cada bloque, cada uno de los tratamientos se asigna a una sola unidad.
    • Condiciones Experimentales y Observacionales
      Cuando las condiciones de interés pueden ser asignadas por el investigador, estas se llaman Condiciones Experimentales. Es lo que hemos llamado hasta ahora los Tratamientos.
      Ejemplo: días largos y cortos es algo que le podemos asignar a los hamsters.
    • De lo contrario se llaman Observacionales. Estas pertenecen ya a la realidad del experimento.
      Ejemplo: Si el estudio hubiera tratado con la siguiente pregunta (y lo hacía): ¿El largo de los días, afecta la concentración de la enzima en cerebros y corazones de la misma forma?
      Como los corazones y cerebros de los hamsters ya están en ellos, son Condiciones Observacionales.
    • Si es posible, es mejor que las condiciones sean experimentales, pues se puede aleatorizar. Esto es importante ya que el análisis estadístico depende en gran medida de la suposición de que los errores son de tipo “chance-like”, debidos al chance.
    • Tercer Principio de Diseño: Cruce Factorial
      Si se desean comparar los efectos de dos o más conjuntos de condiciones en un mismo experimento, estas se pueden “cruzar”, i.e., considerar el conjunto de todas las posibles combinaciones de tratamientos como las condiciones.
    • Interacción
      Recordemos la pregunta que planteamos hace un momento (que en realidad fue parte del experimento con hamsters): 
      ¿El largo de los días, afecta la concentración de la enzima en cerebros y corazones de la misma forma?
    • Este tipo de pregunta tiene que ver con Interacción. La idea es que hay una variación de dos conjuntos de condiciones envueltas: días largos vs. días cortos y corazones vs. cerebros.
    • La pregunta lo que indica es si la diferencia en respuesta debida a un conjunto de condiciones (foto-periodicidad) es la misma para cada una de las otras condiciones (corazones y cerebros).
      Es precisamente para este tipo de preguntas que nos sirve el Cruce Factorial.
    • Lo que se hace es que se incluyen todas las posibles combinaciones entre largo de los días y órganos como condiciones en el experimento:
      días largos y corazón
      días largos y cerebros
      días cortos y corazón
      días cortos y cerebros
    • Estas son ahora las condiciones, mientras que antes teníamos dos condiciones:
      días largos
      días cortos
      Todo lo demás se hace igual, aprovechando siempre al máximo la Asignación Aleatoria de condiciones (considerando ahora estas nuevas condiciones).
    • A este diseño se le conoce propiamente como RBF doble direccional (RBF[2]). Nótese que este también es balanceado, pues cada condición se asignó a dos hamsters.
    • En Resumen
      Se dice que dos factores en un diseño están Cruzados si todas las combinaciones posibles de niveles de los dos factores ocurren en el diseño. (Adelante veremos lo que son factores y niveles.)
      El tipo de diseño cruzado más sencillo es el RBF doble direccional, en el cual se asignan combinaciones de tratamientos a unidades de la misma forma que para el RBF simple direccional.
    • Diseño Split Plot/Repeated Measures(SP/RM)
      Primero se asignan los días largos y cortos de manera aleatoria. Luego se usa cada hámster dos veces, una para la medida de concentración en el cerebro y la otra para la medida en el corazón. Esto implica 16 mediciones.
    • O sea, tenemos:
      Dos condiciones a comparar: días cortos vs. largos. Se realizan todas las posibles condiciones, tal y como antes en el Diseño Factorial doble direccional.
      Un conjunto de condiciones (largo del día) se asigna a las unidades más grandes, de igual manera que en el Diseño RBF.
    • El otro conjunto de condiciones (órgano) se asocia con unidades más pequeñas (aquí serían partes de los hamsters, corazón y cerebro) de forma separada dentro de cada bloque, tal y como en un Diseño CB.
      Notar que una diferencia aquí es el considerar unidades de distinto tamaño.
    • Estructura de Factores
    • Recordemos que
      Tratamientos = Condiciones Experimentales
      Para poder hablar tanto de las condiciones experimentales como de las observacionales utilizamos la palabra Factor.
    • Factor
      Es una forma de “sortear” los valores observados en grupos de manera tal que cada observación pertenezca a uno y solo uno de estos grupos. A estos grupos se les llama los Nivelesdel Factor.
    • Ejemplo (para el caso del Diseño de Cruce Factorial)
      Factores
      Largo del día
      Órgano
      Niveles del Factor “Largo el día”
      Días cortos
      Días largos
    • Niveles del Factor “Órgano”
      Corazón
      Cerebro
      La lista entera de factores para un diseño se conoce como la Estructura de Factores.
    • Es importante notar que cada vez que se calculan promedios, se está trabajando con un grupo de valores observados, i.e., una Estructura de Factores. En el caso del experimento de los hamsters esta Estructura era posiblemente distinta a la presentada, y de hecho, podría haber una Estructura distinta (aunque relacionadas) a distintas etapas del experimento.
    • Tipos de Factores
      Factores Universales:
      Uno en el cual todas las observaciones entran en el mismo grupo o nivel. Este factor es para el gran esquema del diseño.
      Otro en el que cada observación pertenece a su propio grupo o nivel. Este factor es para el error residual.
    • Factores Estructurales
      Estos hacen que la estructura de un diseño difiera de otra estructura.
    • Se puede entender esto de la siguiente forma. Considérese el conjunto de todas las observaciones y todos sus subconjuntos. Como cada conjunto es subconjunto de sí mismo, aquí se tiene el primer Factor Universal. Ahora, cada observación (o elemento del conjunto) pertenece al conjunto sencillo donde ella es el único elemento. Esta sería el otro Factor Universal. Todas las otras colecciones de subconjuntos del conjunto inicial forman los Factores Estructurales.
    • Estructura de Factores para los Diseños presentados
    • RBF
      Para un Experimento de Base Factorial “Aleatorizado” (RBF por sus siglas en inglés), el científico asigna tratamientos aleatoriamente a las unidades, considerando las unidades como intercambiables.
      En un RBF balanceado, cada tratamiento se asigna al mismo número de unidades.
    • El más simple de los RBF, el BF[1] tiene un solo Factor Estructural, los tratamientos.
    • CB
      Para un experimento de Bloque Completo (CB, por sus siglas en inglés), primero se sortea las el material experimental en bloques que contengan unidades similares y luego se asignan aleatoriamente los tratamientos a unidades de forma separada en cada bloque, considerando las unidades en cada bloque como intercambiables.
    • En cada bloque, cada uno de los tratamientos se asigna a una sola unidad.
      El diseño CB[1], el más sencillo de los de Bloque Completo, posee dos factores estructurales :
      Un factor de interés (órgano)
      Un factor extraño o “nuisance factor” (hamsters)
    • RBF[2]
      Se dice que dos factores en un diseño están Cruzados si todas las combinaciones posibles de niveles de los dos factores ocurren en el diseño.
      El tipo de diseño cruzado más sencillo es el RBF doble direccional, en el cual se asignan combinaciones de tratamientos a unidades de la misma forma que para el RBF simple direccional.
    • El RBF doble direccional tiene tres factores estructurales:
      Dos factores de interés
      La interacción entre ellos.
      Para medir Interacción hay que tener más de una medida para cada combinación de niveles.
    • SP/RM
      El diseño “Split Plot/RepeatedMeasures”( SP/RM) tiene unidades de dos diferentes tamaños. Las unidades más grandes son bloques de unidades más pequeñas.
      Los niveles de un factor de interés (el “between-blocks factor”), se asignan a las unidades más grandes tal y como en el RBF.
    • Niveles de otro factor de interés, los factores entre-bloques, se asignan a las unidades más pequeñas de forma separada dentro de cada bloque, como se hace en el CB.
    • El SP/RM más sencillo tiene cuatro factores estructurales:
      Dos factores (cruzados) de interés
      La Interacción entre ellos
      Un factor extraño
    • Bibliografía
      George W. Cobb (1998) Introduction to Design and Analysis of Experiments. Springer