I2

288 visualizaciones

Publicado el

,,mnbvc

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
288
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
6
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

I2

  1. 1. FACULTAD DE CIENCIAS BIOLÓGICAS, BIO-242C BIOESTADÍSTICA, 2008 PRUEBA 2Pregunta 1 (11 puntos). En estudios de especies silvestres en peligro es frecuente estimar el nivelde stress de los individuos a factores ambientales a partir del nivel de la hormona cortisol en lasangre. Dada la dificultad de obtener muestras de sangre en estudios en terreno, se ha planteadoque el nivel de cortisol también podría ser estimado a partir de las heces, las que son más fáciles deobtener y menos invasivas. Para poder estimar los niveles de cortisol en base a las heces esnecesario demostrar que los niveles de cortisol en la sangre afectan los niveles de esta hormona enlas heces. El Prof. Mauricio Soto midió los niveles de cortisol en la sangre (ng mL-1) y en las heces(ng g heces-1) a 17 ejemplares del roedor O. degus. El Prof. Mauricio Soto decidió realizar un análisisde regresión lineal simple y los datos están en la Figura 1.(a) Agregue el nombre y unidades a los ejes (2 puntos); (b) (3 puntos) indique en el espacio a laderecha de la figura si es necesario agregar algún otro elemento para completar la figura (justifiquepor qué si o no); de ser así, agréguelo a la figura. Se trata de un análisis de regresión que involucrauna dependencia matemática lineal entre las dos variables. Por lo tanto se debe mostrar la línea deregresión del modelo que está detrás. 600Cortisol heces (ng g heces )-1 500 400 300 200 R2 = 0.559 100 P = 0.0005 0 0 400 800 1200 1600 2000 -1 Cortisol sangre (ng mL )(c) (3 puntos) Indique cuál sería la conclusión biológica que el Prof. Soto debería extraer luego deeste análisis; indique sobre qué información se basaría esta conclusión.El análisis sugiere una dependencia matemática lineal estadísticamente significativa (P<0,05) entrelas variables, lo que indica que el cortisol en la sangre es un buen predictor del cortisol en las heces.Esto, por lo tanto da validez a la idea de utilizar el cortisol fecal para estimar el stress en especies enpeligro en su ambiente natural.(d) (3 puntos) Explique qué señala el valor de R de la figura 1 en este caso e indique si sería másadecuado o no indicar el valor al cuadrado de R. De ser así, indique por qué.R indica el tipo (positiva o negativa) y grado de correlación entre las dos variables examinadas. Por lotanto, es más apropiado reportar el valor de R2 por que este indica el % de la variación en cortisolfecal que es explicado por variaciones en el cortisol de la sangre bajo el supuesto de un modelomatemático lineal usado en el análisis de regresión usado.
  2. 2. Pregunta 2 (15 puntos). Cuando el Prof. Soto intentó publicar sus resultados, descritos en lapregunta 1, un revisor anónimo lo criticó e indicó que era necesario que realizara un análisis deresiduos. Ansioso por responder a esta crítica, el Prof. Soto realizó el análisis adicional y losresultados aparecen en la Figura 2.(cortisol heces obs - cortisol heces esp) 200 Figura 2 150 100 50 Residuos 0 -50 -100 R=0,01 -150 P=0,98 -200 0 200 400 600 800 1000 1200 1400 1600 1800 -1 Cortisol sangre (ng mL )(a) Agregue el nombre y unidades a ambos ejes (3 puntos)(b) (4 puntos) explique en qué consiste y para qué sirve un análisis de residuos, y por lo tanto quéargumento habría usado el revisor anónimo para solicitar al Prof. Soto un análisis como este.El análisis de residuos consiste en realizar una regresión entre la variable independiente (X) original ylas diferencias entre los valores observados y esperados (por la línea de regresión) de la variablerespuesta (dependiente). Se utiliza para determinar el supuesto del análisis de regresión de acuerdoal cual los errores observados en Y son homogéneos (constantes) a lo largo del rango de valoresmedidos de X.El revisor simplemente considero que este supuesto del análisis de regresión podría no habersecumplido en el análisis del Prof. Soto.(c) (4 puntos) En base a los resultados del análisis de residuos realizado, cuál sería la conclusiónestadística y argumento final del Prof. Soto al momento de responder a la crítica del revisor anónimo.La observación de que el valor de P observado es muy superior a 0,05 indica que no existe unarelación matemática significativa entre la variable independiente y los residuos de la variabledependiente. Esto sugiere que los residuos no cambian a lo largo del rango de valores medidos de Xy que el supuesto de homogeneidad de los errores se cumple.(d) (4 puntos) Suponga ahora que el Prof. Soto hubiese encontrado que los valores de R y P fuesen0,86 y 0,02 respectivamente. Tendría el Prof. Soto que modificar el análisis inicial realizado entre elcortisol de la sangre y las heces. De ser así indique por qué e indique al menos dos alternativas queusted crea apropiadas.Si, pues ello indicaría que los residuos (la diferencia entre el valor de Y observado y la recta)aumentan a valores más grandes de X en forma significativa. Las alternativas incluyen (i) transformarlos datos (e.g., usando logaritmo) seguido del mismo análisis de regresión lineal; (ii) utilizar unmodelo de regresión no lineal. 2
  3. 3. Pregunta 3 (12 puntos). Una segunda crítica realizada al Prof. Soto y su estudio de validación deluso de cortisol en las heces por parte de este revisor anónimo fue que el hecho de que algunosanimales (n = 5) podrían haber estado reproductivamente activos mientras que otros no, algo quepodría haber afectado los resultados. Ya que el Prof. Soto nunca reprobó el BIO 242C, ayúdelo (a) (3puntos) indicando qué análisis sería el más adecuado en este caso. Además, indique claramentecómo usaría las variables en este caso.(a) La manera de examinar esto es un ANCOVA donde el cortisol en las heces sigue siendo lavariable respuesta, pero el cortisol en la sangre es ahora una covariable; el estado reproductivo (dosniveles) sería un factor discretoSuponga que un arranque de creatividad el Prof. Soto examinó los datos y encontró lo siguiente:Fuente de variación SC GL CM F obs PA: Estado reproductivo 2424,30 1 2424,30 0,22 0,646B: Cortisol sangre 73572,30 1 73572,30 6,72 0,022AxB 9109,60 1 9109,60 0,83 0,378Error 142289,50 13 10945,35(b) (2 puntos) Identifique las fuentes de variación en la tabla, suponiendo que el análisis del Prof.Soto no apoya la crítica del revisor.En la Figura 3 se muestran los datos originales del Prof. Soto, pero esta vez tomando en cuenta elestado reproductivo de los animales. 600 ReproductivosCortisol heces (ng g heces ) No reproductivos-1 500 400 300 200 100 0 0 400 800 1200 1600 2000 -1 Cortisol sangre (ng mL )(c) (3 puntos) rotule la leyenda de los puntos y agregue cualquier elemento que falte para completarla figura 3, de acuerdo a los antecedentes que ya conoce de este estudio. Tomando en cuenta losresultados estadísticos anteriores, (d) (4 puntos) indique qué puede concluir sobre la relaciónmatemática entre los niveles de cortisol en la sangre y heces, en animales con distinta condiciónreproductiva (nota: justifique esto con fundamentos estadísticos claros y precisos).(c) Los puntos negros corresponden a los animales reproductivos; las líneas de regresión en estecaso deberían dibujarse paralelas debido a que este factor no tiene efecto. (d) Dado que el análisisindica un efecto de la covariable (cortisol en la sangre) pero no una interacción con el estadoreproductivo, el efecto de los niveles de cortisol en la sangre sobre los niveles de cortisol en las hecesno es afectado por el estado reproductivo de los animales estudiados. 3
  4. 4. Pregunta 4 (18 puntos). Un estudio tuvo como objetivo principal evaluar el efecto de laestacionalidad climática (a través de sus efectos sobre la vegetación) sobre el tiempo asignado porun roedor a forrajeo, vigilancia erguida (posado sobre las extremidades posteriores) y vigilanciasimple (posado sobre las cuatro extremidades). Para ello, y para cada animal observado se registró elporcentaje de tiempo que estos estuvieron realizando cada una de estas tres actividades, en cuatroestaciones distintas y a lo largo de dos años (Nota: suponga que los animales registrados en distintasestaciones son también diferentes).(a) (4 puntos) Justifique estadística y biológicamente la prueba estadística (o procedimiento) queutilizaría, cómo incluiría cada variable en el análisis, y si podría ser necesario realizar algún tipo deajuste o modificación a los datos antes del análisis.Biológicamente, es muy claro que las variables respuesta medidas podrían estar relacionadas pues eltiempo que el animal destina a una actividad podría aumentar o disminuir el tiempo que destina a lasotras. Esto implica que análisis por separado para cada variable aumentaría la posibilidad de cometererror tipo I. La solución entonces es MANOVA de modo que las variables tiempo de forrajeo, tiempode vigilancia erguida y vigilancia simple serían tres variables respuesta. La estacionalidad sería elúnico factor, en este caso con 4 niveles. Por último, dado que los datos corresponden a %, podría sernecesario su transformación usando la transformación arcoseno de la raíz cuadrada.Consultado el Prof. Soto, a quien usted ayudó, este ahora le recomendó un curso de acción y cuyosresultados están a continuación. Fuente de variación SC GL CM F obs F crítico Estadígrafo F observado F crítico Variable respuesta: ForrajeoWilks 0,82 1,608 1,93 A: Estacionalidad 145,10 3 48,37 0,22 2,73Pillais 0,18 1,581 1,92 Error 16609,80 74 224,46Hotelling 0,21 1,622 1,92 Fuente de variación SC GL CM F obs F críticoRoys 0,17 4,225 2,73 Variable respuesta: Vigilancia erguida A: Estacionalidad 946,49 3 315,50 3,84 2,73 Error 6074,88 74 82,09 Fuente de variación SC GL CM F obs F crítico Variable respuesta: Vigilancia simple A: Estacionalidad 233,40 3 77,80 0,65 2,73 Error 8805,68 74 119,00(b) (3 puntos) Explique la recomendación del Prof. Soto, particularmente por qué, a juzgar por elnúmero de tablas, realizó 4 análisis en este caso.El MANOVA inicial solo permite apreciar si el factor (estacionalidad) tiene algún efecto en al menosuna de las variables repuesta examinadas. Por lo tanto, y dado que al manos uno de los estadígrafosdel MANOVA sugiere un efecto, es necesario realizar ANOVAS para cada variable por separado paradeterminar qué variables estarían siendo afectadas por la estacionalidad.(c) (2 puntos) Suponiendo que la recomendación del Prof. Soto sea la correcta, complete lostérminos que faltan en las tablas anteriores. 4
  5. 5. El Prof. Soto. sostiene además que para el análisis realizado antes es importante determinar laposible correlación entre las variables estudiadas. Los valores de R y P para cada correlaciónexaminada están en la siguiente tabla.Correlación examinada Valor de R Valor de PForrajeo vs. vigilancia erguida -0,13 0,270Forrajeo vs. vigilancia simple -0,61 0,001Vigilancia erguida vs. vigilancia erguida -0,05 0,624(d) (3 puntos) Explique con fundamentos claros por qué el Prof. Soto estaría tan interesado enevaluar estas correlaciones.Debido a que un supuesto importante del MANOVA es que las varianzas y covarianzas entre lasvariables respuesta examinadas deben ser iguales (homogéneas). El incumplimiento de estesupuesto afecta algunos estadígrafos del MANOVA, particularmente el de Roy, lo que podríaentonces afectar las conclusiones del análisis.(e) (6 puntos) Indique entonces cuáles serían las conclusiones estadística y biológica finales que sepueden extraer luego de considerar los análisis realizados por el Prof. Soto.Estadística (4/6 puntos):A pesar de que el MANOVA indica un efecto sobre al manos una de las variables examinadas, ello sedebe a un valor significativo para el estadígrafo de Roy. Dado que las correlaciones entre lasvariables no son similares, el supuesto de homogeneidad de varianzas y covarianzas probablementeno se cumple. En estas circunstancias no es posible entonces “confiar” en el estadígrafo de Roy. Yaque los otros tres estadígrafos del MANOVA indican que no hay efecto de la estacionalidad, debemosoptar entonces por no rechazar la hipótesis nula inicial.Biológica (2/6 puntos):Por lo tanto, no hay evidencia que indique que la estacionalidad afecta el tiempo asignado por estosroedores a forrajear, vigilar en forma simple o erguida.Pregunta 5 (14 puntos). Darwin planteó la hipótesis de que la fertilización cruzada (entre plantasdistintas) proporciona mayores beneficios reproductivos comparado con la auto-fertilización. Dadoque el riesgo potencial de auto-fertilización aumenta con el tamaño de las plantas (mayor en árboles,intermedio en arbustos, bajo en hierbas), sería esperable entonces una relación entre el sistema floraly el tamaño de las plantas. No solo eso, en plantas grandes como los árboles sería esperable unamayor ocurrencia de flores masculinas y femeninas separados en individuos distintos (especiesdioicas). Un estudio examinó la flora nativa de la isla de Tasmania y contabilizó la ocurrencia deespecies dioicas, monoicas (flores masculinas y femeninas distintas pero en una misma planta) yhermafroditas (flores con partes femeninas y masculinas juntas en un mismo individuo). Losresultados fueron los siguientes: 19 hierbas dioicas; 102 hierbas monoicas; 379 hierbashermafroditas; 31 arbustos dioicos, 30 arbustos monoicos, 88 arbustos hermafroditas; 12 árbolesdioicos; 40 árboles monoicos; 56 árboles hermafroditas.(a) (4 puntos) Explique brevemente el análisis estadístico que debe realizar, indicando cómo usaría 5
  6. 6. las variables y número de niveles en cada una para evaluar la hipótesis de Darwin con estos datos.No olvide indicar claramente la hipótesis nula.Se requiere examinar una relación entre el tamaño de las plantas (variable independiente con tresniveles o categorías) y el sistema floral (variable dependiente con tres niveles o categorías) medianteuna tabla de contingencia por tratarse de variables discretas. La hipótesis nula es no hay una relaciónentre ambas variables, o que el sistema floral es independiente del tamaño de las plantas.(b) Utilice este espacio que sigue para calcular el valor observado de la estadística apropiada en estecaso (utilice la más conocida) (5 puntos), cómo derivaría el valor esperado (= 9,49 en este caso; 1punto), e indique la conclusión estadística en este caso (1 punto).Tamaño Sistema floral Total Fi Dioico Monoico HermafroditaObservadoHierbas 19 102 379 500Arbustos 31 30 88 149Árboles 12 40 56 108Total Ci 62 172 523 757EsperadoHierbas 41 114 345 500Arbustos 12 34 103 149Árboles 9 25 75 108Total Ci 62 172 523 757Obs-Esp -21,95 -11,61 33,56Obs-Esp 18,80 -3,85 -14,94Obs-Esp 3,15 15,46 -18,62 2(Obs-Esp) 481,85 134,71 1126,10 2(Obs-Esp) 353,31 14,86 223,26 2(Obs-Esp) 9,95 239,04 346,54 2(Obs-Esp) /Esp 11,77 1,19 3,26 2(Obs-Esp) /Esp 28,95 0,44 2,17 2(Obs-Esp) /Esp 1,13 9,74 4,64Valor observado de chi-cuadrado = 63,28Valor crítico de chi-cuadrado para alfa de 0,05 y 4 gl = 9,49Conclusión estadística: existe una asociación significativa entre el tamaño de las plantas y elsistema floral(c) En base resultado final y a los cálculos realizados, indique si la hipótesis de Darwin es o nocorrecta y si las predicciones planteadas inicialmente son válidas (3 puntos).Primero, la dependencia estadística entre el tamaño y el sistema floral indica que ambas variables 6
  7. 7. están relacionadas, lo que concuerda con la predicción general de la hipótesis de Darwin (1 punto).En cuanto a la predicción específica de una mayor frecuencia de especies dioicas en plantasgrandes, esto también se cumple si se observa que la frecuencia de árboles dioicos es mayor que loesperado (desvíos positivos). A la inversa, la frecuencia de árboles hermafroditas es menor que loesperado (desvíos negativos) (2 puntos) 7

×