2. Muestreo Aleatorio Simple (MAS)
1. Hipótesis Fundamental
Todo A OVA requiere que el muestreo de los individuos de una población
muestral o de un experimento sea estrictamente aleatorio (al azar).
Anti-ejemplo:
• tratamientos (T’s) con drogas para ratas control con ratas seleccionadas
pequeñas o grandes, no corresponde, pues no se obtendrá información imparcial
de los T’s.
2. Independencia
En un modelo Yi = µ + α + εi
el término del error es una variable aleatoria con distribución normal.
Falta de independencia:
• registros de pesos con una balanza mal calibrada
3. 3. Homogeneidad de Varianzas u Homocedasticidad
Se prueba que las varianzas de dos muestras son idénticas (test t para
igualdad de varianzas). La condición inversa (desigualdad de varianzas entre
muestras) se denomina heterocedasticidad.
Test de igualdad de medias con 2 muestras cuyas varianzas se supone iguales:
• Comparación de la composición química de la orina de simios (mg ácido glutámico
por mg de creatinina)
Tarea para mañana: probar si los chimpancés expulsan más ácido glutámico
en su orina que los gorilas.
ota: el estadígrafo t es función de … ¿qué?
4. 4. ormalidad
Se ha supuesto que los términos de error (εi) de los datos de cada muestra son
independientes, que la varianza de los εi de las muestras son iguales y que los
εi se distribuyen normal.
¿Qué ocurre cuando no existe normalidad?
• La falta de normalidad se corrige transformando los datos
• Si una transformación simple no resuelve el problema, entonces se aplica un test
no paramétrico.
5. Aditividad
Para A OVA de dos o más factores se prueba la hipótesis de aditividad, esto es, que no
existe interacción y que las componentes pueden descomponerse en un modelo aditivo,
por ejemplo.
Cuando existe interacción aquella puede deberse a múltiples causas (tratamientos)
5. 6. Transformaciones
Si los errores no se distribuyen normal, entonces existen dos posibles
soluciones, a saber:
• realizar un test no paramétricos (distribución libre) o
• transformar los datos de la variable a analizar.
uestro modelo aditivo es Yi = µ + α + εi
donde el término de error se distribuye normal.
Pero, podemos encontrar que los componentes del modelo son multiplicativos, esto es:Pero, podemos encontrar que los componentes del modelo son multiplicativos, esto es:
Yi = µ * α * εi
En este caso la hipótesis de normalidad y homocestacisidad se derrumban. En tal caso
los datos pueden ser log-transformados, por lo que el modelo será
Yi = log µ + log α + log εi
que es aditivo y homocedástico.
6. ¿Cuál es la justificación para transformar los datos?
- La escala de números reales no es la única, pero estamos acostumbrados a ella.
- Sin embargo, debemos acostumbrarnos a la idea que en la naturaleza existen otras
escalas (variables que se mueven en otras escalas, tal como log10, loge, …)
Ejemplos de distribución loge-normal:
• dendidad de huevos de peces en el mar (n°/m2)
• contenido estomacal en peces carnívoros (peso/estómago)
• densidad de langostinos (ton/km2)
• etc.• etc.
Ejemplo: cpue (ton / km2)
Cuando se aplica una transformación a los datos originales, entonces los tests se
aplican sobre los datos transformados (aunque luego la media y la varianza son
informados en la escala no transformada).
8. Muestreo Aleatorio Simple (MAS)
MAS es un método de selección de n unidades sacadas de , de tal manera
que c/u de las muestras, Cn, tienen la misma oportunidad de ser escogidas.
MAS se denomina a veces muestreo aleatorio.
¿Cuál es el propósito del muestreo? Obtener …
- promedio (ejemplo: nº promedio de niños por escuela);
- total (ejemplo: total de hectáreas de trigo en una región)
- varianza (ejemplo: nº promedio de niños por escuela);- varianza (ejemplo: nº promedio de niños por escuela);
- fracción de dos totales o medias (dinero disponible sobre el total);
- fracción de unidades que caen dentro de un intervalo definido (nº de
personas con prótesis sobre el total).
El método de estimación es insesgado si el promedio del estimador, tomado
sobre todas las muestras posibles de un tamaño dado, es exactamente igual
al valor verdadero de la población. Esto será cierto, entonces, para
cualquier población de valores finitos yi para cualquier n.
9. MAS (continuación)
El símbolo t es el valor del desvío normal correspondiente a la probabilidad
de confianza deseada (P). Los valores más comunes son:
P : 50 80 90 95 99
t : 0,67 1,28 1,64 1,96 2,58
Validez de la aproximación normalValidez de la aproximación normal
Para cualquier población que tiene una desviación finita estándar, la
distribución de la media muestral tiende a la normalidad conforme n
aumenta. Entonces,
¿qué tan grande debe ser n en la población muestral para que la aproxima-
ción normal sea suficientemente exacta?
10. MUESTREO ALEATORIO ESTRATIFICADO (MAE)
En el muestreo estratificado la población de unidades es primero dividida
en subpoblaciones o estratos de 1, 2, L unidades, respectivamente, y
juntas forman la totalidad de la población, por lo que
1 + 2 + L =
El muestreo dentro de cada estrato i se realiza independientemente de otro
estrato. Entonces, se realiza un MAS dentro de cada estrato, denominándoseestrato. Entonces, se realiza un MAS dentro de cada estrato, denominándose
MAE.
¿Por qué o cuándo se estratifica?
- ante poblaciones muy grandes y muy variables (heterogéneas);
- mejorar (aumentar) la precisión de los estadígrafos (prom, varianza, …);
- la muestra de cada estrato será nL
11. MAE (continuación)
Entonces,
nL = L
n
Esto es, la fracción de muestreo es la misma en todos los estratos, por lo que
nL = nnL = n
L
El promedio y la varianza se estiman para cada estrato.
¿Y para el total? Venga al interesante Práctico de mañana.
12. ¿A propósito de qué todo esto de MAS y MAE?
DISEÑO EXPERIME TAL
13. Diseño experimental (cont.)
¿Cuál es le propósito?
1. Proporcionar estimadores de los efectos de los tratamientos (T) o
diferencias entre los efectos de los T’s.
2. Proporcionar, de manera eficiente, la confirmación o negación de las
conjeturas acerca de los T’s.
3. Asignar confiabilidad a los estimadores y pruebas.3. Asignar confiabilidad a los estimadores y pruebas.
4. Estimar la variabilidad del material experimental.
5. Aumentar la precisión.
6. Proporcionar un patrón sistemático eficiente para conducir un
experimento.
14. Diseño experimental (cont.)
En el diseño experimental (o diseño de experimento), la variación entre las
unidades experimentales sujeta al mismo tratamiento se denomina error
experimental.
REPLICAS
Repetición del experimento para obtener el error.