Muestreo y diseño de experimentos: tipos de muestreo y fuentes de sesgo
1. Muestreo y diseño de experimentos
Población: conjunto de Muestra: subconjunto de una
individuos o elementos que población seleccionada con el
cumplen ciertas objeto de que represente las
propiedades comunes propiedades de la población
Parámetro: función definida Estadístico: función
sobre los valores numéricos definida sobre los valores
de características medibles numéricos de una muestra
de una población
5. ¿Cuánta información hay que recoger?
Teniendo lo anterior n se puede calcular como:
2 2
n ≥ z /2
D2
Por el momento, vamos a considerar a z2/2 como un indicador del
porcentaje de confianza de que la media de la muestra se encuentre dentro
de la diferencia D que nosotros establecimos.
Generalmente se fija un nivel de significancia en el 5%, lo que significa
que queremos una confianza del 95% de que la muestra se encuentre
dentro de D del valor.
Estableciendo se utiliza una tabla de valores críticos de la variable normal
z, para encontrar z en el nivel /2=0.025. Así el valor de z para una
confianza del 95% es de
1.96
7. ¿Cuánta información hay que recoger?
Entonces,
n≥ (4.102 x 1.962) / 22 = 16.1
Se necesitan por menos 17 mediciones independientes de la tasa de
acercamientos para tener una confianza del 95% de que la tasa media
(muestral) medida se encuentra dentro de 2 acercamientos por hora del valor
promedio verdadero (poblacional).
Nota: n siempre de redondea hacia arriba
Para que la muestra sea representativa no basta que sea
de tamaño suficiente también debemos cuidar que no
esté sesgada.
9. Fuentes de sesgo
Sesgo de selección –muestras con diferente probabilidad de ser
consideradas.
La no respuesta ejem: individuos imposibles de encontrar o que no
proporcionan la información requerida.
El sesgo del observador
Efecto del orden –ejem: tratar o someter a prueba repetidamente a los
mismos sujetos.
Efectos de grupo – por ejemplo utilizar una misma camada.
Error de medida Error de muestreo
Error a partir de las imperfecciones Divergencia entre el
inevitables y la variabilidad del estadísitco muestral y el
proceso de medición. parámetro poblacional
Aleatorio Sistemático
Hay la misma probabilidad de Hay una mayor probabilidad
estar por arriba o por debajo
de estar o por arriba o por
del valor real. abajo del valor real.
17. ¿Qué tipo de muestreo elegir?
Los OBJETIVOS del estudio, la información preliminar y las condiciones del
sitio son los que determinan:
La posición y densidad de los puntos de muestreo
Tiempo de muestreo
Tipo de muestreo
Tratamiento subsecuente de las muestras
Requerimientos analíticos
Muchas veces es necesario un muestreo preliminar para poder planificar
un adecuado diseño de muestreo
Además de lo anterior, es necesario considerar que para muchos
estudios se tiene que tomar en cuenta la variabilidad TEMPORAL
épocas de muestreo
21. Diseño de experimentos
En general, los experimentos se usan para estudiar el desempeño de
procesos o sistemas.
Factores controlables
x1, x2, x3,...............Xn
Entradas Salida y
Proceso
En muchos casos, los
Z1, z2, z3, .............zn experimentos incluyen
Factores no controlables muchos factores,
además cada factor
Objetivos del experimentador:
puede tener varios
niveles.
1) Determinar variables de mayor influencia
2) Determinar relaciones o correlaciones entre las variables
24. Diseño de experimentos
puntuaci
puntuaci
puntuaci
puntuaci
ó
n
ó
n
ó
n
ó
n
G N GB TP C EC A C
palo pelota desplazamiento Bebida
Siguiendo el enfoque de un factor a la vez, la decisión sería seleccionar el
palo normal, cualquier pelota, desplazarse en carro y beber agua.
La desventaja principal es que no se considera ninguna INTERACCIÓN.
Un ejemplo de interacción en el ejemplo Palo grande
puntuaci
anterior se da entre el tipo de palo ya la
bebida. Con el palo grande, la bebida tiene palo normal
ó
n
un marcado efecto pero no lo tiene con el
palo normal. Agua cerveza
25. Diseño de experimentos
Un mejor enfoque para trabajar con varios factores y niveles es un
experimento factorial. Se trata de una estrategia experimental en la
que los factores se hacen variar en conjunto.
en conjunto
Supongamos que para el ejemplo anterior solo son de interés dos
factores: el tipo de palo y de pelota, con sus dos niveles cada uno.
Para el experimento factorial se usan todas las combinaciones posibles
de los niveles de ambos factores.
En este caso (dos factores con dos
GB TP
niveles) se tiene un diseño factorial 2 2.
1Palo grande con pelota de goma Tipo de pelota
2Palo grande con pelota de tres piezas
3Palo normal con pelota de goma PG C
2Palo normal con pelota de tres piezas
Tipo de palo
26. Diseño de experimentos
Comparaciones:
GB TP
GB TP
Tipo de pelota
Tipo de pelota
PG C PG C
Tipo de palo Tipo de palo
Efecto del palo Efecto de la pelota
GB TP
Tipo de pelota
PG C
Efecto de la interacción
Tipo de palo
palopelota
27. Diseño de experimentos
Si hay k factores, cada uno con dos niveles, se tendría un:
k
diseño factorial 2 .
Evidentemente, al aumentar el número de factores, aumenta con
rapidez el número de corridas o pruebas por hacerse.
Por ejemplo un experimento con 10 factores requeriría 1024 corridas.
Esto pronto se vuelve impracticable. Pero no es necesario siempre
probar todas las combinaciones, se puede llevar a cabo una variación
del diseño factorial en la que sólo se realiza un subconjunto de las
corridas = EXPERIMENTO FACTORIAL FRACCIONADO