Muestreo y diseño de experimentos: tipos de muestreo y fuentes de sesgo

Muestreo y diseño de experimentos
Población: conjunto de Muestra: subconjunto de una
individuos o elementos que población seleccionada con el
cumplen ciertas objeto de que represente las
propiedades comunes propiedades de la población

Parámetro: función definida Estadístico: función
sobre los valores numéricos definida sobre los valores
de características medibles numéricos de una muestra
de una población

El tamaño de la población no es relevante para la
estadística inferencial, sino el tamaño de la muestra

Si las inferencias para la población a partir de la muestra han de ser válidas,
es importante obtener muestras representativas de la población.

En este sentido, lo mejor es recoger la mayor cantidad posible de datos. Sin
embargo el aumento de tamaño de muestra para acumular cada vez más
resultados, termina por alcanzar un punto donde ya no da más ventajas.

Cuando se han obtenido resultados
suficientes, la obtención de datos
adicionales puede aumentar poco la
posibilidad de obtener más
conclusiones o tener conclusiones
diferentes.

¿Cuánta información hay que recoger?

1. Coherencia interna.

Un procedimiento burdo pero sencillo de comprobar si se han recogido
suficientes datos consiste en dividir los datos de manera aleatoria en dos
mitades y analizar cada mitad por separado. Si los dos grupos de datos
generan conclusiones claras que son coherentes entre sí, entonces podemos
considerar que se tienen resultados suficientes.


2. Estimación del tamaño necesario de la muestra.

Si nos interesa estimar un parámetro de la población, podemos estimar el
tamaño necesario de la muestra para obtener un valor medio muestral que
se encuentre dentro de los límites especificados del valor promedio
verdadero (poblacional), siempre y cuando contemos con algunas
mediciones piloto para dar una estimación de la desviación estándar de la
población.

Para estimar n se requiere:
1. Estimar la desviación estándar de la población

2. Asignar el nivel de significancia estadística para la estimación

3. Asignar la diferencia máxima aceptable (D) entre la media de
la muestra y la media real.
D= | x |


Teniendo lo anterior n se puede calcular como:

2 2
n ≥  z /2

D2
Por el momento, vamos a considerar a z2/2 como un indicador del
porcentaje de confianza de que la media de la muestra se encuentre dentro
de la diferencia D que nosotros establecimos.

Generalmente se fija un nivel de significancia  en el 5%, lo que significa
que queremos una confianza del 95% de que la muestra se encuentre
dentro de D del valor.

Estableciendo se utiliza una tabla de valores críticos de la variable normal
z, para encontrar z en el nivel /2=0.025. Así el valor de z para una

confianza del 95% es de
1.96


Ejemplo:

Un observador desea estimar la frecuencia media con que las crías de mono
rhesus de una cierta edad se acercan a sus madres. 1  9
2  12
1. Se realizó un estudio piloto: 6 períodos de 1 3  7
hora de observación. Registrando la tasa de 4  15
acercamientos (número de acercamientos por 5  13
6  4
hora).

2. Se estimó la desviación estándar de los datos.         = 4.10 h1

3. Se asignó una D= 2 h1 , es decir, el investigador requiere que la
diferencia entre la media de la muestra y la de la población no sea mayor a
dos acercamientos por hora (un poco menos de la mitad de la DE).

4. Se fijó el nivel de significancia () en al 5%.


Entonces,
n≥ (4.102 x 1.962) / 22 = 16.1

Se necesitan por menos 17 mediciones independientes de la tasa de
acercamientos para tener una confianza del 95% de que la tasa media
(muestral) medida se encuentra dentro de 2 acercamientos por hora del valor
promedio verdadero (poblacional).
Nota: n siempre de redondea hacia arriba

Para que la muestra sea representativa no basta que sea
de tamaño suficiente también debemos cuidar que no
esté sesgada.

Muestra aleatoria

Si se eligen las muestras de forma arbitraria corremos el riesgo de hacer
inferencias erróneas como sobrestimar o subestimar alguna característica de
la población. Para eliminar sesgos es conveniente seleccionar una muestra
aleatoria con observaciones independientes y al azar.

Muestra al azar – aquella en la que todos y cada uno de los
miembros de la población tienen la misma probabilidad de ser
seleccionados.

Tener una muestra representativa no es trivial, necesitamos realizar un adecuado
diseño de muestreo

Muestreo probabilístico

Fuentes de sesgo

Sesgo de selección –muestras con diferente probabilidad de ser
consideradas.
La no respuesta ejem: individuos imposibles de encontrar o que no
proporcionan la información requerida.
El sesgo del observador
Efecto del orden –ejem: tratar o someter a prueba repetidamente a los
mismos sujetos.
Efectos de grupo – por ejemplo utilizar una misma camada.

Error de medida Error de muestreo
Error a partir de las imperfecciones Divergencia entre el
inevitables y la variabilidad del estadísitco muestral y el
proceso de medición. parámetro poblacional

Aleatorio Sistemático
Hay la misma probabilidad de Hay una mayor probabilidad
estar por arriba o por debajo
de estar o por arriba o por

del valor real. abajo del valor real.

Tipos de muestreo

Muestreo aleatorio simple

Es el muestreo más simple, las unidades de muestreo (elementos
individuales de la población de estudio) se eligen independientemente una a
la vez y cada una tiene la misma probabilidad de ser elegida.
Así para elegir una muestre aleatoria simple tenemos que listar y numerar
cada unidad de estudio y elegirlas al azar, es conveniente utilizar series de
números aleatorios para evitar sesgos.

Ejemplo:

1        2      3        4       5       6         7         8
Una parcela se divide en
  9      10     11      12     13      14     15       16
cuadrantes, se numeran y se
eligen n cuadros al azar (tablas
17     18      19     20     21     22      23        24 de números aleatorios).

25     26      27     28     29      30      31      32

Tipos de muestreo

Muestreo sistemático

Es semejante al muestreo aleatorio pero más fácil de aplicar en la práctica.
Teniendo la lista de las posibles unidades de estudio, se puede elige un solo
número aleatorio y con éste se van eligiendo de forma consecutiva las
unidades de estudio.
Lo importante es que la muestra se distribuye uniformemente a lo largo de la
población entera.

Ejemplo:

v
Sistemático rectangular de área
en el centro

Tipos de muestreo

Sistemático en red no
rectangular

v
Sistemático a lo largo de una
fuente lineal

v

Tipos de muestreo

Muestreo estratificado

Este tipo de muestreo nos permite dividir a la población en H diferentes
subgrupos o estatos, de forma que cada grupo tiene un tamaño nH.
Nos sirve cuando en la población de estudio podemos reconocer grupos con
características distintivas, las cuales pueden sesgar la inferencia en un
muestreo aleatorio simple.
Por cambios en la densidad Por cambios en el paisaje
poblacional
v

v

v

Tipos de muestreo

El muestreo estratificado garantiza que todos los estratos estén
representados. Sin embargo, esto no significa que todas las unidades de
estudio tengan la misma posibilidad de elección.
Ya que ciertos grupos pequeños de la población podrían
muestrearse en exceso, en comparación con grupos más grandes.

Cuando se aplica este muestreo, la media poblacional se estima como un
promedio ponderado(tamaño del estrato) de las medias de muestreo del
estrato específico. La varianza se calcula como el promedio ponderado de
las varianzas entre estratos.

Tipos de muestreo

Muestreo de grupo

Se utiliza cuando las unidades de estudio forman grupos naturales, o si una
lista adecuada de la población entera es muy difícil de compilar.

El muestreo implica la selección aleatoria de grupos y la observación de
todas las unidades de estudio entre los grupos elegidos.

Muestreo de dos etapas – se elige una muestra aleatoria de grupos y
enseguida, dentro de cada grupo, se selecciona una muestra aleatoria de
unidades de estudio.

Tipos de muestreo

Muestreo no probabilístico

Se desconoce la probabilidad de que un individuo sea incluido en la muestra.
Por ejemplo, muestras de eventos incontrolados.

Tipos de muestreo no probabilístico:

a) Muestreo por Juicio, Selección Experta o Selección Intencional: El investigador
Muestreo por Juicio, Selección Experta o Selección Intencional
toma la muestra seleccionado los elementos que a él le parecen representativos.
Depende del criterio del investigados.

b) Muestreo casual o fortuito: cuando no es posible seleccionar los elementos, y
Muestreo casual o fortuito
deben sacarse conclusiones con los elementos que estén disponibles.

c) Muestreo de cuota: Se utiliza en estudios de opinión de mercado. Los
Muestreo de cuota:
enumeradores, reciben instrucciones de obtener cuotas especificas a partir de las
cuales se constituye una muestra relativamente proporcional a la población.

d) Muestreo de poblaciones móviles

¿Qué tipo de muestreo elegir?

Los OBJETIVOS del estudio, la información preliminar y las condiciones del
sitio son los que determinan:

La posición y densidad de los puntos de muestreo
Tiempo de muestreo
Tipo de muestreo
Tratamiento subsecuente de las muestras
Requerimientos analíticos

Muchas veces es necesario un muestreo preliminar para poder planificar
un adecuado diseño de muestreo

Además de lo anterior, es necesario considerar que para muchos
estudios se tiene que tomar en cuenta la variabilidad TEMPORAL
épocas de muestreo

Más tipos de muestreo....

Estudios de etología

1) Muestreo ad libitum. el observador decide que registra, cuando y por
cuanto tiempo. Generalmente se usa cuando se ve por primera vez una
población o una cierta pauta conductual (unidad de estudio).

2) Muestreo focal. Se observa a un solo individuo, o a una sola nidada,
camada o grupo durante un determinado período de tiempo. Es útil cuando
se observan poblaciones muy grandes.

3) Muestreo de barrido. A intervalos regulares de tiempo se explora o
censa rápidamente a un grupo completo de individuos, registrando la
conducta de cada individuo al instante de la medición.

4) Muestreo por conducta. el investigador observa el grupo completo y
registra cada ocasión en que se produce un tipo concreto de
comportamiento o pauta conductual.

Más tipos de muestreo....

Tipos de medidas:

a) Latencia. tiempo que transcurre entre la aparición de un determinado
suceso y el momento en que se produce la primera aparición de la pauta
conductual.

b) Frecuencia. número de veces que aparece la pauta conductual por
unidad de tiempo.

c) Duración. Cantidad de tiempo durante el cual se prolonga la aparición
del comportamiento.

d) Intensidad. A diferencias de las anteriores no tiene una definición
universal, depende del tipo de comportamiento que se estudie. Una medida
de intensidad muy utiliada es la TASA LOCAL: número de actos discretos
componentes de una pauta conductual por unidad de tiempo. Ejemplo:
comer – componente discreto= mordidas

Diseño de experimentos

Experimento (base de los estudios prospectivos, longitudinales, comparativos):
Prueba o serie de pruebas en las que se hacen cambios deliberados en las
variables de entrada de un proceso o sistema para observar e identificar las
razones de los cambios que pudieran observarse en la respuesta de salida.

En cualquier experimento, los resultados y las conclusiones que puedan
sacarse dependen de la manera en que se recabaron los datos.

Por ejemplo, se quiere determinar la relación existente entre la tasa de forrajeo y
la temperatura en peces de acuario. Para lo cual, se hacen mediciones de 20
peces a 5 diferentes temperaturas.

Se observa cada uno de Se observa cada uno de
los 10 peces y se regresan los 10 peces y se
a una pecera juntos. mantienen seprados para
NO se identifican. poder IDENTIFICARLOS.

Se debe considerar el cambio en cada pez para que su propia
variabilidad no sesgue los resultados.


En general, los experimentos se usan para estudiar el desempeño de
procesos o sistemas.
Factores controlables
x1, x2, x3,...............Xn

Entradas Salida y
Proceso

En muchos casos, los
Z1, z2, z3, .............zn experimentos incluyen
Factores no controlables muchos factores,
además cada factor
Objetivos del experimentador:
puede tener varios
niveles.
1) Determinar variables de mayor influencia
2) Determinar relaciones o correlaciones entre las variables


Hay muchos factores que podrían considerarse y hay diferentes enfoques
para considerarlos.

Por ejemplo:

Un jugador de golf, quiere bajar su puntuación y busca la forma más sencilla
para hacerlo sin tener que practicar demasiado. Algunos de los factores que él
considera importantes, o que podrían influir son:

1. Tipo de palo (grande o normal)
2. Tipo de pelota (de goma de balata o de tres piezas)
3. Caminar cargando los palos o usar carrito
4. Beber agua o cerveza durante el juego
5. Hora al jugar (mañana o tarde)
6. Estado del tiempo al jugar (frío o calor)
7. Tipo de spikes usados en los zapatos (metálicos o d ehule)
8. Jugar con o sin viento.


Enfoque de la mejor conjetura. el experimentador selecciona una
combinación o ciertas combinaciones arbitrariamente. Funciona cuando el
experimentador cuanta con mucha información y práctica sobre el sistema.
Desventajas:
Tener que probar muchas combinaciones sin éxito
Dejar de hacer pruebas al encontrar resultados satisfactorios sin
comprobar que sea en realidad el mejor resultado.

Un factor a la vez. Se selecciona un punto de partida, o línea base de los
niveles, para cada factor, para después variar sucesivamente cada factor en
su rango, manteniendo constantes los factores restantes en el nivel base.

Después de haber realizado todas las pruebas, se construye por lo general
una serie de gráficas en las que se muestra la forma en que la variable de
respuesta es afectada al variar cada factor, manteniendo a los demás
constantes.


puntuaci
puntuaci

puntuaci

puntuaci

ó
n
ó
n

ó
n

ó
n
       G           N                  GB           TP                C             EC                     A             C

           palo                               pelota                   desplazamiento                 Bebida

Siguiendo el enfoque de un factor a la vez, la decisión sería seleccionar el
palo normal, cualquier pelota, desplazarse en carro y beber agua.

La desventaja principal es que no se considera ninguna INTERACCIÓN.

Un ejemplo de interacción en el ejemplo Palo grande

puntuaci
anterior se da entre el tipo de palo ya la
bebida. Con el palo grande, la bebida tiene palo  normal

ó
n
un marcado efecto pero no lo tiene con el

palo normal.             Agua      cerveza


Un mejor enfoque para trabajar con varios factores y niveles es un
experimento factorial. Se trata de una estrategia experimental en la
que los factores se hacen variar en conjunto.
en conjunto

Supongamos que para el ejemplo anterior solo son de interés dos
factores: el tipo de palo y de pelota, con sus dos niveles cada uno.

Para el experimento factorial se usan todas las combinaciones posibles
de los niveles de ambos factores.

En este caso (dos factores con dos

       GB                TP
niveles) se tiene un diseño factorial 2 2.

1Palo grande con pelota de goma          Tipo de pelota
2Palo grande con pelota de tres piezas
3Palo normal con pelota de goma         PG                C
2Palo normal con pelota de tres piezas

           Tipo de palo


Comparaciones:
       GB                TP

       GB                TP
         Tipo de pelota

         Tipo de pelota
        PG                C         PG                C
           Tipo de palo            Tipo de palo

Efecto del palo Efecto de la pelota
       GB                TP
         Tipo de pelota

        PG                C
Efecto de la interacción
           Tipo de palo

palopelota


Si hay k factores, cada uno con dos niveles, se tendría un:
k
diseño factorial 2 .

Evidentemente, al aumentar el número de factores, aumenta con
rapidez el número de corridas o pruebas por hacerse.

Por ejemplo un experimento con 10 factores requeriría 1024 corridas.

Esto pronto se vuelve impracticable. Pero no es necesario siempre
probar todas las combinaciones, se puede llevar a cabo una variación
del diseño factorial en la que sólo se realiza un subconjunto de las
corridas = EXPERIMENTO FACTORIAL FRACCIONADO


Cualquier problema experimental incluye dos aspectos: Diseño del
experimento y análisis estadístico de los datos, los cuales están muy
relacionados entre sí.

Principios básicos del diseño experimental:

1) Realización de réplicas. repetición del experimento básico. Nos permite
calcular el error experimental y tener un tamaño de muestra suficiente para
hacer las estimaciones. Tener cuidado en hacer réplicas reales y no solo
medidas repetidas.
Ejem: observar al mismo pez muchas veces en vez de utilizar diferentes peces.
2) Aleatorización
3) Formación de bloques. mejora la precisión de las comparaciones.
Reduce la variabilidad transmitida por factores perturbadores.
4) Controles
5) Blancos


Pautas generales para diseñar experimentos:

1) Identificación y enunciación del problema

2) Elección de los factores y niveles

3) Selección de la variable de respuesta

4) Elección del diseño experimental

5) Realización del experimento

6) Análisis estadístico de los datos

7) Conclusiones y recomendaciones

Muestreo y diseño de experimentos: tipos de muestreo y fuentes de sesgo

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Muestreo y diseño de experimentos: tipos de muestreo y fuentes de sesgo

Similar a Muestreo y diseño de experimentos: tipos de muestreo y fuentes de sesgo (20)

Más de Explorer BioGen

Más de Explorer BioGen (9)

Muestreo y diseño de experimentos: tipos de muestreo y fuentes de sesgo