Este documento describe diferentes técnicas de muestreo para estudios epidemiológicos. Explica el muestreo probabilístico, que utiliza métodos aleatorios para seleccionar la muestra, y el muestreo no probabilístico. Dentro del muestreo probabilístico, describe el muestreo aleatorio simple, el estratificado y el de múltiples etapas, y sus ventajas e inconvenientes. El objetivo del muestreo es obtener una muestra representativa de la población que permita hacer inferencias sobre ella con un menor coste que estudi
1. Máster Nuevas Tendencias Asistenciales y de Investigación en Ciencias de la Salud Curso 2010-2011 Prof. Dr. Jesús Rebollo Roldán Prof. Dr. José Jesús Jiménez Rejano
2. Tema 4: Muestreo PRINCIPIO DE REPRESENTATIVIDAD Para que los resultados de un ECA tengan Val. Interna la muestra debe ser representativa de la población de estudio. 1.- Introducción A veces disponemos de una lista con los miembros q forman la población de estudio Pero a veces no tenemos esa lista la pob exp es dinámica y la muestra de suj se selecciona por inclusión consecutiva de los pacientes q acuden a consulta y cumplen los criterios de selección
3. 1. Las principales razones para estudiar una muestra y no toda la pob de estudio son: ahorrar tiempo , dinero y otros recursos . 2.- Ventajas del Muestreo Tomar una muestra eficiencia del estudio 2. Las mediciones serán de mayor calidad podemos dedicar + esfuerzos a estudiar un menor nº de suj. 3. Al dedicar + recursos en el estudio de cada suj podemos medir otras variables , cosa q no podríamos hacer en toda la población. Es imp medir otras variables pues alguna puede ser un potencial F. de confusión su evaluación permite su control en nuestro análisis Validez de los resultados.
4. Si quiero estimar si 1 tto TA las unidades de muestreo son personas. Si quiero aplicar 1 tto en 100 residencias de mayores en Andalucía: muestra de 20/ 10 GE y 10 GC midiendo VD = nº de fallecidos las unidades de muestreo son las residencias 3.- Planificación del Muestreo Unidades de Muestreo: elementos sobre los q aplicamos la técnica de selección . Pueden ser: -Personas, -Centros de Salud o Escuelas... Las unidades de muestreo no tienen pq coincidir con las unidades de análisis . Ej: estudio para conocer la prevalencia de HTA en población escolar. Unidad de muestro: cada escuela Unidad Análisis: niños.
5. 3.- Planificación del Muestreo Segundo paso: decidir como seleccionar la muestra. Existen 2 formas: -Muestreo Probabilístico y - Muestreo No Probabilístico Primer paso del Muestreo: Definir el marco muestral. Marco muestral: lista de personas (o escuelas) Es una forma de identificación de las unidades de muestreo sobre la q se aplica el proceso de selección
6. 4.- Técnicas de Muestreo 4.1.- Muestro Probabilístico Se usa alguna forma de selección aleatoria para obtener las unidades q serán estudiadas. Todos los candidatos tienen una probabilidad conocida, distinta de cero, de ser incluidos en la muestra Existe tendencia a considerar sinónimos muestra probabilística y muestra representativa . Pero no son sinónimos. El uso de 1 técnica de muestreo probabilístico tiende a asegurar q obtendremos una muestra representativa , sobre todo si la población y la muestra son de gran tamaño
7. 4.1.- Muestro Probabilístico Pero puede q no sea así pues el azar puede tb producir 1 muestra q no tenga = distribución de variables de interés q la población de referencia. Esto pasa + fácilmente si el tamaño es reducido . Por otro lado pueden obtenerse muestras representativas usando muestreo no probabilístico .
8. 4.1.- Muestro Probabilístico Por esta razón las muestras tienden a ser representativas , aunque ello no signifique q están exentas de error . En Todas las técnicas de muestreo probabilístico la selección de las unidades es al azar se evita la posible parcialidad , consciente o inconsciente de los inv. La muestra seleccionada es 1 de las muchas q podría obtenerse de la población de referencia. Es probable q la estimación de la V obtenida a partir de la muestra difiera de su verdadero valor en la población de estudio solo por azar (error aleatorio o debido al muestreo). Este error es + probable cto menor es el tamaño de la muestra.
9. 4.1.- Muestro Probabilístico Usar técnicas probabilísticas nos permite emplear técnicas estadísticas capaces de cuantificar ese error aleatorio.
10. 4.1.1.- Muestro Aleatorio Simple Es una técnica equiprobabilística, pero no todo método equiprobabilístico es aleatorio simple Cada unidad del marco muestral tiene = probabilidad de ser escogida y en la q cada una de las posibles muestras de = tamaño tienen = probabilidad de ser escogidas. Ej: Población de estudio = 10 niños Quiero muestra de 5 3 formas de hacerlo: a) Tomo a los 5 primeros de la lista No es probabilístico, los 5 últimos no pueden entrar en la muestra b) Divido la lista en 2 grupos: los 5 primeros y los 5 últimos y moneda al aire. Equiprobabilístico (todos los niños pueden salir en la muestra con = probabilidad) pero no es muestreo aleatorio simple pq sólo puedo escoger 2 muestras y otras muestras q no puedo escoger (por ej: par/impar...) c) Tabla de nº aleatorios: Muestreo aleatorio simple. Puedo escoger 1 cualquiera de las 252 muestras.
11. 4.1.1.- Muestro Aleatorio Simple 1. Preparar una lista de las unidades de muestreo y las numeramos (mejor tener 1 base de datos). 2. Seleccionar tantos nº aleatorios como elementos deba tener mi muestra (ordenador, tabla de nº aleatorios etc).
12. 4.1.1.- Muestro Aleatorio Simple Ventajas: Técnica sencilla y fácil de comprender. Desventajas: 1. Requiere q se conozca de antemano la lista completa de todas las unidades de muestreo. 2. Cdo se trabaja con una muestra pequeña es posible q no sea representativa de la población. 3. Si la lista contiene fallos u omite segmentos de la población se pierden las ventajas del muestreo aleatorio, pues todas las unidades no tendrán la misma probabilidad de aparecer en la muestra.
13. 4.1.2.- Muestro Aleatorio Estratificado 1. La población se divide en estratos en función de las categorías de las V por las q se desea estratificar, formando subgrupos con alguna característica común y mutuamente excluyentes . 2. A continuación se escoge una muestra aleatoria de cada estrato MANTENIENDO las proporciones observadas en la población de referencia. Modificación del anterior q intenta asegurar q la muestra presente la misma distribución q la población de estudio en relación con determinadas variables . Los estratos deben definirse en función de variables q pueden influir en los resultados (género, edad, tabaquismo, obesidad, etc)
14. 4.1.2.- Muestro Aleatorio Estratificado Ejemplo: Población de estudio = 2000 personas Muestra = 250 Estimar prevalencia de HTA HTA varía según sexo y obesidad. Queremos q la muestra mantenga los % de género y obesidad. 180 (72%) 60 (24%) 120 (48%) No obesidad 70 (28%) 40 (16%) 30 (12%) Obesidad Total Mujeres Varones Distribución de una muestra de 250 personas que mantiene la misma distribución en función de sexo y obesidad que la población general 1440 (72%) 480 (24%) 960 (48%) No obesidad 560 (28%) 320 (16%) 240 (12%) Obesidad Total Mujeres Varones Distribución de una población de 2000 personas en función del sexo y la obesidad
15. 4.1.2.- Muestro Aleatorio Estratificado La variabilidad entre los estratos debe ser lo + amplia posible . Dentro de cada estrato la variabilidad debe ser lo + pequeña posible . Así observaremos subgrupos homogéneos respecto a la posible V confusión ( todos los miembros de 1 estrato la presentan ) y heterogéneos entre si (miembros de estratos no comparten la variable).
16. 4.1.2.- Muestro Aleatorio Estratificado Ventajas: 1. Tiende a asegurar q la muestra representa adecuadamente a la población en función de unas variables determinadas . 2. Se obtienen estimaciones + precisas q con el muestreo aleatorio simple pq la variancia total se basa en la de cada uno de los estratos y estos son + homogéneos q la población. 3. Se pueden aplicar fracciones de muestreo en cada estrato. Desventajas: 1. Hay q conocer la distribución en la población de V estratificadas. 2. Requiere q posea de antemano un listado completo de toda la población. 3. El cálculo de las estimaciones es más complejo q en el muestreo aleatorio simple.
17. 4.1.2.- Muestro Aleatorio Estratificado Cdo alguno de los estratos tiene 1 tamaño reducido la ventaja de obtener estimaciones + precisas pq la variancia total se basa en cada uno de los estratos se pierde pq disminuye la precisión de la estimación en dicho estrato y esto afectará a la estimación global. ¿qué hacemos en ese caso? Muestreo no proporcional q sobrerrepresenta este estrato (aplicamos sobre el una fracción de muestreo diferente). Esta alternativa dificulta el análisis. Muestreo no proporcional se usa + para hacer comparaciones entre los estratos.
18. 4.1.2.- Muestro Aleatorio Estratificado Ej: Encuesta a médicos para conocer su opinión sobre 1 dtdo pb de salud 230 (56%) medio urbano/ 160 (39%) semiurbano/ 20 (5%) rural. Tomo muestra de 100 médicos: sólo entrarían 5 médicos del medio rural. Ese nº de sujetos en ese estrato es insuficiente para conocer su opinión y compararla con otros grupos. Muestreo no Proporcional. Diferentes fracciones de muestreo: Tomo 20% urbanos, 30%semiurbanos, 100% rurales % final encuestados: 46 urbanos, 48 semiurbanos, 20 rurales Para el análisis ojo con los % usados. Si solo queremos comparar los estratos da igual el % usado pq cada estrato es como una población diferente.
19. 4.1.3.- Muestro en Múltiples Etapas Ej: Prevalencia de escoliosis en escolares. Elegimos una muestra al azar entre todas las escuelas de Sevilla y en cada una de las escuelas seleccionadas una muestra de niños. Seleccionar unidades de muestreo de una población ( unidades primarias ) y en una 2ª etapa obtener una muestra de cada de las unidades primarias. Se puede usar el nº de etapas q sean necesarias y, en cada una de ellas , aplicar un método diferente de muestreo (simple, estratificado, sistemático). Cdo en el estudio se incluyen todas las unidades secundarias (la fracción de muestreo es del 100%) se denomina MUESTREO EN CONGLOMERADOS .
20. 4.1.3.- Muestro en Múltiples Etapas Técnica muy útil cdo la población de estudio es muy grande y está muy dispersa geográficamente (ej: escolares de Sevilla) El muestreo aleatorio simple me da unos pocos de cada escuela. Tengo q ir a muchas escuelas distintas. Además es difícil tener una lista con todos los escolares de Sevilla y + fácil obtener 1 listado de todos los colegios. Desventaja principal: si las unidades primarias contienen personas similares en relación con el fenómeno de interés la precisión de la estimación es menor q si usamos Muestreo Aleatorio Simple. Ej: Estudio sobre hábitos alimentarios de una comunidad. Encuesto a 100 sujetos obtenidos con Muestreo Aleatorio Simple el grado de la estimación y de la información q me dan no es igual q si estudiamos 100 suj, (unidad secundaria) procedentes de 25 familias (unidad primaria). Los hábitos alimenticios en una misma familia son muy parecidos (es como si hubiese encuestado a 25 personas solo).
21. 4.1.3.- Muestro en Múltiples Etapas Si 1 o varias familias son muy nº contribuyen de una forma desproporcionada al tamaño de la muestra. Otra desventaja es q la variabilidad es mayor q con los métodos anteriores, y su cálculo es complejo. Solución es extraer una muestra de mayor tamaño y considerarla como Aleatoria simple y procurar q las unidades de muestreo sean lo + pequeña posible.
22. 4.1.3.- Muestro Multietápico Ventajas: 1. Es muy eficiente cdo la población es muy grande y dispersa . 2. La necesidad de listas de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior. Desventajas: 1. Las estimaciones son menos precisas q con el muestreo aleatorio simple o estratificado. 2. El cálculo de las estimaciones es complejo.
23. 4.1.4.- Muestro Sistemático Aplicar alguna regla sistemática simple. Elegir 1 de cada n individuos Pasos a seguir: 1. Calcular la cte de muestreo k ( dividiendo el total de la población experimental entre el tamaño de la muestra ). 2. Extraemos la 1ª unidad al azar entre las k primeras unidades de muestreo. 3. Vamos sumando la k y tomando al que toque hasta completar la muestra
24. 4.1.4.- Muestro Sistemático Aplicar alguna regla sistemática simple. Elegir 1 de cada n individuos Pasos a seguir: 1. Calcular la cte de muestreo k (dividiendo el total de la población experimental entre el tamaño de la muestra. 2. Extraemos la 1ª unidad al azar entre las k primeras unidades de muestreo. 3. Vamos sumando la k y tomando al que toque hasta completar la muestra
25. 4.1.4.- Muestro Sistemático Ventajas: 1. Es muy fácil de aplicar, + cómodo y práctico q el muestreo aleatorio simple. 2. No siempre es necesario disponer de una lista de toda la población. Voy seleccionando los suj conforme el estudio avanza siempre siguiendo el orden preestablecido (2, 9, 16, 23...). 3. Cdo la pob de referencia está ordenada siguiendo una tendencia conocida asegura una cobertura de unidades de todos los tipos (+ edad a + joven) Si tengo alumnos ordenados por cursos cogeré de todos los cursos. M. Aleat. Simple puede darme muchos + de 6º q de 1º.
26. 4.1.4.- Muestro Sistemático Desventajas: 1. Si la k (cte de muestreo) esta relacionada con el fenómeno q se quiere medir se pueden obtener estimaciones sesgadas de los parámetros poblacionales. Ej: Actividad asistencial en una consulta unidad de muestreo días de la semana (k = 7) Si me sale 1 (lunes) recogeré la actividad realizada sólo los lunes (cdo + pacientes me entran, día que hago + exploraciones...) suele ser el día q vienen + pacientes de modo q sobreestimo el nº de visitas. Si tomo k = 10, unas veces será lunes, después miércoles ... Es fácil saber si k se relaciona con el fenómeno de estudio.
27. 4.1.4.- Muestro No Probabilístico Se desconoce la probabilidad que posee cada unidad de ser incluida en la muestra , y la selección se realiza mediante métodos en los que no interviene el azar . El uso de pruebas estadísticas requiere que la muestra analizada sea aleatoria . Su aplicación en muestras no obtenidas por un método aleatorio se hace asumiendo q están libres de sesgos y q son representativas de la población de referencia. La técnica + frecuente es el muestreo consecutivo q consiste en seleccionar a los pacientes q cumplan los criterios de selección especificados en el protocolo del estudio a medida q acuden a la consulta durante un período determinado. Muestreo Consecutivo
28. 4.1.4.- Muestro No Probabilístico El muestreo consecutivo es la técnica más utilizada en los ECA. Si se evalúa la eficacia de 1 tto de fisioterapia en el esguince de tobillo no dispongo al comienzo del estudio de un listado ( desconozco quién tendrá un esguince ) por lo que no puedo usar un muestreo aleatorio simple . El equipo investigador se limita a reclutar a los suj. q cumplen los criterios de selección a medida que son diagnosticados . En general es preferible rechazar la participación de voluntarios ya que las verdaderas razones que llevan a una persona a prestarse para un estudio sin haber sido seleccionado para ello suelen estar relacionadas con otras características que afectan a la representatividad de la muestra. Muestreo por Inclusión de Voluntarios
29. 4.1.4.- Muestro No Probabilístico Muestreo por Cuotas Poco usado en los ECA (se emplea + en estudios de mercado ). Se decide o se conoce de antemano la composición general de la población de referencia en términos de características como la edad, el sexo o la clase de educación (estratos). A continuación se fija el nº de personas requerido , o cuotas , para hombres y mujeres , según las diferentes edades y la clase de educación, siendo el único requerimiento conseguir el nº adecuado de personas para llenar cada una de las cuotas. Una vez determinada la cuota se elige a los primeros q se encuentren y q cumplan esas características
30. 4.1.4.- Muestro No Probabilístico Muestreo por Conveniencia Las unidades son seleccionadas pq resultan convenientes para el investigador o pq se piensa q pueden representar + o menos a todo el universo. Ej: muestras obtenidas en instituciones de salud, en consulta externa, o parte de los pacientes de un profesional de la salud . Muestreo en Bola de Nieve Pedir a uno de los suj. q cumplen los criterios de selección q sugiera a otro posible componente de la muestra. Ej: en enfermedades raras , alcohólicos o drogodependientes , miembros de una secta, personas q han sufrido una agresión sexual...
31. Algoritmo para la Selección de la técnica de muestreo Muestreo No Probabilístico No ¿Existe una población de referencia accesible y bien diferenciada antes de iniciar el estudio? Muestreo Probabilístico Si ¿La población de referencia es muy grande, dispersa y está agrupada por alguna característica? Muestreo en Múltiples etapas Si ¿Interesa a priori controlar la distribución de alguna variable de confusión? No Muestreo aleatorio simple o sistemático Muestreo estratificado No Si