Este documento trata sobre el tema del diseño y procedimientos de muestreo. Explica la terminología básica del muestreo, las etapas en la selección de la muestra, los tipos de muestreo probabilístico como el aleatorio simple, sistemático y estratificado, y los tipos de muestreo no probabilístico como el de conveniencia y por cuotas. Además, describe los métodos de determinación del tamaño de la muestra para los casos de muestreo aleatorio simple y estratificado.
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
Muestreo
1. 1.
2.
3.
4.
TEMA 7: DISEÑO Y PROCEDIMIENTOS DE
MUESTREO
Muestra o censo
Terminología y fundamentos del muestreo
Etapas den la selección de la muestra
Muestreo no probabilístico
Muestreo de conveniencia
Muestreo de juicios
Muestreo por cuotas
Muestreo de “bola de nieve”
5. Muestreo probabilístico
Muestreo aleatorio simple
Muestreo aleatorio sistemático
Muestreo aleatorio estratificado
Muestreo por conglomerados
6. Determinación del diseño muestral apropiado
7. Determinación del tamaño de la muestra
7.1. Muestreo aleatorio simple
7.2. Muestreo estratificado
2. 2. TERMINOLOGÍA
Muestreo: conjunto de operaciones encaminadas a determinar
una muestra, su tamaño y demás características necesarios para
identificar a los elementos que la forman.
Población: conjunto formado por la totalidad de elementos con
arreglo a unas características concretas.
Población de estudio : conjunto de elementos sobre los que se
toma la muestra.
Muestra: subconjunto de elementos de la población elegidos
para estudiar y así tratar de inferir características de la población.
Censo: relación completa de los elementos de una población.
Sesgo: error específico de la muestra por falta de
representatividad.
Error muestral: es el imputable al estudio de una parte de la
población o muestra.
Error no muestral: es el que se produce en toda la
investigación como consecuencia de definiciones conceptuales
incorrectas, de fallos en los instrumentos de medida, en la
entrevista o en el desarrollo del trabajo de campo.
3. 2. TERMINOLOGÍA
Marco muestral: listado que identifica a los elementos de la
población objetivo.
Elemento: cada una de las unidades sobre las que interesa
obtener información.
Unidad muestral: unidad seleccionada de la población para la
aplicación de la técnica de investigación; contiene los elementos
de la población que pueden formar parte de la muestra.
Parámetro: medida de una característica determinada de una
población. Si esta medida está referida a una muestra entonces
se denomina estadístico. La diferencia entre ambos valores es
el error muestral.
Estimador: es el valor muestral utilizado para inferir un valor
poblacional. Un estimador insesgado es un estimador cuya
esperanza matemática es el parámetro poblacional que estima.
Se dice que un estimador es consistente si al sustituir el
tamaño de la muestra por el del total de la población la
estimación coincide con el parámetro poblacional.
Distribución muestral : Es la representación de los valores de
los estadísticos (la media, por ejemplo) con sus frecuencias.
4. 2. TERMINOLOGÍA
Teorema central del límite: si el tamaño de la muestra es lo
suficientemente grande (a partir de 30) y si las muestras se
extraen aleatoriamente, este teorema nos dice que la distribución
de muestreo de la media aproximadamente tendrá una
distribución normal con una media igual a la de la población y con
una varianza igual a la varianza de la población dividida por el
tamaño de la muestra.
Dispersión: medida estadística del nivel de variación de la
opinión del colectivo total sobre el tema analizado respecto al
valor medio.
Inferencia estadística: proceso de estimación de resultados
válidos para una población a partir de los resultados obtenidos de
una muestra de esa población.
Intervalo de confianza: intervalo con una determinada
probabilidad de incluir el valor poblacional. Se determina a partir
de los resultados muestrales y el error de muestreo.
Nivel de confianza: probabilidad de obtener un intervalo de
confianza concreto.
Método de muestreo: procedimiento utilizado para seleccionar de
forma representativa las unidades muestrales.
5. 3. ETAPAS EN LA SELECCIÓN DE LA
MUESTRA
1.
Definición de la población objetivo : en términos de
contenido, unidades, extensión y tiempo.
Identificar el marco muestral : normalmente es imposible
confeccionar una lista que no excluya a algunos miembros de
la población.
Determinar el método de muestreo : si la unidad de
muestreo es diferente del elemento es necesario especificar
también cómo se deben seleccionar los elementos dentro de la
unidad de muestreo.
Determinar el tamaño de la muestra : se deben considerar
los siguientes factores cualitativos:
2.
3.
4.
Importancia de la decisión.
Naturaleza de la investigación.
Número de variables.
Naturaleza del análisis.
Tamaños de muestra utilizados en estudios similares.
Restricciones de recursos.
6. 3. ETAPAS EN LA SELECCIÓN DE LA
MUESTRA
5.
Selección material de la muestra : elegir los componentes
de la muestra y localizar materialmente la muestra, es decir,
localización física de las unidades.
6.
Decidir el trato que se ha de dar a la falta de
respuestas: se niega a responder, no se localiza, no sabe
contestar o no es accesible. Para reducir este riesgo de no
respuesta hay varios procedimientos:
Mejorar el diseño de la investigación para reducir las
negativas.
Repetir los intentos.
Estimar los efectos de la falta de respuesta en lo que
respecta a la calidad de la información.
7. 4. MUESTREO NO PROBABILÍSTICO:
CARACTERÍSTICAS
La selección de la muestra no es aleatoria, sino que se basa,
en parte, en el juicio del entrevistador o de responsable de la
investigación.
No se basa en ninguna teoría de la probabilidad y, por lo tanto,
no es posible calcular la precisión o acotar el error cometido.
No es posible calcular estos errores ni la confianza de las
estimaciones que, además, no siempre se reducen
aumentando el tamaño de la muestra.
En el muestreo no probabilístico los costes y la dificultad del
diseño son más reducidos (al no ser necesario disponer de un
marco). Este muestreo puede dar buenos resultados, pero
también apareja el riesgo de proporcionar una información
errónea.
8. 4. MUESTREO NO PROBABILÍSTICO
Muestreo de conveniencia
Las muestras se seleccionan según un criterio de accesibilidad
o comodidad.
Suele emplearse en centros comerciales, plazas, estaciones
de autobuses o de tren, metro, aeropuertos o lugares de gran
afluencia pública.
Se utiliza para obtener un mayor número de cuestionarios
completados de forma rápida y económica.
Adecuado en la investigación exploratoria que venga seguida
de una investigación adicional en la que se extraiga una
muestra probabilística.
Muestreo de juicios
La muestra es elegida por un experto de acuerdo con su
criterio, buscando las unidades más representativas.
Ejemplo: mercados de prueba, presuntos líderes seleccionados
en la investigación de conducta de voto….
Se emplea cuando el tamaño de la muestra es pequeño.
9. 4. MUESTREO NO PROBABILÍSTICO
Muestreo por cuotas
Tiene por objetivo asegurar que los diversos subgrupos de una
población estén representados en la muestra respecto de las
características pertinentes de la muestra y con la proporción exacta que
el investigador desee.
La selección accidental de sujetos puede producir sesgo.
La velocidad de recopilación de datos, los menores costes y la
comodidad son sus principales ventajas frente al muestreo de
probabilidad.
Puede resultar apropiado cuando el investigador sabe que es más
probable que un cierto grupo demográfico rehúse colaborar con una
encuesta.
Muestreo de “bola de nieve”
Los primeros elegidos como encuestados (probablemente a juicio del
investigador) proponen y ayudan a la selección de los restantes de la
muestra. Esta técnica se utiliza para localizar por referencias a miembros
de poblaciones peculiares.
Ventajas: los reducidos tamaños de muestra y los costes.
Sesgo porque la persona sugerida por otro miembro de la muestra tiene
una probabilidad mayor de ser similar a la primera.
10. 5. MUESTREO PROBABILÍSTICO:
CARACTERÍSTICAS
Las muestras se seleccionan al azar, no se seleccionan por los
investigadores.
Cada elemento de la población tiene la misma probabilidad de
ser elegido.
Se puede conocer el error muestral, el nivel de confianza y el
nivel de precisión de las estimaciones.
Los resultados se pueden generalizar.
Es el único método que puede evaluar la representatividad de la
muestra.
Es más caro que el muestreo no probabilística.
Es, en general, más lento y complicado que el muestreo no
probabilística.
11. 5. MUESTREO ALEATORIO SIMPLE:
INCONVENIENTES
Su utilización está supeditada a la existencia de una “base de
sondeo” donde se puedan enumerar todos los elementos
constituyentes del universo objeto de estudio.
La extracción al azar dispersa totalmente a los componentes de
la muestra. Imaginemos los costoso que sería ir a Gerona a
hacer una entrevista a una sola persona, a otra en Cádiz, a otra
en Vigo, …
No tiene en cuenta criterios de homogeneidad/heterogeneidad
entre conjuntos de elementos del universo.
Es un método lento, sobre todo cuando el número de
elementos que constituyen el universo objeto de estudio y/o la
muestra es elevado.
12. 5. MUESTREO ALEATORIO SISTEMÁTICO
En primer lugar se selecciona el “coeficiente de elevación”
(tamaño población/tamaño muestra), a continuación se elige al
azar un número inferior al coeficiente de elevación. La primera
unidad muestral es el número elegido, la segunda unidad muestral
se determina agregando a ese primer número el coeficiente de
elevación y así sucesivamente hasta completar el tamaño de la
muestra.
Es preciso un listado de los elementos, que normalmente sigue
algún criterio coincidente o no con el interés objeto de
investigación: orden alfabético, domicilio, momento o tiempo en
que se produce un hecho, indicadores de tamaño, otros
indicadores.
Este muestreo es sencillo, fácil de ejecutar y menos caros que
otros muestreos aleatorios, sólo se efectúa una selección al azar
al principio y a partir de ahí el proceso es automático. Este
muestreo asegura un reparto de los componentes de la muestra
contribuyendo a evitar que esté compuesta únicamente por
valores extremos.
13. 5. MUESTREO ALEATORIO ESTRATIFICADO
Determina el número de elementos a seleccionar de cada
segmento, necesarios para formar una muestra representativa.
Es un proceso en dos fases en el que la población se divide en
estratos. El estrato debe ser mutuamente excluyente y
colectivamente exhaustivo. Después, los elementos se
seleccionan para cada estrato mediante un procedimiento
aleatorio, por lo general m.a.s.
Difiere del muestreo por cuotas en que los elementos de la
muestra se seleccionan en forma probabilística en vez de hacerlo
por conveniencia o por juicio.
Un objetivo principal de este muestreo es incrementar la
precisión sin aumentar el coste
El criterio para la selección de las variables de estratificación
consiste en homogeneidad, heterogeneidad, relación y coste. Las
variables comúnmente utilizadas incluyen características
demográficas, tipo de cliente (con o sin tarjeta), tamaño de la
empresa o tipo de industria.
14. 5. MUESTREO ALEATORIO ESTRATIFICADO
El número de estratos a utilizar es cuestión de juicio, pero la
experiencia sugiere el uso de no más de seis.
Procedimientos utilizados para la estratificación de la
muestra:
Afijación simple: se reparte la muestra total en partes iguales
para cada estrato.
Afijación
proporcional:
la
muestra
se
proporcionalmente a la población de cada estrato.
reparte
Afijación óptima o no proporcional: se considera la mayor o
menor heterogeneidad dentro de cada estrato, lo que se mide
por la desviación típica. La corrección de la proporcionalidad
con este criterio exige más información de cada estrato, en
concreto la varianza o la desviación típica.
15. 5. MUESTREO POR CONGLOMERADOS
En ocasiones, con el fin de ahorrar tiempo y disminuir
costes, se divide la población total en conglomerados o grupos
de unidades maestrales excluyentes y colectivamente
exhaustivos. Luego se selecciona una muestra aleatoria de
grupos con base en una técnica de muestreo probabilística,
como el MAS. Para cada grupo seleccionado, se incluyen todos
los elementos en la muestra o se toma una muestra de
elementos en forma probabilística. Si todos los elementos en
cada grupo seleccionado están incluidos en la muestra, el
procedimiento se llama muestreo por conglomerados de una
etapa. Si una muestra de elementos se toma en forma
probabilística de cada grupo seleccionado, el procedimiento es
un muestreo por conglomerados en dos etapas.
La unidad muestral primaria ya no es el elemento de la población
sino un grupo mayor de elementos que están situados cerca el
uno del otro (por ejemplo, ciudades).
16. 5. DIFERENCIAS ENTRE MUESTREO POR
CONGLOMERADOS Y ESTRATIFICADO
En el de conglomerados sólo se elige una muestra de
subpoblaciones, en el estratificado todas las subpoblaciones
(estratos) se seleccionan para muestreo posterior.
El objetivo del m. por conglomerados es incrementar la precisión
al reducir costes.
En relación a la homogeneidad y la heterogeneidad, el criterio
para formar conglomerados es el opuesto al de formar estratos.
Los elementos dentro de un conglomerado deben ser tan
heterogéneos como sea posible, pero los conglomerados
mismos deben ser tan homogéneos como sea posible.
Cada conglomerado debe ser una representación en pequeña
escala de la población.
En el m. por conglomerados se necesita un marco de muestreo
sólo para aquellos agrupamientos seleccionados para la muestra
17. 5. MUESTREO POR CONGLOMERADOS
Una forma común de este muestreo es el muestreo por área,
en el que los agrupamientos consisten en áreas geográficas,
como países, zonas de casas o calles.
El muestreo por conglomerados se clasifica como técnica de
muestreo probabilístico porque o bien la selección de
conglomerados es aleatoria, o bien la selección de elementos
dentro de cada conglomerado es aleatoria.
El conglomerado ideal debería ser tan heterogéneo como la
propia población.
Este muestreo puede resultar problemático si las características
y actitudes de los elementos del conglomerado son demasiado
similares.
18. 6. DETERMINACIÓN DEL DISEÑO MUESTRAL
APROPIADO
Grado de precisión : La selección de una muestra representativa
es importante para todos los investigadores. No obstante, el grado de
precisión necesario o la tolerancia del investigador de los errores de
muestreo y ajenos al muestreo pueden ser distintos en cada proyecto,
especialmente cuando la reducción de la precisión pueda
compensarse con el ahorro de costes u otros beneficios.
Recursos: Los costes asociados a las diversas técnicas de
muestreo varían enormemente. Si los recursos financieros y humanos
del investigador son restringidos, habrán de eliminarse ciertas
opciones.
Tiempo: El investigador que necesite cumplir con un plazo o
completar un proyecto rápidamente seguramente elegirá un diseño
simple que ocupe poco tiempo .
Conocimiento previo de la población : disponibilidad de listas
de sus miembros.
Proyecto nacional o local .
Necesidad de análisis estadístico .