2. Objetivos de aprendizaje Al terminar este capítulo, el alumno será capaz de: Identificar los diferentes tipos de muestras en la investigación cuantitativa, sus procedimientos de selección, sus características, las situaciones en que es conveniente utilizar cada uno y sus aplicaciones. Enunciar los conceptos de muestra, población y procedimiento de selección de la muestra. Determinar el tamaño adecuado de la muestra en distintas situaciones de investigación. Obtener muestras representativas de la población estudiada cuando hay interés por generalizar los resultados de una investigación a un universo más amplio.
3. Sintesis del tema En el capítulo se analizan los conceptos de muestra, población o universo, tamaño de la muestra, representatividad de la muestra y procedimiento de selección Se presenta una tipología de muestras: probabilísticas y no probabilísticas. Se explica cómo definir a las unidades de análisis, (participantes, otros seres vivos, objetos, sucesos o comunidades), de las cuales se habrán de recolectar los datos. Asimismo, en el capítulo se presenta cómo determinar el tamaño adecuado de una muestra cuando pretendemos generalizar los resultados a una población, y cómo proceder para obtener la muestra, dependiendo del tipo de selección elegido.
4. ¿En una investigación siempre tenemos una muestra? No siempre, pero en la mayoría de las situaciones sí realizamos el estudio en una muestra. Sólo cuando queremos realizar un censo debemos incluir en él estudio a todos los sujetos o casos (personas, animales, plantas, objetos) del universo o la población. Por ejemplo, los estudios motivacionales en empresas suelen abarcar a todos sus empleados para evitar que los excluidos piensen que su opinión no se toma en cuenta. Las muestras se utilizan por economía de tiempo y recursos.
5. Lo primero: ¿sobre qué o quiénes se recolectarán datos? Aquí el interés se centra en "qué o quiénes", es decir, en los sujetos, objetos, sucesos o comunidades de estudio (las unidades de análisis), lo cual depende del planteamiento de la investigación. Así, en el caso de que el objetivo sea describir el uso que hacen los niños de la televisión, lo más factible sería interrogar a un grupo de niños. También serviría entrevistar a los padres de los niños. Escoger entre los niños o sus padres, o ambos, dependería no sólo del objetivo de la investigación, sino del diseño de la misma. Por lo tanto, para seleccionar una muestra, lo primero que hay que hacer es definir la unidad de análisis (personas, organizaciones, periódicos, comunidades, situaciones, eventos, etc.). El sobre qué o quiénes se van a recolectar datos depende del planteamiento del problema a investigar y de los alcances del estudio. Estas acciones nos llevarán al siguiente paso, que consiste en delimitar una población. Para el proceso cuantitativo la muestra es un subgrupo de la población de interés (sobre el cual se recolectarán datos, y que tiene que definirse o delimitarse de antemano con precisión), éste deberá ser representativo de la población.
6. ¿Cómo se delimita una población? Una vez que se ha definido cuál será la unidad de análisis se procede a delimitar la población que va a ser estudiada y sobre la cual se pretende generalizar los resultados. Así, una población es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Selltiz et al., 1980). Una deficiencia que se presenta en algunos trabajos de investigación es que no describen lo suficiente las características de la población o consideran que la muestra la representa de manera automática. Es común que algunos estudios que sólo se basan en muestras de estudiantes universitarios (porque es fácil aplicar en ellos el instrumento de medición, pues están a la mano) hagan generalizaciones temerarias sobre jóvenes que tal vez posean otras características sociales. Es preferible entonces establecer con claridad las características de la población, con la finalidad de delimitar cuáles serán los parámetros muéstrales.
7. ¿Cómo se delimita una población? Está claro que en dicha investigación la unidad de análisis son los niños. Pero, ¿de qué población se trata?, ¿de todos los niños del mundo?, ¿de todos los niños del país? Sería muy ambicioso y prácticamente imposible referirnos a poblaciones tan grandes. Esta definición elimina, por lo tanto, a niños del país que no vivan en el área metropolitana de la ciudad de capital, a los que no van a la escuela, a los que asisten a clases por la tarde (turno vespertino) y a los infantes más pequeños. El primer paso para evitar tales errores es una adecuada delimitación del universo o población. Los criterios que cada investigador cumpla dependen de sus objetivos de estudio, lo importante es establecerlos de manera muy específica.
8. ¿Cómo seleccionar la muestra? Hasta este momento hemos visto que se debe definir cuál será la unidad de análisis y cuáles son las características de la población. En este inciso hablaremos de la muestra, o mejor dicho de los tipos de muestra, con la finalidad de poder elegir la más conveniente para un estudio. La muestra es, en esencia, un subgrupo de la población. Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus características al que llamamos población. En realidad, pocas veces es posible medir a toda la población, por Lo que obtenemos o seleccionamos una muestra y, desde luego, se pretende que este subconjunto sea ur reflejo fiel del conjunto de la población. Todas las muestras —bajo el enfoque cuantitativo— deben ser representativas; por lo tanto, el uso de este término resulta por demás inútil. Los términos al azar y aleatorio denotan un tipo de procedimiento mecánico relacionado con la probabilidad y con la selección de elementos; pero no logran esclarecer tampoco el tipo de muestra y el procedimiento de muestreo.
9. Tipos de muestra En las muestras probabilísticas, todos los elementos de la población tienen la misma posibilidad de ser escogidos y se obtienen definiendo las características de la población y el tamaño de la muestra, y por medio de una selección aleatoria o mecánica de las unidades de análisis. Imagínese el procedimiento para obtener el número premiado en un sorteo de lotería. Este número se va formando en el momento del sorteo. En las loterías tradicionales, a partir de las esferas con un dígito que se extraen (después de revolverlas mecánicamente) hasta formar el número, de manera que todos los números tienen la misma probabilidad de ser elegidos. En las muestras no probabilísticas, la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características de la investigación o de quien hace la muestra. Aquí el procedimiento no es mecánico, ni con base en fórmulas de probabilidad, sino que depende del proceso de toma de decisiones de una persona o de un grupo de personas y, desde luego, las muestras seleccionadas obedecen a otros criterios de investigación. Elegir entre una muestra probabilística o una no probabilística depende de los objetivos del estudio, del esquema de investigación y de la contribución que se piensa hacer con ella.
10. ¿Cómo se selecciona una muestra probabilística? Resumiremos diciendo que la elección entre la muestra probabilística y la no probabilística se determina con base en el planteamiento del problema, las hipótesis, el diseño de investigación y el alcance de sus contribuciones. Las muestras probabilísticas tienen muchas ventajas, quizá la principal sea que puede medirse el tamaño del error en nuestras predicciones. Se dice incluso que el principal objetivo en el diseño de una muestra probabilística es reducir al mínimo este error, al que se le llama error estándar (Kish, 1995). Las muestras probabilísticas son esenciales en los diseños de investigación transeccionales, tanto descriptivos como correlacionales-causales (las encuestas de opinión o surveys, por ejemplo) , donde se pretende hacer estimaciones de variables en la población. Las unidades o elementos muéstrales tendrán valores muy parecidos a los de la población, de manera que las mediciones en el subconjunto nos darán estimados precisos del conjunto mayor.
11. ¿Cómo se selecciona una muestra probabilística? Para hacer una muestra probabilística es necesario entender los siguientes términos y sus definiciones: La población, a la que se le suele denominar como N, es un conjunto de elementos. La muestra, a la que se le simboliza como n, es un subconjunto de la población N. En una población N (previamente delimitada por los objetivos de la investigación), nos interesa establecer valores de las características de los elementos de N. Nos interesa conocer valores promedio en la población, lo cual se expresa como: Y = al valor de una variable determinada (Y) que nos interesa conocer, digamos un promedio. También nos interesa conocer: V = la varianza de la población con respecto a determinadas variables (la varianza indica la variabilidad).
12. ¿Cómo se selecciona una muestra probabilística? Como los valores de la población no se conocen, seleccionamos una muestra n además, a través de estimados en la muestra, inferimos valores de la población (y será la estimación del valor de Y, el cual desconocemos). En la muestra, y es un estimado promedio que podemos determinar. Sabemos que en nuestra estimación habrá una diferencia (Y - y = ?), es decir, un error, el cual dependerá del número de elementos muestreados. A dicho error se le conoce como error estándar (se). se = la desviación estándar de la distribución muestra! y representa la fluctuación de y. {se}2 = el error estándar al cuadrado, cuya fórmula nos servirá para calcular la varianza (V) de la población (N), así como la varianza de la muestra (n) será la expresión s2. s2 = varianza de la muestra, la cual podrá determinarse en términos de probabilidad donde s2=p(l-p). p = porcentaje estimado de la muestra, probabilidad de ocurrencia del fenómeno, la cual se estima sobre marcos de muestreo previos o se define, la certeza total siempre es igual a uno, las posibilidades a partir de esto son "/»" de que sí ocurra y "q" de que no ocurra {p + q = 1). De aquí se deriva 1 -p. Como se habrá podido observar, cuando hablamos de un término de la muestra se simboliza con una letra minúscula (n, s, sé). Si se trata de un término de la pobkción, se simboliza con una letra mayúscula (ff, S). Para una muestra probabilística necesitamos principalmente dos cosas: determinar el tamaño de la muestra (n) y seleccionar los elementos muéstrales, de manera que todos tengan la misma posibilidad de ser elegidos. Para lo primero, daremos una fórmula que contiene las expresiones ya descritas. Para lo segundo, requerimos un marco de selección adecuado y un procedimiento que permita la aleatoriedad en la selección. Hablaremos de ambas cosas en los siguientes apartados.
13. El tamaño de la muestra Cuando se hace una muestra probabilística, uno debe preguntarse: dado que una población es de N, ¿cuál es el menor número de unidades muéstrales (personas, organizaciones, capítulos de telenovelas, etc.) que necesito para conformar una muestra (n) que me asegure un determinado nivel de error estándar, digamos menor de 0.01? La respuesta a esta pregunta busca encontrar la probabilidad de ocurrencia de P, así como que mi estimado de y se acerque a Y, el valor real de la población. Si establecemos el error estándar y lo fijamos en 0.01, sugerimos que esta fluctuación promedio de nuestro estimado y con respecto a los valores reales de la población Y no sea > 0.01, es decir, que de 100 casos, 99 veces mi predicción sea correcta y que el valor de y se sitúe en un intervalo de confianza que comprenda el valor de Y. Resumiendo, para una determinada varianza [V] de Y, ¿qué tan grande debe ser mi muestra? ' Ello se determina en dos pasos:
14. El tamaño de la muestra Pongamos el siguiente caso: en el ejemplo que ya habíamos mencionado en este capítulo, delimitamos una población para un estudio de directores generales, en el cual consideramos a "todos aquellos directores generales de empresas industriales y comerciales que, en 1983, tenían un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de pesos y con más de 300 personas empleadas". Con estas características se precisó que k población era de N = 1176 directores generales, ya que 1176 empresas reunían las mencionadas características. ¿Cuál es entonces el número de directores generales (n) que se debe entrevistar, para tener un error estándar menor de 0.015, y dado que k población total es de 1176? N = tamaño de la población de 1 176 empresas. y = valor promedio de una variable = 1, un director general por empresa. se = error estándar = 0.015, determinado por nosotros V2= varianza de k población al cuadrado. Su definición se2: cuadrado del error estándar s2 = varianza de la muestra expresada como k probabilidad de ocurrencia de y p = 0.9 . . ' •' n' = tamaño de la muestra sin ajustar n = tamaño de la muestra Si lo sustituimos, tenemos que: Es decir, para nuestra investigación necesitaremos una muestra de 298 directores generales. Se trata del primer procedimiento para obtener k muestra probabilística: determinar su tamaño con base en estimados de la población. El segundo procedimiento estriba en cómo y de dónde seleccionar a esos 298 sujetos.
15. 2. Tiposde muestrasprobabilisticas Preocupación principal al hacer una muestra: que sea “representativa” de la población Que sea una “buena” muestra, que se “parezca” a la población. Los resultados serán “sensatos” (los parámetros se parecerán a los estadísticos) Si seguimos ciertas reglas: podremos calcular matemáticamente, a partirdel estadístico, el valor aproximadodel parámetro
16. 2.1. Muestreoaleatorio simple Mecanismo ideal para la mejor muestra posible: el muestreo aleatorio simple, muestreo en el que Cada elemento de la población tiene la misma probabilidadde ser escogido Todas las posibles muestras del tamaño muestral escogido (n) tienen la misma probabilidad de ser seleccionadas
17. 2.1. Muestroaleatorio simple Ejemploteórico: Todos los nombres en una lista Papeletao bola porcadanombre Mezcla y extracción de las n bolas o papeletas Cumplelas dos condiciones
18. 2.1 Muestroaleatorio simple En la práctica: Numerar todos los sujetos de la población Obtenerlista de númerosaleatorios. En libros: ejemplo, Apéndice B, Tabla 6 Porordenador (Excel) www.random.org Propiedades: Cadanúmeroelegidoseparadamente Igual probabilidad de ser 0, 1, 2, ... 9 Ninguna influencia de unos números en otros Escoger los n primeros números aleatorios
19. 2.1. Muestreoaleatorio simple Ejemplocon EXCEL A =aleatorio.entre(número;número) da un númeroaleatorio entre los valores mínimo y máximo indicados Si número de sujetos en población es 3000 y quiero 30 casosen la muestra A 30 celdas =aleatorio.entre(1;3000) Si población=40.000.000 y necesito 1.000 casos para la muestra A 1.000 celdas =aleatorio.entre(1;40000000)
20. 2.1. Muestreoaleatorio simple Este es el mecanismo ideal Estadística inferencial: se basa en este modelo ideal de muestreo aleatorio simple Casi todos los métodos de inferencia: suponen que la muestra se ha obtenido por este método En la vida real: pocas veces aplicamos este métodoestrictamente. Aplicamos más habitualmente otros métodos de muestreoprobabilísticos.
21. 2.2 Otrosmuestreosprobabilisticos Métodos de muestreo probabilístico: aquellos en los que es posible calcular la probabilidad de aparición de cada una de las muestras posibles El muestreo aleatorio simple es un muestreo probabilístico Otrosmétodosprobabilísticos: Todos los sujetos igual probabilidad de formar parte de la muestra No todas las muestras posible (combinaciones de n sujetos) tienenla mismaprobabilidad
22. 2.2.1 Muestreosistematico Población ordenada en lista numerada Dividimos el tamaño de la población (N) por el tamaño muestral (n): obtenemos el factor de elevación. Ejemplo: población de 25.000, muestra de 500. Factor de elevación= 50. Escogemos al azar (números aleatorios) un sujeto entre el primero y el que ocupa el puesto igual al factor de elevación. Ejemplo: entre los 50 primeros, el 24. Sumamos a ese número el factor de elevación hasta completar la muestra: 24, 74, 124, 174, 224, 274...
23. 2.2.1 Muestreosistematico Es más sencillo que muestreo aleatorio simple Pero normalmente produce un resultado igual de bueno: se pueden usar los mismos métodos de estadísticainferencial Todos los sujetos igual probabilidad de estar en la muestra No todas las muestras igual probabilidad de aparecer
24. 2.2.1 Muestreosistematico Perfectamente seguro cuando no hay ningún orden en la población Peligro de sesgo: si orden en población en forma de ciclos que coincide con el valor del factor de elevación Ejemplo: Estudio de los contenidos de un periódico, población son los periódicos de cada día en uno o más años y factor de elevación 7 o múltiplo de 7. Todos los días seleccionados serán el mismo díade la semana Igual con otros fenómenos cíclicos: entradas de cine, ventas en restaurantes o tiendas, tráfico, usode transportespúblicos....
25. 2.2.2 Muestreo estratificado Muestreoaleatorio estratificado Dividimos la población en diferentes grupos, o estratos, y tomamos de cada uno de ellos una muestraaleatoria simple Lo hacemos cuando conocemos que la población contiene grupos o subpoblaciones que son homogéneosinternamente (estratos), perosospechamos que son muy diferentes entre ellos respectoa la característicaestudiada
26. 2.2.2 Muestreo estratificado Muestreo estratificado proporcional Ejemplo: muestrade estudiantes sospechamos que sexo influye en respuesta apregunta Sabemos proporción de hombres y mujeres en población Muestreo estratificado proporcional: Calcular número de hombres y mujeres en la muestra, manteniendo la proporción de la población Muestra aleatoria simple de mujeres y hombres Resultado: “mejor” que muestreo aleatorio simple
27. 2.2.2 Muestreo estratificado Muestreo estratificado no proporcional Ejemplo: estudio comparativo de acceso a servicios de salud entre personas que viven en municipios pequeños, medianos y grandes Si muestreo aleatorio simple: muy poca gente de municipios pequeños. Muestra muy pequeña error muestral grande imposible hacerinferencia y comparación. “Solución”: muestreo estratificado con muestras del mismo tamaño de personas que viven en municipios pequeños, medianosy grandes.
28. 2.2.3 Muestreoporconglomerados A veces muestreo aleatorio simple, sistemático o estratificado no esposible. Requieren listas (totales o por estratos) En muchos casos: esas listas no existen (o no son accesibleslegalmente). Pero sí existen listas de “grupos heterogéneos de sujetos”, o conglomerados. Hacemos muestreo aleatorio de conglomerados Dentro de los conglomerados elegidos: todos los elementos, o muestreo aleatorio simple
29. 2.2.3 Muestreoporconglomerados Ejemplo: estudio sobre estudiantes universitarios españoles No hay lista de todos los estudiantes, ni por estratos Pero sí: lista de universidades y facultades Muestreoporconglomerados: Muestreo aleatorio simple de universidades Idem de facultades Idem de grupos Dentro del grupo (ya hay lista): todos, o muestreo aleatorio simple
30. 2.2.3 Muestreoporconglomerados Solución muy práctica cuando conglomerados definidosgeográficamente: enormereduccióncostes extracción datos (viajes, tiempo, etc...) Diferencia con estratos: Estratosson homogéneosinternamente; interesaconocerdiferencias entre estratos Conglomeradosson heterogéneosinternamente; no interesa particularmente diferencias; es sólo un medio de tomar datos más económico y simple
31. 2.2.3 Muestreoporconglomerados Requisitos: los conglomerados lo más heterogéneos posibles (como la población) internamente; muy parecidos entre sí Esto nunca es del todo así Sobretodoconglomeradosgeográficos: genteigual vive junta (barrios, ciudades) Resultados: más error muestral que muestra aleatoriasimple Métodosinferencia: diferentes
32. 2.2.4 Muestreopolietapico Combinación de varios métodos de muestreo Para poblacionescomplejas Diferentes pasos en la selección de la muestra que usandiferentesmétodos Ejemplo: Municipios de Lima-Callao son conglomerados, pero heterogéneosentre sí. Hacer “estratos de conglomerados” por tamaño de la población, o por actividad económica dominante Seleccionaraleatoriamente, dentro de cadaestrato, un númerode municipios (muestreo estratificado porconglomerados)
33. 2.2.4 Muestreopolietapico Dentro de cada municipio, las manzanas son conglomerados. Distribuir las manzanas de cada municipio en estratos por niveles de renta, u otro indicador conocido Hacer muestreo aleatorio de manzanas en cada estrato de cada municipio (otra vez: muestreo estratificado porconglomerados). En cada manzana hacer un muestreo sistemático de casas. En cada casa hacer un muestreo aleatorio simple de los individuos residentes en la casa.
34. Muestreosno probalisticos Aquellos en los que no es posible calcular la probabilidad de las diferentes muestras NO ES POSIBLE aplicar métodos de estadística inferencialcuando usamos estos muestreos Típicoejemplo: muestravoluntaria Cupón en revista, que pide contestación por correo Oyentes de programa de radio o televisión, a los que se pide que llamen a un teléfono. Doble distorsión: el programa y el sentimiento intenso sobreel tema. NO es una muestra representativa: es una muestra sesgada. AUNQUE LLAMEN CIENTOS DE MILES DE PERSONAS!!!!
35. Muestreosno probabilisticos Otro ejemplo: muestreo “de calle”: entrevistador se planta en una esquina y entrevista a gente que pasa Muestra sesgada: lugar, hora, día de la semana, proceso de “selección” por el entrevistador de a quién parar... Otro ejemplo: Muestreo de conveniencia: empresa que encuesta a sus clientes para conocer las opiniones de los compradores de un producto; Sindicato que encuesta a sus afiliados para conocer opiniones de los trabajadores Todos estos ejemplos: error o sesgo de selección NO se pueden aplicar métodos de estadística inferencial NO son muestrasrepresentativas
36. 3. Azar y estudiosexperimentales Algunas veces (poco en ciencias sociales, más en otrasciencias): estudiosexperimentales Experimento: comparar respuestas de los sujetos en alguna variable, bajo diferentes condiciones. A esas condiciones las llamamos tratamientos Ejemplos: medicina sobre enfermedad, método de estudiosobrerendimientoacadémico, forma de funcionamientode cárcelsobrereincidencia...
37. 3. Azar y estudiosexperimentales Papel del azar en estudios experimentales es doble Si es posible: el conjunto de la muestra, escogida al azar respecto a la población Submuestras(reciben dos tratamientosdistintos; o una recibe tratamiento y la otra no): también al azar Efecto: en todos los otros factores “no controlados” los dos grupos serán similares