2. El propósito de un estudio estadístico suele
ser el extraer conclusiones acerca de la
naturaleza de una población.
Al ser la población grande y no poder
estudiada en su integridad en la mayoría de
los casos, las conclusiones deben basarse
en el examen de una parte de ésta, es decir,
una muestra, lo que nos lleva a la aplicación
de distintas técnicas de muestreo.
Introducción
Dr. Paúl Gareca López 2
3. La teoría del muestreo tiene por objetivo el
estudio de las relaciones existentes entre la
distribución de un carácter en una población
y las distribuciones de dicho carácter en
todas sus muestras.
Las ventajas de estudiar una población a
partir de sus muestras son, principalmente,
costo reducido, mayor rapidez y más
posibilidades.
Introducción
Dr. Paúl Gareca López 3
4. Al hacer estadística inferencial, nos
enfrentamos con dos problemas:
Elección de la muestra (muestreo)
Extrapolación de las conclusiones obtenidas
sobre la muestra al resto de la población
(inferencia)
Introducción
Dr. Paúl Gareca López 4
5. El muestreo es la selección de una pequeña
parte estadísticamente determinada,
utilizada para inferir el valor de una o varias
características del conjunto.
El objetivo principal del muestreo es
considerar el mayor número de unidades
con el menor costo posible.
Existen dos tipos, el muestreo no
probabilístico y el muestreo probabilístico.
Introducción
Dr. Paúl Gareca López 5
6. Para que la muestra sea representativa,
requiere que todas las unidades de la
población tengan la misma probabilidad de
ser seleccionadas, es decir, debe ser
aleatoria, al azar o probabilística.
El muestreo no aleatorio es incierto, por eso
sólo lo mencionaremos y estudiaremos el
muestreo aleatorio, que tiene procesos
seguros para inferir, a partir de la muestra,
la población de interés.
Introducción
Dr. Paúl Gareca López 6
7. Dr. Paúl Gareca López 7
El muestreo no aleatorio, circunstancial o
errático, tiene método cuyos resultados o
estimaciones no son de ninguna manera
confiables, dado que la selección de las
unidades que conforman la muestra se
realiza en forma caprichosa o por
conveniencia, primando en muchos casos el
juicio personal del investigador.
Muestreo no aleatorio
8. Dr. Paúl Gareca López 8
Dentro del muestreo no aleatorio existen los
siguientes métodos:
Muestreo a juicio, intencional u opinático
Muestreo por conveniencia
Muestreo voluntario
Muestreo por cuotas
Muestreo no aleatorio
9. Dr. Paúl Gareca López 9
Muestreo a juicio, intencional u opinático, donde
los elementos se seleccionan a juicio o en opinión
del investigador; se podría decir que prima la
intención de que estas unidades sean incluidas
dentro de la muestra.
Muestreo por conveniencia, donde se eligen los
elementos que están más al alcance del
investigador.
Muestreo no aleatorio
10. Dr. Paúl Gareca López 10
Muestreo voluntario, donde el informante,
voluntariamente, suministra información sin ser
previamente seleccionado.
Muestreo por cuotas, es un número de
entrevistas, encuestas, condiciones o cuotas que
se le fijan al encuestador para que a su vez
seleccione los elementos en la forma que
considere oportuna.
Muestreo no aleatorio
11. El muestreo aleatorio, realizado bajo ciertas
condiciones y sometido a cumplir ciertos
requisitos, se constituye en un
procedimiento práctico, económico y rápido
para generalizar conclusiones obtenidas a
través de una muestra, aplicables a toda la
población de la que forma parte, dentro de
ciertos límites de confiabilidad establecidos
de antemano.
Muestreo aleatorio
Dr. Paúl Gareca López 11
12. Dr. Paúl Gareca López 12
Dentro del muestreo aleatorio, se tienen los
siguientes métodos:
Muestreo aleatorio simple o irrestricto
Muestreo aleatorio estratificado
Muestreo por conglomerados, geográfico o por
áreas
Muestreo por fases
Muestreo sistemático
Muestreo aleatorio
13. Dr. Paúl Gareca López 13
Muestreo aleatorio simple o muestreo aleatorio
irrestricto, en el cual se da igual oportunidad de
selección a cada elemento o unidad dentro de la
población.
Muestreo aleatorio estratificado (asignación igual,
proporcional y óptima), garantiza la
representatividad, reduciendo el error de la
muestra al formar grupos o subpoblaciones más o
menos homogéneas, en cuanto a su composición
interna y heterogénea cuando se comparan entre
sí.
Muestreo aleatorio
14. Dr. Paúl Gareca López 14
Muestreo por conglomerados, por áreas o
geográfico. Cuando la unidad básica de muestreo
se encuentra en la población en grupos o
conglomerados y la selección de la unidad
permite la observación del total de elementos de
cada conglomerado elegido. Cada conglomerado
tiene las mismas características de la población;
puede hacerse un segundo muestreo dentro del
conglomerado seleccionado, denominándose de
doble etapa o bietápico.
Muestreo aleatorio
15. Dr. Paúl Gareca López 15
Muestreo por fases. En ocasiones, es conveniente
y económico recoger cierta información de la
totalidad de elementos de una muestra, la cual se
extrae de la población en tal forma que sea lo
suficientemente grande.
Muestreo sistemático. La selección de las
unidades se hace a intervalos regulares, en un
orden sistemático.
Muestreo aleatorio
16. Dr. Paúl Gareca López 16
La mecánica de extraer una muestra que
satisfaga la definición de una muestra
aleatoria simple se conoce como muestreo
aleatorio simple.
Si se extrae una muestra de tamaño n de una
población de tamaño N, de tal manera que
cada muestra posible de tamaño n tenga la
misma probabilidad de ser seleccionada, la
muestra se llama muestra aleatoria simple.
Muestreo aleatorio simple
17. Dr. Paúl Gareca López 17
Antes de entrar al procedimiento del
muestreo aleatorio simple, se considerará el
problema de si se muestrea con reemplazo o
sin reemplazo.
Por ejemplo, supóngase que se extrae una
muestra de una población de pacientes antiguos
de un hospital, como parte de un estudio de
duración de la internación. Supóngase que el
muestreo comprende la selección de una muestra
tomada de los expedientes del departamento de
archivo médico de los pacientes dados de alta.
Muestreo aleatorio simple
18. Dr. Paúl Gareca López 18
En el muestreo con reemplazo se procedería
como sigue: se selecciona un expediente para
formar parte de la muestra, se registra la duración
de la internación y se regresa el expediente al
estante. El expediente está nuevamente en la
“población” y puede ser tomado una vez más en
alguna ocasión subsiguiente, en cuyo caso la
duración de la internación se registrará otra vez.
Muestreo aleatorio simple
19. Dr. Paúl Gareca López 19
En el muestreo sin reemplazo, el expediente
extraído no se regresaría al estante después de
haber registrado la duración de la internación.
sino que se separaría hasta que se extrajera la
muestra completa. Siguiendo este procedimiento,
un expediente dado aparecería en la muestra sólo
una vez.
Muestreo aleatorio simple
20. Dr. Paúl Gareca López 20
Como regla, en la práctica, el muestreo
siempre se realiza sin reemplazo.
Con el fin de asegurar una verdadera
aleatoriedad, se necesitará seguir algún
procedimiento objetivo.
Evidentemente, se deseará evitar el uso del
criterio propio para decidir que miembros de
la población constituyen una muestra
aleatoria.
Muestreo aleatorio simple
22. Dr. Paúl Gareca López 22
Una manera de seleccionar una muestra
aleatoria simple es utilizar una tabla de
número aleatorios.
Ejemplo 1.
Supóngase que la población de interés consta de 120
valores de concentración de azúcar en sangre que se ha
extraído en ayunas. Se desea extraer de esta población una
muestra aleatoria simple de tamaño 10.
Como primer paso, se debe localizar un punto de partida
aleatorio en caso de no haber sido especificado, en este
caso, comenzaremos por la columna 5 y el reglón 5.
Muestreo aleatorio simple
23. Dr. Paúl Gareca López 23
Dado que se tiene 120 valores para elegir, pueden utilizarse
sólo los número aleatorios del 1 al 120, por lo que es
conveniente seleccionar tres dígitos, de modo que sean
elegibles los número del 001 al 120.
Como se trabajará con muestra sin reemplazo, en caso de
haber un número repetido, éste no será tomado en cuenta y
se pasará a buscar otro hasta completar el tamaño de la
muestra especificado.
Muestreo aleatorio simple
27. Dr. Paúl Gareca López 27
Número
aleatorio
Número de la persona en
la muestra
Concentración
113
104
043
052
092
085
018
086
051
058
1
2
3
4
5
6
7
8
9
10
85
108
93
101
104
102
93
91
97
103
Muestreo aleatorio simple
28. Dr. Paúl Gareca López 28
Es otro muestreo que también le asigna igual
probabilidad de inclusión uniforme para
todos, como el simple al azar.
Es conveniente por su simplicidad ya que se
necesita sólo un número aleatorio.
Fácil de seleccionar en campo o durante el
operativo
Se logra en general una muestra más
“representativa” de la población.
Muestreo sistemático
29. Dr. Paúl Gareca López 29
No es necesario conocer el tamaño de la
población N si se conoce la fracción de
muestreo.
Origina muestras bien dispersas desde el
punto de vista geográfico.
Se emplea generalmente en las últimas
etapas en diseños en varias etapas o más
complejos
Muestreo sistemático
30. Dr. Paúl Gareca López 30
Para seleccionar la muestra sistemática se
procede de la siguiente manera:
1. Fijar el tamaño de la muestra (n).
2. Determinar un intervalo (i = N/n).
3. Seleccionar un número al azar.
4. Seleccionar las unidades hasta completar las n
necesarias.
Muestreo sistemático
32. Dr. Paúl Gareca López 32
Ejercicio 1
Seleccionar una muestra sistemática de 20 de una
lista de 500 empresas y comenzar el muestreo
desde el número 7.
Muestreo sistemático
33. Dr. Paúl Gareca López 33
Proceso de división de la población en
grupos homogéneos, llamados estratos, para
luego seleccionar muestras independientes
en cada estrato.
La estratificación se limita a los elementos de
información disponibles en el marco muestra.
Los estratos pueden establecerse para dar
resultados a nivel de dominios de estudio.
Muestreo aleatorio estratificado
34. Dr. Paúl Gareca López 34
Población Estratos
Muestreo aleatorio estratificado
35. Dr. Paúl Gareca López 35
Ejemplo:
Estratificación de la población de 267.694 usuarios
de la empresa de electricidad Setar
Muestreo aleatorio estratificado
N° Estratos Habitantes Porcentaje
1 Bermejo 57.241 21,4
2 San Lorenzo 37.932 14,2
3 Padcaya 41.157 15,4
4 Yacuiba 66.440 24,8
5 Villa Montes 64.924 24,2
Total 267.694 100
36. Dr. Paúl Gareca López 36
Ejemplo:
Muestra de 500 clientes de la población de 267.694
usuarios de la empresa de electricidad Setar
Muestreo aleatorio estratificado
N° Estratos Porcentaje Muestra
1 Bermejo 21,4 107
2 San Lorenzo 14,2 71
3 Padcaya 15,4 77
4 Yacuiba 24,8 123
5 Villa Montes 24,2 122
Total 100 500
37. Dr. Paúl Gareca López 37
Es un proceso de muestreo en dos pasos:
Agrupar la población en conglomerados que se
pueden identificar en mapas y en el terreno.
Seleccionar una muestra de conglomerados y
entrevistar todos los elementos de aquellos.
Los conglomerados pueden ser agrupaciones
naturales o artificiales.
Posiblemente disponibles de fuentes como el
censo (barrios, etc.)
Muestreo por conglomerados
38. Dr. Paúl Gareca López 38
Los que diseñan la encuesta tal vez tengan
que conformarlos.
Se entiende la población como jerarquía de
unidades
Personas viven en viviendas
Viviendas constituyen manzanas
Muchas manzanas hacen una ciudad
Muestreo por conglomerados
39. Dr. Paúl Gareca López 39
Ejemplo de muestreo de barrios
Muestreo por conglomerados
40. Dr. Paúl Gareca López 40
Ejemplo de muestreo de barrios
Muestreo por conglomerados
41. Dr. Paúl Gareca López 41
Distribución muestral es la distribución de
todas las muestras que pueden ser
escogidas conforme a un esquema de
muestreo especificado, que implique la
selección al azar y a una función de número
fijo de variables aleatorias independientes.
De una población a estudiar, se selecciona
una sola muestra de todas las muestras
posibles de igual tamaño, con el fin de
obtener conclusiones sobre la población.
Distribuciones muestrales
42. Dr. Paúl Gareca López 42
Para construir una distribución muestral se
hace lo siguiente:
1. De una población finita de tamaño N, se extrae
al azar todas las muestras posibles de tamaño n.
2. Se calcula la estadística de interés para cada
muestra.
3. Se enlistan en una columna los diferentes
valores observados de la estadística y, en otra
columna, la frecuencia correspondiente de
ocurrencia de cada uno de esos valores.
Distribuciones muestrales
43. Dr. Paúl Gareca López 43
La construcción real de una distribución de
muestreo es una tarea ideal si la población
es de un tamaño finito y es imposible si la
población es infinita. En dichos casos,
pueden obtenerse aproximaciones de las
distribuciones muestrales tomando un gran
número de muestras de un determinado
tamaño.
Distribuciones muestrales
44. Dr. Paúl Gareca López 44
Hasta ahora, se ha considerado el tamaño de
la muestra conocido, pero para determinarlo
es necesario identificar los siguientes
componentes:
La población, que se le suele denominar N y se
refiere al conjunto total de los elementos en
investigación, puede ser finita o infinita.
La muestra, a la que se simboliza con la letra n,
es un subconjunto de la población N previamente
delimitada por los objetivos de la investigación.
Tamaño de la muestra
45. Dr. Paúl Gareca López 45
La media aritmética, que se refiere a los valores
promedio de la población y se expresa como X
respecto al valor de una variable determinada X
que nos interesa conocer.
La varianza, que corresponde al grado de
variabilidad que presentan las unidades de la
población. Mientras más grande sea, mayor será
el tamaño de la muestra.
Tamaño de la muestra
46. Dr. Paúl Gareca López 46
Nivel de confianza. Es el grado de certeza con el
que se pretende realizar una estimación. Tiene
relación directa con el tamaño de la muestra, por
lo tanto, a mayor nivel de confianza más grande
debe ser el tamaño de la muestra. Los valores Z
se obtienen mediante el uso de tablas. El nivel de
significación es fijado por el investigador.
Error máximo aceptado. Corresponde al margen
de error que el investigador fija de acuerdo al
parámetro que piensa estimar. También se lo
conoce como error de muestreo (E).
Tamaño de la muestra
48. Dr. Paúl Gareca López 48
Tamaño de la muestra
Nivel de confianza Z
99,7% 3
99% 2,58
98% 2,33
97% 2,17
96% 2,05
95% 1,96
90% 1,645
80% 1,28
50% 0,674
49. Dr. Paúl Gareca López 49
Símbolos utilizados para el cálculo de tamaño
de la muestra en poblaciones infinitas
N = Tamaño de la población
n = Tamaño de muestra
Z = Parámetro que depende del nivel de confianza
E = Error máximo aceptado
σ = Desviación estándar
p = Probabilidad de que ocurra el evento investigado
q = Probabilidad de que no ocurra el evento estudiado (1 - p)
Tamaño de la muestra
50. Dr. Paúl Gareca López 50
Fórmulas para calcular el tamaño de la
muestra:
Tamaño de la muestra
TIPO DE
VARIABLE
POBLACIÓN
INFINITA
POBLACIÓN
FINITA
Cualitativa
(proporciones) 𝒏 =
𝒁𝟐𝒑𝒒
𝑬𝟐
𝒏 =
𝑵𝒁𝟐𝒑𝒒
𝑵 − 𝟏 𝑬𝟐 + 𝒁𝟐𝒑𝒒
Cuantitativa
(promedios) 𝒏 =
𝒁𝟐𝝈𝟐
𝑬𝟐
𝒏 =
𝑵𝒁𝟐𝝈𝟐
(𝑵 − 𝟏)𝑬𝟐+𝒁𝟐𝝈𝟐
51. Dr. Paúl Gareca López 51
Ejemplo 1.- El gerente de un almacén desea
saber el promedio mensual de lo comprado
por los clientes que usan cuenta de crédito,
con error de Bs 2.500 y probabilidad de 95%,
¿cuál será la muestra si la desviación
estándar es de Bs 30.000?
Tamaño de la muestra
𝑛 =
𝑍2𝜎2
𝐸2
𝑛 =
(1,96)2
(30.000)2
2.5002
=
3.457.440.000
6.250.000
= 553,19 = 𝟓𝟓𝟒
52. Dr. Paúl Gareca López 52
Ejemplo 2.- Calcular el tamaño de muestra
para una población desconocida donde el
investigador asigna un nivel de confianza de
95%, un margen de error de 3% y se
desconoce la probabilidad del evento que
será estudiado.
Tamaño de la muestra
𝑛 =
𝑍2𝑝𝑞
𝐸2
𝑛 =
(1,96)2
(0,5) (0,5)
0,032 =
0,9604
0,0009
= 1.067,1 = 𝟏. 𝟎𝟔𝟖
53. Dr. Paúl Gareca López 53
Ejercicio 1.- ¿Qué tamaño de muestra es
razonable para un nivel de confianza del 99%
con un error de 2 si la desviación estándar es
12?
Tamaño de la muestra
𝑛 =
𝑍2
𝜎2
𝐸2
𝑛 =
(2,58)2
(12)2
22
=
958,52
4
= 239,63 = 𝟐𝟒𝟎
54. Dr. Paúl Gareca López 54
Ejercicio 2.- ¿Qué tamaño de muestra es
necesario, si se considera una confianza de
90% y el error es del 8%?
Tamaño de la muestra
𝑛 =
𝑍2𝑝𝑞
𝐸2
𝑛 =
𝑍2
𝑝𝑞
𝐸2
=
(1,645)2
(0,5) (0,5)
0,082
=
0,6765
0,0064
= 105,7 = 𝟏𝟎𝟔
55. Dr. Paúl Gareca López 55
Ejercicio 3.- Estimar la proporción de familias
que desean consumir un nuevo
medicamento, con una confianza del 95% y
un error del 5%
Tamaño de la muestra
𝑛 =
𝑍2
𝑝𝑞
𝐸2
𝑛 =
(1,96)2 (0,5) (0,5)
0,052 =
0,9604
0,0025
= 384,16 = 𝟑𝟖𝟓
56. Dr. Paúl Gareca López 56
Ejercicio 4.- Estimar la proporción de 2.500
familias que desean consumir un nuevo
medicamento, con una confianza del 95% y
un error del 5%, sabiendo que en una
encuesta anterior, sólo el 12% dijo que lo
consume.
Tamaño de la muestra
𝑛 =
(2.500) (1,96)2 (0,12) (0,88)
2.499 (0,05)2 + (1,96)2(0,12) (0,88)
=
1.014,1824
6,6531
= 152,43 = 𝟏𝟓𝟑
𝑛 =
𝑁𝑍2
𝑝𝑞
(𝑁 − 1)𝐸2+𝑍2𝑝𝑞
57. Dr. Paúl Gareca López 57
Ejercicio 5.- Estimar el gasto promedio
mensual en Bs que una familia gasta en
antibióticos en un barrio de 850 familias, con
un 99% de confianza y un error de Bs 1,5,
considerando la desviación estándar de Bs 9.
Tamaño de la muestra
𝑛 =
(850) (2,58)2
(9)2
849 (1, 5)2 + (2,58)2(9)2 =
458.293,14
2.449,41
= 187,1 = 𝟏𝟖𝟖
𝑛 =
𝑁𝑍2σ2
(𝑁 − 1)𝐸2+𝑍2σ2