ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
Muestreo 5 conglomerados
1. MUESTREO 1
MUESTREO POR CONGLOMERADOS
• INTRODUCCIÓN. El muestreo por
conglomerados es menos costoso que el muestreo
estratificado o el irrestricto, si el costo por obtener
un marco que liste todos los elementos
poblacionales es muy alto o si el costo por obtener
observaciones se incrementa con la distancia que
separa los elementos.
• Los elementos dentro de un conglomerado deben
estar geográficamente cerca uno del otro, y
entonces los gastos de transporte se reducen.
• Para resumir, el muestreo por conglomerados es
un diseño efectivo para obtener una cantidad
especificada de información al costo mínimo bajo
las siguientes condiciones:
2. MUESTREO 2
MUESTREO POR CONGLOMERADOS
1. No se encuentra disponible o es muy
costoso obtener un buen marco que liste
los elementos de la población, mientras que
se puede lograr fácilmente un marco que
liste los conglomerados.
2. El costo por obtener observaciones se
incrementa con la distancia que separa los
elementos.
Las manzanas de las ciudades son usadas
frecuentemente como conglomerados de
hogares o personas.
3. MUESTREO 3
Como seleccionar una muestra por Conglomerados
Ejemplo 1. un sociólogo quiere estimar el
ingreso promedio por persona en cierta
ciudad pequeña. No existe una lista
disponible de adultos residentes. ¿cómo se
debe diseñar la encuesta por muestreo?.
Solución.
El muestreo por conglomerado parece ser la
elección lógica para el diseño de la encuesta
porque no se encuentra disponible una lista
de elementos.
La ciudad está dividida en bloques
rectangulares.
4. MUESTREO 4
• El muestreo por conglomerados es muestreo
irrestricto aleatorio con cada unidad de
muestreo conteniendo un número de
elementos. Por esto los estimadores de la
media µ y el total τ son similares a los de
muestreo irrestricto aleatorio. En particular la
media muestral es un buen estimador de la
media poblacional µ. Estudiaremos un
estimador de µ y dos estimadores τ.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
5. MUESTREO 5
Notación:
• N = número de conglomerados en la población.
• n = número de conglomerados seleccionados en una MIA.
• mi = número de elementos en el conglomerado i,
• yi = total de las observaciones en el i-th conglomerado.
muestralaendoconglomeradelpromediotamaño
n
m
m
n
i
;1
∑
=
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
poblaciónlaenelementosdenúmeromM
n
i == ∑1
poblaciónlaendoconglomeradelpromediotamaño
N
M
M ==
6. MUESTREO 6
El estimador de la media poblacional µ es la
media muestral, la cual está dada por
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
∑
∑
=
=
= n
i
i
n
i
i
m
y
y
1
1
∑
∑
=
=
= n
i
i
n
i
i
m
y
y
1
1
Estimador de la media poblacional µ
. . . . . . . . . . . (8.1)
7. MUESTREO 7
Límite para el error de estimación:
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
1
)(
2)(ˆ2 1
2
2
−
−
−
=
∑
n
myy
MNn
nN
yV
n
ii . . . . . . . . . . . (8.3)
Varianza estimada de y
1
)(
)(ˆ 1
2
2
−
−
−
=
∑
n
myy
MNn
nN
yV
n
ii
. . . . . . . . . . . (8.2)
La varianza estimada en la ecuación (8,2) es
sesgada y sería un buen estimador de
unicamente si n es grande.
)(yV
8. MUESTREO 8
• El total poblacional τ es ahora Mµ porque M es
denota el número total de elementos en la población.
Por lo tanto como en MIA, proporciona un
estimador de τ
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
yM
Estimador del total poblacional τ:
∑
∑
=
=
= n
i
i
n
i
i
m
y
MyM
1
1
. . . . . . . . . . . (8.4)
Varianza estimada de :yM
1
)(
)(ˆ)(ˆ 1
2
2
22
−
∑ −
−
== =
n
myy
MNn
nN
MyVMyMV
n
i
ii . . . . . . . . . . . (8.5)
9. MUESTREO 9
• Nótese que el estimador es útil si se
conoce el número de elementos M en la
población.
Límite para el error de estimación:
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
1
)(
2)(ˆ2 1
2
2
2
−
∑ −
−
= =
n
myy
MNn
nN
MyMV
n
i
ii
. . . . . . . . . . . (8.6)
yM
10. MUESTREO 10
• Ejemplo 2. Se realizan entrevistas en cada
uno de los 25 bloques establecidos con
anterioridad. Los datos se presentan en la
tabla adjunta. Use los datos para estimar el
ingreso promedio por persona en la ciudad y
establezca un límite para el error de
estimación.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
14. MUESTREO 14
24750222715)1047()8801()0004038)(8801(200000003982)( 2
1
2
=+−=−∑
n
ii myy
• Solución.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
8801
151
0003291
1
1
===
∑
∑
=
=
n
i
i
n
i
i
m
y
y
∑ ∑ ∑∑ +−=− 222
1
2
2)( iiii
n
ii mymyyymyy
04,6
25
1511
===
∑
n
m
m
n
i
785653
24
24750222715
)04,6)(25)(415(
25415
)(ˆ 2
=
−
=yV
16177856532)(ˆ2 ==yV
15. MUESTREO 15
• Ejemplo 3. Utilice los datos de la tabla
anterior para estimar el ingreso total de todos
los residentes de la ciudad, y ponga un límite
para el error de estimación. Existen 2500
residentes en la ciudad.
• Solución. La media muestral calcula es de $
8801. entonces la estimación de τ es.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
50000222$)8801(2500 ==yM
8480424)785653()2500(2)(ˆ2)(ˆ2 22
=== yVMyMV
16. MUESTREO 16
Frecuentemente el número de elementos en la
población no es conocido en problemas donde el
muestreo por conglomerados es apropiado.
Entonces no podemos usar el estimador , pero
podemos formar otro estimador del total
poblacional que no depende de M. La cantidad
dada por:
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
yM
ty
∑=
=
n
i
it y
n
y
1
1 . . . . . . . . . . . (8.7)
17. MUESTREO 17
es el promedio de los totales de conglomerados
para los n conglomerados muestreados. Es por
esto que (8,7) es un estimador insesgado del
promedio de los N totales de conglomerados en la
población. Por el mismo razonamiento empleado en
MIA, (8,4) es un estimador insesgado de la suma
de los totales de conglomerados o,
equivalentemente, del total poblacional τ.
Por ejemplo es altamente improbable que se
conozca el número de adultos varones en una
ciudad, por lo que el estimador de tendrá que
ser usado en lugar de para estimar τ.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
tyN
yM
18. MUESTREO 18
Estimador del total poblacional τ, el cual
no depende de M:
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
∑=
n
it y
n
N
yN
1
. . . . . . . . . . . (8.8)
1
)(
)(ˆ)(ˆ 1
2
22
−
−
−
==
∑
n
yy
Nn
nN
NyVNyNV
n
ti
tt
Varianza estimada de :yN
. . . . . . . . . . . (8.9)
Límite para el error de estimación:
1
)(
2)(ˆ2
2
2
−
−
−
=
∑
n
yy
Nn
nN
NyNV
ti
t
. . . . . . . . . . . (8.10)
19. MUESTREO 19
• Ejemplo 4. usando los datos del ejemplo 2, estimar el
ingreso total de todos los residentes de la ciudad si M no es
conocido. Establezca un límite para el error de estimación,
sabiendo que N = 415 conglomerados.
• Solución.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
40006122$)0003291(
25
415
==tyN
∑ ∑∑ =−=
−=− 00036038911)0003291(
25
1
00000003982
1
)( 2
2
2
1
2
ii
n
ti y
n
yyy
9205053
24
00036038911
25415
25415
)415(2)(ˆ2 2
=
−
=
x
yNV t
20. MUESTREO 20
• Ejemplo 5. El gerente de circulación d un periódico desea
estimar el número promedio de ejemplares comprados por
familia en determinada comunidad. Los costos de transporte
de un hogar a otro son sustanciales. Es por eso que se
listan los 4 000 hogares de la comunidad en 400
conglomerados geográficos de 10 hogares cada uno, y se
selecciona una muestra irrestricta aleatoria de 4
conglomerados. Se realizan las entrevistas con los
resultados que se muestran en la tabla adjunta. Estime el
número promedio de periódicos por hogar en la comunidad
y establezca un límite para el error de estimación.
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
21. MUESTREO 21
• Solución.
75,10)875,1()10(4)20()16()20()19()( 2222222
1
22
1
2
=−+++=−=− ∑∑ =
ynmymyy
n
i
i
n
ii
Conglomerado Número de periódicos Total
1
2
3
4
1 2 1 3 3 2 1 4 1 1
1 3 2 2 3 1 4 1 1 2
2 1 1 1 1 3 2 1 3 1
1 1 3 2 1 5 1 2 3 1
19
20
16
20
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
875,1
40
20162019
4
1
4
1
=
+++
==
∑
∑
=
=
i
i
i
i
m
y
y
∑∑ ∑∑ == =
+−=−
n
i
i
n
i
n
i
iii
n
ii mymyyymyy
1
22
1 1
2
1
2
2)(
0089,0
)3()10)(4(400
)75,10)(4400(
1
)(
)(ˆ 2
1
2
2
=
−
=
−
−
−
=
∑
n
myy
MNn
nN
yV
n
ii
19,00089,02)(ˆ2 ==yV
22. MUESTREO 22
• La cantidad de información en una muestra por
conglomerados es afectada por dos factores, el
número y el tamaño relativo de los conglomerados.
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
)()(ˆ 2
2 cs
MNn
nN
yV
−
=
1
)(
1
2
2
−
−
=
∑
n
myy
s
n
ii
c
. . . . . . . . . . . (8.11)
)()( 2
2 c
MNn
nN
yV σ
−
=
. . . . . . . . . . . (8.12)
23. MUESTREO 23
• Tamaño de muestra requerido para estimar µ
con B:
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
2
2
c
c
ND
N
n
σ
σ
+
= . . . . . . . . . . . (8.13)
4
22
MB
D =
• Tamaño de muestra requerido para estimar
τ, usando con un límite B:tyN
2
2
c
c
ND
N
n
σ
σ
+
=
. . . . . . . . . . . (8.14)
2
2
4N
B
D =
24. MUESTREO 24
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
• Ejemplo 6. Los datos del ejemplo 2
representan una muestra preliminar de
ingresos en la ciudad. ¿Qué tan grande debe
ser la muestra para estimar el ingreso
promedio por persona µ con B = $ 500?
• Solución. Para utilizar la ecuación (8,13),
debemos estimar σ2
c
25. MUESTREO 25
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
260479634
24
24750222715
1
)(
1
2
2
==
−
−
=
∑
n
myy
s
n
ii
c
2
2222
)04,6)(50062(
4
)04,6()500(
4
===
mB
D
167
260479634)50062()04,6(415
)260479634(415
22
2
≈
+
=
+
=
c
c
ND
N
n
σ
σ
26. MUESTREO 26
• Ejemplo 7. Usando nuevamente los datos del
ejemplo 2, como una muestra preliminar de
ingresos en la ciudad, señale ¿qué tan
grande se necesita una muestra para estimar
el ingreso total de todos los residentes, τ, con
B = $ 1 000 000?. Hay 2500 residentes en la
ciudad (M = 2500).
• Solución. Usamos la ecuación (8,14) y
estimamos σ2
c mediante
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
2604796342
=cs
27. MUESTREO 27
• Luego se deben muestrear 213
conglomerados de los 415 para estimar el
ingreso total con un límite de B = $ 1 000
000 para el error de estimación.
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
2
2
2
2
)415(4
)0000001(
4
==
N
B
D
000409602
)415(4
)0000001( 2
==ND
213
260479634000409602
)260479634(415
2
2
≈
+
=
+
=
c
c
ND
N
n
σ
σ
28. MUESTREO 28
• El estimador que se muestra en la ecuación
(8,8), se usa para estimar τ cuando M es
desconocido. La varianza estimada de que se
muestra en (8,9) es
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
tyN
tyN
22
)(ˆ tt s
Nn
nN
NyNV
−
=
1
)( 2
2
−
−
=
∑=
n
yy
s
n
i
ti
t
. . . . . . . . . . . (8.15)
222
)()( ttt
Nn
nN
NyVNyNV σ
−
== . . . . . . . . . . . (8.16)
• Tamaño de muestra para estimar τ, usando con
un límite B:
tyN
2
2
t
t
ND
N
n
σ
σ
+
=
. . . . . . . . . . . (8.17)
29. MUESTREO 29
• Ejemplo 8. Suponiendo que los datos del
ejemplo 2 provienen de un estudio preliminar
de ingresos en la ciudad y que no se conoce
M. ¿Qué tan grande debe ser la muestra
para estimar el ingreso total de todos los
residentes, τ, con B = 1 000 000?.
• Solución.
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
667556474
24
00036038911
1
)( 2
2
==
−
−
=
∑=
n
yy
s
n
i
ti
t
30. MUESTREO 30
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA
LA ESTIMACIÓN DE MEDIAS Y TOTALES
2
2
2
2
)415(4
)0000001(
4
==
N
B
D
183
667556474)415(4/)0000001(415
)667556474(415
222
2
≈
+
=
+
=
t
t
ND
N
n
σ
σ
• Entonces se debe tomar una muestra de 183
conglomerados para tener un límite de $ 1 000 000
en el error de estimación.
31. MUESTREO 31
• Estimador de la proporción poblacional P:
ESTIMACIÓN DE UNA PROPORCION
POBLACIONAL
• Varianza estimada de p:
• Límite para el error de estimación:
∑
∑
=
=
= n
i
i
n
i
i
m
a
p
1
1 . . . . . . . . . . . (8.18)
1
)(
)(ˆ 1
2
2
−
−
−
=
∑=
n
pma
MNn
nN
pV
n
i
ii . . . . . . . . . . . (8.19)
1
)(
2)(ˆ2 1
2
2
−
−
−
=
∑=
n
pma
MNn
nN
pV
n
i
ii . . . . . . . . . . . (8.20)
32. MUESTREO 32
• Ejemplo 9. además de la pregunta sobre su
ingreso, se interroga a los residentes, de la
encuesta del ejemplo 2, acerca de si son
dueños o alquilan la casa donde viven. Los
resultados se muestran en la tabla adjunta.
Utilice los resultados para estimar la
proporción de residentes que viven en casa
de alquiler. Establezca un límite para el error
de estimación.
ESTIMACIÓN DE UNA PROPORCION
POBLACIONAL
34. MUESTREO 34
• Solución. El mejor estimador de la proporción
poblacional de arrendatarios es p.
ESTIMACIÓN DE UNA PROPORCION
POBLACIONAL
48,0
151
72
1
1
===
∑
∑
=
=
n
i
i
n
i
i
m
a
p
00055,0
24
)729,12(
)04,6)(25(415
25415
)(ˆ 2
=
−
=pV
∑ ∑ ∑∑ +−=−
=
222
1
2
2)( iiii
n
i
ii mpmapapma
729,12)1047()477,0()511)(477,0(2262)( 2
1
2
=+−=−∑=
n
i
ii pma
05,000055,02)(ˆ2 ==pV
35. MUESTREO 35
• La estimación de la proporción poblacional
P, con un límite de B unidades para el error
de estimación, implica que el experimentador
quiere:
Selección del tamaño de muestra para la estimación
de proporciones
BpV =)(ˆ2
2
2
c
c
ND
N
n
σ
σ
+
=
1
)(
1
2
2
−
−
=
∑=
n
pma
s
n
i
ii
c
. . . . . . . . . . . (8,21)
• Ejemplo 10. los datos del ejemplo 2 son absoletos.
Se va a realizar un nuevo estudio en la misma
ciudad con el propósito de estimar P de residentes
que alquilan casa en que viven. ¿Qué tamaño de
muestra se necesita? Si B = 0,04.
36. MUESTREO 36
• Solución. El mejor estimador de σ2
c es s2
c el cual es
calculado usando los datos de la tabla.
Selección del tamaño de muestra para la estimación
de proporciones
53,0
24
729,12
1
)(
1
2
2
==
−
−
=
∑=
n
pma
s
n
i
ii
c
0146,0
4
)04,6()04,0(
4
2222
===
mB
D
34
530,0)0146,0)(415(
)530,0)(415(
2
2
≈
+
=
+
=
c
c
ND
N
n
σ
σ
04,0=B
• De modo que se deben muestrear 34
conglomerados para estimar P, con B = 0.04.
37. MUESTREO 37
• Ejemplo 11. consideremos los datos del
ejemplo 2 como la muestra del estrato 1, con
N1 = 415 y n1 = 25. se toma una ciudad
vecina más pequeña como el estrato 2, con
N2 = 168 y n2 = 10 bloques. Estime el ingreso
promedio por persona en las dos ciudades
combinadas, y establezca un límite para el
error de estimación, dados los datos
adicionales que se muestran en la tabla
adjunta.
MUESTREO POR CONGLOMERADOS
COMBINADO CON ESTRATIFICACIÓN
38. MUESTREO 38
MUESTREO POR CONGLOMERADOS
COMBINADO CON ESTRATIFICACIÓN
conglomerado mi yi mi*2 yi*2 yi*mi
1 2 18000 4 324000000 36000
2 5 52000 25 2704000000 260000
3 7 68000 49 4624000000 476000
4 4 36000 16 1296000000 144000
5 3 45000 9 2025000000 135000
6 8 96000 64 9216000000 768000
7 6 64000 36 4096000000 384000
8 10 115000 100 13225000000 1150000
9 3 41000 9 1681000000 123000
10 1 12000 1 144000000 12000
TOTAL 49 547000 313 39335000000 3488000
mi: número de
residentes
ai: número de
arrendatarios
39. MUESTREO 39
• Solución.
MUESTREO POR CONGLOMERADOS
COMBINADO CON ESTRATIFICACIÓN
70054
10
700054
2
==ty160531
=ty
04,61 =m 90,42 =m
)(
1
2211 ttst yNyN
N
y +=
• Estimación del promedio poblacional del total por
conglomerado
• Mientras que el estimador del promedio del tamaño
de conglomerado es )(
1
2211 mNmN
N
+
• Un estimador de la media poblacional por elemento
es entonces
2211
2211*
mNmN
yNyN
y tt
+
+
=
40. MUESTREO 40
• La varianza puede ser estimada:
[ ]
[ ]
−−−
−
−
+
+−−−
−
−
=
∑
∑
=
=
2
1
1
2
22
22
222
1
2
11
11
111
2
*
)(*)(
)1(
)(
)(*)(
)1(
)(1
)(ˆ
n
i
iti
n
I
iti
mmyyy
nn
nNN
mmyyy
nn
nNN
M
yV
• Donde M es el número total de elementos en la
población y puede ser estimado si no es conocido
por:
2211 mNmN +
41. MUESTREO 41
• Para los datos de la tabla, se tiene
9385
)90.4(168)04.6(415
)54700(168)16053(415
* =
+
+
=y
• Para el estrato 1
• Para el estrato 2
[ ]∑=
=−−−
−
1
1
2
11
1
246930675)(*)(
1
1 n
i
iti mmyyy
n
[ ]∑=
=−−−
−
2
1
2
22
2
60093474)(*)(
1
1 n
i
iti mmyyy
n
42. MUESTREO 42
8.33292211 =+ mNmN
8.563412*)(ˆ =yV
12858.5634122*)(ˆ2 === yVB
• Entonces el ingreso promedio por persona para las
dos ciudades combinadas es: $ 9385±1285.
• Vemos que el límite para el error de estimación es
menor que el del estrato 1, como se encontró en el
ejemplo 2.