Estadística - Muestreo básico

Ing. Juan Trejo Bedón
MUESTREO BÁSICO

MUESTREO ALEATORIO
SIMPLE (M.A.S.)

MUESTREO ALEATORIO
SIMPLE (M.A.S.)
• Método de selección de la muestra en un paso
• El marco muestral debe ser una lista completa
• Cada unidad tiene la misma probabilidad de
selección
• Esta probabilidad es p = n/N
– donde n es el tamaño de la muestra
– y N es el tamaño de la población
• Cada muestra (de n) tiene la misma
probabilidad de selección

Muestreo Aleatorio
Simple
• Población N = 54 viviendas
• Muestra n = 18
• Fracción muestral p = n / N = 18 / 54 = 1/3
• Cada vivienda tiene probabilidad de selección 1/3
• Se seleccionan 18 números aleatorios entre 1 y 54
• Se seleccionan las viviendas correspondientes

Muestreo Aleatorio SimpleMuestreo Aleatorio Simple
San José
San Luis
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo domingo
San Pedro
Av 28 de Julio Av. circunvalación

Muestreo Aleatorio SimpleMuestreo Aleatorio Simple
San José
San Luis
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo Domingo
San Pedro
Av. 28 de Julio Av Circunvalación

Muestreo Aleatorio
Simple
Ventajas del MAS
• Sencillez conceptual
• Necesita como marco muestral sólo una lista de
todos los elementos de la población
• Es fácil calcular las estimaciones de valores
poblacionales
• Es fácil calcular las estimaciones de precisión
(varianza muestral)

Muestreo Aleatorio
Simple
Desventajas del MAS
• Tedioso eligir todos los números aleatorios si n
es grande
• No utiliza información auxiliar sobre la población
• Necesita una lista completa de los elementos de
la población
• Puede tener baja precisión comparado con otros
métodos

Muestreo Aleatorio
Simple
El MAS se puede realizar:
• Con reposición (MASCR)
• Sin reposición (MASSR)

Muestreo Aleatorio
Simple
MASCR
• Seleccionar una unidad
• “Reemplazarla” en la población
• Seleccionar otra, de la población completa
• Continuar hasta obtener una muestra de
tamaño n
• Se puede seleccionar la misma unidad más
que una vez

Muestreo Aleatorio Simple
MASSR:
• Seleccionar una unidad
• “Sacarla” de la población
• Seleccionar otra unidad de las que quedan y sacarla
• Continuar hasta obtener n unidades distintas
• Cada unidad puede estar incluida una sola vez
• Es más eficiente que el MASCR
• Se usa en la práctica

Ejemplo del MAS
Encuesta de las empresas sobre
Gastos en insumos
•Población de seis empresas (N = 6)
•Propósito: estimar gastos para compras
de insumos
•Presupuesto permite sólo una muestra
de dos empresas (n = 2)

Ejemplo del MAS
Población completa
Empresa Gastos
1 $ 26,000
2 470,000
3 63,800
4 145,000
5 230,000
6 12,500
Total 947,300

Muestras Gastos Estimación
posibles observados del total
(1,2) 496,000 1,488,000
(1,3) 89,800 269,400
(1,4) 171,000 513,000
(1,5) 256,000 768,000
(1,6) 38,500 115,500
(2,3) 533,800 1,601,400
(2,4) 613,000 1,845,000
(2,5) 700,000 2,100,000
(2,6) 482,500 1,447,500
(3,4) 208,800 626,400
(3,5) 293,800 881,400
(3,6) 76,300 228,900
(4,5) 375,000 1,125,000
(4,6) 157,500 472,500
(5,6) 252,500 727,500
15 muestras posibles promedio 947,300/6 : insesgado

ESTIMACION DEL TAMAÑO DE MUESTRA -
“MAS”
VARIABLES CUANTITATIVAS
Elementos para calcular un tamaño de muestra
1. Información anterior de promedios y varianzas de variables
relacionadas con la investigación (Censos, encuestas, pilotos).
2. Elegir un nivel de confianza
( 90%, 95%, 99%) . Generalmente para
estudios macroregionales, regionales,
locales se elige 95%. Es
decir: Z = K= 1.96 (abscisa de la
distribución Normal)
( e = d . µ Donde : d = ErrorRelativo Aceptado).
3. Decidirsobre el margen de error (e ) que estamos dispuestos a
tolerar(Errormáximo permisible = ErrorAbsoluto aceptado).
4. Tamaño de la Población ( N )

Fórmula para estimar el
tamaño de la muestra (M.A.S.)
1
o
o
n
n
n
N
≥
+
2 2
2
, : o
Z S
donde n
e
=
e = Margen de error. Es el errorabsoluto del
Promedio Poblacional ( e = d . µ )
d = Es el errorrelativo aceptado (precisión)

MUESTREO ALEATORIO PARA PROPORCIONES
VARIABLES CUALITATIVAS O DE ATRIBUTOS
1
ˆ
ˆ
n
i
i
x
n
X
p
n
=
∑
= =Proporción muestral:
N X−
POBLACIÓ
N (N)
Χ = Número de elementos en la población, que tienen alguna
característica o atributo, o que caen dentro de alguna clase.
X
P Proporción poblacional
N
⇒ = =
ESTIMADOR DE
LA PROPORCION
POBLACIONAL


⇒ 

 ˆ ˆX N p=
Estimador del Total de
Clase Poblacional
X
Χ
n

donde: es la tasa muestral o fracción de muestreo
VARIANZA DE LA PROPORCION Y DEL TOTAL DE
CLASE MUESTRALES - “MAS”
En el muestreo aleatorio sin reposición las varianzas de la
Proporción muestral y del Estimador del Total de Clase
están dadas respectivamente por:
n
f
N
=
ˆ( )
1
PQ N n
V p
n N
− 
= ⇒ 
− 
( )
2
ˆ
1
N PQ N n
V X
n N
− 
= ⇒ 
− 
VARIANZA DEL
ESTIMADOR
DEL TOTAL DE
CLASE
VARIANZA DE LA
PROPORCION
MUESTRAL
( ) 2 ˆ ˆˆ ˆ
1
p q N n
V X N
n N
− 
=  
− 
( )
ˆ ˆˆ ˆ
1
p q N n
V p
n N
− 
=  
− 

ESTIMACION DEL TAMAÑO DE MUESTRA -
“MAS”
(VARIABLES CUALITATIVAS O DE ATRIBUTOS)
Tenemos que:
ˆ 1
1
PQ N n
P p P Z
n N
α
 − 
− ≤ = −  
−   
Tal que, el error de estimación no debe ser mayor que un valor
dado “e” ( ERROR MAXIMO PERMISIBLE O ERROR ABSOLUTO ACEPTADO):
2 2 2 2 2
ˆ ˆ
1
p p
PQ N n
Z Z Z
n N
e e eσ σ
 −  
⇒ ≤ ⇒ ≤ ⇒ ≤  −  
( )1
1
o
o
n
n
n
N
≥
−
+
2
2
, : o
Z PQ
donde n
e
=⇒ e = d.P
d = error relativo
aceptado (precisión)

MODELO DE
MATRIZ PARA
ESTIMAR EL
TAMAÑO DE
MUESTRA
PRECISION
Error Máximo
Permisible (%)
d
NIVEL DE CONFIANZA: ( )
Z = 1.645
90%
Z = 1.96
95%
Z = 2.38
98%
10% 7474
7% 152152
5% 296296
1% 890890
COEFICIENTE
DE VARIACIÓN
α−1
ERROR RELATIVO ACEPTADO

MODELO DE
MATRIZ PARA
ESTIMAR EL
TAMAÑO DE
MUESTRA
PRECISION
Error Máximo
Permisible (%)
d
NIVEL DE CONFIANZA: ( )
Z = 1.645
90%
Z = 1.96
95%
Z = 2.38
98%
10% 5353 7474 105105
7% 107107 152152 214214
5% 210210 296296 418418
2% 325325 890890 13701370
COEFICIENTE
DE VARIACIÓN
α−1
ERROR RELATIVO ACEPTADO

¿QUÉ ES UN MUESTREO
SISTEMATICO?
• Es otro muestreo que también le asigna igual
probabilidad de inclusión uniforme para todos,
como el simple al azar.
• Nuevamente esta probabilidad es n/N.
• Es conveniente porsu simplicidad ya que se
necesita sólo un número aleatorio.
• Fácil de seleccionaren campo o durante el
operativo
• Se logra en general una muestra más
“representativa” de la población.

¿QUÉ ES UN MUESTREO
SISTEMATICO? (cont.)
• No es necesario conocerel tamaño de la
población N si se conoce la fracción de
muestreo.
• Origina muestras bien dispersas desde el
punto de vista geográfico.
• Se emplea generalmente en las últimas
etapas en diseños en varias etapas o más
complejos.

¿Cómo se selecciona una muestra
sistemática?
• Paso 1: Fijarel tamaño de la muestra, n.
• Paso 2: Determinarun paso o intervalo,I=N/n.
• Seleccionarun número al azarentre 1 y I; sea ese
número igual a k.
• Seleccionarlas unidades k, k+I, k+2I, k+3I, k+4I,......
Hasta llegara completarlas n necesarias.
1 2 3 N

¿Cómo se selecciona una muestra
sistemática?(cont.)
Muestreo Sistemático Circular,
útil cuando n no es múltiplo de N.
1
2
3
4
5
67
8
9
1
0
1
1
Arranque
aleatorio

MUESTREO SISTEMATICO: Ejem. 1
Población de tamaño N = 30, muestras
posibles sistemáticas de tamaño n = 6.
Intervalo selección k = N / n = 30/6 = 5
1ra muestra: 1 6 11 16 21 26
2da muestra: 2 7 12 17 22 27
3ra muestra: 3 8 13 18 23 28
4ta muestra: 4 9 14 19 24 29
5ta muestra: 5 10 15 20 25 30
Muestras posibles de tamaño n = 6 :

Ejem. 2: Seleccionar muestra de n = 20n = 20
empresas de lista de N = 500 empresas
• Esto significa que 1 de cada 25 empresas1 de cada 25 empresas de la
población se seleccionará
• Utilizando # al azar# al azar seleccionamos un número entre 1
y 25.
• Suponga que el ## seleccionado esseleccionado es 77..
• Entonces la 1ra empresa. selecc. es el # 71ra empresa. selecc. es el # 7.
• Las otras 19 empresas de la muestra se obtienen
sumando alsumando al 77 el intervalo de selecciónel intervalo de selección 2525.
• Es decir: 07, 32, 57 , ..........07, 32, 57 , ..........

Ejem.2 : La muestra de n = 20n = 20 empresas
seleccionadas de N = 500 empresas es:
 Una ventaja del método sistemático es que laUna ventaja del método sistemático es que la
muestra se distribuye por igual en los diversasmuestra se distribuye por igual en los diversas
empresas.empresas.
 Una M.A.S. tomada de la población no posee estaUna M.A.S. tomada de la población no posee esta
propiedadpropiedad..
0707 3232 5757 8282 107107
132132 157157 182182 207207 232232
257257 282282 307307 332332 357357
382382 407407 432432 457457 482482

Muestreo Estratificado
Aleatorio (M.E.A.)

Muestreo estratificado
• Proceso de división de la población en grupos
homogeneos llamados estratos, para luego
seleccionar muestras independientes en cada
estrato
• Variables de estratificación pueden ser
geográficas o no-geográficas
• Estratificación se limita a los elementos de
información disponibles en el marco muestral

1. Protegernos contra la posibilidad de
obtener una mala muestra.
RAZONES PARA LA
ESTRATIFICACION
2. La estratificación se utiliza para disminuir las
varianzas de los estimadores ( disminuir la
varianza para obtener estimaciones más precisas)
3. Se pueden formar estratos para aplicar diferentes
métodos y procedimientos de muestreo dentro de
cada estrato. (Selección de la muestra y
procedimientos de recojo de información).
4. Los estratos pueden establecerse para dar
resultados a nivel de “DOMINIOS DE ESTUDIO”
(Nivel de inferencia)

N2
ESTRATO 2
(Empresas
medianas)
ESTRATO 3
(Empresas
pequeñas)
ESTRATO 1
(Empresas
grandes)
MUESTREO ALEATORIO ESTRATIFICADO ( MAE )
POBLACION ESTRATOS
N1
N3
n1
n2
n3
1 2 3
1
1 2 3
1
,
L
h
h
L
h
h
Tal que N N N N N N
n n n n n n
=
=
= + + ⇒ =
= + + ⇒ =
∑
∑

Ejemplo 1 de M.E.A.
Estratificacion de
usuarios de la empresa
EDELNOR (parte de Lima)

ESTRATIFICACION DE LA POBLACION
DE 267,694 CLIENTES (EDELNOR)
Nº
de
estrato
ESTRATOS
(Sub-estaciones
transformación)
Nº de clientes
(Tamaño del
estrato)
% de clientes
(Poderación del
estrato)
h =1 Canto Grande N1 = 57,241 W1 = 21.4
h =2 Jicamarca N2 = 37,932 W2 = 14.2
h=3 Mirones N3 = 41,157 W3 = 15.4
h=4 Santa Rosa N4 = 66,440 W4 = 24.8
h=5 Tacna N5 = 64,924 W5 = 24. 2
TOTAL N = 267,694 100.0

MUESTRA DE 500 CLIENTES DE LA POBLACION DE
267,694 CLIENTES (EDELNOR)
Nº
de
estrato
ESTRATOS
(Sub-estaciones
transformación)
% de clientes
(Poderación del
estrato)
Nº de clientes
(Tamaño del
estrato)
h =1 Canto Grande W1 = 21.4 n1 = 107
h =2 Jicamarca W2 = 14.2 n2 = 71
h=3 Mirones W3 = 15.4 n3 = 77
h=4 Santa Rosa W4 = 24.8 n4 = 123
h=5 Tacna W5 = 24.2 n5 = 122
TOTAL 100.0 n = 500

RESULTADOS MUESTRALES DE 500 CLIENTES:
promedio muestral mensual y desviación estándar de consumo por
estratos
N° ESTRATOS Clientes
nh
Media Desviación
estándar
sh
1 Canto Grande 107 1,200 10,000
2 Jicamarca 71 800 6000
3 Mirones 77 3,000 30,000
4 Santa Rosa 123 2,350 25000
5 Tacna 122 2,100 20,000
TOTAL 500 2,000 22,000
hx

AFIJACION DE LA MUESTRA
Se da el nombre de afijación al reparto,
asignación o distribución de la muestra (n)
entre los diferentes estratos. Tal que:
1 2 3 ..... Ln n n n n+ + + + =
1. AFIJACION PROPORCIONAL
h
h h
N
n n nW
N
 
= = 
 
h h h
h
h
n N n n
o o f f
n N N N
⇒ = = =

2. AFIJACION DE NEYMAN ( O DE MINIMA
VARIANZA)
La afijación de Neyman o afijación de mínima
varianza, consiste en determinar los valores de nh
de forma que para un tamaño de muestra (n) fijo,
la varianza sea mínima.
1
h h
h L
h h
h
N S
n n
N S
=
 
 
 =
 
 
 
∑
2
: :hdonde cuasivarianza poblacional del estS rato h
( )stV X

3. AFIJACION DE OPTIMA
La afijación de óptima, consiste en minimizar la varianza
para un coste fijo. Es decir, minimizar con la
condición de que:
1
h h
h
h h
h
N S
C
h L
N S
C
h
n n
=
 
 
 =
 
 
 
∑ 2
:
:
:
( )
:
h
h
donde
costo total
costo por unidad en el
estrato h costo unitario
cuasivarianza poblacional
del estr
C
C
S
ato h
1
L
h h
h
C n C
=
=∑
( )stV X
NOTA: Cuando Ch = constante ∀ h, la Afijación Optima
coincide con la Afijación de Neyman

Muestreo por
conglomerados
• Es un proceso de muestreo en
dos pasos
– Agrupar la población en
conglomerados que se pueden
identificar en mapas y en el terreno
– Seleccionar una muestra de
conglomerados y entrevistar todos
los elementos de aquellos

Muestreo por
conglomerados
• Conglomerados pueden ser
agrupaciones naturales o
artificiales
• Posiblemente disponibles de
fuentes como el Censo
(manzanas, etc.)
• Los que diseñan la encuesta tal
vez tengan que conformarlos

Muestreo por
conglomerados
• Se entiende la población como
jerarquía de unidades
–personas viven en viviendas
–viviendas constituyen
manzanas
–muchas manzanas hacen una
ciudad

Encuesta de estudiantesEncuesta de estudiantes
 = Escuelas  = Estudiantes

Muestra por conglomeradosMuestra por conglomerados
 =
Escuelas
 = Estudiantes  = Seleccionados

Muestreo por
conglomerados
• Ventajas
– Se pueden utilizar aun cuando no haya lista de
unidades de la población
– Para entrevistas personales, el tiempo y costo
de viajes se reduce muchísimo, sobre todo
para poblaciones rurales
– Se necesita sólo una lista de conglomerados
– O la posibilidad de construirla

Muestreo por
conglomerados
• Desventajas
– Tendencia de unidades vecinas de ser
semejantes reduce la precisión
– Dado n fijo, sería menos eficiente
– Pero si se consideran los costos en el terreno, la
posibilidad de aumentar n implica menor pérdida
de precisión en la práctica

MUESTREO PORMUESTREO POR
CONGLOMERADOSCONGLOMERADOS
• En el muestreo por conglomerados, los elementos
individuales de la población sólo pueden participar en
muestra si pertenecen a un conglomerado (UPM)
incluido en la muestra.
• La UPM no es igual a la unidad de observación
(USM), y hay que tomar en cuenta los dos tamaños de
unidades experimentales al calcular los errores
muestrales de las muestras por conglomerados.

¿ PORQUE USAR MUESTREO¿ PORQUE USAR MUESTREO
POR CONGLOMERADOS ?POR CONGLOMERADOS ?
• La construcción de una lista de unidades de
observación para el marco de muestreo puede ser
difícil, cara e imposible.
• La población podría estar muy dispersa
geográficamente o aparecer en cúmulos naturales,
como las escuelas, hospitales, manzanas, familias.
• El muestreo por conglomerados se utiliza en la
práctica debido a que es más barato y conveniente
obtener muestras por conglomerados que al azar
entre la población.

CONGLOMERADOSCONGLOMERADOS
• La población está particionada en N conjuntos que
llamaremos “Conglomerados”
• No se cuenta con una lista de unidades de la población, pero
se tiene una lista de los conglomerados.
• La forma de obtener una muestra consiste en escoger n
conglomerados, y en cada uno de ellos se observan todas las
unidades de población que estaban en cada conglomerado
selecionado.
• Este procedimiento de obtener la muestra se denomina
muestreo por conglomerados.

CONGLOMERADOS :CONGLOMERADOS : EjemploEjemplo
Número deNúmero de niños por manzananiños por manzana
Las 3510 manzanas de una ciudad se
localizan en 90 poblados (urbanizaciones,
AAHH y conjuntos habitacionales).
El número de manzanas en las diferentes
urbanizaciones, AA.HH., C.H. no es el
mismo .
Se selecciona una muestra aleatoria simple de
15 poblados y se determina el # de niños por
manzana.

CONGLOMERADOS :CONGLOMERADOS :
Ejemplo3Ejemplo3
• Promedio de Niños por manzana =
12.24
• La estimación de la varianza del promedio de
niños es de = 0.5854
• El Error Muestral absolutoEl Error Muestral absoluto de lade la
estimación de la varianza del promedio de niñosestimación de la varianza del promedio de niños porpor
manzanamanzana es la Raíz cuadrada de = 0.5854. Es decir :
Error muestral = 0.7651 niños por0.7651 niños por
manzanamanzana
Error muestral relativo = .7651/12.24 =

Estadística - Muestreo básico

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Estadística - Muestreo básico

Similar a Estadística - Muestreo básico (20)

Último

Último (20)

Estadística - Muestreo básico