1. INFERENCIA ESTADÍSTICA
PARTE DE LA ESTADÍSTICA CUYAS TECNICAS
PERMITEN GENERALIZAR LOS RESULTADOS
OBSERVADOS EN UNA MUESTRA A LA
POBLACIÓN CORRESPONDIENTE, CON CIERTO
MARGEN DE CONFIANZA.
EN BASE A UNA MUESTRA SE ESTIMA UN
PARAMETRO POBLACIONAL CON CIERTO
MARGEN DE CONFIABILIDAD Y/O ERROR.
LOS PARAMETROS MAS USADOS SON: LA
MEDIA, LA VARIANZA, LA PROPORCIÓN, Δμ, Y
ΔP.
2. MUESTREO. PROCEDIMIENTO
UTILIZADO PARA SELECCIONAR
UNA MUESTRA REPRESENTATIVA DE
UNA POBLACIÓN
MUESTRA REPRESENTATIVA. ES
AQUELLA QUE DIVERGE DE LA
POBLACIÓN EN TAMAÑO, PERO
MANTIENE SU ESTRUCTURA.
MUESTREO
4. RAZONES PARA USAR EL MUESTREO
Las razones para practicar el muestreo son
entre otras:
Económicas :
Costos, tiempo, oportunidad;
Técnicas :
Poblaciones infinitas y homogéneas
Pruebas destructivas
Calidad y eficiencia,
Exactitud y precisión.
5. DEFINICIÓN DE TÉRMINOS
Población o Universo.
Unidad de Análisis.
Marco de Muestreo (Marco Muestral).
Unidad de muestreo.
Probabilidad de selección.
Error
El error de muestreo
El error no muestral
6. DEFINICIÓN DE TÉRMINOS
Error total = Error no muestral + Error de muestreo
En un censo: mayor grande no estimable
En un muestreo: menor pequeño estimable
El error no muestral puede presentarse al
entrevistar, por comodidad, a un individuo no
seleccionado, al visitar un hogar que no corresponde
a la dirección seleccionada, al tomar mal los datos
por cansancio o negligencia del entrevistador.
El error de muestreo es la diferencia entre el
parámetro P: proporción en la población, de familias
sin servicio de desague.
Simbólicamente: | P - p |
8. Proceso de selección de una muestra donde cada uno de los
elementos de la población tienen igual probabilidad de ser
incluidos en la muestra.
Teóricamente el muestreo aleatorio puede ser practicado en una
población finita o infinita y puede ser con o sin reemplazo.
En la práctica, el muestreo siempre se realiza sin reemplazo..
Restricción.
Para aplicar el M.A.S. es necesario de que la población sea
altamente homogénea respecto a la característica de mayor
interés de estudio, y además que las unidades se encuentren
concentradas.
Muestreo Aleatorio Simple
9. 1.Se confecciona una lista de todos los elementos de
la población (Marco muestral) y se les asigna
números de 1 hasta N (tamaño poblacional)
2.La unidad de base de la muestra debe ser la misma.
3.Se determina el tamaño de la muestra (n)
4.Se extraen al azar los n elementos. Se pueden
utilizar los procedimientos:
Tabla de números aleatorios.
Sistema de la lotería
Cualquier otro procedimiento automatizado
La muestra queda constituida por los n elementos
que hemos obtenido de la población
Procedimiento para seleccionar una muestra
al Azar
10. TAMAÑO DE MUESTRA
Hasta ahora se ha supuesto un tamaño de muestra dado,
interesa analizar brevemente cuáles son los factores
determinantes de la magnitud de “n”.
Fundamentalmente hay cuatro factores condicionantes del
tamaño de muestra:
Variabilidad de la población: σ
Error máximo tolerable en la estimación (Precisión de las
estimaciones): E , D
Nivel de confianza: Z, t.
Tamaño de la población. N.
Además hay un quinto elemento de extraordinaria
importancia práctica: los recursos financieros y recursos
humanos y materiales.
Del equilibrio de todas estas condicionantes se determina
la magnitud del tamaño de muestra.
11. TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA MEDIA
POBLACIONAL ( )
Cuando no se conoce el tamaño de población.
Z2
1- /2 2
n -------------
E2
Donde:
n= Tamaño mínimo de muestra
Z1-/2= Coeficiente de (1-α)% de confiabilidad
= Desviación estándar poblacional.
E = Error máximo tolerable en la estimación de la
media .
12. EJEMPLO: 1
Se quiere determinar el tamaño mínimo de
muestra que permita estimar la resistencia
promedio de un material de construcción,
admitiendo un error máximo de 1.5 kg. Y una
confianza del 95%. Se conoce que = 3
(gk/cm2).
Datos: E= 1.5 kg; Z0.975= 1.96; =3 kg/cm2.
Sustituyendo datos en fórmula:
n (1.962x92)/(1.52) = 15.36
n= 16 Probetas.
14. Ejemplo: 2
Se desea estimar el peso promedio de los sacos que son
llenados por un nuevo instrumento en una industria. Se conoce
que el peso de un saco que se llena con este instrumento es
una variable aleatoria con distribución normal. Si se supone que
la desviación típica del peso es de 0,5 kg. Determine el tamaño
de muestra aleatoria necesaria para determinar con una
confianza del 95% de que el estimado y el parámetro se
diferencien modularmente en menos de 0,1 kg.
15. TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA MEDIA
POBLACIONAL ( )
Cuando se conoce el tamaño de una población (N)
N Z2
/2 2
n --------------------------
(N-1)E2 + Z2
/2 2
Donde:
n= Tamaño mínimo de muestra
Z/2= Coeficiente de (1-α)% de confiabilidad
= desviación estándar poblacional.
E = Error máximo tolerable en la estimación de la media .
N = Tamaño de la población
Se Verifica si N> n(n-1), entonces “n”, tamaño definitivo
Caso contrario, toma “ n’ “, donde:
n
n’ = ---------------- .
1 + (n/N)
16. EJEMPLO: 3
Considere una población de 1000 fincas en la que la
varianza del número de vacunos por finca es de 225.
Se desea estimar el número promedio de vacunos
por finca mediante una muestra, de tal manera que la
estimación no difiera del parámetro en más de 1(Un
vacuno) con una confianza del 95%. Cuál debe ser el
tamaño mínimo de muestra?.
Datos: N= 1000, E=1 2= 225, Z0.975=1.96
Sustituyendo datos en fórmula:
1000x225x1.962
n ------------------------------------------ = 463.87= 4684
999x1 + 225x1.962
como N< n(n-1), entonces: n’ = 317. Aprox.
17. TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA
PROPORCIÓN POBLACIONAL (P )
Cuando no se conoce el tamaño poblacional
Z2
/2 P Q
n -----------------
E2
Donde:
n = Tamaño mínimo de muestra
Z/2= Coeficiente de (1-α)% de confiabilidad
P = Proporción de casos que en la población tienen cierta
característica de interés.
Q = Proporción de casos que en la población no tienen la
característica de interés.
E = Error máximo tolerable en la estimación
de la proporción P
18. Ejemplo: 4
Se desea hacer una encuesta para determinar la
proporción de familias que carecen de medios
económicos para atender los problemas de
vivienda. Antecedentes de casos similares
reportan que esta proporción es próxima a
0.35. ¿De qué tamaño debe tomarse la
muestra a fin de que dicha estimación sea
confiable al 95% admitiendo un error máximo
en la estimación del 5%?
Solución
19. Z2
/2 P Q
n -----------------
E2
Donde:
Z1-/2= Z0.975 = 1.96
P = 0.35.
Q = 0.65.
E = 0.05
Reemplazando:
(1.962 )(0.35x0.65)
n ------------------- = 350.
(0.05)2
20. TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA
PROPORCIÓN POBLACIONAL (P )
Cuando se conoce el tamaño poblacional (N)
N Z2
/2 P Q
n ----------------------------
(N-1)E2 + Z2
/2 P Q
Donde:
n = Tamaño mínimo de muestra
Z/2 = Coeficiente de (1-α)% de confiabilidad
P = Proporción de casos que en la población tienen cierta
característica de interés.
Q = Proporción de casos que en la población no tienen la
característica de interés.
E = Error máximo tolerable en estimación de la proporc. P.
N = Tamaño de la población.
21. EJEMPLO
En un pueblo joven de 1500 viviendas, determinar el
tamaño mínimo de muestra para estimar la
verdadera proporción de viviendas sin servicio de
desague con un error relativo no superior a 0.08 y un
nivel de significancia de 5%. Se sabe por un sondeo
previo que aprox. el 60% de viviendas no tienen
servicios de desague
Datos: N=1500; E=0.08; Z0.975=1.96; P=0.6;Q=0.4
Que sustituyendo en fórmula correspondiente, tenemos:
N Z2
0.975xPxQ 1500x1.962x0.6x0.4
n---------------------------------= ---------------------------------------=132
(N-1)xE2+ Z2
0.975xPxQ 1499x0.082+1.962x0.6x0.4
22. • Este procedimiento de selección es el indicado
para poblaciones heterogéneas y considera la
variabilidad dentro de la población para extraer
una muestra más precisa y eficiente que la que
se obtendría al aplicar directamente el
muestreo aleatorio simple.
• Restricción. Este procedimiento se debe
aplicar cuando es posible dividir la población
en estratos con gran variabilidad entre estratos
y pequeña variabilidad dentro de ellos
Muestreo Estratificado
23. Procedimiento de selección de la
muestra
1º. La población de tamaño N se divide en L subgrupos llamados
estratos. Cuidando que la variabilidad entre estratos sea grande
y que sea pequeña la variabilidad dentro de los estratos.
2º. De cada estrato se toma una muestra aleatoria de tamaño nh.
3º. La suma de las muestras de los estratos conforman la muestra
total “n”.
4º. De la muestra de cada estrato se obtienen los diferentes
indicadores estadísticos. Estos valores, convenientemente
ponderados y sumados a los de los demás estratos, nos
permiten obtener los valores generales para la muestra total.
Para distribuir el tamaño de la muestra entre los L estratos se
utiliza la afijación (Forma de distribución)
24. NOTACIONES
El subíndice h indica el estrato y el subíndice i indica el
elemento del estrato.
Para el estrato h tenemos las siguientes notaciones:
Nh: Total de elementos del estrato h
nh: Nº de elementos de la muestra (estrato h)
Wh=(Nh/N): Ponderación del estrato
fh= (nh/n): Fracción de muestreo del estrato
h
2: Varianza del estrato
S2
h: Varianza de la muestra del estrato h
Ph: Proporción de casos de interés en estrato h
Qh = 1-Ph
25. Tamaño de muestra para afijación
proporcional (Estimación de )
n: Tamaño de muestra
Wh: Ponderación del estrato
E: Error máximo tolerable
Z: Coeficiente del (1-)% de confiabilidad
h
2: Varianza del estrato h.
26. Tamaño de muestra para afijación
optima (Estimación de )
n: Tamaño de muestra
Wh: Ponderación del estrato
E: Error máximo tolerable
Z: Coeficiente del (1-)% de confiabilidad
h
2: Varianza del estrato h.
N
W
Z
E
W
n l
h
h
l
h
h
1
2
2
2
1
27. Tamaño de muestra para afijación
proporcional (Estimación de P )
n: Tamaño de muestra
Wh: Ponderación del estrato
E: Error máximo tolerable
Z: Coeficiente del (1-)% de confiabilidad
Ph: Proporción de casos con caract. de interés en estrato h.
Qh=1-Ph
28. Tamaño de muestra para afijación
óptima (Estimación de P )
n: Tamaño de muestra
Wh: Ponderación del estrato
E: Error máximo tolerable
Z: Coeficiente del (1-)% de confiabilidad
Ph: Proporción de casos con caract. de interés en estrato h.
Qh=1-Ph
N
Q
P
W
Z
E
Q
P
W
n l
h
h
h
l
h
h
h
1
2
2
1
2
)
(
29. AFIJACION
Se denomina afijación a la distribución del tamaño de la
muestra n entre los L estratos. Esto es, determinar los
valores de nh tal que verifique: n1 + n2 + ... +nL = n.
Tipos de afijación.
Afijación igual
Cada valor de nh = n/L, es decir, la distribución no
tiene en cuenta ni el tamaño ni la variabilidad del estrato.
a. Afijación proporcional.
Consiste en distribuir una cantidad de elementos en cada
estrato en forma proporcional al tamaño del estrato
respecto de la población.
El tamaño de la muestra en cada estrato estará dado por:
nh = (Nh/N)*n ; h=1,2,…,L
30. EJEMPLO
Una población de 10000 elementos se ha
dividido en 3 estratos: N1= 3000, N2=2000,
N3=5000; siendo las varianzas de los estratos:
S2
1= 100, S2
2= 400, S2
3= 900
a. Calcular el tamaño de muestra estratificada
para estimar la media con un error de 1.5 y
un nivel de confianza de 95%.
b. Efectuar la afijación proporcional.
c. Calcular el error de muestreo.(Error estándar
de la media muestral)
31. Solución
Estrato Nh Wh 2
h
S h
h
W Nhσh nh
1 3000 0.3 100 3.00 30 112
2 2000 0.2 400 4.00 40 150
3 5000 0.5 900 15.00 150 561
Total 10000 22.00 220 823
a. Usando la fórmula adecuada:
N
W
Z
E
W
n l
h
h
l
h
h
1
2
2
2
1
= 823
10000
0
.
22
96
.
1
5
.
1
)
0
.
22
(
2
2
2
Estrato Nh Wh 2
h
S h
h
W Nhσh nh
1 3000 0.3 100 3.00 30 112
2 2000 0.2 400 4.00 40 150
3 5000 0.5 900 15.00 150 561
Total 10000 22.00 220 823
a. Usando la fórmula adecuada:
N
W
Z
E
W
n l
h
h
l
h
h
1
2
2
2
1
= 823
10000
0
.
22
96
.
1
5
.
1
)
0
.
22
(
2
2
2
32. Continúa solución:
b. Usando la fórmula correspondiente, se distribuye la muestra en los 3 estratos:
3
,...
1
;
*
1
h
n
N
N
n L
h
h
h
h
h
; resultando: n1=112; n2=150; n3=561.
c. Error de muestreo =
2
1
2
1
2
)
(
1
N
N
N
W
n
L
h
h
h
h
h
y
;
Que sustituyendo datos se tiene
41. TIPOS DE MUSTREO NO
PROBABILISTICO
A veces, para estudios exploratorios, el muestreo
probabilístico resulta excesivamente costoso y se
acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar
generalizaciones, pues no se tiene certeza de que la
muestra extraída sea representativa, ya que no todos
los sujetos de la población tienen la misma
probabilidad de se elegidos. En general se
seleccionan a los sujetos siguiendo determinados
criterios procurando que la muestra sea
representativa
42. Muestreo casual o incidental
Se trata de un proceso en el que el
investigador selecciona directa e
intencionadamente los individuos de la
población. El caso más frecuente de
este procedimiento el utilizar como
muestra los individuos a los que se
tiene fácil acceso (los profesores de
universidad emplean con mucha
frecuencia a sus propios alumnos). Un
caso particular es el de los voluntarios
43. Bola de nieve
Se localiza a algunos individuos, los
cuales conducen a otros, y estos a
otros, y así hasta conseguir una
muestra suficiente. Este tipo se emplea
muy frecuentemente cuando se hacen
estudios con poblaciones "marginales",
delincuentes, sectas, determinados
tipos de enfermos, etc
44. Muestreo Discrecional
A criterio del investigador los elementos
son elegidos sobre lo que él cree que
pueden aportar al estudio.
Ej.: muestreo por juicios; cajeros de un
banco o un supermercado; etc.