2. UNIDAD 1
CD CP CA
1.1 1.1 1.1
1.2 1,2 1,2
1.3 1,3 1,3
Nº
HORAS
UNIDAD
Distribuciones muéstrales y técnicas de muestreos
COMPONENTES
RESULTADOS DE APRENDIZAJE DE LA ASIGNATURA: Desarrolla la capacidad de seleccionar la técnica de muestreo más adecuada considerando la teoría
sobre distribuciones muéstrales.
CONTENIDOS ACTITUDINALES
(ACTITUDES Y VALORES)
CONTENIDOS PROCEDIMENTALES
(HABILIDADES)
CONTENIDO A DESARROLLAR
• Identifica y aplica las técnicas de
muestreo probabilístico.
• Identifica y aplica las técnicas de
muestreo no probabilístico.
• Determina el tamaño de la muestra
adecuada, considerando la información
disponible.
• Muestra interés por las
ciencias estadísticas.
• Valora la importancia de
identificar y aplicar una
correcta técnica de muestreo.
• Muestra rigurosidad al
aplicar las técnicas de
muestreo.
12
• Identifica las condiciones para la
aplicación del teorema del límite central.
• Examina la distribución muestral de la
media.
• Examina la distribución muestral de la
varianza.
12 12
• Es honesto y muestra respeto
por los procedimientos que
permiten generar resultados
confiables.
36
• Teorema del límite central.
• Distribución muestral de la media.
• Distribución de la varianza.
• Técnicas de muestreo
probabilístico.
• Técnicas de muestreo no
probabilístico.
• Determinación del tamaño de la
muestra.
3. 2/16 1 1.1 - 1.2
Muestreo sistemático.
CONTENIDO SUBCONTENIDO
SEMANA UNIDAD
Muestreo Aleatorio simple.
Distribución muestral de la varianza.
Técnicas de muestreo.
5. GENERALMENTE LAS POBLACIONES SON DEMASIADO GRANDES
PARA SER ESTUDIADAS EN SU TOTALIDAD. ES NECESARIO
SELECCIONAR UNA MUESTRA REPRESENTATIVA DE UN TAMAÑO
MAS MANEJABLE. ESTA MUESTRA SE UTILIZA LUEGO PARA
SACAR CONCLUSIONES SOBRE LA POBLACION.
EJEMPLO:
SE PUEDE CALCULAR LA MEDIAMUESTRAL, EL ESTADISTICO Ⱦ,Y
UTILIZARLO COMO UN ESTIMADO DE LA MEDIA POBLACIONAL µ.
EL ESTADISTICO SE UTILIZA COMO ESTIMADOR DEL
PARAMETRO.
AL CONFIAR EN UNA MUESTRA PARA SACAR ALGUNA
CONCLUSION O INFERENCIA SOBRE LA POBLACION, SE ESTA EN
LA ESTADISTICA INFERENCIAL.
6. EL VALOR ESTADISTICO DEPENDE DE LA MUESTRA TOMADA. DE
CUALQUIER POBLACION DADA DE TAMAÑO N; ES POSIBLE
OBTENER MUCHAS MUESTRAS DIFERENTES DE TAMAÑO n.
CADA MUESTRA PUEDE TAMBIEN TENER UNA MEDIA
DIFERENTE.
ES POSIBLE OBTENER UNA DISTRIBUCION COMPLETA DE Ⱦs
DIFERENTES DE VARIAS MUESTRAS POSIBLES.
7.
Z
X
x - µ )2
N
s x - Ⱦ)2
n - 1
LA DISTRIBUCION MUESTRAL DE LA MEDIA ES LA DISTRIBUCION DE
PROBABILIDAD DE MEDIAS MUESTRALES, DONDE TODAS LAS
MUESTRAS TIENEN EL MISMO TAMAÑO n.
LOS ESTADISTICOS MUESTRALES QUE COINCIDEN CON EL
PARAMETRO POBLACIONAL SON: MEDIA (Ⱦ), VARIANZA (s2), y la
PROPORCION . (vea y analice el ejemplo de su libro página 251. 9ª. Ed.).
LOS ESTADISTICOS QUE NO COINCIDEN CON LOS PARAMETROS
POBLACIONALES: MEDIANA, RANGO, DESVIACION ESTANDAR
Distribuciones muestrales y estimadores
8. EL VALOR DE UN ESTADISTICO, COMO LA MEDIA MUESTRAL (Ⱦ),
DEPENDE DE LOS VALORES PARTICULARES INCLUIDOS EN LA
MUESTRA, Y GENERALMENTE VARÍA DE UNA MUESTRA A OTRA. TAL
VARIABILIDAD DE UN ESTADISTICO SE DENOMINA VARIABILIDAD DE
MUESTREO).
DISTRIBUCION MUESTRAL DE LA PROPORCION: DISTRIBUCION DE
PROBABILIDAD DE PROPORCIONES MUESTRALES, DONDE TODAS LAS
MUESTRAS TIENEN EL MISMO TAMAÑO MUESTRAL n.
SUPONGAMOS QUE SE TIENE UNA POBLACIÓN DE N = 4 INGRESOS PARA
CUATRO ESTUDIANTES UNIVERSITARIOS. ESTOS INGRESOS SON Q. 100,
Q. 200, Q. 300 Y Q. 400.
EL INGRESO PROMEDIO PUEDE CALCULARSE COMO µ = Q. 250 100 +
200 + 300 + 400 = 1000 / 4 = 250
9. PARA SIMPLIFICAR LAS COSAS:
SE PUEDE PENSAR QUE CALCULAR LA MEDIA DE CUATRO
OBSERVACIONES REQUIERE MUCHO ESFUERZO. COMO
ALTERNATIVA, SE DECIDE SELECCIONAR UNA MUESTRA DE n = 2
OBSERVACIONES PARAESTIMAR LA µ “DESCONOCIDA”.
ENTONCES, SE SELECCIONARÁ ALEATORIAMENTE UNA
MUESTRA DE
4C2 = 6 POSIBLE MUESTRAS (todas las muestras posibles de tamaño
n 0 2 de una población de N = 4 ingresos)
Muestra Elementos muestrales x Media muestral Ⱦ
1 100, 200 150
2 100, 300 200
3 100, 400 250
4 200, 300 250
5 200, 400 300
6 300, 400 350
10. SALVO LAS MUESTRAS TERCERA Y CUARTA, CADA MUESTRA
TIENE UNA MEDIA DIFERENTE. ASUMIENDO QUE CADA
MUESTRA TIENE LA MISMA PROBABILIDAD DE SER
SELECCIONADA, LA PROBABILIDAD DE SELECCIONAR UNA
MUESTRA DE UNA Ⱦ IGUAL A LA MEDIA POBLACIONAL DE 250 ES
SOLO 2/6 = 33.3 %. CUATRO DE LAS SEIS MUESTRAS
RESULTARAN CON ALGUN ERROR EN EL PROCESO DE
ESTIMACION. ESTE ERROR DE MUESTREO ES LA DIFERENCIA
ENTRE µ Y LA MEDIA MUESTRAL QUE SE UTILIZA PARA
ESTIMARLO, (Ⱦ- µ).
ERROR DE MUESTREO: ES LA DIFERENCIA ENTRE EL
PARAMETRO POBLACIONAL Y EL ESTADISTICO DE LA MUESTRA
UTILIZADO PARA ESTIMAR EL PARAMETRO.
11. DEBIDO ALAZAR SE PUEDE SELECCIONAR UNA MUESTRA DE n
= 2 QUE CONSTE DE Q. 100 Y DE Q. 300. LA MEDIA RESULTANTE
DE Ⱦ= Q. 200 PRODUCE UN ERROR DE MUESTREO DE
Q. 250 – Q. 200 = Q. 50.
NUNCA SE PUEDE CALCULAR REALMENTE EL TAMAÑO DEL
ERROR DE MUESTREO DEBIDO A QUE LA MEDIA POBLACIONAL
SIGUE SIENDO DESCONOCIDA. SIN EMBARGO, SE DEBE SER
CONSCIENTE DE QUE ES PROBABLE QUE OCURRA ALGUN
ERROR DE MUESTREO.
12. CON UNA POBLACION DE SOLO N = 5, SE PUEDE ENUMERAR CADA MEDIA
MUESTRAL POSIBLE JUNTO CON SU RESPECTIVAPROBABILIDAD. A ESA
TABLAO LISTADO SE LE DENOMINADISTRIBUCION MUESTRAL.
EJEMPLO
DISTRIBUCION MUESTRAL PARA MUESTRAS DE TAMAÑO n=2 EN UNA
POBLACION DE N=4 INGRESO.
Media muestral Ⱦ Número de muestras que dan Ⱦ probabilidad de P(x)
150 1 1/6
200 1 1/6
250 2 2/6
300 1 1/6
350 1 1/6
1
DISTRIBUCION MUESTRAL: ES UN LISTADO DE TODOS LOS VALORES
POSIBLES PARA UN ESTADISTICO Y LA PROBABILIDAD RELACIONADA CON
CADA VALOR.
13. LA DISTRIBUCION MUESTRAL DE LAS MEDIAS MUESTRALES ES
SIMPLEMENTE UNA LISTA DE TODAS LAS MEDIAS MUESTRALES
POSIBLES. ESTAS MEDIAS MUESTRALES, AL IGUAL QUE CUALQUIER
LISTA DE NUMEROS, TIENEN UNA MEDIA DENOMINADA “LA MEDIA DE LAS
MEDIAS MUESTRALES” O LA GRAN MEDIA.
ESTA MEDIA DE LAS MEDIAS SE CALCULA DE LA FORMA USUAL: LAS
OBSERVACIONES INDIVIDUALES (MEDIAS MUESTRALES) SE SUMAN Y EL
RESULTADO SE DIVIDE POR EL NUMERO DE OBSERVACIONES
(MUESTRAS). SE UTILIZAX CON DOBLE BARRAARRIBA.
LA MEDIA DE LAS MEDIAS MUESTRALES = X
k
DONDE k ES EL NÚMERO DE MUESTRAS EN LA DISTRIBUCION
MUESTRAL.
14. X = 150 + 200 + 250 + 250 + 300 + 350 = 250
6
Debemos notar que la media de la distribución muestral x es igual a la media de la
población original µ = 250. NO ES COINCIDENCIA. LA MEDIA DE LA
DISTRIBUCION MUESTRAL SIEMPRE SERA IGUALA LA MEDIA
POBLACIONAL. X = µ.
LA VARIANZA MIDE LA DISPERSION DE LAS OBSERVACION
INDIVIDUALES (MEDIAS MUESTRALES)ALREDEDOR DE SU MEDIA (LA
GRAN MEDIA).
VARIANZA DE LA DISTRIBUCION
MUESTRAL DE LAS MEDIAS
MUESTRALES
2 = Ⱦ- X)2 = Ⱦ- µ)2
k k
15. DADAS LAS SEIS MEDIAS MUESTRALESANTERIORES
(200-250)2 + (250-250)2 + (250-250)2 + (300-250)2 + (350-250)2
6
= 4,167 AL CUADRADO
SI SE TUVIERA QUE SACAR LA RAÍZ CUADRADA DE LA VARIANZA EN LA
DISTRIBUCION DE ESTAS MEDIAS MUESTRALES, SE TENDRÍAEL ERROR
ESTÁNDAR DE LA DISTRIBUCION MUESTRAL,
ENTONCES:
ERROR ESTANDAR DE LA
DISTRIBUCION MUESTRAL DE
LAS MEDIAS MUESTRALES
EN EL CASO
TODAMEDIDA DE LATENDENCIADE LA MEDIA MUESTRALA DESVIARSE DE µ
SE LE DENOMINA ERROR ESTANDAR. POR LO TANTO EL ERROR ESTANDAR
MIDE LATENDENCIAA SUFRIR DEL ERROR DE MUESTREO EN EL
ESFUERZO POR ESTIMAR µ
16. Ejemplo
Las ventas en miles de dólares para East Coast Manufacturing (ECM) durante los últimos 5
meses fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la
población, la media claramente es µ = 71.6 . Como director de marketing de ECM , se desea
estimar ese µ “desconocido” tomando una muestra de tamaño n = 3. Se espera que el error
de muestreo que es probable que ocurra sea relativamente pequeño. Realice la distribución
muestral y haga Comentarios sobre el posible error de muestreo.
5C3 = 10 muestras de distribución muestral:
No. De la muestra Elementos de la muestra
Media muestral
Ⱦ
1 68, 73, 65 68.67
2 68, 73, 80 73.67
3 68, 73, 72 71.00
4 68, 65, 80 71.00
5 68, 65, 72 68.33
6 68, 80, 72 73.33
7 73, 65, 80 72.67
8 73, 65, 72 70.00
9 73, 80, 72 75.00
10 65, 80, 72 72.33
17. Ⱦ P(x)
68.67 1/10
73.67 1/10
71.00 2/10
68.33 1/10
73.33 1/10
72.67 1/10
70.00 1/10
75.00 1/10
72.33 1/10
1
La
distribución
muestral es
La media de la distribución muestral es:
X = 68.67+73.67+71+71+68.33+73.33+72.67+70 +75+72.33
Ⱦ- µ )
k
= (68.67 – 71.6)2 + (73.67 – 71.6) 2…+ (73.33 – 71.6)2
10
= 4.31 miles de dólares al cuadrado
miles de $
10
X = 71.6 = µ
La varianza y el error estándar de la distribución muestral son:
18. INTERPRETACION:
La media de la distribución muestral es igual a la media de la población original
µ = 71.6.
El error estándar, el cuál mide el grado de dispersión de las 10 medias
muestrales alrededor de µ, indica en cuánto puede variar la media muestral de la
media poblacional.
24. TIPOS DE MUESTREO
No probabilístico
A juicio
Por
conveniencia
Voluntariado
Probabilístico
Aleatorio Simple
Sistemático
Estratificado
Por
conglomerados
25. ¿CÓMO ELEGIR EL MUESTREO
APROPIADO?
Se recomiendan muestreos no probabilísticos,
por limitaciones de recursos, tiempo, dinero y
trabajo, se debe estudiar un número de individuos
menor que el deseable y entonces la opinión del
experto se hace conveniente.
Los muestreos probabilísticos, en la literatura
se menciona que deberían utilizarse siempre que
sean posibles de realizar, sin embargo veamos
algunas excepciones:
26. EJEMPLOS DE SELECCIÓN
DE MUESTREO
Ejemplo. En ocasiones no se puede obtener una lista
completa de la población que se va a estudiar, siendo
por lo tanto imposible aplicar el azar. En dicho caso, la
selección de los individuos que se estudian envuelve
un proceso de opinión.
Ejemplo. Si se desea ensayar una nueva droga y sólo
se tienen
individuos
5 o 6 dosis, en lugar de escoger los
al azar pueden seleccionarse casos
graves, ya que si se mejoran estos casos, será válido
para pacientes con menor o sin gravedad.
27. Ejemplo. En ocasiones el principal interés está en
localizar individuos con determinadas características
en una población muy numerosa, digamos los
enfermos tuberculosos de una colectividad. En tal
caso, es preferible concentrarnos en el estudio de
aquellos grupos en los cuales la experiencia señala
que hay más probabilidad de encontrar los individuos
buscados.
EJEMPLOS DE SELECCIÓN DE
MUESTREO (cont.)
29. MUESTREO NO PROBABILÍSTICO (I)
Es un procedimiento por medio del cual las
unidades muestrales no se seleccionan al
azar, sino que son elegidas por el responsable
de realizar el muestreo.
La selección de la muestra se basa en el
criterio del investigador.
El costo de dichos muestreos es menor
comparado con un muestreo probabilístico.
30. Este tipo de muestreo estriba en la posibilidad de
que un individuo sea incluido en la muestra
desconocida, siendo imposible medir la exactitud
de los resultados obtenidos
MUESTREO NO PROBABILÍSTICO (II)
Porque no se puede medir el error o nivel de
confianza, porque no se pueden incluir
ecuaciones de probabilidad.
31. DESVENTAJAS DEL MUESTREO
NO PROBABILÍSTICO
• Incapacidad de juzgar la precisión de la muestra.
• Mecanismo poco objetivo de apreciación.
• No ofrece representatividad.
• No se puede medir la exactitud de los resultados.
32. TIPOS DE MUESTREOS NO
PROBABÍLISTICO
A JUICIO, INTENCIONAL U OPINÁTICO: los
elementos son seleccionados a juicio o en
opinión del investigador.
POR CONVENIENCIA: se eligen los elementos
que se encuentran a mayor alcance del
investigador.
VOLUNTARIADO: el informante voluntariamente
suministra información sin ser seleccionado.
34. MUESTREO PROBABILÍSTICO (I)
Es aquel procedimiento en el cual cada individuo
de la población, tiene probabilidad perfectamente
conocida.
No es necesario que los individuos cumplan con el
principio de equiprobabilidad, basta con que tenga
cualquier posibilidad diferente de cero de formar
parte de la muestra y que esa probabilidad sea
conocida.
35. MUESTREO PROBABILÍSTICO (II)
Todas las posibles muestras de tamaño n tienen
la misma probabilidad de ser elegidas.
Estos métodos de muestreo probabilísticos nos
aseguran
extraída
la representatividad de la muestra
y son, por tanto, los más
recomendables.
36. CONDICIONES DE UN MUESTREO
PROBABILÍSTICO (I)
- La probabilidad de elegir cada
perfectamente conocida, de lo contrario, NO
individuo sea
se
podrán calcular los errores al momento de la
selección.
- Es fundamental que los individuos se elijan al azar,
se puede usar, por ejemplo: la tabla de números
aleatorios, el método de la lotería u otro método.
37. MUESTREO ALEATORIO
SIMPLE (I)
Procedimiento donde todos y cada uno de
los elementos de la población tienen la
misma probabilidad de ser seleccionados
en la muestra y esta probabilidad es
conocida.
38. Este tipo de muestreo es más recomendable,
pero resulta mucho más difícil de llevarse a
cabo y por lo tanto, es más costoso.
Para seleccionar una muestra de este tipo se
requiere tener en forma de lista todos los
la población
elementos que integran
investigada y utilizar algún instrumento, yal
como las tablas de números aleatorios.
MUESTREO ALEATORIO
SIMPLE (II)
40. EJEMPLO 1
Suponga que estamos investigando sobre el
porcentaje de estudiantes que fuman según el
sexo de una población de 20 estudiantes de la
Universidad de Los Andes
41. -Elija una muestra aleatoria simple de tamaño n=4
de esta población.
-Use la tabla de números aleatorios adjunta.
-Empiece en la fila 1 columna 1 y continúe
seleccionando hacia la derecha.
-Indique los pasos para elegir la muestra.
43. Segundo. Buscamos en la tabla de números aleatorios 4
números, de dos dígitos, entre el 1 y el 20, sin repetir:
Los números seleccionados son: 10, 1, 11 y 20. Por lo tanto,
la muestra está compuesta por Victoria, Juan y Marcelo que
fuman y María que no fuma.
44. El 75% de los estudiantes de la Universidad de Los Andes
fuman.
El 50% de los estudiantes de la Universidad de Los Andes
son hombres fumadores.
El 25% de los estudiantes de la Universidad de Los
Andes son mujeres fumadoras.
¿Qué falló en el muestreo para que se dieran
resultados no extrapolables a la población?
Tercero. Conclusiones
Fundamentalmente falló el tamaño de la población y muestra, pues ante
poblaciones pequeñas se puede hacer un censo.
45. ¿CÓMO CALCULAR EL TAMAÑO DE
LA MUESTRA?
Se requiere el valor de la Varianza, Nivel de confianza y
Precisión de la estimación.
La Varianza (𝝈𝟐): correspondiente al grado de variabilidad que
presentan las unidades de la población. Mientras más grande
sea la varianza, mayor será el tamaño de la muestra. El valor
de la Varianza se debe conocer, de lo contrario se debe
estimar a través de una investigación preliminar. En el caso de
la Varianza de una proporción, se toma P=0,5, con lo cual se
obtiene el máximo valor posible de n.
46. Nivel de confianza: tiene relación directa con el tamaño de
la muestra, por lo tanto se dirá que a mayor nivel de
confianza más grande debe ser el tamaño de la muestra.
Los valores de la Distribución Normal Estandarizada (Z) se
obtienen mediante el uso de tablas. El nivel es fijado por el
investigador de acuerdo con su experiencia.
Precisión de la estimación: Corresponde al margen de
error que el investigador fija de acuerdo con el
conocimiento que tenga acerca del parámetro que piensa
estimar. Se le conoce como error de muestreo (E).
47. Supongamos que se quiere obtener una muestra para la
población de estudiantes del Ejemplo 1, con los siguientes
datos, con un Nivel de Confianza del 95% que en la tabla de Z
es 1,96 y se estima que P=0,1, por lo tanto Q=0,9 y se asume
un E=0,02
𝒁𝟐𝑵𝑷𝑸
𝒏 =
𝑵𝑬𝟐 + 𝒁𝟐𝑷𝑸
𝑛 =
1,962 × 20 × 0,1 × 0,9
20 × 0,02 2 + 1,962 × (0,1) × (0,9)
= 19,54 ≈ 20
Por ello se recomienda hacer un censo ante poblaciones
pequeñas.
EJEMPLO 2
48. EJEMPLO 3
Tamaño de poblaciones infinitas
Un médico desea investigar sobre los accidentes de
motos, para ello quiere tomar una muestra con un nivel de
confianza del 99% y que no exceda un error del 2% ¿Qué
tamaño de muestra tendrá que tomar si estima que la
proporción del error es del 8%?
Solución:
Nivel de Confianza del 95% que en la tabla de Z es 2,58
P=0,08, por lo tanto Q=0,92
E=0,02
𝒏 =
𝑬𝟐
=
𝒁𝟐𝑷𝑸 2,582 × (0,08) × (0,92)
0,022
= 1224,78 ≈ 1225
49. EJEMPLO 4
Error muestral
De un conjunto de gorros descartables se tomaron una
muestra de 200, se encontró que 9 de ellos eran
defectuosos. Con una confianza del 95%, calcular el error
de la muestra.
Solución:
𝑃 =
9
200
= 0,045
𝐸 = 𝑍
𝑃𝑄
= 1,96
(0,045) × (0,955)
𝑛 200
= 0,0287
Expresado en porcentaje el error muestral es del 2,87%
50. EJEMPLO 5
Tamaño de poblaciones finitas
El INTTT desea tomar una muestra para estimar la proporción
de conductores con experiencia de 1 año o menos, que puedan
clasificarse como conductores descuidados ¿De qué tamaño es
la muestra si se considera 10 mil conductores a investigar,
utilizando un nivel de confianza del 95% y un error muestral del
2%? Se espera observar que aproximadamente ¼ de los
conductores sean descuidados.
Solución:
𝒁𝟐𝑵𝑷𝑸
𝒏 =
𝑵𝑬𝟐 + 𝒁𝟐𝑷𝑸
𝑛 =
1,962 × 10000 × 0,25 × 0,75
10000 × 0,02 2 + 1,962 × (0,25) × (0,75)
= 1526
51. través
La selección de unidades se halla a
intervalos regulares en un orden sistemático.
La lista de elementos debe estar realizada al azar.
El punto de partida debe ser al azar.
CUIDADO: Si en la lista existen periodicidades, se
obtendría una muestra sesgada.
MUESTREO SISTEMÁTICO
52.
53. EJEMPLO 6
En la Facultad de Medicina de la Universidad de
Los Andes, se desea elegir una muestra
sistemática de 30 estudiantes a partir de una
población de 120 estudiantes que poseen
enfermedades respiratorias.
54. SOLUCIÓN
Paso 1. Se enumeran los estudiantes.
Paso 2. Se calcula la constante (k) entre cada intervalo, es
decir:
𝑁 120
𝑘 =
𝑛
=
30
= 4
Paso 3. Se sortea un número del 1 al 4, a partir del número
obtenido al azar se le suma la constante hasta conseguir la
cantidad de la muestra.
Supongamos que sea 2, entonces la muestra queda
conformada por los siguientes números:
2, 6,10,14,18,22,26,30,34,38,42,46,50,54,
58,62,66,70,74,78,82,86,90,94,
98,102,106,110,114,118