2. a). Población.
Es el conjunto de todos los elementos a los cuales se refiere la
investigación.
Es la totalidad de elementos o individuos que tienen ciertas
características similares y sobre las cuales se desea hacer
inferencia, o bien unidades de análisis.
b). Muestra.
Es la parte de la población que se selecciona, de la cual
realmente se obtiene la información para el desarrollo del
estudio y sobre la cual se efectuarán la medición y la
observación de las variables objeto de estudio.
2
3. Pasos en la selección de la muestra
Definir la población
Identificar el marco muestral (listado)
Determinar el tamaño de la muestra
Elegir el procedimiento de la muestra
Seleccionar la muestra
Una de las formas de conseguir información
cuantitativa en la fase de caracterización es por
medio de encuestas. En ellas se debe tener en
consideración que sólo se obtendrá información de
una parte de la población, por lo tanto se debe estar
seguro en la relación al número de individuos
(campesinos, productores, trabajadores, enfermeros,
etc.) que se entrevistará. Los métodos cuantitativos
para tener seguridad en la información son descritos
por medio de la técnica de muestreo.
3
4. 10.4. Obtención del tamaño de la muestra.
Uno de los problemas más difíciles del muestreo
probabilístico es la determinación del tamaño de la
muestra, ya que el objetivo primordial al determinarlo es
obtener información representativa, valida y confiable al
mínimo costo. Para obtener más exactitud en la
información es necesario seleccionar una muestra
mayor; sin embargo, el solo hecho de contar con una
muestra grande no garantiza su representatividad.
El tamaño de la muestra estará relacionado con los
objetivos del estudio y las características de la
población, además de los recursos y el tiempo de que se
dispone.
A continuación se describen dos formas de obtener
tamaños de la muestra:
4
5. 1.- De acuerdo a Graybill y Kneebone (1995) , para la estimación
del tamaño de la muestra, se basa en el uso de la amplitud de
los límites de confianza. El intervalo de confianza se expresa
como sigue:
Pr { ỹ – Zɑ S/ √n < µ < ỹ + Zɑ S/ √n } = (1 -ɑ)
El tamaño de la muestra requerida es inversamente proporcional a
la amplitud del intervalo de confianza. Así, si se define d como la
amplitud del intervalo de confianza deseado, la determinación del
tamaño de la muestra, de modo que el intervalo de confianza sea
menor o igual a d unidades es:
2 Zɑ S
d ≥ ----------------
√n
Para asegurar que se seleccione el tamaño de la muestra mínimo, que
cumpla con los requerimientos establecidos, se despeja n
4 Z 2ɑ S 2
n = ----------------
d2
Se busca en la tabla de Z el valor de ɑ/2, debido a que el
intervalo es de dos colas. Por ejemplo si ɑ=0.05, entonces ɑ/2
=0.025 y el valor de Z es d a 1.96.
5
6. Ejemplo:
Se desea estimar a través de encuestas las diferencias en el consumo de energía
de los agricultores de una comunidad campesina. El número total de familias es de
80, los que se dividen en 10 en el estrato alto, 45 en el medio y 25 en el bajo.
Estudio preliminares muestran que la media del consumo de energía es de 2500
kcal con una desviación estándar de 325 kcal día-1. Se desea estimar con una
probabilidad de 95 % y una diferencia deseable de detectar (d) de 10 %.
4 Z 2ɑ S 2
n = ----------------
d2
4 (1,96) 2 325 2
n = -------------------------- = n = 26
250 2
El número de encuestas que se deben tomar, si se utiliza un muestreo aleatorio
simple es de 26. La selección de los individuos a muestrearse debe ser en forma
aleatoria.
Si se toma en consideración los estratos, el número de encuestas en cada estrato
sería:
Nh
nh = ---------- * n
N
10
na = ---------- * 26 = 3
80
45
na = ----------- * 26 = 15
80
25 6
na = ---------- * 26 = 8
80
7. 2.- En el caso anterior se tiene datos como la media y el desvío
estándar, en esta parte veremos sin datos de media y desvío
estándar.
Las etapas para determinar el tamaño de la muestra en el muestreo
aleatorio simple, que es el más usual, son las siguientes:
a.- Determinar el nivel de confianza con que se desea trabajar.
X = σ o el 66 % de confianza
X = 2 σ o el 95 % de confianza
X = 3 σ o el 99 % de confianza
El más usual es el 2 σ (2 desvío estándar).
b.- Estimar las características del fenómeno investigado. Para ello se
determina la probabilidad de que se realice el evento (p) o la que
no se realice (q); cuando no se posea suficiente información de la
probabilidad del evento, se le asigna los máximos valores:
P = 0.5 y q = 0.5.
La suma de p y q siempre es 1.
c.- Determinar el grado de error máximo aceptable en los resultados
de la investigación. Este puede ser hasta del 10 %; normalmente lo
más aconsejable es trabajar con variaciones del 2 al 6 %, ya que
variaciones superiores al 10 % reducen demasiado la validez de la
información.
d.- Se aplica la formula del tamaño de la muestra de acuerdo con el
tipo de población.
7
8. Infinita. Cuando no se sabe el número exacto de unidades del que está compuesto la
población. Y su formula es:
pq
n = ---------------
e2
Nota: no esta muy aceptado su utilización
Finita. Cuando se conoce cuántos elementos tiene la población. Y su formula es:
Z 2 pq N
n = ----------------------------------
N e 2 + Z 2 pq
Donde:
n = tamaño de la muestra
e= error estimado
Z= nivel de confianza (tabla de distribución normal para el 95% de confiabilidad)
N= Población o universo
p= Probabilidad a favor
q= Probabilidad en contra
El error de estimación se utiliza con dos finalidades:
Estimar la precisión necesaria
Determinar el tamaño de la muestra más adecuado.
Para calcular el error de estimación con un nivel de confianza del 95 % o 2 σ, se
aplica la siguiente formula:
3.84 pq
e = ---------------
n
Donde:
e= error estimado
n = tamaño de la muestra
p= Probabilidad a favor
q= Probabilidad en contra 8
9. Ejemplo:
Supóngase que el objetivo de nuestra investigación es
determinar los factores que inciden en la productividad
de los obreros de la pequeña y mediana industria; por lo
que es necesario entrevistar a los gerentes de
producción para conocer su opinión. El tamaño de la
muestra se calcula de la siguiente manera:
1. Se determina el nivel de confianza (95% - 5%) o (90% -
10%).
2. Se obtiene el marco muestral, en este caso la referencia
adecuada es el directorio de la pequeña y mediana
industria que anualmente publica la Cámara Nacional de
Comercio (el número de empresas y de gerentes de
producción en la zona elegida es de 21703.
3. Se obtiene una lista de los representantes de los
gerentes de producción y se numera.
4. Se elige el método de muestreo. Dada las características
de la población se utilizará el método probabilístico y el
muestreo aleatorio simple.
5. Se aplica la formula para los distintos valores:
9
10. Valores (95 % de confiabilidad).
Datos:
n=?
e= error estimado 5 %
Z= 1.96 (tabla de distribución normal para el 95% de
confiabilidad)
N= 21 703 representantes
q= 0,50
alpha = 0.05
Z2 pq N
n = ---------------------------
N e2 + Z2 pq
10
11. Sustitución con el 95 % de confiabilidad
(1,96) 2 (0,50) (1-0,50) (21 703)
n = --------------------------------------------------------------
(21 703) (0,05) 2 + (1,96) 2 ( 0,5) (1-0,50)
(3,8416) (0,50) (0,50) (21 703)
n = --------------------------------------------------------------
(21 703) (0,0025) + (3,8416)(0,50) (0,50)
(3,8416) (0,25) (21 703)
n = --------------------------------------------------------------
(54,2575) + (3,8416) (0,25)
(20 843,561) 20 843,561
n = ------------------------------------ = --------------------------
(54,2575 + 0,9604) 55,2179
n = 377,48
11
12. Sustitución con el 90 % de confiabilidad
(1,65) 2 (0,50) (1-0,50) (21 703)
n = --------------------------------------------------------------
(21 703) (0,10) 2 + (1,65) 2 (0,5) (1-0,50)
(2,7225) (0,25) (21,73)
n = --------------------------------------------------------------
(21 703)(0,01) 2 + (2,7225) (0,25)
(14771,604) 14 771,604
n = ------------------------------------ = --------------------------
(217,03 + 0,680625) 217,7106
n = 67,85
Se comparan ambos resultados, se analizan y se elige el más
adecuado. En este ejemplo si observamos los resultados,
elegiremos el de 377 entrevistas ya que es el que tiene menor
margen de error y consecuentemente una mayor confiabilidad.
Mediante una tabla de números aleatorios se eligen los
representantes.
12
Notas del editor
Ing. Wilfredo Peñafiel Rodríguez Taller de Grado I
Ing. Wilfredo Peñafiel Rodríguez Taller de Grado I