SlideShare una empresa de Scribd logo
1 de 21
HIPÓTESIS EN ESTADÍSTICA INFERENCIAL
En un trabajo de investigación generalmente se plantean dos hipótesis mutuamente
excluyentes: la hipótesis nula o hipótesis de nulidad (
) y la hipótesis de investigación (
). La hipótesis de investigación es una afirmación especial cuya validez se pretende
demostrar, y si las pruebas empíricas no apoyan decididamente la hipótesis de
investigación, entonces se aceptará la hipótesis nula, abandonándose la hipótesis de
investigación.
En algunos casos es posible plantear hipótesis alternas o hipótesis alternativas. El análisis
estadístico de los datos servirá para determinar si se puede o no aceptar
. Cuando se
rechaza
, significa que el factor estudiado ha influido significativamente en los
resultados y es información relevante para apoyar la hipótesis de investigación
planteada. Plantear hipótesis de investigación que no sea excluyente con
supondría
una aplicación incorrecta del razonamiento estadístico.
Identificación de las variables
Algunas investigaciones hacen hipótesis que involucran variables cuantitativas. La
hipótesis puede tratar de establecer relaciones causales entre esas variables
cuantitativas.
A veces el investigador tendrá control sobre ciertas variables pero no sobre otras, y en
términos de qué variables son controladas u observables y cuales no,las diferentes
variables involucradas en un problema pueden clasificarse en:
Variable independiente: El valor de verdad que se le da a una hipótesis en relación con la
causa, se denomina variable independiente.
Variable dependiente: Denominamos de esta manera a las hipótesis cuando su valor de
verdad hace referencia no a la causa, sino al efecto.
Variable interviniente: Será aquella cuyo contenido se refiere a un factor que ya no es
causa, tampoco efecto, pero sí modifica las condiciones del problema investigado.
Ejemplos
Esta sección se proponen algunos ejemplos de las diferentes tipologías de hipótesis que
se pueden hacer:
Hipótesis de investigación: La computadora con regulador trabaja 100% del tiempo sin
fallar. La computadora que se utiliza sin regulador solamente trabaja 80% del tiempo sin
fallar.
Hipótesis no direccional: Existe una diferencia entre el nivel de ansiedad de los niños
con un coeficiente intelectual alto y aquellos con un coeficiente bajo.
Hipótesis direccional: Los niños con coeficientes intelectuales altos tendrán un nivel de
ansiedad mayor que los niños con coeficientes intelectuales bajos.

Hipótesis nula: No existe diferencia en los niveles de ansiedad entre niños con
coeficientes intelectuales altos y aquellos que tienen coeficientes intelectuales bajos.

Tipos de hipótesis
Hipótesis nulas: estas hipótesis son sobre relaciones que se establecen entre distintas
variables en las que se refuta o niega aquello que es afirmado por las hipótesis de
investigación.
Hipótesis alternativas: estas hipótesis contienen conjeturas o suposiciones de
explicaciones diferentes a las que fueron planteadas por las hipótesis nulas y las de
investigación. Se recurre a esta cuando la de investigación ha sido rechazada y la nula no
es aceptada.
Hipótesis estadísticas: estas hipótesis consisten en las nulas, alternativas o de
investigación transformadas en símbolos estadísticos, se pueden realizar cuando los
datos a estudiar son mensurables. Dentro de estas hipótesis existen distintas clases:
De estimación: estas suponen el valor de alguna característica de la muestra que fue
seleccionada y de la población en su conjunto. Para formularlas se tienen en cuenta datos
adquiridos previamente.
Estadísticas de correlación: buscan establecer estadísticamente las relaciones
existentes entre dos o más variables.
MUESTREO
El definir el tamaño maestral y el método de selección de las unidades de análisis, es uno
de los puntos más importantes en procesos de análisis de datos, ya que dependiendo de
éste, será posible generar inferencias o generalizaciones a toda la población, y por ende,
definir políticas y tomar acciones que impacten el entorno del objeto de estudio. El
proceso seguido para seleccionar una muestra de una población se conoce como
muestreo.
El propósito que se tiene con el muestreo es recabar información representativa de toda
una población con el propósito de generalizar los resultados obtenidos durante un estudio;
controlando la cantidad de información ya que poca información podría afectar los
resultados del estudio y mucha información podría generar gastos innecesarios.
Es evidente que el reducir costos en todas las actividades que se realizan en la
cotidianidad es una prioridad en todo estudio, por lo tanto, es menester en lo posible
trabajar con una parte de la población objeto de estudio, en lugar de realizar un censo. No
obstante, se presentan algunos casos donde es imprescindible medir o explorar a todos
los elementos del universo bajo estudio.
CONCEPTOS BÁSICOS DE MUESTREO
Muestro probabilístico: es aquel cuyos elementos tienen una probabilidad conocida y
mayor de cero de ser seleccionados, tienen la particularidad de que los resultados
encontrados por medio de este método se puede generalizar a toda la población. Se
necesita de formulas matemáticas ya elaboradas para el cálculo del número de unidades
de análisis y tiene como ventaja el poder determinar los errores de estimación.
Muestreos no probabilísticos: es aquel que no permiten generalizar sus resultados a
toda la población, no obstante, son muy útiles para estudios exploratorios y en general
para estudios de corte cualitativo.La elección del procedimiento depende
fundamentalmente de los objetivos del estudio.
Población o Universo: es un conjunto de elementos (sujetos, objetos, entidades
abstractas, etc.) que poseen una o más características en común, podemos encontrar dos
tipos de poblaciones dependiendo del número de elementos de que consten:
Poblaciones finitas: formadas por un número finito de elementos.
Poblaciones infinitas: formadas por un número infinito de elementos.
El hecho de que las poblaciones, por lo general, sean infinitas o estén formadas por un
gran número de elementos, hace que la descripción exacta de sus propiedades sea un
objetivo prácticamente inaccesible. Por esta razón, lo habitual es trabajar con “muestras”.
Muestra: es un subconjunto de elementos de una población.Para extraer conclusiones
validas e imparciales referidas a todos los elementos de la población a partir de la
observación de sólo unos pocos elementos, es necesario, que la muestra utilizada sea
representativa de la población; esto se consigue mediante las “técnicas de muestreo”.
Una muestra proporciona una estimación de parámetro a estudiar, pero si se extrae otra
muestra según las mismas reglas de selección, se obtendrá sin duda otro resultado para
la estimación del parámetro a estudiar. Por tanto “el estimador” es una “variable aleatoria”.
Parámetro: es un valor numérico que describe una característica de una población. Los
parámetros son valores numéricos constantes (es decir, no son variables), definida una
población cualquiera y un parámetro en ella, ese parámetro sólo puede tomar un valor
numérico concreto. Habitualmente los parámetros de interés serán la media
la
varianza
y los porcentajes.
Estadístico o Estimador: es un valor numérico que describe una característica de una
muestra. Su valor concreto depende de los valores de la muestra seleccionada en la que
es calculado. Es evidente que de una población cualquiera es posible extraer más de una
muestra diferente del mismo tamaño, por tanto el valor de un estadístico varía de una
muestra a otra. Un estadístico no es un valor numérico constante (como lo es un
parámetro), sino que es una variable; y su valor concreto depende de la muestra en la
que es calculado.
Algunos de los estadísticos principales son: la media muestral
, la varianza
muestral
, el total muestral(n), la proporción muestral, el mayor y menor valor de la
muestra.
La distribución del estimador viene dada por el conjunto de los resultados obtenidos a
partir del conjunto de las muestras posibles; el carácter aleatorio proviene de la extracción
aleatoria de la muestra. Un estadístico que se utiliza para estimar un parámetro
desconocido de la población recibe el nombre de estimador
Variable aleatoria: es una variable que puede tomar un cierto número de valores, con
una probabilidad asociada a cada valor. Por tanto dicha variable aleatoria seguirá una
“distribución” determinada.

Error de estimación: es la diferencia entre el valor estimado del parámetro usualmente la
media
o el porcentaje de la población que cumple una condición
y el verdadero
valor del parámetro
o el porcentaje de la población que cumple una condición
que
en general será desconocido. El error de estimación va medido en las mismas unidades
que el parámetro que deseamos estimar; si se quiere mantener o disminuir el error, más
elementos u observaciones de la población deberán incluirse en la muestra estudiada.
Como es natural, al aproximar las características poblacionales mediante estimadores
basados en la muestra se comete un error, error que mide la representatividad de dicha
muestra. Dependiendo del coste del muestreo, del presupuesto disponible y de otros
muchos factores fijaremos un error de muestreo que en todo caso debe ser el mínimo
posible. Dicho error de muestreo puede venir dado en términos absolutos, en términos
relativos o sujeto adicionalmente a un coeficiente de confianza dado (sujeto a unos
límites de tolerancia)
En caso de no incluir nuevas observaciones para la muestra, más error se comete en la
precisión o valor estimado del parámetro. El error de estimación se mide en las mismas
unidades que el parámetro que deseamos estimar ejemplo cantidad, precio..., etc. y se
simboliza por:

ó
La estimación de un valor de interés, como la media o el porcentaje (poblacional), estará
generalmente sujeta a una variación entre una muestra y otra. Estas variaciones en las
posibles muestras de una estadística pueden, teóricamente, ser expresadas como errores
muestrales, sin embargo, normalmente, en la práctica el error exacto es desconocido. El
error muestral se refiere en términos más generales al fenómeno de la variación entre
muestras.
El error muestral deseado, generalmente puede ser controlado tomando una muestra
aleatoria de la población, suficientemente grande, sin embargo, el costo de esto puede ser
limitante. Si las observaciones son tomadas de una muestra aleatoria, la teoría estadística
brinda cálculos probabilísticos del tamaño deseado del error muestral para una estadística
en particular o estimación. Estos usualmente son expresados en términos del error
estándar.
El error muestral puede ser contrastado con el error no muestral, el cual se refiere al
conjunto de las desviaciones del valor real que no van en función de la muestra escogida,
entre los cuales se encuentran varios errores sistemáticos y algunos errores aleatorios.
Resultan mucho más difíciles de cuantificar que el error muestral.
Nivel de confianza: Es la probabilidad de que el verdadero valor del parámetro estimado
en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se
denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)•100%).
Es usual tomar como nivel de confianza un 95% o un 99%, que se corresponden con
valores α de 0,05 y 0,01, respectivamente; aunque este se puede escoger a criterio del
que realiza el estudio, la idea es que al seleccionar la muestra esta de mayor que 30 para
poder aplicar la tabla de la normal y asumir normalidad cumpliendo con el teorema del
límite central “entre más grande sea la muestra más se aproxima a una normal”
ESTIMACIÓN DE TAMAÑO DE MUESTRA
Todo estudio lleva implícito en la fase de diseño la determinación del tamaño muestral. Al
no realizar esto pueden suceder diferentes situaciones; seleccionar menos muestras que
las necesarias, perdiéndose precisión en la estimación de parámetros y en las pruebas
estadísticas puede suceder que no se encuentren diferencias significativas cuando
realmente las hay. La segunda situación es que se puede estudiar más muestras que las
necesarias, lo cual lleva implícito pérdida de tiempo e incremento de recursos
innecesarios.
Se debe tener claro el tipo de muestreo que se utilizarápara calcular el tamaño de
muestras. Las limitaciones establecidas en el procedimiento de muestreo varían de un
área de las ciencias a otra. Hay que tomar en cuenta varios factores para determinar el
tamaño que debe alcanzar una muestra como: el tipo de muestreo, el parámetro a
estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza.
TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS
Si conocemos el tamaño de la población se usa los métodos para poblaciones finitas. La
ventaja sobre poblaciones finitas es que al conocer exactamente su tamaño, el tamaño
de la muestra resulta con mayor precisión y se pueden ahorrarse recursos y tiempo para
la aplicación y desarrollo del estudio.Se puede determinar tamaño de la muestra para la
media o para la proporción y las formula a utilizar son:

Para la media

Para la proporción

Ejemplo: se desea estimar entre 10.000 establos, el número de vacas lecheras por
establo con un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la
varianza es 1.000. ¿Cuántos establos deben visitarse para satisfacer estos
requerimientos?
Teniendo en cuenta que el error muestral es de 4 vacas lecheras por establo y para un
nivel de confianza
y un error de confianza es
se busca en la tabla de
la normal el
y es 1.96 (celda marca de color rojo en la tabla de la norma y
=1000, se tiene que la muestra es:

Se deben analizar 234 establos
NOTA: Se puede observar en el ejemplo que como se conoce la varianza y esta es de
1000 vacas lecheras por establo, el error muestral debe ir en la misma unidad de medida
Ejemplo: Se desea realizar una encuesta entre la población juvenil de una determinada
localidad para determinar la proporción de jóvenes que estaría a favor de una nueva zona
de ocio, existe la impresión de que esta proporción está próxima a 0´35; El número de
jóvenes de dicha población es N=2.000.Determinar el tamaño de muestra necesario para
estimar la proporción de estudiantes que están a favor con un error de estimación de 0´05
y un nivel de confianza del 90%
Teniendo en cuenta que el error muestral es de 0.05 y para un nivel de confianza
y un error de confianza es
se busca en la tabla de la normal el
y es 1.65 (celda marca de color café en la tabla de la norma), como la
proporción según la información a favor es del 0.35 (p éxito) entonces la proporción de
jóvenes que no esta de acuerdo es 0.65 (q Fracaso), se tiene que la muestra es:

Se deben encuestar 221 jóvenes de la localidad
NOTA: cuando no se conoce la varianza o proporción se asume la máxima variabilidad
tomando p=0.5 y q= 0.5
TAMAÑO DE MUESTRA PARA POBLACIONES INFINITAS
La población infinitaes aquella que teóricamente es imposible observar todos los
elementos. En la práctica se entenderá por población infinita la que no puede ser
enumerada en un período razonable o aquella en la que se incluye un gran conjunto de
medidas y observaciones que no pueden alcanzarse en el conteo. La desventaja sobre
esta población es que como no se conoce con exactitud el tamaño de la población, el
tamaño de la muestra resulta con poca precisiónSe puede determinar tamaño de la
muestra para la media o para la proporción y las formula a utilizar son:
Para la media

Para la proporción

EJEMPLO:Una compañía de televisor por cable quisiera estimarla proporción de
personas que comprarían una revista con los programas de televisor por cable; por
estudios anteriores se sabe que el 30% de las personas compraría la revista de
programación. La Compañía desea que su estudio tenga un nivel de confianza del 95% y
un error de muestreo del 3%. ¿Qué tamaño de muestra se necesita?
Teniendo en cuenta que el error muestral es de 0.03 y para un nivel de confianza
y un error de confianza es
se busca en la tabla de la normal el
y es 1.96 (celda marca de color rojo en la tabla de la norma), como la
proporción según la información de personas que comprarían la revista es del 0.30 (p
éxito) entonces la proporción de personas que no están dispuestas a comprar la revista
es 0.70 (q Fracaso), se tiene que la muestra es:
Se deben encuestar 896 personas
Ejemplo: el director de una compañía de tabacos desea realizar un estudiar a los la
ciudadanos sobre consumo y adicción que tienen a este producto. Por estudios anteriores
se sabe que el consumo tiene una variabilidad
unidades diarias. El estudio lo
realiza el director con una confiabilidad del 95% y un error entre el número de unidades
consumidas de 4. ¿Cuántos ciudadanos debe tener en cuenta en la muestra el director?
Teniendo en cuenta que el error muestral es de 4 y para un nivel de confianza
y un error de confianza es
se busca en la tabla de la normal el
es 1.96 (celda marca de color rojo en la tabla de la norma y
muestra es:

y

=225, se tiene que la

Se deben analizar 54 ciudadanos
TIPOS DE MUESTREO PROBABILISTICO
Muestreo Aleatorio Simple:
De población se extrae una muestra de tamaño “n”, dando a cada unidad la misma
probabilidad de ser extraída. La muestra se puede extraer:
Con reposición: cuando una unidad seleccionada en una extracción se devuelve a
la población y puede participar en las siguientes extracciones, pudiéndose extraer
dicha unidad dos veces o más. La composición de la población siempre es la
misma y el elemento puede ser seleccionado nuevamente. Al no modificarse la
composición de la población el elemento puede ser elegido en cada extracción con
la misma probabilidad.
Sin reposición: se obtiene la muestra unidad a unidad de forma aleatoria sin
reposición a la población de las unidades previamente seleccionadas, teniendo
presente además que el orden de colocación de los elementos en las muestras no
interviene, es decir, muestras con los mismos elementos colocados en orden
distinto se consideran iguales.
Las ventajas que tiene este procedimiento de muestreo son las siguientes:
Sencillo y de fácil comprensión.
Calculo rápido de medias y varianzas.
Existen paquetes informáticos para analizar los datos
Por otra parte, las desventajas de este procedimiento de muestreo son:
Requiere que se posea de antemano un listado completo de toda la población.
Si trabajamos con muestras pequeñas, es posible que no representen a
lapoblación adecuadamente.
El procedimiento empleado para seleccionar los elementos de la población que hacen
parte en la muestra son:
Identificar a todas las unidades de observación de la población constante.
se asigna un número o código a cada individuo de la población
Se codifica cada elemento de la población y se seleccionan n códigos a través de
una tabla de números aleatorios que se puede encontrar en libros de estadística
como el libro (JOHN E. FREUD; GARAY A. SIMON Estadística elemental.
Octava edición. Editorial Pearson). También se pueden obtener utilizando
Excel a través de la función =ALEATORIO.ENTRE (inferior; superior). Se
eligen tantos sujetos como sea necesario para completar el tamaño de muestra
requerida
LA TABLA DE NUMEROS ALEATORIOS
Una tabla de números aleatorios es un conjunto de dígitos generado de modo que,
normalmente, la tabla contenga cada uno de los diez dígitos (0, 1,…,9), en proporciones
aproximadamente iguales, sin mostrar tendencias en el patrón que se generan los dígitos.
Por lo tanto, si se selecciona un número en un lugar aleatorio de la tabla, es igualmente
probable que sea cualquiera de los dígitos entre el 0 y el 9. Estas tablas se construyen
para asegurar que cada dígito, cada par de dígitos, cada tres dígitos, etc, aparecen con la
misma frecuencia. En el caso de extraer una muestra aleatoria simple, se elige un lugar
para empezar a leer dichos números aleatorios. Después se selecciona una dirección
(arriba, abajo, derecha e izquierda) y se van recogiendo dígitos hasta que se consiga el
tamaño muestral adecuado. Utilizando este método, un elemento puede aparecer más de
una vez. Si queremos extraer una muestra aleatoria simple sin reposición, la solución es
ignorar los elementos repetidos.
Ejemplo: se tiene una población de 50 fabricantes de automóviles y desea seleccionar
una muestra de 20 fábricas para realizar un estudio sobre responsabilidad social de las
mismas. La siguiente tabla muestra las fabricas que componen la población y al lado
derecho el código asignado para seleccionar las que hacen parte en la muestra
F. Chip
F. Contra
F. Destiny
Vista A
Berger 100
Gab. Assett
Neub. Focus
F. Magellan
Janus
L. Mason Value
Gabelli Growth
Franklin Growth
Janus 20
AARP Capital

01
02
03
04
05
06
07
08
09
10
11
12
13
14

Diameter
Thickness
Lbl offctr
Lbl folded
Label cut
Mislabeled
No label
No hole
Hole offct
Hole size
Chip
Scratch
Cracked
Warped

26
27
28
29
30
31
32
33
34
35
36
37
38
39
Kemper Growth A
20th Cent. Growth
F. OTC
Volkswagen
Ford
Mazda
Datsun
Honda
Oldsmobile
Dodge
Mercury

15
16
17
18
19
20
21
22
23
24
25

Columbia Growth
T. R. P. Capital
Neub. Partners
Pontiac
Chevrolet
Ford
Ford
Plymouth
AMC
Buick
Mercury

40
41
42
43
44
45
46
47
48
49
50

Para seleccionar las fábricas que hacen parte en la muestra se utilizo la siguiente tabla de
números aleatorios, se empezó con los dos primeros dígitos por columna empezando por
la primera columna y el recorrido fue de arriba hacia abajo los dígitos que se tuvieron en
cuenta fuero los resaltados con rojo
TABLA DE NUMEROS ALEATORIOS
RENGLÓN COLUMNAS
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

49280
61870
43898
62993
33850
97340
70543
89382
37818
60430
82975
39087
55700
14756
32166
23236
45794
09893
54382
94750
70297
87157
11100
36871
23913
79348
92074
06873
12478
57175

88924
41657
65923
93912
58555
03364
29776
93809
72142
22834
66158
71938
24586
23997
53251
73751
26926
20505
74598
89923
34135
47954
02340
50775
48357
36085
54641
21440
37622
55564

35779
07468
25078
30454
51438
88472
10087
00796
67140
14130
84731
40355
93247
78643
70654
31888
15130
14225
01499
37089
53140
32970
12860
30592
63308
27973
53673
75503
99650
65411

00283
08612
86129
84598
85507
04334
10072
95945
50785
96593
19436
54324
32596
75912
92827
81718
82455
68514
14523
20048
33340
26575
74697
57143
16090
65157
54421
11373
31065
42547

81163
98083
78496
56095
71865
63919
55980
34101
22380
23298
55790
08401
11665
83832
63491
06546
78305
46427
68479
80336
42050
57600
96644
17381
51690
07456
18130
49502
83613
70457

07275
97349
97653
20664
79488
36394
64688
81277
16703
56203
69229
26290
63397
32768
04233
83246
55058
56788
27686
94598
82341
40881
89439
68856
54607
22255
60103
17972
69889
03426

89863
20775
91550
12872
76783
11095
68239
66090
53362
92671
28661
40420
44251
18928
33825
47651
52551
96297
46162
26940
44140
12250
28707
25853
72407
25626
69593
82578
58869
72937

02348
45091
08078
64647
31708
92470
20461
88872
44940
15925
13675
59208
43189
57070
60662
04877
47182
78822
83554
36858
82949
73742
25815
35041
55538
57054
49464
16364
29571
83792
31
32
33
34
35
36
37
38
39
40

91616
78025
27587
16690
70183
90730
10934
82462
27463
02979

11075
73539
67228
20427
58065
35385
93242
30166
10433
52997

80103
14621
80145
04251
65489
15679
13431
79613
07606
00079

07831
39044
10175
64477
31833
90742
24590
47416
16285
92709

59309
47450
12822
73709
82093
50866
02770
13389
93699
90110

13276
03107
86687
73945
16747
78028
48582
80268
60912
47506

26710
12787
65530
92396
10386
75573
00906
05085
94532
53693

73000
47709
49325
68263
59293
67257
58595
96666
95632
40802

Las fábricas que hacen parte en la muestra son las que tienen los Códigos seleccionados
y son:
Buick
Pontiac
No hole
Scratch
Warped
AARP Capital
No label
Oldsmobile
Ford
Janus
Gabelli Growth
Cracked
Gab. Assett
Franklin Growth
Thickness
20th
Cent.
Growth
L. Mason Value
F. Contra
T. R. P. Capital

49
43
33
37
39
14
32
23
45
09
11
38
06
12
27
16
10
02
41

Muestreo Estratificado
La estratificación tiene como objetivo principal aumentar la precisión global de la
estimación sin incrementar el tamaño muestral.
Estratificar una población consiste en dividirla, “antes” de la extracción de la muestra, en
subconjuntos homogéneos (respecto de caracteres determinados a priori), llamados
estratos.
Los estratos deberán ser homogéneos en sí y heterogéneos entre sí respecto de la
característica en estudio. La selección de la muestra se efectúa de maneraindependiente
en el interior de cada estrato. Esto conlleva a que la varianza en cada estrato sea
pequeña. Se trata de que los estratos sean lo más homogéneos posibles dentro de cada
uno de ellos, es decir, que exista en cada uno la menor variabilidad posible y de que haya
grandes diferencias de unos a otros estratos.
En lugar de extraer la muestra totalmente al azar, se extrae parte de la muestra en cada
estrato.Una vez dividido la población en estratos, se deberá repartir la muestra entre
dichos estratos. El reparto o afijación de la muestra a través de los estratos dependerá de
la distribución de la característica en estudio que deberá ser conocida a prior.
Existen muchas maneras de repartir la muestra, pero las más importantes son:
Afijación uniforme: Consiste en asignar el mismo número de unidades
muestrales a cada estrato. Da la misma importancia a todos los estratos, en
cuanto al tamaño de la muestra. Favorece a los estratos de menor tamaño y
perjudica a los grandes, en cuanto a precisión.
La cantidad de elementos de cada estrato que hacen parte en la muestra
Se simboliza por ni.

Ejemplo: Se desea realizar un estudio sobre la gestión financiera del las microempresas
de la cierta ciudad; para ello se tuvo en cuenta aquellas empresas que tenían contador y
que no tenían. Al observar que la proporción de “empresas que tenían dentro de su
empresa un contador era muy baja, se toma la decisión de no utilizar una “muestra
proporcional” puesto que dejaría en la representación de este estrato a muy pocas
empresas. El total de microempresas en la ciudad eran 1780, de las cuales se selecciono
una muestra de 80, el total de empresa por estrato es:
Se tiene en cuenta que la población de empresas esta dividida en dos estratos las que
tienen contador y las que no tienen
La distribución de la población y de la muestra se resume en la siguiente tabla:
N° empresas

Con
contador
Sin
contador
TOTAL

Porcentaje
de la población

380
1400

21.3
78.7

N° de empresas Porcentaje
en la muestra
de estrato en la
muestra
40
10.52
40
2.85

1780

100

80

13.37

Como se puede apreciar, se prefiere “el muestreo estratificado uniforme” cuando existe
un estrato con pocos casos o de baja representación en la población que sin embargo,
presenta algúninterés particular.
Afijación proporcional: La muestra se distribuye proporcionalmente a los
tamaños de los estratos, es la indicada cuando no tenemos información sobre la
distribución de la característica en estudio.
Si existen k estratos de tamaños N1,...,Nk, entonces N=N1+...+Nk . Existen dos
métodos para dividir el tamaño total de la muestra n en estratos n1 ,...,nk .
Se mantiene la proporción del estrato escogiendo
n=n1+...+nk

, de modo que

Si el número de unidades de muestreo seleccionadas de cada estrato esproporcional al
tamaño relativo del estrato en la población, el resultado es unamuestra estratificada
proporcional, lo contrario es una muestra estratificada noproporcional. Esto último es
preferible si los diversos estratos no sonhomogéneos con respecto a la característica bajo
estudio.El error de muestreo de una muestra estratificada puede considerasemenor que el
de una muestra simple aleatoria del mismo tamaño.
Lo anterior sedebe a que el diseño de estratificaciones hace uso de información
adicional,considerando la división de la población de acuerdo con las
característicasrelevantes y sirve para reducir el margen de error de muestreo.El problema
con este método, es que aún cuando se conocen lascaracterísticas relevantes y en base
a ellas se estratifica, el tamaño relativo de losestratos en la población no siempre se
conoce con gran exactitud.
Debido a esta escasez de información, las ventajas obtenidas con la estratificación se
pierden con las variaciones introducidas por la información incorrecta referente al tamaño
de los estratos en la población, elemento que desafortunadamente se subestima
frecuentemente. Puede aportar información mas precisa de algunas subpoblaciones que
varían bastante en tamaño y propiedades entre sí, pero que son homogéneas dentro de
sí. Los estratos deberían en lo posible estar constituidos por unidades homogéneas
Ejemplo: Se quiere obtener una muestra de 50 grandes empresas industriales para hacer
un estudio sobre los gastos en publicidad. En una ciudad se cuenta con 352 grandes
empresas industriales. Se divide a las empresas en 5 estratos de acuerdo a su
rentabilidad.
Para seleccionar la cantidad de empresas que hacen parte en la muestra se utilizó un
muestreo estratificado proporcional, como se indica en la siguiente tabla
, donde Ni, es la cantidad de empresas por estrado

Estrato
A
B
C
D
E

Rentabilida
d
30% o más
20 – 30%
10 – 20%
0 – 10%
Con pérdida

Número

Porcentaje

Muestra

8
35
189
115
5

2
10
54
33
1

1
5
27
16
1
Total

352

100

50

En un muestreo estratificado no proporcional, el número de elementos estudiado en cada
estrato es desproporcionado con respecto a su número en la población. Por ejemplo, si un
muestreo no proporcional fuese utilizado en el caso anterior, se deberán ponderar los
resultados de cada estrato multiplicándose por 0.02 en el estrato 1, por 0.10 en el estrato
2, etc.
Afijación de varianza mínima: El reparto de la muestra se hace de forma que
para un tamaño fijo de n unidades, la varianza sea mínima. Cuanto mayor sea la
variabilidad de estrato, más elementos cogeremos de tal forma que la varianza
global sea mínima.
Proporcionalmente a la variabilidad del estrato. Si conocemos la varianza
entonces

i

,

Afijación óptima: Consiste en minimizar la varianza para un coste fijo.
Para que sea útil el muestreo estratificado se deben reunir las siguientes tres condiciones:
Deben conocerse ciertas características relevantes que influencian fuertemente el
fenómeno bajo estudio:
Que la población sea susceptible de dividirse de acuerdo con las características
relevantes:
La división relativa de la población debe conocerse con cierto grado deprecisión.
Para la selección de los elementos en cada estrato que van ha ser parte en la muestra se
hace por medio de un muestreo aleatorio simple
Una muestra estratificada puede obtenerse aún cuando no se pudieranidentificar los
elementos del estrato, siempre y cuando se conozca despuésde haberse seleccionado la
muestra. El problema sin embargo, es que los erroresde muestreo de las estimaciones
resultan mayores que si se hubiera estratificadoantes.
El uso adecuado del muestro estratificado puede generar ganancia en precisión, pues al
dividir una población heterogénea en estratos homogéneos, el muestreo en estos estratos
tiene poco error debido precisamente a la homogeneidad.

Muestreo Sistemático
En el muestreo sistemático los elementos se seleccionan de la población con un intervalo
uniforme que se mide en el tiempo, en orden o en el espacio; los elementos más
parecidos tienden a estar más cercanos, el muestreo sistemático suele ser más preciso
que el aleatorio simple, ya que recorre la población de un modo más uniforme. Difiere del
muestreo aleatorio simple en que cada elemento tiene iguales posibilidades de ser
seleccionado, pero cada muestra no tiene esa misma probabilidad.Una vez definido el
tamaño de muestra se fija al azar un punto de partida en la selección de las unidades de
muestreo. A partir de allí la población se recorre sistemáticamente usando un intervalo
fijo.
Para seleccionar las unidades de la muestra en primer lugar se debe calcular la
constante de muestreo (K), dividiendo el total de la población elegible por el tamaño de
la muestra deseado
. La primera unidad (r) se extrae tomando un número al azar
entre 1 y la constante de muestreo (K)o entre 1 y N, a partir de ahí se va sumando la
constante de muestreo consecutivamente hasta completar el tamaño de la muestra,
(siendo el primer individuo r, el segundo r + K, el tercero r +2 K y así sucesivamente
hasta completar los “n” individuos).
Este tipo de muestreo tiene la ventaja de no necesitar tener la lista de la población
cerrada de antemano. Sin embargo este tipo de muestreo no es aconsejable en las
situaciones en que las unidades de muestreo están ordenadas por algún criterio periódico
y la constante de muestreo puede coincidir con ello. Por ejemplo si quiere conocer la
demanda en un centro recreación y elegimos como unidad de muestreo el día de la
semana, puede ocurrir que obtengamos como constante de muestreo (K) el número 7, en
ese caso estaríamos describiendo siempre la demanda que se produce un día
determinado, podría ser aleatoriamente sábado, teniendo una elevada probabilidad que la
demanda que se produce el sábado sea diferente de la demanda que se produce a lo
largo de toda la semana, no siendo por tanto la muestra obtenida representativa de la
población que queremos estudiar.
Ejemplo: se desea realizar un estudio sobre la incidencia de cáncer en estudiantes
fumadores de cierta universidad; se opta por un muestreo sistemático, se necesita
calcular primero la constante de muestreo. Si N = 200 estudiantes fumadores y n = 50 la
constante de muestreo
se selecciona un número un número entre 1 y el 4
(supongamos que es el 3, r = 3) y ese será nuestro punto de arranque. Tomaremos el
listado de los estudiantes fumadores de la universidad y el primer estudiante que se
selecciona es el que se encuentra en la lista de tercero, el segundo estudiante
seleccionado seria el que esta de séptimo en la lista(r + K, es decir 3 + 4), el tercero es
el que aparece en la lista de once (r +2 K, es decir 3 + 2x4),y así sucesivamente hasta
tomar los 50 estudiantes fumadores que constituyen nuestra muestra.
Otra forma de seleccionar el punto de arranque sería seleccionar aleatoriamente un
número entre 1 y 200, por ejemplo aleatoriamente se tiene el número 32, el estudiante r=
32 de la lista es el primero seleccionado para la muestra, el segundo es el estudiante 36
(r + K, es decir 32 + 4), el tercero es el 40 (r + 2K, es decir 3 + 2x4), y así
sucesivamente.
El muestreo sistemático suele ser más preciso que el aleatorio simple, ya que recorre la
población de un modo más uniforme. Por otro lado, es a menudo más fácil no cometer
errores con un muestreo sistemátic0. Observación: El método tal como se ha definido
anteriormente es sesgado si no es entero, ya que los últimos elementos de la lista nunca
pueden ser escogidos. Un modo de evitar este problema consiste en considerar la lista
como si fuese circular
¿Cuándo usar Muestreo Sistemático y cuándo Muestreo Aleatorio Simple?
Se debe tener cuidado cuando la distribución de los elementos en la poblaciónpresenta
ciclos en los valores de la variable de interés, ya que en el muestreosistemático se
extraerán valores semejantes, lo que se transfiere a una sub o super valoración del valor
verdadero. En estos casos es más conveniente usar el muestreoaleatorio simple.
Por lo tanto:
Si la distribución de la variable en la población ordenada es aleatoria, los
dosdiseños de muestreo tienen la misma performance. A veces redunda en una
economía de recursos el uso del Muestreo Sistemático.
Si la variable presenta ciclos o estacionalidades, es más eficiente el Muestreo
Aleatorio Simple.
Si la distribución de la variable es creciente o decreciente (por ejemplo, montosde
deudores o acreedores) es más eficiente el Muestreo Sistemático.
Muestreo por Conglomerado
Esta técnica tiene utilidad cuando el universo que se requiere estudiar admite ser
subdividido en universos menores de características similares a la del universo
total.Cuando es posible asumir esta alternativa se procede a subdividir el universo en un
número finito de conglomerados. Entre ellos se pasará a elegir algunos que serán los
únicos que se procederá a investigar. Esta elección puede realizarse ya sea por el
método del muestreo simple o muestreo sistemático. Una vez cumplida esta etapa puede
realizarse una segunda selección dentro de cada uno de los conglomerados elegidos,para
llegar a un número aún más reducido de unidades muéstrales; para obtener una muestra
de conglomerados, primero dividir la población en grupos que son convenientes para el
muestreo;Bajo este método, aunque no todos los grupos son muestreados, cada grupo
tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo
tanto, da menor precisión de las estimaciones acerca de la población) que una muestra
aleatoria simple del mismo tamaño; los elementos individuales dentro de cada
"conglomerado" tienden usualmente a ser iguales. El incremento del tamaño de la
muestra puede fácilmente ser hecho en muestra de área. Por otra parte, una muestra de
conglomerados puede producir la misma precisión en la estimación que una muestra
aleatoria simple, si la variación de los elementos individuales dentro de cada
conglomerado es tan grande como la de la población.
Hay una variante de este muestreo, que puede quedar también incluida en lo que se
llamadiseños complejos y es elconocido como muestreo multietápico o polietápico de
conglomerados (bietápico, trietápico, etc.). En esta variante se seleccionanlos
conglomerados y puede procederse a una segunda selección dentro de los
conglomerados seleccionados y lo mismo en las etapasque sean necesarias. Así la
necesidad de listados se va limitando a aquellas unidades de muestreo que hayan siendo
seleccionadas encada etapa.
Antes de terminar este apartado vale la pena enfatizar la diferencia entre estratos y
conglomerados. Los estratos deben sertan homogéneos dentro de ellos como sea
posible, pero un estrato debe diferir de otro tanto como se pueda en relación a
lacaracterística que está siendo medida. Los conglomerados por su parte deben ser tan
heterogéneos dentro de sí mismos como seaposible, pero similares a los otros para
aprovechar las ventajas económicas de su diseño. Los estratos deben quedar
representadostodos, es decir contribuir a la muestra. Los conglomerados no tienen que
quedar representados todos, pero si uno queda en la muestradebe ser muestreado
totalmente (al menos en el monoetápico).
En el muestreo por conglomerados se selecciona una muestraaleatoria de conglomerados
y, dentro de cada conglomerado, se seleccionaal azar una muestra de sus individuos.
Ejemplo: se supone que se desea conocer algunas características de los estudiantes de
educación superior de cierta ciudad, para lo cual se necesita aplicar un cuestionario. El
universo, los elementos (los estudiantes) están naturalmente agrupados en unos
conjuntos o conglomerados (12 universidades). Se seleccionan 4 universidades a través
de un muestreo aleatorio simple, como se indica en el gráfico. Una vez seleccionadas las
universidades, sería posible aplicar la encuesta a la totalidad de los estudiantes, en cada
una de ellas. Se habría llegado a los estudiantes a través de los conglomerados que los
agrupan.
12 universidades (conglomerado)

4 universidades en la muestra (2,4, 7,12 conglomerado)

Esta es una muestra por conglomerados de etapa única: se ha seleccionado al azar sólo
una vez. La eficacia de este tipo de muestras depende de dos factores. En primer lugar,
de la relación
, donde m es la cantidad de conglomerados seleccionados y M es la
cantidad existente en el universo. Cuanto mayor es esta relación, menor será el error de
muestreo: obviamente, si seleccionáramos la totalidad de los conglomerados no habría
error alguno. En segundo término, la muestra será tanto mejor cuanto más se parezcan
los conglomerados entre sí: si fueran muy semejantes unos a otros, perderíamos muy
poco al seleccionar sólo algunos para incluir en la muestra. Otra vez, vale emplear un
razonamiento “por el absurdo”: si todos los conglomerados fueran idénticos entre sí,
bastaría con quedarse con uno solo. De manera que, al contrario de lo que ocurría con los
estratos, aquí el ideal consistiría en que hubiera una gran homogeneidad
interconglomerados (similares entre sí) y una amplia heterogeneidad intraconglomerados
(que toda la diversidad del universo quedara representada al interior de cada uno). En
otros términos, que cada conglomerado fuera “un universo en pequeño”.
Ejemplo: Suponga que se quiere preguntar a las personas de 18 años y más (habilitadas
para votar) que residen en cierta ciudad, la opinión que tienen sobre el desempeño del
gobierno de la región (o sobre cualquier otro variable de interés). ¿De dónde se sacaría el
marco muestral, es decir un listado con los datos de todos los habitantes de la ciudad. No
existe: no se podría disponer de tal listado. Pero se podría tratar de dar con las personas
dentro de los conglomerados que los agrupan: los hogares. Sin embargo, tampoco se
tiene un listado de hogares: ni siquiera uno actualizado de viviendas. ¿Qué se puede
hacer?
El territorio de cualquier ciudad está naturalmente dividido en jurisdicciones
administrativas. Por ejemplo, las fracciones censales, que son grandes jurisdicciones
geográficas al interior de la ciudad. Pues bien, podría seleccionarse al azar algunas de
estas fracciones. A su vez, las fracciones están divididas en áreas menores, que se
denominan radios censales. En un segundo paso o etapa, sería posible seleccionar al
azar cierta cantidad de radios al interior de cada una de las fracciones que “quedaron” al
primer sorteo. Finalmente, se tendría algunos radios de ciertas fracciones. Y dentro de
estos radios, tendrían manzanas, que apelando a la cartografía podrían ser numeradas y
seleccionadas al azar. Estas manzanas que quedaron en los tres sorteos se denominan,
habitualmente, puntos muestra. Dependiendo del total de hogares que se quieren
seleccionar (es decir del n muestral), suele determinarse previamente cuántos puntos
muestra se requiere.
En las encuestas domiciliarias debe preverse un porcentaje considerable de rechazos
(personas que se niegan a ser entrevistadas). Generalmente, este margen de rechazos se
conoce por experiencia y puede ser estimado. Para compensar, es posible seleccionar
más puntos muestra de los necesarios, a los efectos de los posibles reemplazos.
TIPOS DE MUESTREO NO PROBABILISTICO
Muestreo por cuotas
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base
de un buen conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificadoen el sentido que busca
representatividad de diferentes categorías o estratos de la población objeto de estudio,
pero no tiene el carácter de aleatoriedad de aquél, sin embargo, para la selección de esas
unidades no usa el azar.
Conceptualmente es un muestreo estratificado en el que los estratos suelen estar
determinados por características sociológicas o demográficas (el sexo, la edad, profesión,
etc.). Sin embargo, se suele llevar a cabo en la calle, de forma que los encargados de
recoger los datos, buscan a las personas de cada estrato que deben entrevistar para
cubrir la cuota en vez de elegirlas al azar. Además, laselección de las unidades de
muestreo queda juicio del investigador;
La muestra debe serproporcional a la población, y en ella deberán tenerse en cuenta
lasdiferentes categorías. El muestreo por cuotas se presta a distorsiones, alquedar a
criterio del investigador la selección de las categorías.
Ejemplo: en un estudio sobre la actitud que tiene la población hacia un candidato político,
se les indica a los encuestadores entrevistar a 150 sujetos
cuota

categorías

Cantidad
de
personas
encuestadas en la muestra
por categoría
30%
Hombres mayores de 30 45
30%
años,
45
20%
Mujeres mayores de 30 30
20%
años,
30
Hombres menores de 25
años,
Mujeres menores de 25
años
TOTAL
150
Muestreo a conveniencia o intencional
El Muestreo por conveniencia es el procedimiento que consiste en la selección de las
unidades de la muestra en forma arbitraria, las que se presentan al investigador, sin
criterio alguno que lo defina. Las unidades de la muestra se autoseleccionan o se eligen
de acuerdo a su fácil disponibilidad. No se específica claramente el universo del cual se
toma la muestra. Por consiguiente, la representatividad estructural es nula, no se
consideran las variables que definen la composición estructural del objeto de estudio.
Su principal debilidad es el nombre, ya que, para muchas personas el nombre da a
entender que se está haciendo la selección de las unidades de análisis amañando las
respuestas, situación que no es cierta, toma su nombre, debido a que se busca obtener
una representatividad de la población consultando o midiendo unidades de análisis a las
cuales se puede acceder con relativa facilidad. Los límites serios de este muestreo se
evidencian en la etapa exploratoria de una investigación, para generar hipótesis, elegir
problemas de estudio y aproximarse inicialmente a la caracterización del objeto de estudio
Ejemplo: la realización de una encuesta a los amigos y vecinos para analizar su opinión
sobre el tema “tratado de libre comercio entre estados Unidos y Colombia “.
Muestreo a juicio
En este caso se toman las muestras en aquel lugar en donde hay mayor probabilidad de
encontrar la variable de interés, este tipo de muestreo es muy importante sobre todo
cuando la característica buscada sea poco común, como es el caso de ciertas
enfermedades raras, en estas situaciones, el juicio de un experto; porque cree que son
representativos de la población de interés o que son apropiados en alguna otra forma.
Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento
profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por
esas personas es vital para la toma de decisiones. Si se utilizará un método aleatorio,
probablemente quedarían en la muestra algunas personas con poco dominio sobre el
tema en estudio
Ejemplo: Se quiere realizar un estudio comparativo de la imagen de una Empresa en dos
ciudades del estado de Colombia. Un experto en Mercadotecnia puede recomendar, a su
juicio, que las dos ciudades idóneas para realizar el estudio son Cali y Medellín.
El objetivo seria entonces conocer el grado que afectan las opiniones de los
consumidores en los medios masivos de comunicación al volumen de venta de la
Empresa en cada una de las 2 ciudades.
Muestreo bola de nieve
Se definen como aquella técnica en la que los sujetos participantes de un estudio refieren
a otros individuos, que a su vez refieren a otros que son también incluidos en la muestra.
Esta técnica también recibe el nombre de muestreo por red (network sample) o
muestreo por multiplicidad (multiplicity sample).
De la misma manera en que al descender por una cuesta, una bola de nieve va
incorporando más materia, igual sucede con la red de participantes que son agregados a
la muestra de una investigación que emplee esta técnica. Para adquirir un grupo de
estudio que se aproxime a una muestra aleatoria, una condición muy importante es que el
primer grupo de encuestados (en la etapa cero) debe ser seleccionado aleatoriamente.
El supuesto subyacente es que, los miembros de la población escondida no viven en
completo aislamiento, es decir, tienen por lo menos una “red social” con la cual es posible
contactarlos.El muestreo en bola de nieve, básicamente sigue las siguientes etapas.
a. Mapa de la red: Se hace una descripción de la población objetivo de la mejor
forma posible, en éste caso, no importa que “lo mejor posible” sea una descripción
muy vaga.
b. Proceso de referenciación: A un informante clave se le pide nominar y contactar
individuos de la población objetivo. Se obtienen así varios puntos de partida o
contactos iníciales. Para ganar validez científica, se debe de elegir aleatoriamente
entre ellos para comenzar.
c. Entrevista: Cuando la persona es contactada aleatoriamente, se le entrevista y a
su vez se le pide que nomine a otras personas dentro de la población objetivo.
d. Repitiendo el procedimiento: Cada grupo de nominados representa una etapa,
se forma entonces una línea de respondientes-referenciado- respondiente, a esta
cadena se le denomina la “bola de nieve”.
La cadena se detiene cuando no se pueden dar más nominaciones o cuando el individuo
seleccionado no es encontrado o se rehúsa a contestar.
Ventajas:
Es un método eficiente en los casos donde se tiene una población de escasos
elementos o donde cierto grado de confianza es requerido para que estén
dispuestos a participar en la investigación.
Permite la creación de un marco de muestra cuando éste no existía per se.
Todos los individuos entrevistados son del conjunto de la población objetivo.
Tipos de Sesgos
Sesgo de Distancia Social: La probabilidad de contacto social entre dos
individuos es función de la distancia social entre los individuos.
El modelo de las isla: Subgrupos de individuos existen, entre los individuos las
probabilidades de conexión son aleatorias, pero entre grupos las oportunidades de
conexión son limitadas.
Círculos traslapados: Si no existen conexiones entre muchos grupos de
individuos, diferentes grupos pueden ser conectados por los individuos que son
miembros de varios grupos.
Sesgo reflexivo: Un referido de una persona a otra teóricamente agranda la
oportunidad de que la primera persona sea nominada otra vez.
Sesgo forzado de campo: Algunos individuos van a tener una gran oportunidad
de ser seleccionados debido a ciertas características como la popularidad.
Desventajas
Como se mencionó anteriormente, produce estimadores sesgados. Ya que
individuos muy populares dentro de una población tiene mayores oportunidades de
ser seleccionados.
Hay poca representatividad entre los resultados y por ende no se puede extrapolar
hacia la población
Muestreo con fines específicos
El cual pretende llegar a grupos muy específicos, tal es el caso, de personas con
preferencias y/o gustos similares, por ejemplo, los que gustan de la música metálica, es
fácil abordarlos en un concierto de ese tipo de música, los constructores se pueden
abordar en un congreso para tal fin.
Se pueden encontrar otros nombres en procedimientos de muestreo, sin embargo, se
pueden encasillar en alguno de los descritos anteriormente.

Más contenido relacionado

La actualidad más candente

Estadistica inferencial expo
Estadistica inferencial expoEstadistica inferencial expo
Estadistica inferencial expoPepe Rodríguez
 
Selección de la Muestra en Investigación Cuantitativa
Selección de la Muestra en Investigación CuantitativaSelección de la Muestra en Investigación Cuantitativa
Selección de la Muestra en Investigación Cuantitativagambitguille
 
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...Ekthor Daniel R G
 
Estadistica inferencial
Estadistica inferencialEstadistica inferencial
Estadistica inferencialRobert Amaro
 
Conceptos básicos de estadística
Conceptos básicos de estadísticaConceptos básicos de estadística
Conceptos básicos de estadísticaJavier Rodriguez
 
contrastacion de la hipotesis
contrastacion de la hipotesiscontrastacion de la hipotesis
contrastacion de la hipotesisstefanycory
 
Población, muestra y elaboración de instrumentos en investigaciones cuantitat...
Población, muestra y elaboración de instrumentos en investigaciones cuantitat...Población, muestra y elaboración de instrumentos en investigaciones cuantitat...
Población, muestra y elaboración de instrumentos en investigaciones cuantitat...Evelyn Acevedo
 
conceptos básicos de estadística
conceptos básicos de estadísticaconceptos básicos de estadística
conceptos básicos de estadísticagreciadaena
 
Resumen formulario estadistica_avanzada
Resumen formulario estadistica_avanzadaResumen formulario estadistica_avanzada
Resumen formulario estadistica_avanzadaMermi Celati Cano
 
Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)Kalitokaiba7
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadisticaIIe
 

La actualidad más candente (20)

Inferencia Estadística
Inferencia EstadísticaInferencia Estadística
Inferencia Estadística
 
EstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicosEstadíStica Inferencial Y Conceptos BáSicos
EstadíStica Inferencial Y Conceptos BáSicos
 
Estadistica inferencial expo
Estadistica inferencial expoEstadistica inferencial expo
Estadistica inferencial expo
 
INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICAINFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA
 
Selección de la Muestra en Investigación Cuantitativa
Selección de la Muestra en Investigación CuantitativaSelección de la Muestra en Investigación Cuantitativa
Selección de la Muestra en Investigación Cuantitativa
 
Analisis de muestreo
Analisis de muestreoAnalisis de muestreo
Analisis de muestreo
 
Muestreo Farmacia
Muestreo  FarmaciaMuestreo  Farmacia
Muestreo Farmacia
 
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
 
Estadistica inferencial
Estadistica inferencialEstadistica inferencial
Estadistica inferencial
 
Conceptos básicos de estadística
Conceptos básicos de estadísticaConceptos básicos de estadística
Conceptos básicos de estadística
 
contrastacion de la hipotesis
contrastacion de la hipotesiscontrastacion de la hipotesis
contrastacion de la hipotesis
 
Población, muestra y elaboración de instrumentos en investigaciones cuantitat...
Población, muestra y elaboración de instrumentos en investigaciones cuantitat...Población, muestra y elaboración de instrumentos en investigaciones cuantitat...
Población, muestra y elaboración de instrumentos en investigaciones cuantitat...
 
conceptos básicos de estadística
conceptos básicos de estadísticaconceptos básicos de estadística
conceptos básicos de estadística
 
Resumen formulario estadistica_avanzada
Resumen formulario estadistica_avanzadaResumen formulario estadistica_avanzada
Resumen formulario estadistica_avanzada
 
Tema estadisticas (1)
Tema estadisticas (1)Tema estadisticas (1)
Tema estadisticas (1)
 
Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadistica
 
estadistica inferencial
estadistica inferencialestadistica inferencial
estadistica inferencial
 
Apuntes de estadistica
Apuntes de estadisticaApuntes de estadistica
Apuntes de estadistica
 
Ensayo
EnsayoEnsayo
Ensayo
 

Destacado

1 informe final ejecutivo_consulta2012_13dejunio
1 informe final ejecutivo_consulta2012_13dejunio1 informe final ejecutivo_consulta2012_13dejunio
1 informe final ejecutivo_consulta2012_13dejunioMaribel Nicasio González
 
G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...
G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...
G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...g-w
 
Tema 1 MatemáTicas Ejercicios
Tema 1   MatemáTicas   EjerciciosTema 1   MatemáTicas   Ejercicios
Tema 1 MatemáTicas EjerciciosEscuela Guadalupe
 
IV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circular
IV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circularIV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circular
IV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circularMaribel Nicasio González
 
ENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE LA PAZ
ENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE  LA PAZENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE  LA PAZ
ENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE LA PAZMaribel Nicasio González
 

Destacado (7)

1 informe final ejecutivo_consulta2012_13dejunio
1 informe final ejecutivo_consulta2012_13dejunio1 informe final ejecutivo_consulta2012_13dejunio
1 informe final ejecutivo_consulta2012_13dejunio
 
G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...
G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...
G-W - Derechos humanos y grupos vulnerables en México y América Latina enero ...
 
Tema 1 MatemáTicas Ejercicios
Tema 1   MatemáTicas   EjerciciosTema 1   MatemáTicas   Ejercicios
Tema 1 MatemáTicas Ejercicios
 
IV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circular
IV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circularIV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circular
IV CONGRESO LATINOAMERICANO DE ANTROPOLOGÍA Tercera circular
 
Convocatoria PACMYC 2015
Convocatoria PACMYC 2015Convocatoria PACMYC 2015
Convocatoria PACMYC 2015
 
ENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE LA PAZ
ENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE  LA PAZENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE  LA PAZ
ENCUENTRO NACIONAL SOBRE VIOLENCIA DE GÉNERO POR UNA CULTURA DE LA PAZ
 
Ejercicios números romanos 5°
Ejercicios números romanos 5°Ejercicios números romanos 5°
Ejercicios números romanos 5°
 

Similar a Muestreo.

República bolivariana de venezuela 1
República bolivariana de venezuela 1 República bolivariana de venezuela 1
República bolivariana de venezuela 1 thomas669
 
República bolivariana de venezuela
República bolivariana de venezuelaRepública bolivariana de venezuela
República bolivariana de venezuelathomas669
 
República bolivariana de venezuela
República bolivariana de venezuelaRepública bolivariana de venezuela
República bolivariana de venezuelathomas669
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadísticaJenny HB
 
Estadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosEstadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosCristina Rios
 
Proyecto Estadística ESPOL 2 parcial
Proyecto Estadística ESPOL 2 parcialProyecto Estadística ESPOL 2 parcial
Proyecto Estadística ESPOL 2 parcialESPOL
 
Garcia metodologia 4a_tamano_de_la_muestra
Garcia metodologia 4a_tamano_de_la_muestraGarcia metodologia 4a_tamano_de_la_muestra
Garcia metodologia 4a_tamano_de_la_muestraromeo pomari juarez
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxSamuelLndooCorrea
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxSamuelLndooCorrea
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfGabrielCastillolvare
 
Blog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdfBlog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdfTheManBehindTheSlaug1
 
Blog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdfBlog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdfssuserf6ab1c
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfGabrielCastillolvare
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfGabrielCastillolvare
 
Bioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíABioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíAPaola Torres
 

Similar a Muestreo. (20)

Estadistica Muestreo
Estadistica MuestreoEstadistica Muestreo
Estadistica Muestreo
 
tema 1.pdf
tema 1.pdftema 1.pdf
tema 1.pdf
 
República bolivariana de venezuela 1
República bolivariana de venezuela 1 República bolivariana de venezuela 1
República bolivariana de venezuela 1
 
República bolivariana de venezuela
República bolivariana de venezuelaRepública bolivariana de venezuela
República bolivariana de venezuela
 
República bolivariana de venezuela
República bolivariana de venezuelaRepública bolivariana de venezuela
República bolivariana de venezuela
 
técnicas de muestreo
técnicas de muestreotécnicas de muestreo
técnicas de muestreo
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadística
 
Estadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosEstadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicos
 
Proyecto Estadística ESPOL 2 parcial
Proyecto Estadística ESPOL 2 parcialProyecto Estadística ESPOL 2 parcial
Proyecto Estadística ESPOL 2 parcial
 
MUESTREO
MUESTREOMUESTREO
MUESTREO
 
MUESTREO
MUESTREOMUESTREO
MUESTREO
 
Garcia metodologia 4a_tamano_de_la_muestra
Garcia metodologia 4a_tamano_de_la_muestraGarcia metodologia 4a_tamano_de_la_muestra
Garcia metodologia 4a_tamano_de_la_muestra
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docx
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docx
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
 
Blog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdfBlog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdf
 
Blog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdfBlog Excel avanzado y métodos estadísticos.pdf
Blog Excel avanzado y métodos estadísticos.pdf
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
 
Bioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíABioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíA
 

Muestreo.

  • 1. HIPÓTESIS EN ESTADÍSTICA INFERENCIAL En un trabajo de investigación generalmente se plantean dos hipótesis mutuamente excluyentes: la hipótesis nula o hipótesis de nulidad ( ) y la hipótesis de investigación ( ). La hipótesis de investigación es una afirmación especial cuya validez se pretende demostrar, y si las pruebas empíricas no apoyan decididamente la hipótesis de investigación, entonces se aceptará la hipótesis nula, abandonándose la hipótesis de investigación. En algunos casos es posible plantear hipótesis alternas o hipótesis alternativas. El análisis estadístico de los datos servirá para determinar si se puede o no aceptar . Cuando se rechaza , significa que el factor estudiado ha influido significativamente en los resultados y es información relevante para apoyar la hipótesis de investigación planteada. Plantear hipótesis de investigación que no sea excluyente con supondría una aplicación incorrecta del razonamiento estadístico. Identificación de las variables Algunas investigaciones hacen hipótesis que involucran variables cuantitativas. La hipótesis puede tratar de establecer relaciones causales entre esas variables cuantitativas. A veces el investigador tendrá control sobre ciertas variables pero no sobre otras, y en términos de qué variables son controladas u observables y cuales no,las diferentes variables involucradas en un problema pueden clasificarse en: Variable independiente: El valor de verdad que se le da a una hipótesis en relación con la causa, se denomina variable independiente.
  • 2. Variable dependiente: Denominamos de esta manera a las hipótesis cuando su valor de verdad hace referencia no a la causa, sino al efecto. Variable interviniente: Será aquella cuyo contenido se refiere a un factor que ya no es causa, tampoco efecto, pero sí modifica las condiciones del problema investigado. Ejemplos Esta sección se proponen algunos ejemplos de las diferentes tipologías de hipótesis que se pueden hacer: Hipótesis de investigación: La computadora con regulador trabaja 100% del tiempo sin fallar. La computadora que se utiliza sin regulador solamente trabaja 80% del tiempo sin fallar. Hipótesis no direccional: Existe una diferencia entre el nivel de ansiedad de los niños con un coeficiente intelectual alto y aquellos con un coeficiente bajo. Hipótesis direccional: Los niños con coeficientes intelectuales altos tendrán un nivel de ansiedad mayor que los niños con coeficientes intelectuales bajos. Hipótesis nula: No existe diferencia en los niveles de ansiedad entre niños con coeficientes intelectuales altos y aquellos que tienen coeficientes intelectuales bajos. Tipos de hipótesis Hipótesis nulas: estas hipótesis son sobre relaciones que se establecen entre distintas variables en las que se refuta o niega aquello que es afirmado por las hipótesis de investigación. Hipótesis alternativas: estas hipótesis contienen conjeturas o suposiciones de explicaciones diferentes a las que fueron planteadas por las hipótesis nulas y las de investigación. Se recurre a esta cuando la de investigación ha sido rechazada y la nula no es aceptada. Hipótesis estadísticas: estas hipótesis consisten en las nulas, alternativas o de investigación transformadas en símbolos estadísticos, se pueden realizar cuando los datos a estudiar son mensurables. Dentro de estas hipótesis existen distintas clases: De estimación: estas suponen el valor de alguna característica de la muestra que fue seleccionada y de la población en su conjunto. Para formularlas se tienen en cuenta datos adquiridos previamente. Estadísticas de correlación: buscan establecer estadísticamente las relaciones existentes entre dos o más variables. MUESTREO
  • 3. El definir el tamaño maestral y el método de selección de las unidades de análisis, es uno de los puntos más importantes en procesos de análisis de datos, ya que dependiendo de éste, será posible generar inferencias o generalizaciones a toda la población, y por ende, definir políticas y tomar acciones que impacten el entorno del objeto de estudio. El proceso seguido para seleccionar una muestra de una población se conoce como muestreo. El propósito que se tiene con el muestreo es recabar información representativa de toda una población con el propósito de generalizar los resultados obtenidos durante un estudio; controlando la cantidad de información ya que poca información podría afectar los resultados del estudio y mucha información podría generar gastos innecesarios. Es evidente que el reducir costos en todas las actividades que se realizan en la cotidianidad es una prioridad en todo estudio, por lo tanto, es menester en lo posible trabajar con una parte de la población objeto de estudio, en lugar de realizar un censo. No obstante, se presentan algunos casos donde es imprescindible medir o explorar a todos los elementos del universo bajo estudio. CONCEPTOS BÁSICOS DE MUESTREO Muestro probabilístico: es aquel cuyos elementos tienen una probabilidad conocida y mayor de cero de ser seleccionados, tienen la particularidad de que los resultados encontrados por medio de este método se puede generalizar a toda la población. Se necesita de formulas matemáticas ya elaboradas para el cálculo del número de unidades de análisis y tiene como ventaja el poder determinar los errores de estimación. Muestreos no probabilísticos: es aquel que no permiten generalizar sus resultados a toda la población, no obstante, son muy útiles para estudios exploratorios y en general para estudios de corte cualitativo.La elección del procedimiento depende fundamentalmente de los objetivos del estudio. Población o Universo: es un conjunto de elementos (sujetos, objetos, entidades abstractas, etc.) que poseen una o más características en común, podemos encontrar dos tipos de poblaciones dependiendo del número de elementos de que consten: Poblaciones finitas: formadas por un número finito de elementos. Poblaciones infinitas: formadas por un número infinito de elementos. El hecho de que las poblaciones, por lo general, sean infinitas o estén formadas por un gran número de elementos, hace que la descripción exacta de sus propiedades sea un objetivo prácticamente inaccesible. Por esta razón, lo habitual es trabajar con “muestras”. Muestra: es un subconjunto de elementos de una población.Para extraer conclusiones validas e imparciales referidas a todos los elementos de la población a partir de la observación de sólo unos pocos elementos, es necesario, que la muestra utilizada sea representativa de la población; esto se consigue mediante las “técnicas de muestreo”. Una muestra proporciona una estimación de parámetro a estudiar, pero si se extrae otra muestra según las mismas reglas de selección, se obtendrá sin duda otro resultado para la estimación del parámetro a estudiar. Por tanto “el estimador” es una “variable aleatoria”. Parámetro: es un valor numérico que describe una característica de una población. Los parámetros son valores numéricos constantes (es decir, no son variables), definida una
  • 4. población cualquiera y un parámetro en ella, ese parámetro sólo puede tomar un valor numérico concreto. Habitualmente los parámetros de interés serán la media la varianza y los porcentajes. Estadístico o Estimador: es un valor numérico que describe una característica de una muestra. Su valor concreto depende de los valores de la muestra seleccionada en la que es calculado. Es evidente que de una población cualquiera es posible extraer más de una muestra diferente del mismo tamaño, por tanto el valor de un estadístico varía de una muestra a otra. Un estadístico no es un valor numérico constante (como lo es un parámetro), sino que es una variable; y su valor concreto depende de la muestra en la que es calculado. Algunos de los estadísticos principales son: la media muestral , la varianza muestral , el total muestral(n), la proporción muestral, el mayor y menor valor de la muestra. La distribución del estimador viene dada por el conjunto de los resultados obtenidos a partir del conjunto de las muestras posibles; el carácter aleatorio proviene de la extracción aleatoria de la muestra. Un estadístico que se utiliza para estimar un parámetro desconocido de la población recibe el nombre de estimador Variable aleatoria: es una variable que puede tomar un cierto número de valores, con una probabilidad asociada a cada valor. Por tanto dicha variable aleatoria seguirá una “distribución” determinada. Error de estimación: es la diferencia entre el valor estimado del parámetro usualmente la media o el porcentaje de la población que cumple una condición y el verdadero valor del parámetro o el porcentaje de la población que cumple una condición que en general será desconocido. El error de estimación va medido en las mismas unidades que el parámetro que deseamos estimar; si se quiere mantener o disminuir el error, más elementos u observaciones de la población deberán incluirse en la muestra estudiada. Como es natural, al aproximar las características poblacionales mediante estimadores basados en la muestra se comete un error, error que mide la representatividad de dicha muestra. Dependiendo del coste del muestreo, del presupuesto disponible y de otros muchos factores fijaremos un error de muestreo que en todo caso debe ser el mínimo posible. Dicho error de muestreo puede venir dado en términos absolutos, en términos relativos o sujeto adicionalmente a un coeficiente de confianza dado (sujeto a unos límites de tolerancia) En caso de no incluir nuevas observaciones para la muestra, más error se comete en la precisión o valor estimado del parámetro. El error de estimación se mide en las mismas unidades que el parámetro que deseamos estimar ejemplo cantidad, precio..., etc. y se simboliza por: ó
  • 5. La estimación de un valor de interés, como la media o el porcentaje (poblacional), estará generalmente sujeta a una variación entre una muestra y otra. Estas variaciones en las posibles muestras de una estadística pueden, teóricamente, ser expresadas como errores muestrales, sin embargo, normalmente, en la práctica el error exacto es desconocido. El error muestral se refiere en términos más generales al fenómeno de la variación entre muestras. El error muestral deseado, generalmente puede ser controlado tomando una muestra aleatoria de la población, suficientemente grande, sin embargo, el costo de esto puede ser limitante. Si las observaciones son tomadas de una muestra aleatoria, la teoría estadística brinda cálculos probabilísticos del tamaño deseado del error muestral para una estadística en particular o estimación. Estos usualmente son expresados en términos del error estándar. El error muestral puede ser contrastado con el error no muestral, el cual se refiere al conjunto de las desviaciones del valor real que no van en función de la muestra escogida, entre los cuales se encuentran varios errores sistemáticos y algunos errores aleatorios. Resultan mucho más difíciles de cuantificar que el error muestral. Nivel de confianza: Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)•100%). Es usual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01, respectivamente; aunque este se puede escoger a criterio del que realiza el estudio, la idea es que al seleccionar la muestra esta de mayor que 30 para poder aplicar la tabla de la normal y asumir normalidad cumpliendo con el teorema del límite central “entre más grande sea la muestra más se aproxima a una normal” ESTIMACIÓN DE TAMAÑO DE MUESTRA Todo estudio lleva implícito en la fase de diseño la determinación del tamaño muestral. Al no realizar esto pueden suceder diferentes situaciones; seleccionar menos muestras que las necesarias, perdiéndose precisión en la estimación de parámetros y en las pruebas estadísticas puede suceder que no se encuentren diferencias significativas cuando realmente las hay. La segunda situación es que se puede estudiar más muestras que las necesarias, lo cual lleva implícito pérdida de tiempo e incremento de recursos innecesarios. Se debe tener claro el tipo de muestreo que se utilizarápara calcular el tamaño de muestras. Las limitaciones establecidas en el procedimiento de muestreo varían de un área de las ciencias a otra. Hay que tomar en cuenta varios factores para determinar el tamaño que debe alcanzar una muestra como: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza.
  • 6. TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS Si conocemos el tamaño de la población se usa los métodos para poblaciones finitas. La ventaja sobre poblaciones finitas es que al conocer exactamente su tamaño, el tamaño de la muestra resulta con mayor precisión y se pueden ahorrarse recursos y tiempo para la aplicación y desarrollo del estudio.Se puede determinar tamaño de la muestra para la media o para la proporción y las formula a utilizar son: Para la media Para la proporción Ejemplo: se desea estimar entre 10.000 establos, el número de vacas lecheras por establo con un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la varianza es 1.000. ¿Cuántos establos deben visitarse para satisfacer estos requerimientos? Teniendo en cuenta que el error muestral es de 4 vacas lecheras por establo y para un nivel de confianza y un error de confianza es se busca en la tabla de la normal el y es 1.96 (celda marca de color rojo en la tabla de la norma y =1000, se tiene que la muestra es: Se deben analizar 234 establos NOTA: Se puede observar en el ejemplo que como se conoce la varianza y esta es de 1000 vacas lecheras por establo, el error muestral debe ir en la misma unidad de medida Ejemplo: Se desea realizar una encuesta entre la población juvenil de una determinada localidad para determinar la proporción de jóvenes que estaría a favor de una nueva zona de ocio, existe la impresión de que esta proporción está próxima a 0´35; El número de jóvenes de dicha población es N=2.000.Determinar el tamaño de muestra necesario para estimar la proporción de estudiantes que están a favor con un error de estimación de 0´05 y un nivel de confianza del 90% Teniendo en cuenta que el error muestral es de 0.05 y para un nivel de confianza y un error de confianza es se busca en la tabla de la normal el
  • 7. y es 1.65 (celda marca de color café en la tabla de la norma), como la proporción según la información a favor es del 0.35 (p éxito) entonces la proporción de jóvenes que no esta de acuerdo es 0.65 (q Fracaso), se tiene que la muestra es: Se deben encuestar 221 jóvenes de la localidad NOTA: cuando no se conoce la varianza o proporción se asume la máxima variabilidad tomando p=0.5 y q= 0.5 TAMAÑO DE MUESTRA PARA POBLACIONES INFINITAS La población infinitaes aquella que teóricamente es imposible observar todos los elementos. En la práctica se entenderá por población infinita la que no puede ser enumerada en un período razonable o aquella en la que se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el conteo. La desventaja sobre esta población es que como no se conoce con exactitud el tamaño de la población, el tamaño de la muestra resulta con poca precisiónSe puede determinar tamaño de la muestra para la media o para la proporción y las formula a utilizar son: Para la media Para la proporción EJEMPLO:Una compañía de televisor por cable quisiera estimarla proporción de personas que comprarían una revista con los programas de televisor por cable; por estudios anteriores se sabe que el 30% de las personas compraría la revista de programación. La Compañía desea que su estudio tenga un nivel de confianza del 95% y un error de muestreo del 3%. ¿Qué tamaño de muestra se necesita? Teniendo en cuenta que el error muestral es de 0.03 y para un nivel de confianza y un error de confianza es se busca en la tabla de la normal el y es 1.96 (celda marca de color rojo en la tabla de la norma), como la proporción según la información de personas que comprarían la revista es del 0.30 (p éxito) entonces la proporción de personas que no están dispuestas a comprar la revista es 0.70 (q Fracaso), se tiene que la muestra es:
  • 8. Se deben encuestar 896 personas Ejemplo: el director de una compañía de tabacos desea realizar un estudiar a los la ciudadanos sobre consumo y adicción que tienen a este producto. Por estudios anteriores se sabe que el consumo tiene una variabilidad unidades diarias. El estudio lo realiza el director con una confiabilidad del 95% y un error entre el número de unidades consumidas de 4. ¿Cuántos ciudadanos debe tener en cuenta en la muestra el director? Teniendo en cuenta que el error muestral es de 4 y para un nivel de confianza y un error de confianza es se busca en la tabla de la normal el es 1.96 (celda marca de color rojo en la tabla de la norma y muestra es: y =225, se tiene que la Se deben analizar 54 ciudadanos TIPOS DE MUESTREO PROBABILISTICO Muestreo Aleatorio Simple: De población se extrae una muestra de tamaño “n”, dando a cada unidad la misma probabilidad de ser extraída. La muestra se puede extraer: Con reposición: cuando una unidad seleccionada en una extracción se devuelve a la población y puede participar en las siguientes extracciones, pudiéndose extraer dicha unidad dos veces o más. La composición de la población siempre es la misma y el elemento puede ser seleccionado nuevamente. Al no modificarse la composición de la población el elemento puede ser elegido en cada extracción con la misma probabilidad. Sin reposición: se obtiene la muestra unidad a unidad de forma aleatoria sin reposición a la población de las unidades previamente seleccionadas, teniendo presente además que el orden de colocación de los elementos en las muestras no interviene, es decir, muestras con los mismos elementos colocados en orden distinto se consideran iguales. Las ventajas que tiene este procedimiento de muestreo son las siguientes: Sencillo y de fácil comprensión. Calculo rápido de medias y varianzas. Existen paquetes informáticos para analizar los datos Por otra parte, las desventajas de este procedimiento de muestreo son: Requiere que se posea de antemano un listado completo de toda la población.
  • 9. Si trabajamos con muestras pequeñas, es posible que no representen a lapoblación adecuadamente. El procedimiento empleado para seleccionar los elementos de la población que hacen parte en la muestra son: Identificar a todas las unidades de observación de la población constante. se asigna un número o código a cada individuo de la población Se codifica cada elemento de la población y se seleccionan n códigos a través de una tabla de números aleatorios que se puede encontrar en libros de estadística como el libro (JOHN E. FREUD; GARAY A. SIMON Estadística elemental. Octava edición. Editorial Pearson). También se pueden obtener utilizando Excel a través de la función =ALEATORIO.ENTRE (inferior; superior). Se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerida LA TABLA DE NUMEROS ALEATORIOS Una tabla de números aleatorios es un conjunto de dígitos generado de modo que, normalmente, la tabla contenga cada uno de los diez dígitos (0, 1,…,9), en proporciones aproximadamente iguales, sin mostrar tendencias en el patrón que se generan los dígitos. Por lo tanto, si se selecciona un número en un lugar aleatorio de la tabla, es igualmente probable que sea cualquiera de los dígitos entre el 0 y el 9. Estas tablas se construyen para asegurar que cada dígito, cada par de dígitos, cada tres dígitos, etc, aparecen con la misma frecuencia. En el caso de extraer una muestra aleatoria simple, se elige un lugar para empezar a leer dichos números aleatorios. Después se selecciona una dirección (arriba, abajo, derecha e izquierda) y se van recogiendo dígitos hasta que se consiga el tamaño muestral adecuado. Utilizando este método, un elemento puede aparecer más de una vez. Si queremos extraer una muestra aleatoria simple sin reposición, la solución es ignorar los elementos repetidos. Ejemplo: se tiene una población de 50 fabricantes de automóviles y desea seleccionar una muestra de 20 fábricas para realizar un estudio sobre responsabilidad social de las mismas. La siguiente tabla muestra las fabricas que componen la población y al lado derecho el código asignado para seleccionar las que hacen parte en la muestra F. Chip F. Contra F. Destiny Vista A Berger 100 Gab. Assett Neub. Focus F. Magellan Janus L. Mason Value Gabelli Growth Franklin Growth Janus 20 AARP Capital 01 02 03 04 05 06 07 08 09 10 11 12 13 14 Diameter Thickness Lbl offctr Lbl folded Label cut Mislabeled No label No hole Hole offct Hole size Chip Scratch Cracked Warped 26 27 28 29 30 31 32 33 34 35 36 37 38 39
  • 10. Kemper Growth A 20th Cent. Growth F. OTC Volkswagen Ford Mazda Datsun Honda Oldsmobile Dodge Mercury 15 16 17 18 19 20 21 22 23 24 25 Columbia Growth T. R. P. Capital Neub. Partners Pontiac Chevrolet Ford Ford Plymouth AMC Buick Mercury 40 41 42 43 44 45 46 47 48 49 50 Para seleccionar las fábricas que hacen parte en la muestra se utilizo la siguiente tabla de números aleatorios, se empezó con los dos primeros dígitos por columna empezando por la primera columna y el recorrido fue de arriba hacia abajo los dígitos que se tuvieron en cuenta fuero los resaltados con rojo TABLA DE NUMEROS ALEATORIOS RENGLÓN COLUMNAS 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 49280 61870 43898 62993 33850 97340 70543 89382 37818 60430 82975 39087 55700 14756 32166 23236 45794 09893 54382 94750 70297 87157 11100 36871 23913 79348 92074 06873 12478 57175 88924 41657 65923 93912 58555 03364 29776 93809 72142 22834 66158 71938 24586 23997 53251 73751 26926 20505 74598 89923 34135 47954 02340 50775 48357 36085 54641 21440 37622 55564 35779 07468 25078 30454 51438 88472 10087 00796 67140 14130 84731 40355 93247 78643 70654 31888 15130 14225 01499 37089 53140 32970 12860 30592 63308 27973 53673 75503 99650 65411 00283 08612 86129 84598 85507 04334 10072 95945 50785 96593 19436 54324 32596 75912 92827 81718 82455 68514 14523 20048 33340 26575 74697 57143 16090 65157 54421 11373 31065 42547 81163 98083 78496 56095 71865 63919 55980 34101 22380 23298 55790 08401 11665 83832 63491 06546 78305 46427 68479 80336 42050 57600 96644 17381 51690 07456 18130 49502 83613 70457 07275 97349 97653 20664 79488 36394 64688 81277 16703 56203 69229 26290 63397 32768 04233 83246 55058 56788 27686 94598 82341 40881 89439 68856 54607 22255 60103 17972 69889 03426 89863 20775 91550 12872 76783 11095 68239 66090 53362 92671 28661 40420 44251 18928 33825 47651 52551 96297 46162 26940 44140 12250 28707 25853 72407 25626 69593 82578 58869 72937 02348 45091 08078 64647 31708 92470 20461 88872 44940 15925 13675 59208 43189 57070 60662 04877 47182 78822 83554 36858 82949 73742 25815 35041 55538 57054 49464 16364 29571 83792
  • 11. 31 32 33 34 35 36 37 38 39 40 91616 78025 27587 16690 70183 90730 10934 82462 27463 02979 11075 73539 67228 20427 58065 35385 93242 30166 10433 52997 80103 14621 80145 04251 65489 15679 13431 79613 07606 00079 07831 39044 10175 64477 31833 90742 24590 47416 16285 92709 59309 47450 12822 73709 82093 50866 02770 13389 93699 90110 13276 03107 86687 73945 16747 78028 48582 80268 60912 47506 26710 12787 65530 92396 10386 75573 00906 05085 94532 53693 73000 47709 49325 68263 59293 67257 58595 96666 95632 40802 Las fábricas que hacen parte en la muestra son las que tienen los Códigos seleccionados y son: Buick Pontiac No hole Scratch Warped AARP Capital No label Oldsmobile Ford Janus Gabelli Growth Cracked Gab. Assett Franklin Growth Thickness 20th Cent. Growth L. Mason Value F. Contra T. R. P. Capital 49 43 33 37 39 14 32 23 45 09 11 38 06 12 27 16 10 02 41 Muestreo Estratificado La estratificación tiene como objetivo principal aumentar la precisión global de la estimación sin incrementar el tamaño muestral. Estratificar una población consiste en dividirla, “antes” de la extracción de la muestra, en subconjuntos homogéneos (respecto de caracteres determinados a priori), llamados estratos. Los estratos deberán ser homogéneos en sí y heterogéneos entre sí respecto de la característica en estudio. La selección de la muestra se efectúa de maneraindependiente en el interior de cada estrato. Esto conlleva a que la varianza en cada estrato sea pequeña. Se trata de que los estratos sean lo más homogéneos posibles dentro de cada uno de ellos, es decir, que exista en cada uno la menor variabilidad posible y de que haya grandes diferencias de unos a otros estratos.
  • 12. En lugar de extraer la muestra totalmente al azar, se extrae parte de la muestra en cada estrato.Una vez dividido la población en estratos, se deberá repartir la muestra entre dichos estratos. El reparto o afijación de la muestra a través de los estratos dependerá de la distribución de la característica en estudio que deberá ser conocida a prior. Existen muchas maneras de repartir la muestra, pero las más importantes son: Afijación uniforme: Consiste en asignar el mismo número de unidades muestrales a cada estrato. Da la misma importancia a todos los estratos, en cuanto al tamaño de la muestra. Favorece a los estratos de menor tamaño y perjudica a los grandes, en cuanto a precisión. La cantidad de elementos de cada estrato que hacen parte en la muestra Se simboliza por ni. Ejemplo: Se desea realizar un estudio sobre la gestión financiera del las microempresas de la cierta ciudad; para ello se tuvo en cuenta aquellas empresas que tenían contador y que no tenían. Al observar que la proporción de “empresas que tenían dentro de su empresa un contador era muy baja, se toma la decisión de no utilizar una “muestra proporcional” puesto que dejaría en la representación de este estrato a muy pocas empresas. El total de microempresas en la ciudad eran 1780, de las cuales se selecciono una muestra de 80, el total de empresa por estrato es: Se tiene en cuenta que la población de empresas esta dividida en dos estratos las que tienen contador y las que no tienen La distribución de la población y de la muestra se resume en la siguiente tabla: N° empresas Con contador Sin contador TOTAL Porcentaje de la población 380 1400 21.3 78.7 N° de empresas Porcentaje en la muestra de estrato en la muestra 40 10.52 40 2.85 1780 100 80 13.37 Como se puede apreciar, se prefiere “el muestreo estratificado uniforme” cuando existe un estrato con pocos casos o de baja representación en la población que sin embargo, presenta algúninterés particular. Afijación proporcional: La muestra se distribuye proporcionalmente a los tamaños de los estratos, es la indicada cuando no tenemos información sobre la distribución de la característica en estudio.
  • 13. Si existen k estratos de tamaños N1,...,Nk, entonces N=N1+...+Nk . Existen dos métodos para dividir el tamaño total de la muestra n en estratos n1 ,...,nk . Se mantiene la proporción del estrato escogiendo n=n1+...+nk , de modo que Si el número de unidades de muestreo seleccionadas de cada estrato esproporcional al tamaño relativo del estrato en la población, el resultado es unamuestra estratificada proporcional, lo contrario es una muestra estratificada noproporcional. Esto último es preferible si los diversos estratos no sonhomogéneos con respecto a la característica bajo estudio.El error de muestreo de una muestra estratificada puede considerasemenor que el de una muestra simple aleatoria del mismo tamaño. Lo anterior sedebe a que el diseño de estratificaciones hace uso de información adicional,considerando la división de la población de acuerdo con las característicasrelevantes y sirve para reducir el margen de error de muestreo.El problema con este método, es que aún cuando se conocen lascaracterísticas relevantes y en base a ellas se estratifica, el tamaño relativo de losestratos en la población no siempre se conoce con gran exactitud. Debido a esta escasez de información, las ventajas obtenidas con la estratificación se pierden con las variaciones introducidas por la información incorrecta referente al tamaño de los estratos en la población, elemento que desafortunadamente se subestima frecuentemente. Puede aportar información mas precisa de algunas subpoblaciones que varían bastante en tamaño y propiedades entre sí, pero que son homogéneas dentro de sí. Los estratos deberían en lo posible estar constituidos por unidades homogéneas Ejemplo: Se quiere obtener una muestra de 50 grandes empresas industriales para hacer un estudio sobre los gastos en publicidad. En una ciudad se cuenta con 352 grandes empresas industriales. Se divide a las empresas en 5 estratos de acuerdo a su rentabilidad. Para seleccionar la cantidad de empresas que hacen parte en la muestra se utilizó un muestreo estratificado proporcional, como se indica en la siguiente tabla , donde Ni, es la cantidad de empresas por estrado Estrato A B C D E Rentabilida d 30% o más 20 – 30% 10 – 20% 0 – 10% Con pérdida Número Porcentaje Muestra 8 35 189 115 5 2 10 54 33 1 1 5 27 16 1
  • 14. Total 352 100 50 En un muestreo estratificado no proporcional, el número de elementos estudiado en cada estrato es desproporcionado con respecto a su número en la población. Por ejemplo, si un muestreo no proporcional fuese utilizado en el caso anterior, se deberán ponderar los resultados de cada estrato multiplicándose por 0.02 en el estrato 1, por 0.10 en el estrato 2, etc. Afijación de varianza mínima: El reparto de la muestra se hace de forma que para un tamaño fijo de n unidades, la varianza sea mínima. Cuanto mayor sea la variabilidad de estrato, más elementos cogeremos de tal forma que la varianza global sea mínima. Proporcionalmente a la variabilidad del estrato. Si conocemos la varianza entonces i , Afijación óptima: Consiste en minimizar la varianza para un coste fijo. Para que sea útil el muestreo estratificado se deben reunir las siguientes tres condiciones: Deben conocerse ciertas características relevantes que influencian fuertemente el fenómeno bajo estudio: Que la población sea susceptible de dividirse de acuerdo con las características relevantes: La división relativa de la población debe conocerse con cierto grado deprecisión. Para la selección de los elementos en cada estrato que van ha ser parte en la muestra se hace por medio de un muestreo aleatorio simple Una muestra estratificada puede obtenerse aún cuando no se pudieranidentificar los elementos del estrato, siempre y cuando se conozca despuésde haberse seleccionado la muestra. El problema sin embargo, es que los erroresde muestreo de las estimaciones resultan mayores que si se hubiera estratificadoantes. El uso adecuado del muestro estratificado puede generar ganancia en precisión, pues al dividir una población heterogénea en estratos homogéneos, el muestreo en estos estratos tiene poco error debido precisamente a la homogeneidad. Muestreo Sistemático En el muestreo sistemático los elementos se seleccionan de la población con un intervalo uniforme que se mide en el tiempo, en orden o en el espacio; los elementos más parecidos tienden a estar más cercanos, el muestreo sistemático suele ser más preciso que el aleatorio simple, ya que recorre la población de un modo más uniforme. Difiere del muestreo aleatorio simple en que cada elemento tiene iguales posibilidades de ser seleccionado, pero cada muestra no tiene esa misma probabilidad.Una vez definido el tamaño de muestra se fija al azar un punto de partida en la selección de las unidades de
  • 15. muestreo. A partir de allí la población se recorre sistemáticamente usando un intervalo fijo. Para seleccionar las unidades de la muestra en primer lugar se debe calcular la constante de muestreo (K), dividiendo el total de la población elegible por el tamaño de la muestra deseado . La primera unidad (r) se extrae tomando un número al azar entre 1 y la constante de muestreo (K)o entre 1 y N, a partir de ahí se va sumando la constante de muestreo consecutivamente hasta completar el tamaño de la muestra, (siendo el primer individuo r, el segundo r + K, el tercero r +2 K y así sucesivamente hasta completar los “n” individuos). Este tipo de muestreo tiene la ventaja de no necesitar tener la lista de la población cerrada de antemano. Sin embargo este tipo de muestreo no es aconsejable en las situaciones en que las unidades de muestreo están ordenadas por algún criterio periódico y la constante de muestreo puede coincidir con ello. Por ejemplo si quiere conocer la demanda en un centro recreación y elegimos como unidad de muestreo el día de la semana, puede ocurrir que obtengamos como constante de muestreo (K) el número 7, en ese caso estaríamos describiendo siempre la demanda que se produce un día determinado, podría ser aleatoriamente sábado, teniendo una elevada probabilidad que la demanda que se produce el sábado sea diferente de la demanda que se produce a lo largo de toda la semana, no siendo por tanto la muestra obtenida representativa de la población que queremos estudiar. Ejemplo: se desea realizar un estudio sobre la incidencia de cáncer en estudiantes fumadores de cierta universidad; se opta por un muestreo sistemático, se necesita calcular primero la constante de muestreo. Si N = 200 estudiantes fumadores y n = 50 la constante de muestreo se selecciona un número un número entre 1 y el 4 (supongamos que es el 3, r = 3) y ese será nuestro punto de arranque. Tomaremos el listado de los estudiantes fumadores de la universidad y el primer estudiante que se selecciona es el que se encuentra en la lista de tercero, el segundo estudiante seleccionado seria el que esta de séptimo en la lista(r + K, es decir 3 + 4), el tercero es el que aparece en la lista de once (r +2 K, es decir 3 + 2x4),y así sucesivamente hasta tomar los 50 estudiantes fumadores que constituyen nuestra muestra. Otra forma de seleccionar el punto de arranque sería seleccionar aleatoriamente un número entre 1 y 200, por ejemplo aleatoriamente se tiene el número 32, el estudiante r= 32 de la lista es el primero seleccionado para la muestra, el segundo es el estudiante 36 (r + K, es decir 32 + 4), el tercero es el 40 (r + 2K, es decir 3 + 2x4), y así sucesivamente. El muestreo sistemático suele ser más preciso que el aleatorio simple, ya que recorre la población de un modo más uniforme. Por otro lado, es a menudo más fácil no cometer errores con un muestreo sistemátic0. Observación: El método tal como se ha definido anteriormente es sesgado si no es entero, ya que los últimos elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema consiste en considerar la lista como si fuese circular ¿Cuándo usar Muestreo Sistemático y cuándo Muestreo Aleatorio Simple? Se debe tener cuidado cuando la distribución de los elementos en la poblaciónpresenta ciclos en los valores de la variable de interés, ya que en el muestreosistemático se
  • 16. extraerán valores semejantes, lo que se transfiere a una sub o super valoración del valor verdadero. En estos casos es más conveniente usar el muestreoaleatorio simple. Por lo tanto: Si la distribución de la variable en la población ordenada es aleatoria, los dosdiseños de muestreo tienen la misma performance. A veces redunda en una economía de recursos el uso del Muestreo Sistemático. Si la variable presenta ciclos o estacionalidades, es más eficiente el Muestreo Aleatorio Simple. Si la distribución de la variable es creciente o decreciente (por ejemplo, montosde deudores o acreedores) es más eficiente el Muestreo Sistemático. Muestreo por Conglomerado Esta técnica tiene utilidad cuando el universo que se requiere estudiar admite ser subdividido en universos menores de características similares a la del universo total.Cuando es posible asumir esta alternativa se procede a subdividir el universo en un número finito de conglomerados. Entre ellos se pasará a elegir algunos que serán los únicos que se procederá a investigar. Esta elección puede realizarse ya sea por el método del muestreo simple o muestreo sistemático. Una vez cumplida esta etapa puede realizarse una segunda selección dentro de cada uno de los conglomerados elegidos,para llegar a un número aún más reducido de unidades muéstrales; para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo;Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria. Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño; los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales. El incremento del tamaño de la muestra puede fácilmente ser hecho en muestra de área. Por otra parte, una muestra de conglomerados puede producir la misma precisión en la estimación que una muestra aleatoria simple, si la variación de los elementos individuales dentro de cada conglomerado es tan grande como la de la población. Hay una variante de este muestreo, que puede quedar también incluida en lo que se llamadiseños complejos y es elconocido como muestreo multietápico o polietápico de conglomerados (bietápico, trietápico, etc.). En esta variante se seleccionanlos conglomerados y puede procederse a una segunda selección dentro de los conglomerados seleccionados y lo mismo en las etapasque sean necesarias. Así la necesidad de listados se va limitando a aquellas unidades de muestreo que hayan siendo seleccionadas encada etapa. Antes de terminar este apartado vale la pena enfatizar la diferencia entre estratos y conglomerados. Los estratos deben sertan homogéneos dentro de ellos como sea posible, pero un estrato debe diferir de otro tanto como se pueda en relación a lacaracterística que está siendo medida. Los conglomerados por su parte deben ser tan heterogéneos dentro de sí mismos como seaposible, pero similares a los otros para
  • 17. aprovechar las ventajas económicas de su diseño. Los estratos deben quedar representadostodos, es decir contribuir a la muestra. Los conglomerados no tienen que quedar representados todos, pero si uno queda en la muestradebe ser muestreado totalmente (al menos en el monoetápico). En el muestreo por conglomerados se selecciona una muestraaleatoria de conglomerados y, dentro de cada conglomerado, se seleccionaal azar una muestra de sus individuos. Ejemplo: se supone que se desea conocer algunas características de los estudiantes de educación superior de cierta ciudad, para lo cual se necesita aplicar un cuestionario. El universo, los elementos (los estudiantes) están naturalmente agrupados en unos conjuntos o conglomerados (12 universidades). Se seleccionan 4 universidades a través de un muestreo aleatorio simple, como se indica en el gráfico. Una vez seleccionadas las universidades, sería posible aplicar la encuesta a la totalidad de los estudiantes, en cada una de ellas. Se habría llegado a los estudiantes a través de los conglomerados que los agrupan. 12 universidades (conglomerado) 4 universidades en la muestra (2,4, 7,12 conglomerado) Esta es una muestra por conglomerados de etapa única: se ha seleccionado al azar sólo una vez. La eficacia de este tipo de muestras depende de dos factores. En primer lugar, de la relación , donde m es la cantidad de conglomerados seleccionados y M es la cantidad existente en el universo. Cuanto mayor es esta relación, menor será el error de muestreo: obviamente, si seleccionáramos la totalidad de los conglomerados no habría error alguno. En segundo término, la muestra será tanto mejor cuanto más se parezcan los conglomerados entre sí: si fueran muy semejantes unos a otros, perderíamos muy poco al seleccionar sólo algunos para incluir en la muestra. Otra vez, vale emplear un razonamiento “por el absurdo”: si todos los conglomerados fueran idénticos entre sí, bastaría con quedarse con uno solo. De manera que, al contrario de lo que ocurría con los estratos, aquí el ideal consistiría en que hubiera una gran homogeneidad interconglomerados (similares entre sí) y una amplia heterogeneidad intraconglomerados (que toda la diversidad del universo quedara representada al interior de cada uno). En otros términos, que cada conglomerado fuera “un universo en pequeño”.
  • 18. Ejemplo: Suponga que se quiere preguntar a las personas de 18 años y más (habilitadas para votar) que residen en cierta ciudad, la opinión que tienen sobre el desempeño del gobierno de la región (o sobre cualquier otro variable de interés). ¿De dónde se sacaría el marco muestral, es decir un listado con los datos de todos los habitantes de la ciudad. No existe: no se podría disponer de tal listado. Pero se podría tratar de dar con las personas dentro de los conglomerados que los agrupan: los hogares. Sin embargo, tampoco se tiene un listado de hogares: ni siquiera uno actualizado de viviendas. ¿Qué se puede hacer? El territorio de cualquier ciudad está naturalmente dividido en jurisdicciones administrativas. Por ejemplo, las fracciones censales, que son grandes jurisdicciones geográficas al interior de la ciudad. Pues bien, podría seleccionarse al azar algunas de estas fracciones. A su vez, las fracciones están divididas en áreas menores, que se denominan radios censales. En un segundo paso o etapa, sería posible seleccionar al azar cierta cantidad de radios al interior de cada una de las fracciones que “quedaron” al primer sorteo. Finalmente, se tendría algunos radios de ciertas fracciones. Y dentro de estos radios, tendrían manzanas, que apelando a la cartografía podrían ser numeradas y seleccionadas al azar. Estas manzanas que quedaron en los tres sorteos se denominan, habitualmente, puntos muestra. Dependiendo del total de hogares que se quieren seleccionar (es decir del n muestral), suele determinarse previamente cuántos puntos muestra se requiere. En las encuestas domiciliarias debe preverse un porcentaje considerable de rechazos (personas que se niegan a ser entrevistadas). Generalmente, este margen de rechazos se conoce por experiencia y puede ser estimado. Para compensar, es posible seleccionar más puntos muestra de los necesarios, a los efectos de los posibles reemplazos. TIPOS DE MUESTREO NO PROBABILISTICO Muestreo por cuotas También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificadoen el sentido que busca representatividad de diferentes categorías o estratos de la población objeto de estudio, pero no tiene el carácter de aleatoriedad de aquél, sin embargo, para la selección de esas unidades no usa el azar. Conceptualmente es un muestreo estratificado en el que los estratos suelen estar determinados por características sociológicas o demográficas (el sexo, la edad, profesión, etc.). Sin embargo, se suele llevar a cabo en la calle, de forma que los encargados de recoger los datos, buscan a las personas de cada estrato que deben entrevistar para cubrir la cuota en vez de elegirlas al azar. Además, laselección de las unidades de muestreo queda juicio del investigador; La muestra debe serproporcional a la población, y en ella deberán tenerse en cuenta lasdiferentes categorías. El muestreo por cuotas se presta a distorsiones, alquedar a criterio del investigador la selección de las categorías.
  • 19. Ejemplo: en un estudio sobre la actitud que tiene la población hacia un candidato político, se les indica a los encuestadores entrevistar a 150 sujetos cuota categorías Cantidad de personas encuestadas en la muestra por categoría 30% Hombres mayores de 30 45 30% años, 45 20% Mujeres mayores de 30 30 20% años, 30 Hombres menores de 25 años, Mujeres menores de 25 años TOTAL 150 Muestreo a conveniencia o intencional El Muestreo por conveniencia es el procedimiento que consiste en la selección de las unidades de la muestra en forma arbitraria, las que se presentan al investigador, sin criterio alguno que lo defina. Las unidades de la muestra se autoseleccionan o se eligen de acuerdo a su fácil disponibilidad. No se específica claramente el universo del cual se toma la muestra. Por consiguiente, la representatividad estructural es nula, no se consideran las variables que definen la composición estructural del objeto de estudio. Su principal debilidad es el nombre, ya que, para muchas personas el nombre da a entender que se está haciendo la selección de las unidades de análisis amañando las respuestas, situación que no es cierta, toma su nombre, debido a que se busca obtener una representatividad de la población consultando o midiendo unidades de análisis a las cuales se puede acceder con relativa facilidad. Los límites serios de este muestreo se evidencian en la etapa exploratoria de una investigación, para generar hipótesis, elegir problemas de estudio y aproximarse inicialmente a la caracterización del objeto de estudio Ejemplo: la realización de una encuesta a los amigos y vecinos para analizar su opinión sobre el tema “tratado de libre comercio entre estados Unidos y Colombia “. Muestreo a juicio En este caso se toman las muestras en aquel lugar en donde hay mayor probabilidad de encontrar la variable de interés, este tipo de muestreo es muy importante sobre todo cuando la característica buscada sea poco común, como es el caso de ciertas enfermedades raras, en estas situaciones, el juicio de un experto; porque cree que son representativos de la población de interés o que son apropiados en alguna otra forma. Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones. Si se utilizará un método aleatorio, probablemente quedarían en la muestra algunas personas con poco dominio sobre el tema en estudio
  • 20. Ejemplo: Se quiere realizar un estudio comparativo de la imagen de una Empresa en dos ciudades del estado de Colombia. Un experto en Mercadotecnia puede recomendar, a su juicio, que las dos ciudades idóneas para realizar el estudio son Cali y Medellín. El objetivo seria entonces conocer el grado que afectan las opiniones de los consumidores en los medios masivos de comunicación al volumen de venta de la Empresa en cada una de las 2 ciudades. Muestreo bola de nieve Se definen como aquella técnica en la que los sujetos participantes de un estudio refieren a otros individuos, que a su vez refieren a otros que son también incluidos en la muestra. Esta técnica también recibe el nombre de muestreo por red (network sample) o muestreo por multiplicidad (multiplicity sample). De la misma manera en que al descender por una cuesta, una bola de nieve va incorporando más materia, igual sucede con la red de participantes que son agregados a la muestra de una investigación que emplee esta técnica. Para adquirir un grupo de estudio que se aproxime a una muestra aleatoria, una condición muy importante es que el primer grupo de encuestados (en la etapa cero) debe ser seleccionado aleatoriamente. El supuesto subyacente es que, los miembros de la población escondida no viven en completo aislamiento, es decir, tienen por lo menos una “red social” con la cual es posible contactarlos.El muestreo en bola de nieve, básicamente sigue las siguientes etapas. a. Mapa de la red: Se hace una descripción de la población objetivo de la mejor forma posible, en éste caso, no importa que “lo mejor posible” sea una descripción muy vaga. b. Proceso de referenciación: A un informante clave se le pide nominar y contactar individuos de la población objetivo. Se obtienen así varios puntos de partida o contactos iníciales. Para ganar validez científica, se debe de elegir aleatoriamente entre ellos para comenzar. c. Entrevista: Cuando la persona es contactada aleatoriamente, se le entrevista y a su vez se le pide que nomine a otras personas dentro de la población objetivo. d. Repitiendo el procedimiento: Cada grupo de nominados representa una etapa, se forma entonces una línea de respondientes-referenciado- respondiente, a esta cadena se le denomina la “bola de nieve”. La cadena se detiene cuando no se pueden dar más nominaciones o cuando el individuo seleccionado no es encontrado o se rehúsa a contestar. Ventajas: Es un método eficiente en los casos donde se tiene una población de escasos elementos o donde cierto grado de confianza es requerido para que estén dispuestos a participar en la investigación. Permite la creación de un marco de muestra cuando éste no existía per se. Todos los individuos entrevistados son del conjunto de la población objetivo.
  • 21. Tipos de Sesgos Sesgo de Distancia Social: La probabilidad de contacto social entre dos individuos es función de la distancia social entre los individuos. El modelo de las isla: Subgrupos de individuos existen, entre los individuos las probabilidades de conexión son aleatorias, pero entre grupos las oportunidades de conexión son limitadas. Círculos traslapados: Si no existen conexiones entre muchos grupos de individuos, diferentes grupos pueden ser conectados por los individuos que son miembros de varios grupos. Sesgo reflexivo: Un referido de una persona a otra teóricamente agranda la oportunidad de que la primera persona sea nominada otra vez. Sesgo forzado de campo: Algunos individuos van a tener una gran oportunidad de ser seleccionados debido a ciertas características como la popularidad. Desventajas Como se mencionó anteriormente, produce estimadores sesgados. Ya que individuos muy populares dentro de una población tiene mayores oportunidades de ser seleccionados. Hay poca representatividad entre los resultados y por ende no se puede extrapolar hacia la población Muestreo con fines específicos El cual pretende llegar a grupos muy específicos, tal es el caso, de personas con preferencias y/o gustos similares, por ejemplo, los que gustan de la música metálica, es fácil abordarlos en un concierto de ese tipo de música, los constructores se pueden abordar en un congreso para tal fin. Se pueden encontrar otros nombres en procedimientos de muestreo, sin embargo, se pueden encasillar en alguno de los descritos anteriormente.