1. Cálculos Muestra y Muestreo
Dr. Cristian Díaz Vélez
Editor Científico de Revista Cuerpo Médico Hospital Nacional Almanzor Aguinaga Asenjo
Miembro del comité Científico. Revista Acta Médica Peruana del Colegio Médico del Perú
y Revista Médica de Risaralda, Universidad Tecnológica de Pereira-Colombia.
2. MUESTRA
En las investigaciones muchas veces es
imprescindible realizar un cálculo de tamaño de
muestra para saber la precisión o la potencia del
estudio.
4. Conceptos primarios
►Población: conjunto de individuos o elementos que
cumplen ciertas propiedades comunes.
►Muestra: subconjunto representativo de una
población.
5. Conceptos primarios
►Parámetro : Son las medidas o datos que se
obtienen sobre la distribución de probabilidades de
la población, tales como la media, la varianza, la
proporción, etc.
►Estadístico. Los datos o medidas que se obtienen
sobre una muestra y por lo tanto una estimación de
los parámetros, es decir es igual al parámetro pero de
la muestra.
6. Conceptos primarios
►Varianza Poblacional. Cuando una población es
más homogénea la varianza es menor. Generalmente
es un valor desconocido y hay que estimarlo a partir
de datos de estudios previos.
►Inferencia estadística. Inferencias acerca de la
población a partir de una muestra extraída de la
población.
7. Conceptos primarios
►Error Muestral o Tolerancia de error: de
estimación o estándar. Es la diferencia entre un
estadístico y su parámetro correspondiente.
Generalmente 5%, en estudios con fármacos 1%.
La tolerancia debe ir de la mano de la prevalencia
del estudio en cuestión.
►Nivel de Confianza. Probabilidad de que la
estimación efectuada se ajuste a la realidad.
8. Conceptos primarios
►Ejemplo:
Si por ejemplo estudiamos la prevalencia de asma
bronquial en un estudio donde se cálculo la muestra
con tolerancia de error del 5% y nivel de significancia
del 95% y se encontró que la prevalencia es de 20%.
Interpretación: hay un 95% de probabilidad que la
prevalencia real este entre 15 y 25%.
Que ocurre si las prevalencias son muy bajas, por ejemplo 2%??
9. Factores que influyen
►Tipo de diseño.
►Tipo de muestreo utilizado.
►Comparación de muestras
independientes o pareadas.
10. Circulo vicioso del cálculo
Cálculo muestral
La frecuencia se Frecuencia del
obtendrá en el estudio Problema en estudio
x
%
r
OR
11.
12.
13. Muestra para la media de población
Población conocida Población no conocida
Las variables son numéricas
El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar
a un coeficiente (Zα). Para una seguridad del 95% = 1.96; para una seguridad
del 99% = 2.58.
d : error máximo permisible o Tolerancia de error (mayormente 5%)
S2: varianza poblacional
14. Muestra para la media de población
Variables Nominales
siendo
es la varianza de la población.
es la varianza de la muestra, la cual podrá determinarse en
términos de probabilidad como
es error estándar que está dado por la diferencia entre () la media
poblacional y la media muestral.
es el error estándar al cuadrado, que nos servirá para determinar
, por lo que = es la varianza poblacional.
15. Muestra para la media de población
► Ejemplo:
En un área sanitaria, la distribución del peso al nacer de
niños que cumplen su período de gestación de 40 sem. es
aproxim. normal con una media de m=3500 g. y una
DS=430 g.
Un investigador planea llevar a cabo un estudio para
estimar el peso medio al nacer de los niños que llegan al
término del embarazo y cuyas madres fumaron durante ese
período, asumiendo que la DS es la misma. Si el
investigador desea que el error (precisión) sea de 50 g con
una confianza del 95%, ¿qué tamaño de muestra se requiere
en este estudio?
16.
17. Muestra para la proporción de población
Población conocida Población no conocida
Las variables son nominales
n: Tamaño muestral
N: Tamaño de la población, número total de historias.
Z: Valor correspondiente a la distribución de Gauss 1,96 para α =0,05
p: Prevalencia del fenómeno en estudio.
Q: 1-p
“i” o “d”: Tolerancia de error (mayormente 5%)*.
•Si las prevalencias son bajas, las tolerancias de error lo debe ser aun más. Ejemplo de la tasa
de prevalencia, se puede suponer que la proporción que ha de estimarse se moverá
probablemente entre un 5% y un 15%, y es razonable aspirar a que no se incurra en un error
mayor del 1%.
18. Muestra para la proporción de población
• Si la seguridad Zα fuese del 90% el coeficiente sería 1.645
• Si la seguridad Zα fuese del 95% el coeficiente sería 1.96
• Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24
• Si la seguridad Zα fuese del 99% el coeficiente sería 2.576
19. Muestra para la proporción de población
En estudio se quiere identificar las frecuencia de
retención de restos placentarios como parte de la
morbilidad materna extrema durante el embarazo,
parto y puerperio en los hospitales MINSA-
Lambayeque, en el periodo 1°enero
2010-31°diciembre 2011. Si se desea trabajar con
una precisión del 3%, nivel de confianza del 95%, y
se sabe que según estudios previos la proporción
de restos placentarios es 15%.
Calcule la muestra necesaria para el estudio.
20.
21.
22. Cálculo del tamaño muestra en estudios de casos y
controles
p2: probabilidad de exposición entre los controles
W: es el OR previsto
P1: la frecuencia de exposición entre los casos,
Así, el problema del cálculo del tamaño muestral podrá abordarse mediante
las fórmulas habituales empleadas en la comparación de dos proporciones,
asumiendo aquí que las proporciones esperadas son p1 y p2
23. Cálculo del tamaño muestra en estudios de casos y
controles
p1: La frecuencia de la exposición entre los casos.
p2: La frecuencia de la exposición entre los controles.
α : La seguridad con la que se desea trabajar, o riesgo de cometer un error de
tipo I. Generalmente se trabaja con una seguridad del 95% (α = 0,05).
1-β: El poder estadístico que se quiere para el estudio, o riesgo de cometer un
error de tipo II. Es habitual tomar β = 0,2, es decir, un poder del 80%.
24. Cálculo del tamaño muestra en estudios de
casos y controles
Donde:
son valores que se obtienen de la distribución normal estándar en función de
la seguridad y el poder elegidos para el estudio. En particular, para una
seguridad de un 95% y un poder estadístico del 80% se tiene que.
25. Cálculo del tamaño muestra en estudios de casos y
controles
n = número de sujetos sin pérdidas
R = proporción esperada de pérdidas
26. Cálculo del tamaño muestra en estudios de
casos y controles
►Ejemplo: Un estudio de casos y controles
emparejado sobre tabaquismo y cáncer de laringe
utilizando controles poblacionales.
►Suponiendo que la prevalencia del hábito
tabáquico en la población es del 45% y que el OR
esperado es aproximadamente es 3
►¿cuántos pares de casos y controles necesitará para
estimar el OR con una potencia de 80% y un nivel
de confianza del 95%?
27.
28.
29. Cálculo del tamaño muestra en estudios de
Cohortes
n : sujetos necesarios en cada una de las muestras
Zα : Valor Z correspondiente al riesgo deseado
Zβ : Valor Z correspondiente al riesgo deseado
S2 : Varianza de la variable cuantitativa que tiene el grupo control o de
referencia.
d : Valor mínimo de la diferencia que se desea detectar (datos cuantitativos).
30. Cálculo del tamaño muestra en estudios de
Cohortes
► Un epidemiólogo proyecta un estudio sobre la posibilidad
de que cierta enfermedad pulmonar esté favorecida por la
exposición a un contaminante atmosférico recién detectado
cuyo efecto no ha sido examinado previamente.
► ¿Qué tamaño tendrá que tener la muestra de cada grupo (el
de expuestos y el de no expuestos) si se desea estimar el
riesgo relativo con una potencia 80% y un 95% de
confianza?
► La enfermedad se manifiesta en el 20% de las personas no
expuestas y 30% en las expuestas al contaminante
atmosférico y los dos grupos serán de igual tamaño.
31.
32.
33. Tamaño muestra del coeficiente correlación
lineal
Siendo el error estándar de z aproximadamente igual a
34. Tamaño muestra del coeficiente correlación lineal
A. Planteamiento bilateral B. Planteamiento Unilateral
r: magnitud de la correlación que se desea detectar. Esto se obtiene de
estudios anteriores entre las dos variables a estudio.
1−α: la seguridad con la que se desea trabajar o riesgo de cometer un error
de tipo I. Generalmente se trabaja con una seguridad del 95% (α = 0,05 ).
1−β: el poder estadístico que se quiere para el estudio, o riesgo de cometer
un error de tipo II. Es habitual tomar β = 0,2 o, equivalentemente, un poder
estadístico del 80%.
35. Tamaño muestra del coeficiente correlación
lineal
se obtienen de la distribución normal estándar en función de la seguridad
y el poder elegidos para el estudio. En particular, para una seguridad del
95% y un poder estadístico del 80% se tiene que
A
B
36. Tamaño muestra del coeficiente correlación
lineal
►Supóngase que la correlación entre el volumen
espiratorio forzado en un segundo y la capacidad
vital forzada en individuos sanos es
aproximadamente de 0,60.
►Supóngase, adicionalmente, que un grupo de
pacientes con una enfermedad de pulmón está
accesible en una clínica, e interesa contrastar si hay
correlación entre ambas medidas en esos
pacientes. Con un nivel de confianza del 95% y una
potencia del 90%, ¿cuántos sujetos se necesitan en
la muestra?
37.
38.
39. Ensayos Clínicos
► La formula dependerá del tipo de medida que se este
calculando en el ensayo clínico.
Ejemplo: un ensayo clínico sobre el uso de una droga en
embarazos gemelares, un gineco-obstetra desea demostrar
que hay un aumento significativo en la duración del
embarazo al usar la droga frente a un placebo.
El tocólogo estima que la media de la duración de los
embarazos es de 1,75 semanas. ¿Cuántos embarazos debe
observar como mínimo en cada grupo si considera que una
semana es un aumento clínicamente importante en la
duración del embarazo y quiere trabajar con una confianza
del 95% y una potencia del 80%?
44. Muestreo aleatorio simple
►Es aquel en que cada elemento de la población tiene
la misma probabilidad de ser seleccionado para
integrar la muestra.
►Existen dos formas de extraer una muestra de una
población: con reposición y sin reposición.
45. Muestreo aleatorio simple
►Muestreo con reemplazo: un elemento puede
ser seleccionado más de una vez en la muestra para
ello se extrae un elemento de la población se
observa y se devuelve a la población, por lo que de
esta forma se pueden hacer infinitas extracciones
de la población aun siendo esta finita.
►Muestreo sin reemplazo: No se devuelve los
elementos extraídos a la población hasta que no se
hallan extraídos todos los elementos de la
población que conforman la muestra.
46. Muestreo aleatorio simple
►Ejemplo:
Supóngase que se quiere obtener una MAS de 120
descansos médicos de un registro de 973 emitidos
durante el mes de diciembre del 2009.
47.
48.
49.
50. Muestreo sistemático en fases
►También otorga igual probabilidad de integrar la
muestra a todas las unidades de análisis de la
población.
►Se usa para los casos en los que no se cuenta con una
base de datos con el caso del muestreo aleatorio
simple.
►Para su calculo se debe saber el tamaño de la
población y que porcentaje es la muestra de la
población.
51. Muestreo sistemático en fases
►Ejemplo:
Supóngase que se quiere obtener una muestra
sistemática que contenga aproximadamente al 12%
de los estudiantes de un centro universitario que
tiene 966 alumnos registrados.
52.
53. Muestreo aleatorio estratificado
►Un muestreo aleatorio estratificado es aquel en el
que se divide la población de N individuos, en k sub-
poblaciones o estratos, atendiendo a criterios que
puedan ser importantes en el estudio, de tamaños
respectivos.
N1, . . . , Nk,
54. Muestreo aleatorio estratificado
► Ejemplo:
Supóngase que se quiere obtener una muestra de
120 estudiantes de un centro universitario que
tiene 966 alumnos registrados, distribuidos en
cuatro áreas académicas con los siguientes
tamaños:
Ingeniería: 264
Ciencias económicas: 284
Ciencias salud: 182
Letras: 236
55. Muestreo por conglomerados monoetápico
►No se pueda disponer de un listado total de las
unidades de análisis, solo se sabe de cuantas están
conformadas cada unidades de análisis y/o
►Dispersión geográfica de las unidades de análisis a lo
largo del territorio en que se halla ubicada la
población.
56. Muestreo por conglomerados monoetápico
►Cuando solo se tienen identificados los
conglomerados y sus tamaños; en este caso se debe
conformar un archivo con tantos registros como
conglomerados, con un campo que identifique el
conglomerado y otro campo que contenga su tamaño
(número de unidades de que consta).
57. Muestreo por conglomerados monoetápico
►Ejemplo:
Supóngase que se quiere obtener una muestra de
aproximadamente 120 estudiantes de un centro
universitario que tiene 966 alumnos registrados y
que los alumnos están distribuidos en 52 grupos de
tamaños variables y conocidos.
58. Muestreo por conglomerados bietápico
►Este procedimiento de selección muestral se utiliza
cuando hay gran variabilidad entre los tamaños de
los conglomerados.
►Se usa para escoger más conglomerados, claro esta
manteniéndose la misma cantidad de la muestra.
59. Muestreo por conglomerados bietápico
►Ejemplo:
Supóngase que se quiere obtener una muestra de
120 estudiantes de un centro universitario que
tiene 966 alumnos registrados. Supóngase además
que los alumnos están distribuidos en 52 grupos de
tamaños variables y conocidos y que se ha decidido
seleccionar 12 de esos grupos, o equivalentemente,
10 alumnos por grupo.
60. Muestreo por conclomerados bietápico
estratificado
►Este procedimiento de selección muestral se utiliza
cuando se quiere aplicar un muestreo bietápico pero
habiendo separado antes las Unidades de Primera
Etapa según estratos.
►Se trata de un método cuyo uso está muy extendido
en la práctica.
61. Muestreo por conclomerados bietápico
estratificado
►Ejemplo:
Supóngase que se quiere obtener una muestra de
120 estudiantes de un centro universitario que
tiene 966 alumnos registrados. Supóngase
además que hay cuatro áreas académicas y que
en cada una existe cierto número de grupos de
alumnos (14, 14, 11 y 13 grupos respectivamente)
de modo que los alumnos están distribuidos en
52 grupos de tamaños variables y conocidos.
Considérese, finalmente, que se ha decidido
seleccionar 12 de esos grupos y 10 alumnos por
grupo.
62.
63. ¿DÓNDE EMPIEZA EL
PLAGIO DE UN ARTÍCULO
CIENTÍFICO? PROTOCOLO O
INFORME FINAL
Dr. Cristian Díaz Vélez
Presidente del Comité de Investigación
Hospital Nacional Almanzor Aguinaga Asenjo. Essalud
64. Resultados
Tabla 02: Frecuencia de plagio protocolos de investigación
presentados al comité de investigación de la Red
Asistencial Essalud de Lambayeque 2011
Saldaña-Gástulo titulo de
Medico Cirujano, 6/33 tesis no Frecuencia N %
se encontraron evidencias de
plagio.
> 30% 8 7,5%
21%-30% 11 10,4%
10%-20% 43 40,6%
< 10% 44 41,5%
Total 106 100,0%
65. Resultados
Plagio (%)
Características
Tabla 03: Promedio de la frecuencia X
de plagio según algunas Grado
características de filiación en los Postgrado 17,69
protocolos de investigación
presentados al comité de Pregrado 13,68
investigación de la Red Asistencial Tipo Investigación
Essalud de Lambayeque 2011. Cualitativa 14,85
Cuantitativa 13,92
Diseño Investigación
Descriptivo 13,60
Analítico 17,42
Facultad
Enfermería 16,03
Medicina 13,78
Psicología 12,40
Ingeniería 6,50
Motivo Investigación
Tesis Postgrado 13,62
Tesis Especialidad 21,75
Tesis Pregrado 14,94
Pregrado Curso 6,50
Pregrado Libre 5,60
66. Resultados
Tabla 04: Frecuencia de las páginas más usadas para plagio en los
protocolos de investigación presentados al comité de investigación de la
Red Asistencial Essalud de Lambayeque 2011.
Páginas %
http://www.monografias.com 28%
Paginas de revistas 25%
http://apuntes.rincondelvago.com 23%
http://es.wikipedia.org 20%
http://www.alipso.com/ 12%
Blogs, foros 10%