SlideShare una empresa de Scribd logo
1 de 134
Descargar para leer sin conexión
BIOESTADÍSTICA
Handbook
Fundamentos Básicos
Diego H. Giunta
2
3
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Contenido
1 LA PREGUNTA DE INVESTIGACIÓN
¿Por qué empezar por la pregunta de investigación? 9
¿Cuáles son las características de una buena pregunta de
investigación? 9
¿Cómo se utilizan los aspectos de la pregunta? 13
¿Cómo se clasifican las preguntas de investigación? 14
¿Qué estructura tiene un pregunta de investigación? 15
¿Cómo expresar la hipótesis de investigación? 16
¿Cuál es la relación entre pregunta, hipótesis y objetivos? 16
¿Cuántas preguntas tiene un estudio? 17
2 POBLACIÓN
¿Qué es la población del estudio? 19
¿Qué tipos de poblaciones hay? 19
¿En que parte se define la población blanco de un estudio? 21
¿En que parte se describe la muestra? 23
¿Cómo se toma una muestra? 25
¿Cuáles son las diferencias entre los tipos de muestreo
probabilístico? 25
3 DISEÑOS DE ESTUDIOS DE INVESTIGACIÓN
¿Qué es un diseño? 29
¿Cómo se clasifican? 29
Con respecto a las unidades de observación 30
Con respecto a la temporalidad 30
Con respecto a la naturaleza de la exposición 31
¿Cuáles son los tipos de diseños más frecuentes? 32
¿Cómo se define un ensayo clínico? 32
¿Qué es el ciego o enmascaramiento? 33
¿Para qué sirve la asignación al azar de tratamiento? 34
4
¿Cómo se clasifican los ensayos clínicos? 35
¿En qué se diferencian los ensayos clínicos pragmáticos
de los clásicos? 37
¿Cómo se define un estudio de cohorte? 38
¿Cómo se define un estudio de casos y controles? 39
¿Qué es el matcheo? ¿Para qué sirve? 40
¿Cómo se define un estudio de corte transversal? 40
¿Cómo se define un estudio ecológico? 41
¿Cúal es el mejor diseño? 42
4 VARIABLES, MEDIDAS DE RESUMEN Y MEDIDAS DE
ASOCIACIÓN
¿Qué son las variables? 43
¿Cómo se clasifican las variables? 44
¿Cuánta información contiene cada tipo de variable? 45
¿Cómo se clasifican las variables de acuerdo a su función en el
estudio? 46
¿Qué utilidad tiene clasificar las variables? 47
¿Cómo elijo las variables a medir? 47
¿Qué son los parámetros poblacionales y los estimadores
muestrales? 48
¿Qué son las medidas de resumen? 49
¿Cuáles son las medidas de resumen para variables
cuantitativas? 50
¿Qué son las medidas de frecuencia? 51
¿Qué son las medidas de asociación? 52
¿Cómo se clasifican las medidas de asociación? 52
Otras medidas de asociación 53
¿Cómo se interpretan las medidas de asociación? 54
¿Cómo se interpretan las medidas de asociación relativas? 54
¿Cómo se interpretan las medidas de asociación absolutas? 55
5
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
5 AMENAZAS A LA VALIDEZ
¿Qué es la validez de un estudio? 57
¿Qué es la validez interna? 57
¿Qué es la validez externa? 57
¿Cuáles son las amenazas a la validez? 58
¿Qué son los sesgos? 58
¿Qué son los sesgos de selección? 59
¿Cómo minimizo los sesgos de selección? 60
¿Qué son los sesgos de información? 60
¿Cómo minimizo los sesgos de información? 62
¿Qué es el error aleatorio? 62
¿Qué hago con los sesgos? 62
¿Qué son los confundidores? 62
¿Qué hago con los confundidores? 63
¿Qué es el azar de muestreo? 64
Teorema del Límite Central 65
¿Qué es una distribución normal? 67
¿Cuál es el efecto del azar de muestreo? 67
¿Cómo minimizo el efecto del azar de muestreo? 68
6 TEST DE HIPÓTESIS E INTERVALOS DE CONFIANZA
¿Qué es una hipótesis? 69
¿Cuál es la relación entre pregunta e hipótesis? 70
¿Cómo se clasifican las hipótesis? 70
¿Cuáles son los componentes de la hipótesis? 70
¿Qué es la hipótesis nula? ¿Y la hipótesis alterna? 70
¿Qué es una asociación causal? 71
¿Qué es el error Alfa y Beta? 72
¿Qué es un test de hipótesis? 74
¿Cuáles son los componentes de un test de hipótesis? 74
¿Cuántas colas puede tener un test de hipótesis? 76
6
¿Qué es el p valor? 77
¿Qué son los intervalos de confianza? 77
¿Cómo se interpretan los intervalos de confianza? 79
7 ANÁLISIS ESTADÍSTICO
¿Cuál es el objetivo de la planificación del análisis estadístico? 81
Antes de analizar… 81
¿Qué partes tiene el plan de análisis estadístico? 82
¿Qué es el análisis descriptivo? 83
¿Qué es el análisis bivariado? 84
¿Qué test uso para variables continuas? 85
¿Qué hago si las muestras no son independientes? 87
¿Cómo seleccionar las medidas de asociación? 87
¿Cómo calcular las medidas de asociación? 88
¿Cómo detectar los potenciales confundidores? 89
¿Qué es la modificación de efecto? 90
8 MODELOS DE REGRESIÓN
¿Qué es el análisis de regresión? 91
¿Cuál es el uso de un modelo de regresión? 91
¿Cómo uso los modelos de regresión para predecir? 92
¿Cómo valido los modelos de regresión predictivos? 92
¿Cómo uso los modelos de regresión para ajustar por
potenciales confundidores? 93
¿Cuáles son los componentes del análisis de regresión? 94
¿Qué parámetros estima un modelo de regresión? 95
¿Cómo se clasifican los modelos de regresión? 96
¿Cuáles son los supuestos de los modelos de regresión? 98
¿Cómo evalúo los supuestos de un modelo de regresión lineal? 98
¿Qué tipos de variables explicativas se pueden incluir en un
modelo de regresión? 100
7
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
¿Cómo selecciono las variables para incorporar en el modelo? 101
¿Cómo elijo el mejor modelo predictivo? 101
9 MÉTODOS PARA DATOS CENSURADOS
¿Qué son los datos censurados? 103
¿Cómo registrar datos censurados? 105
¿Qué son los eventos competitivos? 105
¿Cómo describo los datos censurados? 106
¿Cómo comparo dos curvas de sobrevida? 107
¿Cúal es modelo de regresión para datos censurados? 107
10 ESTUDIOS DE TEST DIAGNÓSTICOS
¿Qué es un test diagnóstico? 109
¿Qué es un estudio de test diagnóstico? 109
¿Qué preguntas responden los estudios de test diagnósticos? 110
¿Qué componentes tienen los estudios de test diagnóstico
clásicos? 111
¿Cuáles son las situaciones clínicas específicas de un test
diagnóstico? 112
¿Cuáles son las medidas de performance diagnóstica? 113
¿Qué es la curva ROC y para qué sirve? 115
¿Cuáles son los diseños de los estudios de test diagnóstico? 115
¿Cuál es el mejor test diagnóstico? 117
11 ESTIMACIÓN DE TAMAÑO MUESTRAL
¿Necesito estimar el tamaño muestral? 119
¿Cuándo hacer la estimación de tamaño muestral? 120
¿Tamaño muestral en las preguntas descriptivas? 120
¿Qué necesito para realizar una estimación de tamaño
muestral para precisión? 121
¿Cómo se modifica el tamaño muestral por precisión? 121
8
¿Cómo se hace una estimación de tamaño muestral por
precisión? 122
¿Tamaño muestral en las preguntas analíticas? 122
¿Qué necesito para realizar una estimación de tamaño muestral
para poder? 123
¿Cómo se modifica el tamaño muestral para testear hipótesis? 125
¿Cómo se hace una estimación de tamaño muestral para
testear una hipótesis? 125
¿Qué pasa si tengo más de una pregunta de investigación? 126
¿Qué hago si me faltan datos para la estimación del tamaño
muestral? 126
¿Qué hago si requiero un tamaño muestral muy grande? 127
REFERENCIAS 129
9
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
¿Por qué empezar por la pregunta de investigación?
La pregunta de investigación es el eje central de un proyecto de investigación.
Representa lo que el investigador intenta contestar con un estudio de investi-
gación, el conocimiento nuevo que se pretende generar. Respondiendo a las
preguntas de investigación, la comunidad científica conoce y construye la rea-
lidad. En la investigación en salud, las preguntas de investigación tienen el fin
de conocer para mejorar el cuidado de la salud de las poblaciones e individuos.
Desde este rol clave y central, la pregunta de investigación es el primer paso de
una investigación. Es el componente principal e inicial de cualquier proyecto de
investigación, tanto en la construcción de proyectos o reportes de estudios de
investigación. Una adecuada estructura y apropiado proceso de generación de
la pregunta asegurará la construcción de un proyecto sólido fundamentado en
los conocimientos disponibles. Asimismo, es el componente principal a identifi-
car en el primer paso de la lectura crítica de un artículo científico.
Algunas preguntas de investigación podrían ser ¿Cuál es la sobrevida de los
pacientes con fibrosis quística? ¿El tratamiento con antihipertensivos disminuye
la sobrevida de los pacientes hipertensos adultos? ¿Cuáles son las barreras y
facilitadores para dejar de fumar en los fumadores de áreas rurales? ¿Los agro-
químicos causan cáncer? A estas preguntas les faltaría madurar y refinarse.
La pregunta puede surgir de la experiencia del investigador, nuevas ideas o
nuevas aproximaciones a nuevos problemas, estudios previos, creatividad pro-
pia para asociar distintas observaciones, evaluación crítica de la literatura, entre
otros. Cualquiera sea el origen de la pregunta, deberá cumplir con ciertos requi-
sitos y propiedades para convertirse en el centro de un proyecto de investiga-
ción.
¿Cuáles son las características de una buena pregunta de investigación?
La pregunta de investigación debe poseer ciertas características para ser ade-
cuada como eje de un proyecto de investigación. Las principales característi-
cas de la pregunta de investigación se pueden recordar por las siglas FINER-P,
modificado de la propuesta de Hulley.[1]
Representan las principales caracterís-
LA PREGUNTA DE
INVESTIGACIÓN
1
10
ticas que debería tener una pregunta de investigación para ser el mejor eje de
un estudio: Factible, Interesante, Novedoso, Ético, Relevante, y Biológicamente
Plausible.
Es interesante notar que la evaluación de estos aspectos se realiza en un con-
texto sociocultural en un determinado lugar y tiempo. En diferentes momentos
de la historia, estas características varían para una misma pregunta. Por ejemplo,
una pregunta novedosa en un determinado momento de la historia de la ciencia
como ¿Fumar causa cáncer?, no sería novedosa ni ética en el día de hoy.
Figura 1: Características de una buena pregunta de investigación.
FINER - P
INTERESANTE
FACTIBLE NOVEDOSO RELEVANTE
PLAUSIBILIDAD
BIOLÓGICA
ETICA
A continuación, presentaremos una breve descripción de cada una de las características
cambiando el orden en sentido uno de los muchos órdenes de relevancia propuestos
para los mismos aspectos:
ÉTICA El primer aspecto a considerar es la ética de la pregunta de
investigación. Desde el punto de vista del contenido de la pre-
gunta, una pregunta es ética cuando respeta todos los princi-
pios éticos: no maleficencia (no causar daño), justicia (igualdad
de oportunidades para todos), benevolencia (intención de ha-
cer el bien) y autonomía (respetar la decisión de participar en
el estudio de los individuos).
Todas las preguntas y proyectos de investigación biomédica
deben estar en total concordancia con el Código de Nürem-
berg de principios éticos sobre la experimentación en seres
humanos publicado en 1947 luego de los juicios de Nürem-
berg de 1945 - 1946[2]
, la Declaración de Principios éticos para
las investigaciones médicas en seres humanos de Helsinki de
la Asociación Médica Mundial y enmiendas posteriores,[3]
las
guías de Buenas Prácticas Clínicas de la de Conferencia In-
ternacional de Armonización ICH,[4]
la normativa y legislación
regulatoria local.
11
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
FACTIBLE Es importante evaluar de manera precoz si podemos llevar a
cabo el proyecto. Por ejemplo, muchas veces las preguntas
de investigación para ser contestadas requieren un número
elevados de participantes y si no tenemos manera de incluir
dicho número, la factibilidad del estudio se verá amenazada.
Los componentes de la factibilidad son la ética, la complejidad
y los recursos.
Los recursos implican cantidad de pacientes, tiempo disponi-
ble, recursos económicos, humanos, materiales, entre otros.
La complejidad del estudio es un componente fundamental.
Los estudios más simples tienen menos componentes que pu-
dieran fallar y son más fáciles de diseñar, implementar y maxi-
mizar su calidad.
INTERESANTE La pregunta debería ser interesante para el investigador, su
equipo de trabajo, la comunidad científica, los pacientes y la
salud pública. La motivación probablemente sea uno de los
recursos más importante por lo cual es fundamental que la
pregunta, eje de la investigación, resulte interesante para el
investigador y su equipo también. El desarrollo de una pre-
gunta madura, el diseño, la implementación y el reporte de
los resultados lleva mucho tiempo y esfuerzo, por lo cual es
fundamental mantener el interés del investigador y su equipo.
Si bien toda pregunta que apunte hacia un área de descono-
cimiento es fundamental para el crecimiento del conocimiento
universal, si existe poco interés de la comunidad científica es
probable que sea más dificultoso el financiamiento y su difu-
sión. Dado que el objetivo de la investigación clínica y epi-
demiológica es conocer la realidad para mejorar la salud de
la población, esto no debiera ser un inconveniente sino una
consideración.
NOVEDOSA ¡La pregunta debe contribuir nuevo conocimiento!
Sea cual sea la pregunta de investigación es fundamental que
no esté respondida en la literatura. No tiene sentido desper-
diciar recursos en contestar una pregunta cuya respuesta se
encuentra al alcance de cualquier búsqueda bibliográfica. La
gran mayoría de las preguntas que podríamos formularnos
en realidad son falta de lectura o de búsqueda bibliográfica
adecuada. Existe mucho más conocimiento generado del que
aplicamos en la práctica diaria.
12
Por supuesto se podría contestar una pregunta que ya fue con-
testada sólo si tenemos razones para creer que la respuesta
no es definitiva o concluyente. Por ejemplo si los resultados de
otros estudios son contradictorios y ninguno es concluyente
definitivamente, si podemos identificar errores o amenazas a
la validez de los resultados, o si tenemos suficientes razones
para pensar que nuestra población se comporta de manera
diferente que la población donde se estudió la pregunta. Otra
razón es confirmar resultados de estudios ya que todo resulta-
do está sujeto a errores por el fenómeno de azar de muestreo
(error alfa y error beta).
Además de la ineficiencia de montar un estudio de investiga-
ción con todo el costo en recursos que implica, no sería ético
implementar un proyecto de investigación para contestar un
interrogante cuya respuesta se conoce con certeza. No es éti-
co si se quiere interrogar pacientes en el marco de una investi-
gación, que probablemente no reciban beneficios directos de
participar, ni tampoco generará beneficios indirectos en otros
pacientes con similares características ya que no se generará
ningún conocimiento nuevo. Sólo se repetirán los hallazgos ya
conocidos.
Un problema adicional lo constituyen las preguntas ya contes-
tadas y no publicadas. Si nuestra pregunta ya se evaluó pero
por algún motivo no se difundió el resultado (en EEUU 20% de
los estudios realizados nunca se difunden y más del 50% de
las presentaciones en congresos)[5]
, irremediablemente repe-
tiremos un mismo estudio para obtener la misma respuesta.
¡Asegurémonos en este caso de difundir nuestros resultados![6]
RELEVANTE El esfuerzo requerido para responder una pregunta de inves-
tigación hace que sea fundamental que la pregunta sea rele-
vante para el conocimiento científico, para políticas de salud o
para futuras investigaciones.
Una buena manera de evaluar si una pregunta es relevante es
considerar cuánto aportará nuestra pregunta al avance cientí-
fico, si aporta a las políticas actuales de salud o guiar a futuras
investigaciones.
¡El solo hecho de que la pregunta carezca de respuesta hace
que sea relevante! Si bien no debiera ser un impedimento que
la pregunta no tuviera una relevancia obvia de gran impacto,
se puede modificar las preguntas para que se encuentren diri-
gidas al aspecto más relevante del área de desconocimiento.
13
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Obviamente si el conocimiento se basara sólo en los visiona-
rios que contestaron preguntas de máxima relevancia en un
determinado paradigma de conocimiento, ¡el conocimiento no
habría llegado tan lejos! Las preguntas más irrelevantes pue-
den tener implicaciones inesperadas que pueden tener un alto
impacto en el futuro o en otros contextos.
PLAUSIBILI-
DAD
BIOLÓGICA
¿Es posible construir un mecanismo biológico o de otra natu-
raleza que una la exposición con el evento? Una pregunta que
permita identificar el concatenado de eventos biológicos que
relacionan la exposición con un evento será mejor.
Esta característica es un agregado a los criterios FINER origi-
nales. Es una de los postulados de Bradford Hill para identificar
asociaciones causales.[7,8]
En nuestra opinión, es un aspecto
valioso a considerar durante la construcción de una pregunta
de investigación. La revisión y reflexión sobre el mecanismo
biológico tiene un impacto directo en la maduración y cons-
trucción de preguntas de investigación.
En algunos casos se conocerá perfecto en un determinado
momento todos los mecanismos implicados. En otros casos
no se conoce completamente los mecanismo, pero puede
ser vital revisar la biología relacionada con la pregunta para
al menos estar seguro que lo que se conoce al respecto no
contradice nuestra pregunta de investigación. Por ejemplo, se
conocen perfectamente los eventos que deben ocurrir en el
desarrollo de un cáncer de colon. En otros casos puede no
conocerse tan acabadamente los mecanismos por los cuales
se desarrolla un determinado síntoma del espectro autista en
ciertas ocasiones. La cantidad de conocimiento relacionado
que permite armar un mecanismo biológico, cambia con el
momento histórico. La plausibilidad es un concepto que es ex-
tensible a cualquier otro tipo de pregunta que implique otro
mecanismo que podría ser descrito como plausibilidad como
por ejemplo psicológica, social, antropológica o física que sea
necesario para relacionar una exposición con un resultado.
¿Cómo se utilizan los aspectos de la pregunta?
Es esperable que los aspectos enunciados se superpongan y en ocasiones sea
difícil distinguir cual de los aspectos se está discutiendo. No es nuestra intención
revisar las características de la pregunta como si fueran estancas, exhaustivas
y excluyentes. Estos aspectos son una guía que sirve para reflexionar sobre las
preguntas de investigación, refinar y madurarlas. Durante la etapa de construc-
ción de una pregunta de investigación, suelen coexistir varias preguntas simila-
res relacionadas. En esta situación, estos atributos de la pregunta sirven para se-
14
leccionar cuál es la mejor pregunta para ser eje de un trabajo de investigación.
A su vez, es posible modificar la pregunta para que sea dirigida hacia un área de
desconocimiento o de mayor relevancia, mayor interés o mayor factibilidad. Es
ideal que en la selección de la pregunta eje del proyecto se intente maximizar
todas los aspectos mencionados en la tabla anterior. Aunque es claro que no
es posible maximizar todos estos aspectos a la vez. La pregunta más relevante
puede no ser factible. La que más me interesa puede no ser la más novedosa.
Por ejemplo, podría ser que la pregunta que me resultara más interesante ¿la
observación de ciertas imágenes, genera cambios en la activación de ciertas
áreas corticales del cerebro?, no sea factible por falta de disponibilidad de re-
cursos para hacer resonancias magnéticas funcionales en tiempo real. Podría
reformular para ver el impacto sobre el ánimo a través de un cuestionario de au-
tocompletado. Este cambio de la pregunta, podría hacer más factible un estudio
de investigación cambiando la variable de resultado.
Si mi pregunta específica fuera ¿Cuál es la frecuencia de enfermedades oncohe-
matológicas en los pacientes con Lupus Eritematoso Sistémico? Pero, si la fre-
cuencia fuera muy baja de nuevos casos de enfermedad oncohematológicas,
podríamos modificar por enfermedades oncológicas. ¿O tal vez por todas las
enfermedades autoinmunes como población? Este cambio de evento o de po-
blación modifica la pregunta dramáticamente, pero acerca la factibilidad.
¿Cómo se clasifican las preguntas de investigación?
Existen formas diferentes de clasificar las preguntas de investigación. Por ejem-
plo, las preguntas de investigación pueden ser clasificadas en descriptivas o
analíticas. En las preguntas descriptivas, el investigador se pregunta cómo es
algo en particular. ¿Cómo es la frecuencia? ¿Cuál es la prevalencia? ¿Cuál es la
incidencia? ¿Cómo es el tiempo al desarrollo de un determinado evento? ¿Cuá-
les son los factores de riesgo para el desarrollo de una condición? ¿Y los facto-
res protectores?
Las preguntas descriptivas en sí no puede transformarse en una hipótesis direc-
tamente. Siempre se responden estimando un parámetro poblacional. Como la
frecuencia de una determinada característica; en estos casos, se espera que en
los resultados de una pregunta descriptiva se presente la estimación del pará-
metro que se pretendía conocer, acompañado de intervalos de confianza.
Por el contrario, las preguntas analíticas son preguntas de asociación entre dos
variables. Naturalmente tienen la estructura de una hipótesis evaluable (o tes-
teable), por lo cual es fácil expresarlas como hipótesis. En este caso existe asi-
metría entre las variables de la pregunta, una funciona como una variable de
exposición y otra como una variable de respuesta. ¿Los pacientes tratados con
la droga 1 tienen mejor calidad de vida que los pacientes tratados con la droga
2? En este caso, las drogas 1 o 2 son la exposición, y la calidad de vida es la
respuesta.
15
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Las preguntas causales son analíticas. Por ejemplo ¿La exposición a plastifican-
tes en la comida causa síndrome metabólico? ¿La exposición solar controlada y
breve causa fotoenvejecimiento? ¿Es un determinado tratamiento más eficaz y
seguro para controlar la hipertensión arterial? No toda pregunta analítica es cau-
sal ¿La eritrosedimentación extremadamente elevada es un factor pronóstico de
mortalidad?
En la respuesta a una pregunta analítica deberia haber una medida de asocia-
ción. La medida de asociación brinda mucha información: direccionalidad, y
magnitud de la asociación entre la variable de exposición y la variable de res-
puesta. A su vez, nos interesara saber el p valor como resultado de un test de
hipótesis para evaluar la pregunta analítica o los intervalos de confianza de la
medida de asociación. Ambos métodos brindan información similar sobre los
resultados de una pregunta analítica.
¿Qué estructura tiene un pregunta de investigación?
Las preguntas descriptivas responden a la estructura simplificada ¿Cómo es A
en C? donde A es lo que interesa conocer y C la población blanco a la que se
pretende generalizar los resultados. ¿Cómo es la sobrevida libre de enfermedad
de los pacientes con estadio 4 de cáncer de pulmón en Latinoamérica?
Las preguntas analíticas responden a la estructura general simplificada ¿A se
asocia a B en C? donde A es la variable de exposición, B la variable de resul-
tado y C la población blanco. ¿La estrategia educativa centrada en aprendizaje
basado en problemas genera conocimiento más significativo en estudiantes de
secundario en Argentina?
Para las preguntas analíticas se puede utilizar el acrónimo PICOTS para enunciar
todos los componentes necesarios: Población, Intervención/exposición, Compa-
rador, Outcome/resultado, Temporalidad y Escenario (setting).[9]
Por supuesto el
orden de los componentes no es lo importante, sino su presencia o ausencia.
Este acrónimo fue propuesto en el marco de la lectura crítica de las prácticas
basadas en la evidencia, con foco en estudios experimentales.[10]
De ahí su es-
tructura y su máxima utilidad para estudios con preguntas analíticas y experi-
mentales. Es una herramienta útil para la presentación transparente y completa
de preguntas analíticas.
Es fundamental remarcar que toda pregunta tiene una población de referencia
C. La población blanco a la que se pretende generalizar los resultados. A los
fines de la claridad, se omitió la población en la gran mayoría de las preguntas
de juguete presentadas en este apartado. Intente identificar los componentes
de las preguntas de ejemplo.
16
¿Cómo expresar la hipótesis de investigación?
La hipótesis es una afirmación que hace el investigador antes de conducir la
investigación, como respuesta a la pregunta central del estudio. Siempre es una
afirmación y tiene el mismo contenido que la pregunta analítica: A se asocia a
B en C, donde A es la exposición, B es la variable de resultado y C la población
blanco. Por ejemplo la pregunta de mi estudio puede ser ¿A mayor índice de
masa corporal es mayor la mortalidad de origen cardiovascular? Y la hipótesis
de mi estudio sería la afirmación “A mayor índice de masa corporal la mortalidad
de origen cardiovascular es mayor”. Las hipótesis simples son las que tienen
sólo una exposición y sólo una variable de respuesta. Las que tienen más de uno
de estos componentes se llaman hipótesis complejas.
Esta estructura específica, permitirá aplicar métodos estadísticos específicos.
Por esta razón, muchas veces se las llama hipótesis en sentido estadístico. Apli-
cando esta definición, las preguntas descriptivas no tienen hipótesis en este
sentido.
Una hipótesis específica puede ser verdadera o falsa, pero no las dos cosas a la
vez. Es posible utilizar métodos estadísticos para testear cuál es la probabilidad
de que una hipótesis sea verdadera utilizando un estudio de investigación. Se
llama inferencia a este método de obtener información en una muestra para
sacar conclusiones sobre el comportamiento de una población blanco. En este
caso utilizaremos la información de los individuos incluidos en la muestra de un
estudio, para evaluar si la hipótesis es verdadera o falsa en la población blanco
de la cual proviene la muestra. Esto se realiza a través de un procedimiento que
se llama testeo de hipótesis que describiremos más adelante.
En muchos casos se utiliza el término hipótesis del estudio en un sentido más
amplio que el estrictamente formal que acabamos de enunciar. En estos casos,
se utiliza hipótesis como sinónimo de lo que el investigador espera encontrar a
priori. En estos casos, no es exclusiva de las preguntas analíticas. El investigador
podría decir “Nuestra hipótesis es que el índice de masa corporal incrementa la
mortalidad debido a ...” Lo que el investigador cree que va a pasar con los resul-
tados no requiere métodos estadísticos específicos.
¿Cuál es la relación entre pregunta, hipótesis y objetivos?
En general pregunta, hipótesis y objetivos expresiones de lo mismo. Deben es-
tar 100% alineados en un determinado estudio. No es esperable que los com-
ponentes sean totalmente diferentes entre los tres. Los objetivos son acciones
concretas alineadas con las preguntas del estudio.
Para la pregunta descriptiva ¿Cuál es la prevalencia de obesidad entre los es-
tudiantes de medicina en Ciudad Autónoma de Buenos Aires?, es esperable un
objetivo “Estimar la prevalencia de obesidad entre los estudiantes de medicina
en Ciudad Autónoma de Buenos Aires”. En este caso no hay una hipótesis pre-
definida.
17
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
La pregunta analítica ¿Es mayor la prevalencia de obesidad en los estudiantes
de medicina que en los estudiantes de abogacía de Ciudad Autónoma de Bue-
nos Aires? En este caso una hipótesis apropiada podría ser “La prevalencia de
obesidad en los estudiantes de medicina es mayor que en los estudiantes de
abogacía de Ciudad Autónoma de Buenos Aires”. El objetivo podría ser “Eva-
luar la asociación entre obesidad y estudiar medicina o abogacía en estudiantes
universitarios de Ciudad Autónoma de Buenos Aires”. ¿Qué componentes de
PICOTS faltan en este caso?
¿Cuántas preguntas tiene un estudio?
Un estudio tiene idealmente una pregunta central, la cual es la pregunta princi-
pal eje del estudio. El protocolo de una propuesta de investigación se construirá
sobre una pregunta central. En sentido estricto el protocolo es el método que se
utilizara para contestar una pregunta de investigación. En este sentido conten-
drá todas las decisiones que se toman para contestar la pregunta. Se seleccio-
nará el diseño más apropiado a la pregunta central; la población más adecuada
a la pregunta central; los métodos estadísticos más apropiados a la pregunta, y
todo el resto de las decisiones en función de contestar la pregunta central del
estudio. Esta es la razón por la cual la pregunta es el eje del protocolo y del es-
tudio de investigación.
Preguntas adicionales pueden requerir diseños diferentes, muestreos diferen-
tes, poblaciones diferentes, tamaños muestrales diferentes. En este caso puede
que los componentes del protocolo queden desalineados con las preguntas y
objetivos. Si el protocolo tiene múltiples preguntas, es fundamental que al me-
nos requieran el mismo diseño, la misma población y el resto de materiales y
métodos definidos para contestar las preguntas adicionales.
Es un error muy común intentar responder más de una pregunta con un estudio
de investigación. La mejor opción es definir una pregunta central única. Es una
práctica ineficiente intentar contestar más de una pregunta de investigación con
un mismo estudio. En general genera desprolijidades y es difícil alinear todos
los componentes del estudio a varias preguntas de investigación a la vez, como
es esperable.
Por ejemplo un estudio cuya pregunta central es ¿La exposición a concentracio-
nes altas de partículas ambientales genera mayor cantidad de exacerbaciones
de enfermedad pulmonar obstructiva crónica (EPOC) en pacientes con EPOC?
Tiene implícito los siguientes objetivos que corresponden a preguntas acceso-
rias necesarias para responder de manera apropiada la pregunta central del
estudio:
•	 Evaluar la asociación entre la exposición a concentraciones altas de
partículas ambientales y cantidad de exacerbaciones de EPOC en
pacientes con EPOC.
18
•	 Estimar la exposición a concentraciones altas de partículas ambientales.
•	 Estimar la frecuencia de exacerbaciones de EPOC en pacientes con EPOC.
•	 Describir las principales características de los pacientes con EPOC/las
exacerbaciones.
•	 Es claro que algunas son objetivos principales y otros secundarios.
¿Cuáles y por qué?
19
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
¿Qué es la población del estudio?
Según Leon Gordis, la epidemiología es el estudio de la distribución y deter-
minantes de los estados relacionados con la salud o eventos en poblaciones
específicas y su aplicación al control de los problemas de salud, con el fin de
maximizar la salud de las poblaciones.[11,12]
Podríamos definir la población como
un conjunto de individuos con características específicas, referidas a un espacio
y tiempo.[11]
Las características específicas podrían referirse a una condición clíni-
ca, una exposición, una enfermedad, un subgrupo de individuos o cualquier otro
segmento sobre el que interese conocer su comportamiento. En sentido más
amplio se puede llamar población al conjunto de unidades de observación. En
esta última definición, se incluyen unidades de observación que podrían corres-
ponder a conjuntos de individuos o el mismo individuo en diferentes momentos
o incluso situaciones diferentes.
El método epidemiológico que utilizamos para contestar preguntas de investi-
gación, requiere que seamos específicos con la población bajo estudio. Las pre-
guntas de investigación están siempre referidas a una población. Las preguntas
descriptivas quieren conocer cómo se comporta un determinado parámetro en
una población. Las preguntas analíticas se preguntan si una asociación es ver-
dadera en una determinada población.
No existe pregunta que no esté referida a una determinada población. De la
misma manera los resultados de un estudio en particular se extrapolan a una
determinada población. Esta es la razón por la cual debe quedar definida con
claridad tanto en el protocolo como en un artículo de investigación.
¿Qué tipos de poblaciones hay?
Considerando una pregunta específica, en general se describen 3 tipos de po-
blación: la población blanco, la población accesible y la muestra. Describiremos
la población para la pregunta ¿La broncoaspiración se asocia con mayor severi-
dad de las exacerbaciones de los pacientes con EPOC?
La población blanco es la población sobre la que se quieren generalizar los re-
POBLACIÓN
2
20
sultados y por lo tanto, las preguntas se plantean siempre sobre esta población.
La población blanco se describe por características clínicas y demográficas y
está formada por todos los individuos con una determinada característica, in-
cluyendo los que la tuvieron, los que la tienen y los que la van a tener. Con
esta definición operativa, ni siquiera los censos representan la totalidad de una
población blanco.
Desde este punto de vista, la población blanco es teórica e inabarcable. No es
posible siquiera conocer qué tamaño tiene, ni conocer nada sobre su comporta-
miento. En nuestro ejemplo, la población blanco serían todos los pacientes con
EPOC, incluyendo los que van a tener desde el momento que lo desarrollen,
los que tienen y conocen su diagnóstico en la actualidad, los que no y los que
tuvieron EPOC en el pasado. Esta forma de definirla, implica que si conozco algo
sobre esta población blanco, podré generalizar lo que conozca al próximo pa-
ciente con esa condición que diagnostique. En esto nos basamos en la toma de
decisiones clínicas en el consultorio o en cualquier ámbito permanentemente.
La población accesible es una parte de la población blanco que está disponible
y potencialmente podría incluirse en el estudio. Se define por características
geográficas, temporales y de accesibilidad. Por ejemplo: todos los EPOC de la
Ciudad Autónoma de Buenos Aires en 2017 podría ser una población accesible.
Probablemente todos los EPOC asistidos en un determinado centro de salud
de la Ciudad Autónoma de Buenos Aires en 2017 sea una población accesible
mejor definida.
La muestra corresponde a la fracción de la población accesible que efectiva-
mente se incluye en un determinado estudio. La muestra es lo opuesto a la
población blanco en el sentido de que puedo conocer todo: su tamaño, la dis-
tribución de los diferentes factores, su comportamiento y sus características. En
general, tiene un tamaño definido previamente de acuerdo a la estimación de
tamaño muestral. Si tomo 100 pacientes de la población accesible y los invito a
participar de mi estudio, ellos constituirán mi muestra.
La muestra tiene la ventaja de ser tangible y es posible obtener mediciones con-
cretas de las variables que le interesan al investigador a los fines de responder
su pregunta. A través de las mediciones que se realizan en la muestra, utilizan-
do métodos estadísticos, podremos hacer inferencia sobre lo que ocurre en la
población blanco. Esta es la razón por la cual es fundamental que la población
accesible represente lo que ocurre en la población blanco y de igual manera,
que la muestra represente lo que ocurre en la población blanco.
21
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Figura 2. En A se muestra la relación entre la población blanco, pobla-
ción accesible y muestras. Se espera que la muestra del estudio repre-
sente el mismo fenómeno que ocurre en la población blanco. Para que
eso ocurra debe haber una correspondencia perfecta entre lo que ocu-
rre en la población blanco y lo que observo en mi muestra. En la figura
B se muestra un esquema que representa una tabla de doble entrada
en la población blanco y la misma proporción exacta de cada cuadrante
en la población accesible y la muestra.
POBLACIÓN
BLANCO
POBLACIÓN
BLANCO
MUESTRA
POBLACIÓN
ACCESIBLE
POBLACIÓN
ACCESIBLE
MUESTRA
A
B
¿En que parte se define la población blanco de un estudio?
La pregunta de investigación define la población blanco del estudio. A su vez,
se repite en la hipótesis y los objetivos. Al responder esta pregunta, esta será la
población a la cual se extrapolan los resultados de un estudio.
22
La población blanco se define con precisión en los criterios de inclusión. Los
criterios de inclusión son las condiciones que debe cumplir una unidad de ob-
servación para ser elegible para participar de un estudio de investigación. Los
criterios de inclusión deben definir sin ambigüedades las características que se
debe tener para pertenecer a la población blanco sobre la que se intenta con-
testar una pregunta de investigación. La población accesible a su vez se descri-
be principalmente en los criterios de inclusión también.
Los criterios de exclusión en general responden al respeto por los principios
éticos de autonomía, y no maleficencia, restricción como método para controlar
potenciales confundidores y decisiones prácticas (problemas con accesibilidad,
comprensión, adherencia, entre otros). Los dos primeros son necesarios y fun-
damentales. Los dos segundos pueden potencialmente generar sesgos y es
muy importante considerarlos con cuidado antes de utilizarlos o al leer un artí-
culo de investigación.
Se respeta la autonomía cuando se deja explícito en los criterios de exclusión
que no se va a incluir participantes que no decidan libre e informadamente su
participación en el estudio. Se respeta el principio ético de no maleficencia
cuando se excluyen los participantes que pudieran tener algún perjuicio por la
participación en el estudio o pudiera comprometer su seguridad. En los estudios
experimentales es fundamental que un comité de ética evalúe y apruebe la rela-
ción entre los beneficios y los riesgos de la participación en el estudio.
Para la pregunta ¿la droga A previene las exacerbaciones de EPOC en pacien-
tes adultos con EPOC?, los criterios de inclusión deben tomar una definición
validada de EPOC de acuerdo a la mejor evidencia conocida, características
demográficas acordes (como podría ser mayores a 60 años), que se atiendan
en el Centro de Salud D de la Ciudad Autónoma de Buenos Aires durante 2017.
Los criterios de exclusión podrían ser la negativa a participar o al proceso de
consentimiento informado, hipersensibilidad conocida o sospechosa a la droga
A o sus componentes, contraindicaciones para recibir A. A su vez podría restrin-
gir mi estudio a no fumadores que vivan en la ciudad, cerca del centro de salud
donde se realizará el estudio.
Ser adherente habitual en la toma de medicación o estar cerca del centro donde
se realiza el estudio son criterios que se suelen agregar a los criterios de exclu-
sión del estudio con el fin de mejorar la eficiencia y disminuir la pérdida de los
participantes. Este tipo de criterios de exclusión comprometen la forma en que
la muestra representa la población blanco ¿Por qué?
A su vez en ocasiones se restringe el grupo etario del estudio a una población
poco mórbida donde los eventos graves como la muerte son extremadamente
improbables, por ejemplo, Pacientes entre 60 y 75 años. Este tipo de restricción
en la edad o las comorbilidades hace que luego los resultados no sean extrapo-
lables a los pacientes muy ancianos o con comorbilidades. Ambos grupos son
muy frecuentes en la práctica clínica cotidiana.
23
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Nunca los criterios de exclusión son la negativa de los criterios de inclusión. Los
criterios de exclusión son las excepciones. Si un participante coincide con los
criterios de inclusión, si presenta al menos un criterio de exclusión está excluido
del estudio.
Figura 3. En este ejemplo se muestra una descripción de criterios de
inclusión y de exclusión: Spontaneous bacteremia and spontaneous
bacterial peritonitis share similar prognosis in patients with cirrhosis: a
cohort study.* Este es un resumen de los criterios detallados ampliados
que se detallan en el protocolo del estudio.
(
)


≥
   
     



≥  /­
   
€
   (
)
‚ƒ„
ƒ
 
* Marciano S, Dirchwolf M, Bermudez CS, Sobenko N, Haddad L, Genre Bert F, et al. Spontaneous bac-
teremia and spontaneous bacterial peritonitis share similar prognosis in patients with cirrhosis: a cohort
study. Hepatol Int. 2017; doi:10.1007/s12072-017-9837-7. Con permiso de los autores
¿En que parte se describe la muestra?
Los individuos que forman parte de la muestra deben cumplir todos los criterios
de inclusión y no tener ningún criterio de exclusión. Sólo se tiene una muestra
cuando el estudio finaliza. La sección de resultados de un artículo científico em-
pieza con un diagrama de flujo que presenta la población accesible y la muestra
del estudio.[13,14]
Asimismo también suele brindar información de la permanencia
en el estudio. Tanto el ingreso como la permanencia en el estudio son funda-
mentales para asegurar que la muestra representa la población blanco y evaluar
la potencial presencia de sesgos de selección.
24
La descripción de la muestra se realiza en el análisis descriptivo de la misma
sección resultados. Describir la muestra del estudio permite al lector conocer
cuál es la verdadera población que se terminó incluyendo en el estudio. Esta
información nos permite rápidamente saber si los resultados del estudio son
extrapolables a la población sobre la cual quisiera aplicar los resultados.
Si el estudio incluyó sólo pacientes EPOC entre 55 y 70 años sin comorbilida-
des, y en la primer tabla del artículo todos tienen cerca de 60 años ¿a qué po-
blación blanco son generalizables los resultados? ¿Puedo aplicar los resultados
a mis pacientes de consultorio? ¿A cuáles?
Figura 4. Este es un ejemplo de descripción en una tabla de los resul-
tados del mismo artículo que presentamos anteriormente: Spontaneous
bacteremia and spontaneous bacterial peritonitis share similar progno-
sis in patients with cirrhosis: a cohort study.*
(

	)
	(=)
All variables collected at time of diagnosis of infection. All qualitative variables expressed an absolute numbers and percentages.
All quantitative variables expressed as median and interquartile range (IQR)
HCC hepatocellular carcinoma, INR international normalized ratio, SIRS systemic inflamatory response syndrome, MELD
Model for End-Stage Liver Disease
* Available in 125 patients.
Age (years)
Male gender
Cirrhosis etiology
Viral hepatitis
Alcohol
Autoimmune hepatitis
Primary biliary cholangitis
Other
HCC
Ascites
Creatinine (mg/dL)
Leukocyte count (x 103
/mm3
)
Total bilirubin (mg/dL)
Serum albumin (g/dL)
INR
Serum sodium (mEq/L)
SIRS*
MELD score
Child-Pugh score
Variable
63 (53-69)
73 (58%)
39 (31%)
28 (22%)
16 (13%)
13 (10%)
30 (24%)
23 (18%)
106 (84%)
1.1 (0.8-1.6)
7.6 (5.0-10.1)
4.4 (2.1-7.6)
2.6 (2.2-2.9)
1.8 (1.5-2.2)
133 (129-137)
70 (56%)
20 (16-26)
10 (9-12)
All (n=126)
62 (53-69)
42 (59%)
27 (38%)
15 (21%)
9 (13%)
5 (7%)
15 (21%)
12 (17%)
51 (72%)
1 (0.8-1.4)
7.3 (4.7-9.4)
3.8 (1.9-6.1)
2.6 (2-3)
1.8 (1.4-2.1)
134 (129-137)
38 (54%)
19 (14-25)
10 (9-12)
Spontaneous bacteremia
(n=71)
65 (51-69)
31 (56%)
12 (22%)
13 (24%)
7 (13%)
8 (15%)
15 (26%)
11 (20%)
55 (100%)
1.3 (0.8-1.9)
7.8 (5.6-12.1)
6.4 (3.1-9.0)
2.6 (2-3)
1.95 (1.6-2.8)
132 (127-136)
32 (58%)
24 (18-31)
11 (9-12)
Spontaneous bacterial
peritonitis (n=55)
0.83
0.75
0.17
0.65
0.001
0.041
0.24
0.003
0.74
0.03
0.10
0.66
0.001
0.34

* Marciano S, Dirchwolf M, Bermudez CS, Sobenko N, Haddad L, Genre Bert F, et al. Spontaneous bac-
teremia and spontaneous bacterial peritonitis share similar prognosis in patients with cirrhosis: a cohort
study. Hepatol Int. 2017; doi:10.1007/s12072-017-9837-7. Con permiso de los autores
25
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
¿Cómo se toma una muestra?
Se llama técnica de muestreo al método para seleccionar unidades de obser-
vación a los fines de un estudio de investigación. En la investigación cualitativa,
las técnicas de muestreo permiten seleccionar los participantes del estudio para
representar la población blanco. Se dividen en técnicas probabilísticas y no pro-
babilísticas.
En un muestreo probabilístico, los individuos de la población accesible tienen
una probabilidad conocida de estar en la muestra. Ejemplos de este tipo de
muestreo son el muestreo probabilístico simple, el muestreo sistemático, el
muestreo consecutivo, el muestreo por estratos y el muestreo por clusters. Al-
gunos tipos de muestreo no probabilístico son el muestreo por conveniencia y
el muestreo en bola de nieve.
En la investigación cualitativa las muestras se toman de manera diferente. En
este caso el objetivo de la muestra no es utilizar técnicas estadísticas para hacer
inferencia sobre una población blanco, sino comprender un fenómeno. Por lo
tanto, las unidades de observación se eligen específicamente por ser la mejor
fuente del fenómeno bajo estudio, representando un punto de vista valioso y
representativo a los ojos del investigador.
La técnica de muestreo se define en base a las necesidades de la pregunta de
investigación y aspectos técnicos como capacidad de evaluación de pacientes
en el tiempo. Se describe en el protocolo y se sostiene a lo largo del estudio.
Muchas de las técnicas más complejas requieren ajustes de la estimación de
tamaño muestral o de los métodos estadísticos que se utilizarán en el estudio.
¿Cuáles son las diferencias entre los tipos de muestreo probabilístico?
El muestreo aleatorio simple consiste en tomar al azar una muestra de una lista.
Para este tipo de muestreo es necesario tener una lista de la población accesi-
ble previamente para seleccionar los individuos. Es muy fácil de realizar, ya que
se puede utilizar cualquier software que sea capaz de generar números aleato-
rios como planillas de cálculos o paquetes de análisis estadísticos. Se dice que
la probabilidad es conocida de pertenecer a la muestra aleatoria simple porque
si debo tomar 50 pacientes de una población accesible de 500, la probabilidad
de estar incluido en la muestra es 0,1 para cualquier individuo de la población
accesible.
Por el contrario si carezco de la lista completa, es necesario utilizar otras técni-
cas que permiten tomar muestras aleatorias, aun en ausencia de la lista com-
pleta de la población accesible, como el muestreo sistemático. El inicio debe
ser aleatorio para que sea considerado como muestreo probabilístico. Este tipo
de muestreo es particularmente útil si los individuos que forman parte de la
población accesible van a incluirse en la población accesible en el tiempo. Los
pacientes que van a requerir una colecistectomía o los pacientes que consultan
a una central de emergencias de adultos son ejemplos de estas situaciones.
26
Si mi pregunta requiere tomar una muestra prospectiva de los pacientes que
llegan a la guardia en un determinado período, puedo utilizar el muestreo siste-
mático. Si mi probabilidad de inclusión es 0,1, quiere decir que incluiré 1 de cada
10 pacientes que consulten a la guardia. El muestreo sistemático requiere que
en los pacientes ordenados por orden de llegada, incluiría el paciente número
10, el número 20, el número 30, etc. Es importante asegurarse que no exista
periodicidad asociada a la frecuencia de muestreo. Si existiera alguna variable
asociada a la periodicidad de la frecuencia de muestreo, podríamos cometer un
sesgo al utilizar este tipo de muestreo.
¿Cómo elijo la frecuencia de muestreo? depende principalmente de la capaci-
dad y recurso disponible para las evaluaciones. Si tengo recurso disponible para
evaluar 1 de cada 5 pacientes que consultan, entonces es posible plantear una
probabilidad de estar en la muestra de 0,2. ¿Qué pasa si tengo capacidad de
incorporar 1 de cada 3? ¿o 1 de cada 2? Puedo tomar una frecuencia de mues-
treo de 0,33 o de 0,5. En el mismo sentido, el muestreo consecutivo es un caso
particular de muestreo probabilístico sistemático con relación 1 de 1. La frecuen-
cia de muestreo sistemático se define previamente y no se cambia durante la
implementación de un estudio.
Se llama cluster o conglomerado a grupos naturales de individuos como pue-
den ser los alumnos de una escuela. Por definición los individuos de un mismo
cluster se parecen más entre sí, que con los individuos de otros clusters. Son
ejemplos de cluster, los pacientes de un hospital, los pacientes de un médico
de cabecera, entre otros. En el muestreo por clusters, se seleccionan al azar
los clusters de unidades de observación y no los individuos en particular. Este
tipo de muestreo, requiere utilizar tipos de análisis estadísticos que consideren
el natural agrupamiento de las unidades de observación en esos clusters. Asi-
mismo, requiere considerar esta estructura en clusters en el cálculo del tamaño
muestral.
En el muestreo estratificado, la probabilidad de estar en la muestra es fija por
estratos. Por ejemplo: si me interesa tener 50% de hombres y 50% de muje-
res en una muestra de una población accesible que tiene 500 hombres y 1000
mujeres, la probabilidad de ingresar al estudio en los hombres será 0,1 y en las
mujeres 0,05. En algunos casos me interesa representar un determinado estrato
que es de particular importancia para mi pregunta de investigación, pero que
hay pocos individuos. Puedo utilizar un muestreo por estratos para asegurarme
de incluir suficientes pacientes del estrato que me interesa en el estudio. En este
tipo de muestreo, es necesario utilizar métodos estadísticos específicos para
ponderar los estimadores muestrales por los tamaños de los estratos. Muchas
encuestas, como La Encuesta Nacional de Examen de Salud y Nutrición (NHA-
NES),[15]
utilizan probabilidades de muestreo por estratos de zonas por ejemplo.
Luego ponderan los resultados obtenidos en cada zona para estimar cómo se
comporta un parámetro en toda la población.
27
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Se llama muestreo multietápico a todas las técnicas que combinan estos tipos
de muestreo en diferentes etapas. Requieren ajustes del tamaño muestral y de
los métodos estadísticos. En líneas generales, la técnica más simple será la más
apropiada y la más fácil de diseñar, implementar y controlar su calidad. Para las
técnicas más complejas, es una buena idea buscar ayuda de alguien con expe-
riencia en el campo de muestreos complejos.
28
29
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
¿Qué es un diseño?
El diseño de un estudio es una estructura estándar con características predefi-
nidas que se selecciona para responder una pregunta de investigación especí-
fica. Es un componente principal de un estudio de investigación que determina
aspectos fundamentales como el grado de evidencia a generar, fortalezas, de-
bilidades, complejidad, factibilidad, calidad, costos, temporalidad, entre otros.
Existe una gran variedad de diseños y clasificaciones. Nos enfocaremos sólo en
los más importantes y sus aspectos principales.
¿Cómo se clasifican?
Los diferentes diseños pueden clasificarse de diferentes maneras de acuerdo
a distintos atributos. La importancia de la clasificación radica en conocer qué
quiere decir que un determinado diseño caiga en una determinada categoría.
Conocer las ventajas y desventajas de una categoría, permite que clasificar un
diseño tenga sentido. Clasificar solo es útil si nos dice algo del comportamiento
o las características del estudio.
De acuerdo a sus características se pueden clasificar con respecto a la pregunta
de investigación (descriptivos o analíticos), de acuerdo a las unidades de obser-
vación (individuales o poblacionales), de acuerdo a la temporalidad (retrospecti-
vos o prospectivos), de acuerdo a la naturaleza de la exposición (observaciona-
les o experimentales).
Figura 5. En este esquema se muestra una simplificación de la clasifica-
ción de diseños más comunes.
DISEÑOS
Observacionales
Experimentales Ensayos Clínicos
Cuasiexperimentales
Ecológicos
Cortes transversales
Casos y controles
Cohortes
DISEÑOS DE ESTUDIOS
DE INVESTIGACIÓN
3
30
Con respecto a las unidades de observación
Los diseños pueden clasificarse de acuerdo con las unidades de observación en
individuales o poblacionales.
Los estudios individuales son muchísimo más frecuentes. Se trata de cualquier
estudio que realiza mediciones a nivel del individuo. En estos casos es posible
conocer el valor de las mediciones de cada variable a nivel individual. Por ende
va a ser posible clasificar a los individuos participantes de acuerdo al nivel de
exposición y al nivel de variable de respuesta. La gran fortaleza es que para
estimar asociaciones causales es necesario obtener mediciones individuales.
En los estudios poblacionales, las unidades de observación son poblaciones.
Típicamente las mediciones son frecuencias o tasas de exposición o de eventos.
En este tipo de diseños no es posible saber si quien tuvo una determina expo-
sición es el mismo individuo que tiene un determinado evento. Este fenómeno
se llama falacia ecológica. Se clasifica habitualmente como un sesgo de infor-
mación. Se presenta porque intentamos sacar conclusiones a nivel individual,
utilizando mediciones agregadas en poblaciones en un nivel superior.[16]
Si mi pregunta fuera ¿Cuál es la asociación entre el consumo de carne por per-
sona y la tasa de cáncer colorrectal?, es posible obtener las tasas de consumo
de carne por persona de todos los países de latinoamérica y la tasa de cáncer
colorrectal de la misma manera. En ambos casos son datos disponibles, de fácil
y rápido acceso y de bajo costo. Debido a que las mediciones se encuentran
agregadas al nivel de la población, no es posible identificar si los individuos
que más carne consumen son los que más probabilidad de desarrollar cáncer
tienen. A su vez sólo podré sacar conclusiones a nivel de las poblaciones, con
baja evidencia en sentido causal. Otro ejemplo de estudio con mediciones po-
blacionales es Cancer incidence in adults living in the vicinity of nuclear power
plants in France, based on data from the French Network of Cancer Registries.[17]
Con respecto a la temporalidad
Los diseños pueden clasificarse de acuerdo con la temporalidad en retrospec-
tivos y prospectivos. La diferencia entre los estudios retrospectivos y prospec-
tivos es el momento en el que ocurre la variable de resultado. Agregamos a
esta clasificación los estudios de series temporales y los ambispectivos o retro
prospectivos.
En los estudios retrospectivos, la variable de resultado ya ocurrió en el momento
que decidimos incluir a un individuo en el estudio. Es decir, al momento de incluir
los individuos en el estudio, el evento de interés ya ocurrió o no. Los diseños
más frecuentes que entran dentro de esta categoría son los cortes transversales
y los casos y controles. Por ejemplo, en este estudio Geographic region: Does
it matter in cutaneous melanoma of the head and neck? los autores utilizaron
información retrospectiva para identificar y evaluar las características de los me-
lanomas de manera retrospectiva.[18]
31
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Por ejemplo si mi pregunta es ¿existe asociación entre la exposición a asbestos
y el desarrollo de cáncer de laringe? y decido estudiarlo incluyendo a pacientes
con cáncer de laringe y controles sin cáncer de laringe, la naturaleza del estudio
es retrospectiva. En estos casos las variables independientes se recuperan de la
información disponible sobre exposiciones previas al desarrollo o no del evento.
Esto puede generar que recordar las exposiciones o recuperar información de
exposiciones previas sea potencialmente un problema.
En los estudios prospectivos por definición, la inclusión de los participantes es
previa a que ocurra el evento de interés. En este caso es posible medir las expo-
siciones previamente al desarrollo de los eventos. Esta condición aporta fortale-
za causal ya que la preexistencia de la exposición al evento de interés es una de
los requisitos para evaluar asociaciones causales. Son típicamente prospectivos
los estudios de cohorte prospectiva y los ensayos clínicos.
En los estudios ambispectivos se incluyen pacientes retrospectivamente y pros-
pectivamente a la vez. Este tipo de diseño se utiliza muchas veces, por ejemplo,
para registros de enfermedades raras. En estos casos se consensúa un set de
datos posible para los pacientes retrospectivos y los prospectivos. La principal
dificultad es la heterogeneidad de la calidad y disponibilidad de la información.
Un ejemplo de este tipo de estudios es Quality of Life in Patients with Osteopo-
rotic Vertebral Compression Fractures.[19]
Los estudios que utilizan bases de datos secundarias son por definición retros-
pectivos. En este caso se utilizan bases de datos recolectadas con otro objetivo
diferente de la investigación. Estas bases pueden ser administrativas, registros,
datos rutinarios, etc. En este caso la información ya está recolectada y fue me-
dida de acuerdo a otros objetivos. No es posible controlar o definir una forma
estándar de medición dado que ya se realizaron. La información que no fue me-
dida no estará disponible. A su vez, es común que presenten gran cantidad de
datos perdidos y heterogeneidad en las mediciones. Estos problemas se solu-
cionan con captura de información primaria, es decir un sistema de recolección
de datos diseñado a los fines de la pregunta de investigación. Un ejemplo de es-
tudio utilizando bases de datos secundarias es Do influenza and pneumococcal
vaccines prevent community-acquired respiratory infections among older peo-
ple with diabetes and does this vary by chronic kidney disease? A cohort study
using electronic health records,[20]
Otro ejemplo es Comparative effectiveness
research using electronic health records: impacts of oral antidiabetic drugs on
the development of chronic kidney disease.[21]
Con respecto a la naturaleza de la exposición
Con respecto a la naturaleza de la exposición, se puede clasificar los estudios
en observacionales o experimentales.
Adicionalmente, existen estudios quasi experimentales que son aquellos donde
falta alguno de los componentes de los estudios experimentales como pueden
32
ser los diseños antes - después de una determinada intervención. Un ejemplo
de este tipo de estudios es Evaluating influenza vaccination campaigns beyond
coverage: a before-after study among health care workers.[22]
En este estudio
los autores evaluaron el efecto de una campaña educativa sobre los profesiona-
les de salud, comparando antes y después de la implementación de la campaña.
Los estudios observacionales son aquellos en que el investigador para contes-
tar su pregunta de investigación sólo observa. Observar no es una actividad
pasiva en este sentido, ya que implica observar lo que ocurre de manera activa
y recuperar la información de manera estandarizada. El investigador no indica
procedimientos adicionales sino que se limita a obtener información del cuidado
habitual de los pacientes. Pueden existir variaciones en el cuidado, pero típica-
mente no se le indican procedimientos o exposiciones adicionales.
Está ampliamente documentado que los participantes de un estudio, modifican
su comportamiento por el solo hecho de ser observados. Este cambio en el
comportamiento en los participantes que se saben observados, se llama efecto
Hawthorne.[23]
Este efecto está presente en todos los estudios que involucren
sujetos de investigación de manera prospectiva.
En los estudios experimentales el investigador administra una exposición. Los
estudios experimentales más comunes son los ensayos clínicos en los cuales el
investigador administra la exposición bajo estudio. Esta administración de la ex-
posición, sólo es posible con las exposiciones administrables. Es decir que no se
podrá hacer estudios experimentales con exposiciones potencialmente dañinas
(fumar, radiación o exposición a agroquímicos) o con exposiciones no adminis-
trables (como polimorfismos genéticos o historia de interacciones sociales de un
individuo). Algunos ejemplos de exposiciones administrables son tratamientos
(farmacológicos o no), vacunas, métodos de diagnóstico, educación, entre otras.
¿Cuáles son los tipos de diseños más frecuentes?
Los tipos más frecuentes de diseño son los ensayos clínicos, las cohortes, los
estudios de casos y controles, los cortes transversales y los estudios ecológicos.
A continuación presentaremos las características principales de cada uno de los
diseños clásicos.
¿Cómo se define un ensayo clínico?
En los ensayos clínicos el investigador evalúa el efecto sobre un evento, de una
exposición administrada por el investigador. En sentido estricto son cohortes
experimentales, donde el investigador administra una exposición y sigue a los
participantes en el tiempo en busca de los que desarrollan un evento de interés.
Son siempre experimentales y prospectivos. A su vez los ensayos clínicos pue-
den ser aleatorios, controlados, y ciegos entre otros.
33
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
Pueden tener una o más ramas de exposición. Se llama ramas de exposición a
los diferentes niveles de exposición, como por ejemplo dieta A o dieta B. Los
ensayos clínicos con más de una rama son los más comunes y permiten obtener
información de eficacia y seguridad de las intervenciones. La eficacia de una
exposición es el efecto deseado o buscado. Por ejemplo: una medicación para
el tratamiento de hipertensión es eficaz cuando controla adecuadamente la pre-
sión de una población específica de pacientes hipertensos. La medicación es
segura si el perfil de efectos adversos es apropiado para una determinada situa-
ción clínica de una población específica. La relación entre eficacia y seguridad
es un aspecto fundamental de cualquier ensayo clínico. Se llaman controlados a
los ensayos clínicos que tienen más de una rama de exposición. Generalmente
en estos casos, una de las ramas actúa como control.
Las ventajas principales de los ensayos clínicos son la posibilidad de obtener
información causal sobre la asociación entre la exposición bajo estudio y el
evento de interés cuando es posible aleatorizar la exposición. Las principales
desventajas son el costo y el tiempo de la implementación y la complejidad del
diseño, implementación y control de calidad.
Por ejemplo si mi pregunta es ¿El uso de una aplicación para smartphones (te-
léfonos celulares móviles inteligentes) con estrategias de gamificación para
el control del peso corporal, es más eficaz que el consejo médico habitual en
adultos con obesidad? En este caso puedo plantear un ensayo clínico con dos
ramas: una rama expuesta a la aplicación de smartphones y otra rama expuesta
a consejo habitual de descenso de peso. Los participantes serán asignados al
azar a una rama u otra del estudio. Los seguiremos en el tiempo por un período
de 6 meses y compararemos el descenso de peso en ambos grupos.
Si bien no son las publicaciones más frecuentes, existen muchos ejemplos en la
literatura de ensayos clínicos. Como Assessment of the effectiveness of physical
activity interventions in the Brazilian Unified Health System donde se asignaron
adultos a diferentes intervenciones y se evaluó su efecto en el descenso de
peso.[24]
Se trata de un estudio experimental no aleatorizado.
¿Qué es el ciego o enmascaramiento?
Los participantes que se saben tomando un placebo reportan menos efectos
adversos aunque los sientan. Los participantes que se saben tomando un prin-
cipio activo presentan más efectos adversos. Los participantes que se saben
tomando un principio activo, que creen que es mejor, reportan mucha más efica-
cia y bienestar que los participantes que toman una medicación que creen que
es inferior. Esto representa un sesgo de información ya que los participantes
reportan sistemáticamente diferente de acuerdo a en qué rama del estudio se
encuentran. A su vez los médicos podrían preguntar diferente o seguir diferente
o solicitar diferentes estudios o indicar medicación adicional a sus pacientes si
saben la rama del estudio en la cual está un determinado participante.
34
El ciego o enmascaramiento es el ocultamiento de la rama de exposición a uno
o más actores del estudio. Se puede ocultar al paciente, al médico, al evaluador,
a quien realiza el análisis estadístico. Todos los actores podrían potencialmente
estar afectados por su subjetividad, por lo cual se recomienda cegar siempre
que sea técnica y éticamente posible. Es posible utilizar el ciego incluso en es-
tudios observacionales donde pudieran existir sesgos de información relaciona-
dos con la subjetividad.
Los estudios no ciegos o abiertos se parecen más a la práctica clínica real, pero
son mucho más susceptibles de sesgos de información por reporte diferencial
de los pacientes o por recuperación de la información diferencial. A su vez son
problemas frecuentes el uso diferencial de estudios de test diagnósticos o las
cointervenciones de acuerdo a conocer en qué rama del estudio está un pacien-
te. En muchos casos como los estudios incluidos en este metanálisis Efficacy and
safety of insulin glargine compared to other interventions in younger and older
adults: a pooled analysis of nine open-label, randomized controlled trials in pa-
tients with type 2 diabetes, no es posible enmascarar las intervenciones.[25]
¿Qué
efecto podría tener sobre los resultados que los pacientes conozcan su rama de
intervención?
Una desventaja del ciego es que aumenta la complejidad del estudio. Requiere
el desarrollo de mecanismos para asegurar el ciego y mantenerlo durante todo
el estudio. Así también requiere mecanismos de ruptura de ciego ante eventua-
les necesidades clínicas. Por ejemplo si un paciente en un estudio consulta a la
guardia con un dolor precordial, puede ser fundamental tener disponible un me-
canismo para que los médicos que lo asistan tengan la posibilidad de conocer
en qué rama del estudio está, para tomar acciones en el cuidado de emergencia
del paciente.
¿Para qué sirve la asignación al azar de tratamiento?
En los ensayos clínicos la exposición bajo estudio es administrada por el inves-
tigador. Esta única posibilidad exclusiva de este diseño permite usar la aleatori-
zación como herramienta para decidir quien recibe la exposición. Es decir, si mi
pregunta fuera ¿es la droga A más eficaz que la droga B en el tratamiento de la
hipertensión crónica en adultos? Al asignar al azar los participantes del estudio
a recibir la droga A o la droga B, se eliminan las diferencias entre los grupos.
Sólo es posible aleatorizar exposiciones administrables y cuando existe Equi-
poise. Equipoise quiere decir que no se conoce que ninguna de las ramas del
estudio sea más eficaz o más segura antes de iniciar el estudio.[26]
Es decir, no
hay evidencia a priori de eficacia y seguridad entre las ramas del estudio.
En la práctica clínica múltiples factores intervienen en la decisión de iniciar un
tratamiento y con qué principio activo. Se trata de un decisión activa en la cual
participa el médico y el paciente decidiendo cual es el mejor tratamiento para
la situación clínica particular. Esto hace que en la práctica clínica, los pacientes
35
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
que tomaron la droga A podrían ser diferentes a los que toman la droga B. Ima-
ginemos que la droga B pudiera causar enfermedad coronaria, entonces existe
la posibilidad que los médicos decidan dar la droga A a los pacientes con facto-
res de riesgo coronario y no la droga B. Por esta razón, probablemente, ambos
grupos no serían comparables por las diferencias en sus factores de riesgo co-
nocidos y desconocidos. Este problema es una constante de los estudios ob-
servacionales. Este fenómeno se llama confusión por indicación. La asignación
aleatoria a droga A o droga B elimina el sesgo de confusión por indicación, ya
que nadie elige quien recibe droga A o droga B, sino que se asigna a un grupo
u otro aleatoriamente.
Que ambos grupos sean similares en todas sus características con excepción
de la exposición a A o B, podría enunciarse como que son intercambiables. La
intercambiabilidad promedio es una propiedad de la causalidad que dice que
los individuos que reciben la droga A, se hubieran comportado igual que los
que reciben la droga B, si hubieran recibido droga B. Es decir, con respecto a
su probabilidad de tener el evento condicional al tratamiento que recibieron,
son intercambiables. La intercambiabilidad es la propiedad más importante de la
causalidad y es exclusiva de los ensayos clínicos aleatorizados.[27]
Si la aleatorización funciona, los dos grupos resultantes serán idénticos en todas
sus características con excepción de que unos fueron expuestos a la droga A y
otros a la droga B. La aleatorización es una estrategia para tratar confundidores
que tiene el potencial de eliminar el efecto de los confundidores conocidos, los
desconocidos e incluso los no medibles. Sólo funciona cuando el tamaño mues-
tral es lo suficientemente grande.
Algunos ejemplos de estudios aleatorizados son: A Bivalent Meningococcal
B Vaccine in Adolescents and Young Adults,[28]
Limited screening with versus
without,(18)
F-fluorodeoxyglucose PET/CT for occult malignancy in unprovoked
venous thromboembolism: an open-label randomised controlled trial,[29]
Primary
isoniazid prophylaxis against tuberculosis in HIV-exposed children,[30]
y Outco-
mes of a Coaching-Based WHO Safe Childbirth Checklist Program in India.[31]
En
estos estudios se aleatorizaron diferentes exposiciones: una vacuna, diferentes
estrategias diagnósticas, un preparado farmacéutico o una estrategia educativa,
respectivamente.
¿Cómo se clasifican los ensayos clínicos?
Los ensayos clínicos pueden clasificarse acuerdo a diferentes criterios. Por
ejemplo, durante el desarrollo y evaluación de los fármacos nuevos se desarro-
llan diferentes fases con diferentes objetivos, diseños y particularidades que se
resumen en la siguiente tabla.
36
Fase Objetivo Individuos de estudio
Fase
preclínica
Estudio de farmacocinética,
diferentes tipos y niveles de
toxicidad.
Animales
Fase I Datos incipientes de toxicidad,
dosis máxima tolerada, vía de
administración.
Individuos sanos
Fase II Actividad clínica y respuesta,
dosis y frecuencia.
Pacientes 100
Fase III Comparación de seguridad
y eficacia; comparación con
tratamiento conocido o placebo.
1000 pacientes
Fase IV Farmacovigilancia, eficacia
a largo plazo, efectividad,
detección de efectos adversos
raros.
Población general una vez
comercializado
Los ensayos clínicos farmacológicos son los estudios experimentales clásicos
que utilizan exposiciones farmacológicas. En estos estudios es común la compa-
ración con otro principio activo o con un placebo. Dentro de los ensayos clínicos
no farmacológicos se agrupan una gran cantidad de exposiciones diferentes
no farmacológicas, como: quirúrgicas, tecnología, educativas, diagnósticas, con-
ductuales, entre otros.
Con respecto a las ramas del ensayo clínico, se puede dividir en estudios de ra-
mas paralelas o cruzadas. En los primeros, la asignación a rama de intervención
se mantiene constante durante todo el estudio. Por el contrario en los ensayos
clínicos con ramas cruzadas, los participantes son asignados a una exposición
y luego de un período de wash out, reciben la otra exposición del estudio. Este
diseño sólo puede aplicarse a eventos de interés reversibles. Por ejemplo en
este estudio se evaluó el efecto de 3 dietas diferentes sobre la presión arterial
y el perfil lipídico en pacientes ambulatorios sanos Comparison of the DASH
(Dietary Approaches to Stop Hypertension) diet and a higher-fat DASH diet on
blood pressure and lipids and lipoproteins: a randomized controlled trial.[32]
En
este estudio de ramas cruzadas, todos los participantes recibieron las 3 dietas
por 3 semanas, separadas por 2 semanas cada una. El orden en el que recibie-
ron cada dieta fue al azar.
Existe un subtipo de ensayo clínico denominado factorial. En este tipo de dise-
ño, se estudia simultáneamente el efecto de 2 intervenciones diferentes y su
combinación. Los diseños factoriales son muy eficientes para estudiar el efecto
37
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
de dos intervenciones en simultáneo. Por ejemplo en este estudio se evaluó el
efecto de la dieta, el ejercicio o la combinación sobre el peso y su repercusión
metabólica en mujeres obesas lactantes a través de un diseño factorial Diet and
exercise interventions among overweight and obese lactating women: randomi-
zed trial of effects on cardiovascular risk factors.[33]
En los estudios de superioridad, el investigador cree que una de las dos ramas
del ensayo clínico es superior a la otra. Por ejemplo, si interesa evaluar la efica-
cia de un nuevo tratamiento para el control de la ansiedad versus placebo. Por
el contrario es común que no sea ético dejar sin tratamiento a los participantes
de un estudio de investigación ya que existen tratamientos disponibles de cono-
cida eficacia. En ese contexto, cualquier nuevo tratamiento interesa demostrar
que al menos no es inferior que los tratamientos de mejor cuidado recomen-
dado disponible. Estos estudios se llaman estudios de no inferioridad y tienen
particularidades en su diseño, tamaño muestral, análisis estadístico y métodos.
Por ejemplo en este estudio se evaluó el uso de antibióticos profilácticos en la
colecistectomía laparoscópica de bajo riesgo Antibiotic Prophylaxis in Laparos-
copic Cholecystectomy: A Randomized Controlled Trial.[34]
Si bien está plantea-
do como un estudio de superioridad, impresiona que la pregunta del estudio es
una pregunta de no inferioridad.
¿En qué se diferencian los ensayos clínicos pragmáticos de los clásicos?
De acuerdo a su diseño específico se los puede clasificar en ensayos clínicos
clásicos y pragmáticos. Los ensayos clínicos clásicos, de eficacia o tradicionales
son situaciones muy artificiales donde se estudia la eficacia de una intervención
sobre un determinado resultado. Los pacientes incluidos en el estudio se selec-
cionan para ser similares, adherentes y tener baja probabilidad de abandonar
el estudio. A su vez se incluye un determinado grupo etario que tenga baja
frecuencia de eventos adversos y dentro de lo posible pocas comorbilidades
adicionales. Los métodos de seguimiento de los participantes son intensivos,
invasivos y muy diferentes de la práctica habitual. Los pacientes incluidos son
muy parecidos entre sí. Esta situación maximiza la validez interna y la eficiencia
del estudio, pero compromete la validez externa.
Es fácil imaginarse lo difícil que es extrapolar los resultados de los estudios clíni-
cos clásicos a la población de la práctica clínica habitual: en el consultorio los pa-
cientes son cada vez más ancianos, son frecuentes las múltiples comorbilidades
y tratamientos farmacológicos. Los pacientes reales no cumplen con las visitas
ni son completamente adherentes. Las decisiones sobre tratamientos, estudios
diagnósticos o conductas se discuten y consensúan entre el paciente, su equipo
médico tratante y la familia. No siempre toman la medicación, cuando la toman,
no siempre la toman bien ni de la misma manera. Son muy variables y diferentes
entre sí y su seguimiento puede ser errático y personal.
La efectividad es la medida de cómo funciona una determinada intervención en
38
un escenario más real y no tan artificial como son los ensayos clínicos clásicos.
Estos estudios se llaman pragmáticos y son más parecidos a la práctica clínica
habitual. Los pacientes son diferentes, con comorbilidades, similares a la prác-
tica clínica habitual. El seguimiento es más parecido al seguimiento habitual de
los pacientes en el mundo real. Si bien aportan información más parecida a lo
que pasa en la realidad con las indicaciones de tratamiento, requieren tamaños
muestrales mucho más grandes.
Una herramienta apropiada para clasificar a los estudios en pragmáticos o clási-
cos es el PRECIS-2 que permite asignar puntajes a la características del diseño
para definir si se trata de un estudio pragmático o clásico.[35]
La herramienta mide
diferentes aspectos como elegibilidad, reclutamiento, seguimiento, flexibilidad,
organización, seguimiento, eventos primarios y análisis. Con esta herramienta
es posible clasificar los estudios en ensayos de eficacia o efectividad.
¿Cómo se define un estudio de cohorte?
En los estudios de cohorte el investigador incluye los pacientes de acuerdo a su
exposición y los sigue en el tiempo en busca de los participantes que desarro-
llan eventos. Las cohortes implican un período de seguimiento para los partici-
pantes. Pueden ser retrospectivas o prospectivas. Pueden tener una única rama
o varias ramas de exposición diferente y permiten estimar riesgos. La medida
natural de asociación es el riesgo relativo o la razón de tasas de incidencia.
En las cohortes retrospectivas se incluyen los individuos en un momento hacia
atrás en el tiempo y se los sigue retrospectivamente para identificar quienes de-
sarrollaron el evento durante el tiempo de seguimiento. Las cohortes retrospec-
tivas requieren recuperación de información retrospectiva que puede provenir
de historias clínicas, historias clínicas electrónicas, otras bases de datos secun-
darias. En las cohortes prospectivas se incluyen respectivamente los participan-
tes y se los sigue en el tiempo hasta que desarrollan el evento.
La pregunta ¿Cuál es la asociación entre el consumo de losartán y la mortali-
dad en los pacientes EPOC? se podría construir una cohorte retrospectiva con
pacientes que consumieron losartan en el futuro y pacientes que no consumie-
ron losartán y seguirlos retrospectivamente para identificar los eventos de fa-
llecimiento.[36]
En este caso requerimos un registro de fármacos y de eventos
de muerte. Otro ejemplo de cohorte retrospectiva es Do influenza and pneu-
mococcal vaccines prevent community-acquired respiratory infections among
older people with diabetes and does this vary by chronic kidney disease? A
cohort study using electronic health records, que utilizó historias clínicas electró-
nicas[20]
. Otro ejemplo adicional es la cohorte prospectiva más famosa: el estudio
de Framingham.[37]
Por el contrario la pregunta ¿El aprendizaje basado en problemas se asocia a
conocimiento más duradero en estudiantes de medicina? podría contestarse
con una cohorte retrospectiva de estudiantes de 2 universidades una que utiliza
39
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
aprendizaje tradicional y otra basado en problemas y seguirlos en el tiempo. En
este caso, es posible que se requiera captura primaria de información no dis-
ponible previamente. Otro ejemplo de estudio de cohorte retrospectiva es The
incidence of venous thromboembolism in patients with overt hyperthyroidism: a
retrospective multicentre cohort study.[38]
Las cohortes a su vez pueden ser cerradas o abiertas. Las cohortes cerradas
implican el mismo tiempo de seguimiento para todos los individuos pertene-
cientes a la cohorte. En cambio en las cohortes abiertas o dinámicas los tiempos
de seguimiento pueden ser diferentes para los distintos participantes. En este
caso se deberán usar los métodos estadísticos apropiados para las cohortes
dinámicas o métodos para datos censurados (ver más adelante Métodos para
datos censurados).
Las cohortes son eficientes para exposiciones infrecuentes. También permiten
estudiar más de un evento simultáneamente. Permiten medir las exposiciones
antes que los eventos, asegurando así la preexistencia de las exposiciones a los
eventos. La relación temporal es uno de los criterios de causalidad postulados
por Bradford Hill para identificar asociaciones causales,[7,8]
por lo cual aportan
mayor información con fortaleza causal.
Las principales desventajas de las cohortes prospectivas son la dificultad en su
implementación, el costo y tiempo que requiere para completarse. La principal
desventaja de las cohortes retrospectivas es la validez de la información y la
calidad de las mediciones y registros retrospectivos. Por ejemplo, las historias
clínicas pueden registrar información muy incompleta. A su vez es imposible
estandarizar como se tomó la información o como se evaluaron los pacientes de
manera retrospectiva.
¿Cómo se define un estudio de casos y controles?
En los estudios de casos y controles, los participantes se incluyen por haber
tenido un evento (casos) o por no haberlo tenido (controles). En este caso se
busca retrospectivamente recuperar información sobre su exposición previa a la
ocurrencia del evento. En los estudios de casos y controles no se puede estimar
riesgos, pero si odds. La natural medida de asociación de los estudios de casos
y controles el es odds ratio (OR, ver más adelante Variables, medidas de resu-
men y medidas de asociación).
Debido a que en general los casos son escasos, se puede incrementar el ta-
maño de los controles ganando poder adicional para detectar diferencias que
verdaderamente existen. En el caso más común se mantiene igual tamaño para
casos y controles, pero puede incrementarse el tamaño de los controles hasta 5
veces y se sigue ganando poder adicional. Más allá de 1 caso por cada 5 contro-
les, no se gana poder adicional. Esta misma estrategia puede aplicarse a otros
diseños como ensayos clínicos o cohortes, variando el tamaño relativo de las
ramas de exposición o de los grupos de exposición, respectivamente.
40
Los casos y controles pueden estar anidados en cohortes. El casos y controles
anidado en una cohorte tiene mayor calidad ya que permite recuperar infor-
mación de mejor calidad con respecto a las exposiciones. Asimismo, permite
determinar la preexistencia de la exposición al evento.
Por ejemplo, si mi pregunta es ¿un determinado polimorfismo de un gen es-
pecífico predispone a melanoma? es posible identificar casos de melanoma y
seleccionar controles de población general del mismo sexo y edad utilizando
un diseño de casos y controles. Otro ejemplo de estudio de casos y controles
es Risk factors for infection following prostate biopsy - a case control study.[39]
Estos estudios son muy eficientes para el estudio de eventos raros (casos poco
frecuentes) y permiten estudiar varias exposiciones al mismo tiempo. La gran
restricción es la incapacidad para medir algunas exposiciones por falta de in-
formación. A su vez el desafío más grande de los estudios de casos y controles
es asegurar que tanto casos como controles provienen de la misma población.
¿Qué es el matcheo? ¿Para qué sirve?
El matcheo o apareamiento es una técnica para controlar el efecto de confun-
didores. Si decido matchear por sexo y edad por ejemplo, es porque son con-
fundidores importantes y deseamos controlar su efecto. En este caso, por cada
caso de sexo femenino de 30 años, deberíamos incluir un control sexo femenino
y de la misma edad. De esta manera al matchear los controles con los casos, nos
aseguramos que los casos y los controles son iguales en su proporción de sexo
femenino y en la edad.
El matcheo requerirá métodos estadísticos específicos para datos apareados ya
que los casos y los controles matcheados dejan de ser independientes entre sí.
El matcheo no va a permitir comparar el sexo ni la edad entre casos y controles
ya que nos ocupamos de que sean iguales. A su vez, puede no ser suficiente
y persistir confusión residual. En este caso se deberá posteriormente ajustar el
efecto de la confusión residual con otro método como análisis multivariado.
Si bien no es una estrategia excluyente de los estudios de casos y controles,
es frecuente su uso en este diseño. Un ejemplo de matcheo en un estudio de
casos y controles es A case-control study of the risk of cutaneous melanoma as-
sociated with three selenium exposure indicators.[40]
Un ejemplo de una cohorte
en la que matchearon por propensity score es Concurrent Chemoradiothera-
py in Curatively Resected Gallbladder Carcinoma: A Propensity Score-Matched
Analysis.[41]
¿Cómo se define un estudio de corte transversal?
En los estudios de cohorte transversal, se seleccionaron participantes por per-
tenecer a una población específica. Son siempre retrospectivos, pueden ser
descriptivos o analiticos. La natural medida de frecuencia en este caso es la
prevalencia y la medida de asociación la razón de prevalencias.
41
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
En este tipo de estudio, se realizan las mediciones de eventos y exposiciones en
el mismo momento del tiempo. Esto no quiere decir que ocurre exactamente en
el mismo día, quiere decir que se trata del mismo momento conceptual para to-
dos los participantes. Por ejemplo si me interesa responder ¿Cuál es la prevalen-
cia de colonización por pseudomonas multirresistentes en pacientes de terapia
intensiva a los 7 días de ingreso a la terapia? o ¿Cuál es la prevalencia de dolor
a las 24 horas post cirugía de cadera? Son preguntas referidas a un momento
conceptual específico y no a un momento calendario específico.
Los estudios de corte transversal son susceptibles a la presencia de causalidad
reversa, ya que no es posible en la mayoría de las exposiciones, definir con
claridad la preexistencia de una exposición en particular con respecto a un de-
terminado evento.
La gran ventaja de este tipo de estudio es la simpleza y facilidad de su diseño e
implementación. Los estudios de corte transversal generan escasa información
causal, pero permiten evaluar múltiples asociaciones a la vez. Este estudio re-
presenta un ejemplo de corte trasversal analítico donde se identificaron factores
asocados a calidad de vida Factors associated with health-related quality of life
among overweight or obese adults.[42]
¿Cómo se define un estudio ecológico?
Los estudios ecológicos son poblacionales por definición. En estos estudios las
unidades de observación están medidas en niveles de poblaciones y no de in-
dividuos. Es natural presentar la asociación de las tasas como coeficientes de
correlación o aplicar modelos de regresión a situaciones más complejas.
Es el diseño más apropiado cuando una determinada exposición varía natural-
mente entre las poblaciones o cuando el efecto de una exposición ocurre a nivel
de la población como las campañas de vacunación. En este estudio se evaluó
la pregunta ¿existe asociación entre la exposición a arsénico en el agua y el de-
sarrollo de cáncer de próstata? Arsenic in drinking water and prostate cancer in
Illinois counties: An ecologic study.[43]
Como todos los estudios ecológicos, está sujeto al fenómeno de falacia ecoló-
gica. La falacia ecológica se clasifica como un sesgo de información en el cual
la exposición y el efecto no se miden en el mismo nivel que me interesa hacer
inferencia.[16,44]
No se puede asegurar que exista una relación causal a nivel indi-
vidual ya que no contamos con información individual del grado de exposición a
arsénico de los individuos que desarrollaron cáncer y los que no. Es decir, no se
puede saber si esta asociación se sostiene a nivel individual.
Este diseño se utiliza ampliamente en la salud pública para la toma de decisio-
nes y para medir el impacto de las políticas en salud sobre indicadores agrega-
dos poblacionales. En este ejemplo se evaluó el efecto de la vacunación para
rotavirus sobre la tasa de internaciones de niños menores a 5 años Impact of
Rotavirus Vaccination in Germany, utilizando información agregada poblacio-
42
nal[45]
. En el estudio de las campañas de vacunación, parte del efecto se produce
a nivel poblacional ya que una población con mayor porcentaje de individuos
vacunados se resiste al contagio entre las personas (efecto manada o inmuni-
dad de grupo).[46]
La gran ventaja de los diseños ecológicos es su facilidad de implementación y
bajo costo, ya que los datos son en general recolectados por sistemas de datos
rutinarios. La desventaja más grande es que son los estudios que aportan menor
fortaleza en sentido causal. Tienen un enorme valor en la generación de infor-
mación para salud pública y gestión de salud.
¿Cúal es el mejor diseño?
Si bien es común ordenar los diseños por el grado de evidencia que son capa-
ces de generar. Es interesante resaltar que la clasificación de la evidencia de-
pende del grado de fortaleza causal que se puede generar con un determinado
tipo de estudio. Los ensayos clínicos aleatorizados son los que generan mayor
evidencia causal, pero no todas las preguntas pueden contestarse con ensayos
clínicos. No existe un diseño único para contestar todas las preguntas. Cada pre-
gunta tiene un mejor diseño para contestarla. El diseño más apropiado depende
de la pregunta de investigación.
Por ejemplo ¿Cuál es la prevalencia de esclerosis múltiple en las poblaciones
urbanas de Argentina? es una pregunta que se contesta con un estudio de corte
transversal o de prevalencia.
¿Cuál es el efecto de una campaña de vacunación antigripal sobre las inter-
naciones por neumonía en una determinada población? Es una pregunta que
podría contestarse apropiadamente con un estudio de intervención poblacional
antes y después de la implementación de la campaña.
Si mi interés como investigador es generar y validar un instrumento pronósti-
co para identificar los individuos con EPOC que tengan mayor probabilidad de
morir o internarse en un año luego de una internación, probablemente el mejor
diseño sea una cohorte prospectiva. Pero se podría contestar apropiadamente
con una cohorte retrospectiva.
Si mi pregunta fuera ¿el consumo crónico de estatinas mejora las interacciones
de los pacientes con enfermedades autoinmunes? probablemente requeriría un
ensayo clínico aleatorizado para su respuesta. Sin embargo, se podría aproximar
a través de una cohorte retrospectiva. También podría contestarse con un estu-
dio de casos y controles. Cada aproximación tendrá sus ventajas y desventajas.
Si pensamos en la pregunta ¿la circuncisión reduce la transmisión del HIV?
¿Cuantas formas hay de contestarla? ¿Qué ventajas y que desventajas tendría
cada diseño seleccionado para contestarla?
43
MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK
VARIABLES, MEDIDAS DE
RESUMEN Y MEDIDAS DE
ASOCIACIÓN
4
¿Qué son las variables?
Se podría definir las variables como toda porción de la realidad que puede ser
medida. Se llama variable a cualquier aspecto que es posible conceptualizar y
potencialmente podría tomar valores diferentes entre individuos o unidades de
observación. Con el instrumento apropiado se puede medir cualquier aspecto
de la realidad: fisiológicas, medicación, sociales, demográficas, comportamien-
tos, genéticas, fisiopatológicas, culturales, económicas, entre muchas otras.
Algunos ejemplos de variables son el sexo que puede tomar valores masculino
y femenino. El género comprendido como identidad sexual en relación con la
sociedad y la cultura, puede aproximarse con escalas diferentes y puede tomar
diferentes valores en un determinado espectro, existiendo diferentes formas
para medir y representarlo. La edad, la presión arterial, el consumo de una de-
terminada medicación, su dosis, la presencia o ausencia de una enfermedad
como la colitis ulcerosa, la exposición a un tóxico como la radiación ambiental, el
nivel socioeconómico, el antecedente familiar de depresión, la calidad de vida,
la zona de residencia, el tiempo al infarto o la muerte son algunos ejemplos de
variables.
Cuando una herramienta mide apropiadamente el concepto de interés en un
determinado contexto, se dice que está validada. Se llama validación de un ins-
trumento de medición, al proceso de acumulación de evidencia sobre la capaci-
dad de un instrumento para representar un concepto de interés. Por ejemplo, la
depresión es un constructo no medible directamente. Es un concepto que sirve
para tomar conductas y creemos corresponde a un estado psicológico de rele-
vancia. Algunos instrumentos para la medición de depresión son Beck Depres-
sion Inventory,[47]
Hamilton Rating Scale for Depression[48]
y Montgomery Asberg
depression Rating Scale.[49]
Cada una de estas escalas tiene sus propiedades
particulares para la medición y representación del concepto depresión.
En un determinado estudio, al seleccionar la población blanco sobre la que se
generalizarán los resultados, se utilizan variables. Los criterios de selección son
variables en el mundo real, que fijo para delimitar la población blanco de mi es-
tudio. De esta manera, en mi estudio estas variables pasan a ser constantes. Por
44
ejemplo, si un estudio incluirá pacientes mayores a 65 años con infarto agudo
de miocardio de Argentina, las variables edad mayor de 65 (Sí) , infarto agudo de
miocardio (Sí) y país de origen (Argentina) pasan a ser constantes.
¿Cómo se clasifican las variables?
Las variables se pueden clasificar de diferentes maneras. Habitualmente se las
clasifica de acuerdo a la naturaleza de la información que contiene en dos gran-
des grupos: cuantitativas y categóricas.
Las variables cuantitativas representan números verdaderos. Que sean números
implica que las operaciones matemáticas tienen sentido usando las variables
cuantitativas. A su vez pueden clasificarse en variables cuantitativas continuas
y las discretas.
Las cuantitativas continuas son las variables en las cuales todo valor entre dos
mediciones tiene sentido. Por ejemplo, la altura, el peso, la presión arterial y
cualquier medida de tiempo. Las fracciones tienen sentido y tanta importancia
como los números enteros. Un individuo puede medir 1,7 y otro 1,8. Medir 1,75 es
posible y tiene sentido. A su vez entre 1,7 y 1,75, está el 1,725. Todos estos núme-
ros tienen una interpretación natural, son posibles y tienen sentido.
Las variables cuantitativas discretas son aquellas variables en las cuales sólo tie-
nen sentido los números enteros. Corresponden a las cuentas de cosas, como
cantidad de hijos o cantidad de eventos de infarto que tuvo un individuo duran-
te su seguimiento. El aumento de una unidad es siempre igual y homogéneo:
para pasar de 1 a 2 hijos, es necesario agregar la misma cantidad de hijos, que
para pasar de 3 a 4 hijos. Nadie tiene 2 infartos y medio ni 1,333... hijos. Si bien
las fracciones no tienen sentido, en muchas ocasiones se suelen tratar como
variables continuas a los fines prácticos. En muchas ocasiones las variables con-
tinuas se discretizan debido a la resolución de la herramienta de medición. Por
ejemplo, muchas veces en las mediciones de tiempo que es naturalmente con-
tinua, se suelen discretizar por ejemplo, en días u horas de acuerdo al problema
bajo estudio.
Las variables categóricas son aquellas que corresponden a categorías exhaus-
tivas y mutuamente excluyentes. Los individuos se clasifican en categorías. Es-
tas categorías pueden codificarse utilizando números. Esto facilita el análisis de
muchos de los paquetes estadísticos. Estos números equivalentes a los códigos
de las categorías no son números en realidad sino códigos numéricos que iden-
tifican las categorías. Las operaciones matemáticas con estos códigos no tienen
sentido. Se dividen en ordinales y nominales.
Las variables categóricas ordinales son las que las categorías tienen un orden
natural. Suelen representar una variable continua atrás no observable. Los es-
cores y escalas corresponden a esta categoría. Como el score de Charlson que
representa el grado de comorbilidad de un paciente. Un charlson de 2 tiene más
comorbilidad que un score de 1. A su vez un score de 5 es mayor que un score
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck
Bioestadística Merck

Más contenido relacionado

Similar a Bioestadística Merck

METODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdf
METODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdfMETODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdf
METODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdfLupita González
 
NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.
NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.
NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.nenukiita
 
Nuevo documento de texto enriquecido
Nuevo documento de texto enriquecidoNuevo documento de texto enriquecido
Nuevo documento de texto enriquecidoKaThe Gonzalez
 
Nuevo documento de texto enriquecido
Nuevo documento de texto enriquecidoNuevo documento de texto enriquecido
Nuevo documento de texto enriquecidoKaThe Gonzalez
 
Proceso De Investigación: Planteamiento del problema
Proceso De Investigación: Planteamiento del problemaProceso De Investigación: Planteamiento del problema
Proceso De Investigación: Planteamiento del problemaTito Zurita
 
Presentación Taller Metodología de Investigación PREGRADO.pptx
Presentación Taller Metodología de Investigación PREGRADO.pptxPresentación Taller Metodología de Investigación PREGRADO.pptx
Presentación Taller Metodología de Investigación PREGRADO.pptxandreacaballero780382
 
Metodologia investigacion
Metodologia investigacionMetodologia investigacion
Metodologia investigacionogalvisp
 
2. planteamiento del problema
2. planteamiento del problema2. planteamiento del problema
2. planteamiento del problemaJuan Lopez
 
DISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptx
DISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptxDISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptx
DISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptxSaraBatallanosNeme1
 
Proceso de-investigacin-planteamiento-del-problema
Proceso de-investigacin-planteamiento-del-problemaProceso de-investigacin-planteamiento-del-problema
Proceso de-investigacin-planteamiento-del-problemaWalter Becerra
 
Preguntas a tener en cuenta en una sustentación
Preguntas a tener en cuenta en una sustentaciónPreguntas a tener en cuenta en una sustentación
Preguntas a tener en cuenta en una sustentaciónBeltran Puma Ccaña
 
Elementos mínimos para presentar evaluacion
Elementos mínimos para presentar evaluacionElementos mínimos para presentar evaluacion
Elementos mínimos para presentar evaluacionMCMurray
 

Similar a Bioestadística Merck (20)

METODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdf
METODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdfMETODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdf
METODOLOGIA_DE_LA_INVESTIGACION_SAMPERI.pdf
 
Cuestionario economia
Cuestionario economiaCuestionario economia
Cuestionario economia
 
NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.
NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.
NACIMIENTO DE UN PROYECTO DE INVESTIGACIÓN CUANTITATIVA, CUALITATIVA O MIXTA.
 
Nuevo documento de texto enriquecido
Nuevo documento de texto enriquecidoNuevo documento de texto enriquecido
Nuevo documento de texto enriquecido
 
Nuevo documento de texto enriquecido
Nuevo documento de texto enriquecidoNuevo documento de texto enriquecido
Nuevo documento de texto enriquecido
 
Proceso De Investigación: Planteamiento del problema
Proceso De Investigación: Planteamiento del problemaProceso De Investigación: Planteamiento del problema
Proceso De Investigación: Planteamiento del problema
 
Presentación Taller Metodología de Investigación PREGRADO.pptx
Presentación Taller Metodología de Investigación PREGRADO.pptxPresentación Taller Metodología de Investigación PREGRADO.pptx
Presentación Taller Metodología de Investigación PREGRADO.pptx
 
Metodologia investigacion
Metodologia investigacionMetodologia investigacion
Metodologia investigacion
 
2. planteamiento del problema
2. planteamiento del problema2. planteamiento del problema
2. planteamiento del problema
 
EL PROTOCOLO
EL PROTOCOLOEL PROTOCOLO
EL PROTOCOLO
 
Diapositivas paula salcedo
Diapositivas paula salcedoDiapositivas paula salcedo
Diapositivas paula salcedo
 
Diapositivas paula salcedo
Diapositivas paula salcedoDiapositivas paula salcedo
Diapositivas paula salcedo
 
DISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptx
DISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptxDISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptx
DISCUSION, CONCLUSIONES, RECOMENDACIONES, RESUMEN.pptx
 
Proceso de-investigacin-planteamiento-del-problema
Proceso de-investigacin-planteamiento-del-problemaProceso de-investigacin-planteamiento-del-problema
Proceso de-investigacin-planteamiento-del-problema
 
Preguntas a tener en cuenta en una sustentación
Preguntas a tener en cuenta en una sustentaciónPreguntas a tener en cuenta en una sustentación
Preguntas a tener en cuenta en una sustentación
 
Presentación1.pptx
Presentación1.pptxPresentación1.pptx
Presentación1.pptx
 
Elementos mínimos para presentar evaluacion
Elementos mínimos para presentar evaluacionElementos mínimos para presentar evaluacion
Elementos mínimos para presentar evaluacion
 
Metodolog.1 (1)
Metodolog.1 (1)Metodolog.1 (1)
Metodolog.1 (1)
 
S2.proceso investigacion
S2.proceso investigacionS2.proceso investigacion
S2.proceso investigacion
 
Proyecto de investigacion
Proyecto de investigacionProyecto de investigacion
Proyecto de investigacion
 

Último

Colecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptxColecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptx Estefa RM9
 
Enferemedades reproductivas de Yeguas.pdf
Enferemedades reproductivas  de Yeguas.pdfEnferemedades reproductivas  de Yeguas.pdf
Enferemedades reproductivas de Yeguas.pdftaniacgcclassroom
 
PPT HIS PROMSA - PANAS-MINSA DEL 2024.pptx
PPT HIS PROMSA - PANAS-MINSA DEL 2024.pptxPPT HIS PROMSA - PANAS-MINSA DEL 2024.pptx
PPT HIS PROMSA - PANAS-MINSA DEL 2024.pptxOrlandoApazagomez1
 
Revista de psicología sobre el sistema nervioso.pdf
Revista de psicología sobre el sistema nervioso.pdfRevista de psicología sobre el sistema nervioso.pdf
Revista de psicología sobre el sistema nervioso.pdfleechiorosalia
 
Clase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdfClase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdfgarrotamara01
 
Trombocitopenia Inmune primaria , clínica
Trombocitopenia Inmune primaria , clínicaTrombocitopenia Inmune primaria , clínica
Trombocitopenia Inmune primaria , clínicaVillegasValentnJosAl
 
Torax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de toraxTorax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de toraxWillianEduardoMascar
 
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdfClase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdfgarrotamara01
 
(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx
(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx
(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptxUDMAFyC SECTOR ZARAGOZA II
 
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdfUDMAFyC SECTOR ZARAGOZA II
 
Clase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdfClase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdfgarrotamara01
 
TANATOLOGIA de medicina legal y deontología
TANATOLOGIA  de medicina legal y deontologíaTANATOLOGIA  de medicina legal y deontología
TANATOLOGIA de medicina legal y deontologíaISAIDJOSUECOLQUELLUS1
 
Clase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdfClase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdfgarrotamara01
 
(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf
(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf
(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdfUDMAFyC SECTOR ZARAGOZA II
 
Posiciones anatomicas basicas enfermeria
Posiciones anatomicas basicas enfermeriaPosiciones anatomicas basicas enfermeria
Posiciones anatomicas basicas enfermeriaKarymeScarlettAguila
 
docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...
docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...
docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...MariaEspinoza601814
 
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docxUDMAFyC SECTOR ZARAGOZA II
 
LA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.pptLA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.pptSyayna
 
equipos e insumos para la administracion de biologicos
equipos e insumos para la administracion de biologicosequipos e insumos para la administracion de biologicos
equipos e insumos para la administracion de biologicosmafaldoachonga
 

Último (20)

Colecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptxColecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptx
 
Enferemedades reproductivas de Yeguas.pdf
Enferemedades reproductivas  de Yeguas.pdfEnferemedades reproductivas  de Yeguas.pdf
Enferemedades reproductivas de Yeguas.pdf
 
PPT HIS PROMSA - PANAS-MINSA DEL 2024.pptx
PPT HIS PROMSA - PANAS-MINSA DEL 2024.pptxPPT HIS PROMSA - PANAS-MINSA DEL 2024.pptx
PPT HIS PROMSA - PANAS-MINSA DEL 2024.pptx
 
Revista de psicología sobre el sistema nervioso.pdf
Revista de psicología sobre el sistema nervioso.pdfRevista de psicología sobre el sistema nervioso.pdf
Revista de psicología sobre el sistema nervioso.pdf
 
(2024-04-17) SISTEMASDERETENCIONINFANTIL.pdf
(2024-04-17) SISTEMASDERETENCIONINFANTIL.pdf(2024-04-17) SISTEMASDERETENCIONINFANTIL.pdf
(2024-04-17) SISTEMASDERETENCIONINFANTIL.pdf
 
Clase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdfClase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdf
 
Trombocitopenia Inmune primaria , clínica
Trombocitopenia Inmune primaria , clínicaTrombocitopenia Inmune primaria , clínica
Trombocitopenia Inmune primaria , clínica
 
Torax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de toraxTorax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de torax
 
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdfClase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
 
(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx
(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx
(2024-25-04) Epilepsia, manejo el urgencias (ptt).pptx
 
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (ppt).pdf
 
Clase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdfClase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdf
 
TANATOLOGIA de medicina legal y deontología
TANATOLOGIA  de medicina legal y deontologíaTANATOLOGIA  de medicina legal y deontología
TANATOLOGIA de medicina legal y deontología
 
Clase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdfClase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdf
 
(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf
(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf
(2024-04-17) TRASTORNODISFORICOPREMENSTRUAL (ppt).pdf
 
Posiciones anatomicas basicas enfermeria
Posiciones anatomicas basicas enfermeriaPosiciones anatomicas basicas enfermeria
Posiciones anatomicas basicas enfermeria
 
docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...
docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...
docsity.vpdfs.com_urticaria-y-angioedema-en-pediatria-causas-mecanismos-y-dia...
 
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
 
LA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.pptLA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
 
equipos e insumos para la administracion de biologicos
equipos e insumos para la administracion de biologicosequipos e insumos para la administracion de biologicos
equipos e insumos para la administracion de biologicos
 

Bioestadística Merck

  • 2. 2
  • 3. 3 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Contenido 1 LA PREGUNTA DE INVESTIGACIÓN ¿Por qué empezar por la pregunta de investigación? 9 ¿Cuáles son las características de una buena pregunta de investigación? 9 ¿Cómo se utilizan los aspectos de la pregunta? 13 ¿Cómo se clasifican las preguntas de investigación? 14 ¿Qué estructura tiene un pregunta de investigación? 15 ¿Cómo expresar la hipótesis de investigación? 16 ¿Cuál es la relación entre pregunta, hipótesis y objetivos? 16 ¿Cuántas preguntas tiene un estudio? 17 2 POBLACIÓN ¿Qué es la población del estudio? 19 ¿Qué tipos de poblaciones hay? 19 ¿En que parte se define la población blanco de un estudio? 21 ¿En que parte se describe la muestra? 23 ¿Cómo se toma una muestra? 25 ¿Cuáles son las diferencias entre los tipos de muestreo probabilístico? 25 3 DISEÑOS DE ESTUDIOS DE INVESTIGACIÓN ¿Qué es un diseño? 29 ¿Cómo se clasifican? 29 Con respecto a las unidades de observación 30 Con respecto a la temporalidad 30 Con respecto a la naturaleza de la exposición 31 ¿Cuáles son los tipos de diseños más frecuentes? 32 ¿Cómo se define un ensayo clínico? 32 ¿Qué es el ciego o enmascaramiento? 33 ¿Para qué sirve la asignación al azar de tratamiento? 34
  • 4. 4 ¿Cómo se clasifican los ensayos clínicos? 35 ¿En qué se diferencian los ensayos clínicos pragmáticos de los clásicos? 37 ¿Cómo se define un estudio de cohorte? 38 ¿Cómo se define un estudio de casos y controles? 39 ¿Qué es el matcheo? ¿Para qué sirve? 40 ¿Cómo se define un estudio de corte transversal? 40 ¿Cómo se define un estudio ecológico? 41 ¿Cúal es el mejor diseño? 42 4 VARIABLES, MEDIDAS DE RESUMEN Y MEDIDAS DE ASOCIACIÓN ¿Qué son las variables? 43 ¿Cómo se clasifican las variables? 44 ¿Cuánta información contiene cada tipo de variable? 45 ¿Cómo se clasifican las variables de acuerdo a su función en el estudio? 46 ¿Qué utilidad tiene clasificar las variables? 47 ¿Cómo elijo las variables a medir? 47 ¿Qué son los parámetros poblacionales y los estimadores muestrales? 48 ¿Qué son las medidas de resumen? 49 ¿Cuáles son las medidas de resumen para variables cuantitativas? 50 ¿Qué son las medidas de frecuencia? 51 ¿Qué son las medidas de asociación? 52 ¿Cómo se clasifican las medidas de asociación? 52 Otras medidas de asociación 53 ¿Cómo se interpretan las medidas de asociación? 54 ¿Cómo se interpretan las medidas de asociación relativas? 54 ¿Cómo se interpretan las medidas de asociación absolutas? 55
  • 5. 5 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK 5 AMENAZAS A LA VALIDEZ ¿Qué es la validez de un estudio? 57 ¿Qué es la validez interna? 57 ¿Qué es la validez externa? 57 ¿Cuáles son las amenazas a la validez? 58 ¿Qué son los sesgos? 58 ¿Qué son los sesgos de selección? 59 ¿Cómo minimizo los sesgos de selección? 60 ¿Qué son los sesgos de información? 60 ¿Cómo minimizo los sesgos de información? 62 ¿Qué es el error aleatorio? 62 ¿Qué hago con los sesgos? 62 ¿Qué son los confundidores? 62 ¿Qué hago con los confundidores? 63 ¿Qué es el azar de muestreo? 64 Teorema del Límite Central 65 ¿Qué es una distribución normal? 67 ¿Cuál es el efecto del azar de muestreo? 67 ¿Cómo minimizo el efecto del azar de muestreo? 68 6 TEST DE HIPÓTESIS E INTERVALOS DE CONFIANZA ¿Qué es una hipótesis? 69 ¿Cuál es la relación entre pregunta e hipótesis? 70 ¿Cómo se clasifican las hipótesis? 70 ¿Cuáles son los componentes de la hipótesis? 70 ¿Qué es la hipótesis nula? ¿Y la hipótesis alterna? 70 ¿Qué es una asociación causal? 71 ¿Qué es el error Alfa y Beta? 72 ¿Qué es un test de hipótesis? 74 ¿Cuáles son los componentes de un test de hipótesis? 74 ¿Cuántas colas puede tener un test de hipótesis? 76
  • 6. 6 ¿Qué es el p valor? 77 ¿Qué son los intervalos de confianza? 77 ¿Cómo se interpretan los intervalos de confianza? 79 7 ANÁLISIS ESTADÍSTICO ¿Cuál es el objetivo de la planificación del análisis estadístico? 81 Antes de analizar… 81 ¿Qué partes tiene el plan de análisis estadístico? 82 ¿Qué es el análisis descriptivo? 83 ¿Qué es el análisis bivariado? 84 ¿Qué test uso para variables continuas? 85 ¿Qué hago si las muestras no son independientes? 87 ¿Cómo seleccionar las medidas de asociación? 87 ¿Cómo calcular las medidas de asociación? 88 ¿Cómo detectar los potenciales confundidores? 89 ¿Qué es la modificación de efecto? 90 8 MODELOS DE REGRESIÓN ¿Qué es el análisis de regresión? 91 ¿Cuál es el uso de un modelo de regresión? 91 ¿Cómo uso los modelos de regresión para predecir? 92 ¿Cómo valido los modelos de regresión predictivos? 92 ¿Cómo uso los modelos de regresión para ajustar por potenciales confundidores? 93 ¿Cuáles son los componentes del análisis de regresión? 94 ¿Qué parámetros estima un modelo de regresión? 95 ¿Cómo se clasifican los modelos de regresión? 96 ¿Cuáles son los supuestos de los modelos de regresión? 98 ¿Cómo evalúo los supuestos de un modelo de regresión lineal? 98 ¿Qué tipos de variables explicativas se pueden incluir en un modelo de regresión? 100
  • 7. 7 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK ¿Cómo selecciono las variables para incorporar en el modelo? 101 ¿Cómo elijo el mejor modelo predictivo? 101 9 MÉTODOS PARA DATOS CENSURADOS ¿Qué son los datos censurados? 103 ¿Cómo registrar datos censurados? 105 ¿Qué son los eventos competitivos? 105 ¿Cómo describo los datos censurados? 106 ¿Cómo comparo dos curvas de sobrevida? 107 ¿Cúal es modelo de regresión para datos censurados? 107 10 ESTUDIOS DE TEST DIAGNÓSTICOS ¿Qué es un test diagnóstico? 109 ¿Qué es un estudio de test diagnóstico? 109 ¿Qué preguntas responden los estudios de test diagnósticos? 110 ¿Qué componentes tienen los estudios de test diagnóstico clásicos? 111 ¿Cuáles son las situaciones clínicas específicas de un test diagnóstico? 112 ¿Cuáles son las medidas de performance diagnóstica? 113 ¿Qué es la curva ROC y para qué sirve? 115 ¿Cuáles son los diseños de los estudios de test diagnóstico? 115 ¿Cuál es el mejor test diagnóstico? 117 11 ESTIMACIÓN DE TAMAÑO MUESTRAL ¿Necesito estimar el tamaño muestral? 119 ¿Cuándo hacer la estimación de tamaño muestral? 120 ¿Tamaño muestral en las preguntas descriptivas? 120 ¿Qué necesito para realizar una estimación de tamaño muestral para precisión? 121 ¿Cómo se modifica el tamaño muestral por precisión? 121
  • 8. 8 ¿Cómo se hace una estimación de tamaño muestral por precisión? 122 ¿Tamaño muestral en las preguntas analíticas? 122 ¿Qué necesito para realizar una estimación de tamaño muestral para poder? 123 ¿Cómo se modifica el tamaño muestral para testear hipótesis? 125 ¿Cómo se hace una estimación de tamaño muestral para testear una hipótesis? 125 ¿Qué pasa si tengo más de una pregunta de investigación? 126 ¿Qué hago si me faltan datos para la estimación del tamaño muestral? 126 ¿Qué hago si requiero un tamaño muestral muy grande? 127 REFERENCIAS 129
  • 9. 9 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK ¿Por qué empezar por la pregunta de investigación? La pregunta de investigación es el eje central de un proyecto de investigación. Representa lo que el investigador intenta contestar con un estudio de investi- gación, el conocimiento nuevo que se pretende generar. Respondiendo a las preguntas de investigación, la comunidad científica conoce y construye la rea- lidad. En la investigación en salud, las preguntas de investigación tienen el fin de conocer para mejorar el cuidado de la salud de las poblaciones e individuos. Desde este rol clave y central, la pregunta de investigación es el primer paso de una investigación. Es el componente principal e inicial de cualquier proyecto de investigación, tanto en la construcción de proyectos o reportes de estudios de investigación. Una adecuada estructura y apropiado proceso de generación de la pregunta asegurará la construcción de un proyecto sólido fundamentado en los conocimientos disponibles. Asimismo, es el componente principal a identifi- car en el primer paso de la lectura crítica de un artículo científico. Algunas preguntas de investigación podrían ser ¿Cuál es la sobrevida de los pacientes con fibrosis quística? ¿El tratamiento con antihipertensivos disminuye la sobrevida de los pacientes hipertensos adultos? ¿Cuáles son las barreras y facilitadores para dejar de fumar en los fumadores de áreas rurales? ¿Los agro- químicos causan cáncer? A estas preguntas les faltaría madurar y refinarse. La pregunta puede surgir de la experiencia del investigador, nuevas ideas o nuevas aproximaciones a nuevos problemas, estudios previos, creatividad pro- pia para asociar distintas observaciones, evaluación crítica de la literatura, entre otros. Cualquiera sea el origen de la pregunta, deberá cumplir con ciertos requi- sitos y propiedades para convertirse en el centro de un proyecto de investiga- ción. ¿Cuáles son las características de una buena pregunta de investigación? La pregunta de investigación debe poseer ciertas características para ser ade- cuada como eje de un proyecto de investigación. Las principales característi- cas de la pregunta de investigación se pueden recordar por las siglas FINER-P, modificado de la propuesta de Hulley.[1] Representan las principales caracterís- LA PREGUNTA DE INVESTIGACIÓN 1
  • 10. 10 ticas que debería tener una pregunta de investigación para ser el mejor eje de un estudio: Factible, Interesante, Novedoso, Ético, Relevante, y Biológicamente Plausible. Es interesante notar que la evaluación de estos aspectos se realiza en un con- texto sociocultural en un determinado lugar y tiempo. En diferentes momentos de la historia, estas características varían para una misma pregunta. Por ejemplo, una pregunta novedosa en un determinado momento de la historia de la ciencia como ¿Fumar causa cáncer?, no sería novedosa ni ética en el día de hoy. Figura 1: Características de una buena pregunta de investigación. FINER - P INTERESANTE FACTIBLE NOVEDOSO RELEVANTE PLAUSIBILIDAD BIOLÓGICA ETICA A continuación, presentaremos una breve descripción de cada una de las características cambiando el orden en sentido uno de los muchos órdenes de relevancia propuestos para los mismos aspectos: ÉTICA El primer aspecto a considerar es la ética de la pregunta de investigación. Desde el punto de vista del contenido de la pre- gunta, una pregunta es ética cuando respeta todos los princi- pios éticos: no maleficencia (no causar daño), justicia (igualdad de oportunidades para todos), benevolencia (intención de ha- cer el bien) y autonomía (respetar la decisión de participar en el estudio de los individuos). Todas las preguntas y proyectos de investigación biomédica deben estar en total concordancia con el Código de Nürem- berg de principios éticos sobre la experimentación en seres humanos publicado en 1947 luego de los juicios de Nürem- berg de 1945 - 1946[2] , la Declaración de Principios éticos para las investigaciones médicas en seres humanos de Helsinki de la Asociación Médica Mundial y enmiendas posteriores,[3] las guías de Buenas Prácticas Clínicas de la de Conferencia In- ternacional de Armonización ICH,[4] la normativa y legislación regulatoria local.
  • 11. 11 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK FACTIBLE Es importante evaluar de manera precoz si podemos llevar a cabo el proyecto. Por ejemplo, muchas veces las preguntas de investigación para ser contestadas requieren un número elevados de participantes y si no tenemos manera de incluir dicho número, la factibilidad del estudio se verá amenazada. Los componentes de la factibilidad son la ética, la complejidad y los recursos. Los recursos implican cantidad de pacientes, tiempo disponi- ble, recursos económicos, humanos, materiales, entre otros. La complejidad del estudio es un componente fundamental. Los estudios más simples tienen menos componentes que pu- dieran fallar y son más fáciles de diseñar, implementar y maxi- mizar su calidad. INTERESANTE La pregunta debería ser interesante para el investigador, su equipo de trabajo, la comunidad científica, los pacientes y la salud pública. La motivación probablemente sea uno de los recursos más importante por lo cual es fundamental que la pregunta, eje de la investigación, resulte interesante para el investigador y su equipo también. El desarrollo de una pre- gunta madura, el diseño, la implementación y el reporte de los resultados lleva mucho tiempo y esfuerzo, por lo cual es fundamental mantener el interés del investigador y su equipo. Si bien toda pregunta que apunte hacia un área de descono- cimiento es fundamental para el crecimiento del conocimiento universal, si existe poco interés de la comunidad científica es probable que sea más dificultoso el financiamiento y su difu- sión. Dado que el objetivo de la investigación clínica y epi- demiológica es conocer la realidad para mejorar la salud de la población, esto no debiera ser un inconveniente sino una consideración. NOVEDOSA ¡La pregunta debe contribuir nuevo conocimiento! Sea cual sea la pregunta de investigación es fundamental que no esté respondida en la literatura. No tiene sentido desper- diciar recursos en contestar una pregunta cuya respuesta se encuentra al alcance de cualquier búsqueda bibliográfica. La gran mayoría de las preguntas que podríamos formularnos en realidad son falta de lectura o de búsqueda bibliográfica adecuada. Existe mucho más conocimiento generado del que aplicamos en la práctica diaria.
  • 12. 12 Por supuesto se podría contestar una pregunta que ya fue con- testada sólo si tenemos razones para creer que la respuesta no es definitiva o concluyente. Por ejemplo si los resultados de otros estudios son contradictorios y ninguno es concluyente definitivamente, si podemos identificar errores o amenazas a la validez de los resultados, o si tenemos suficientes razones para pensar que nuestra población se comporta de manera diferente que la población donde se estudió la pregunta. Otra razón es confirmar resultados de estudios ya que todo resulta- do está sujeto a errores por el fenómeno de azar de muestreo (error alfa y error beta). Además de la ineficiencia de montar un estudio de investiga- ción con todo el costo en recursos que implica, no sería ético implementar un proyecto de investigación para contestar un interrogante cuya respuesta se conoce con certeza. No es éti- co si se quiere interrogar pacientes en el marco de una investi- gación, que probablemente no reciban beneficios directos de participar, ni tampoco generará beneficios indirectos en otros pacientes con similares características ya que no se generará ningún conocimiento nuevo. Sólo se repetirán los hallazgos ya conocidos. Un problema adicional lo constituyen las preguntas ya contes- tadas y no publicadas. Si nuestra pregunta ya se evaluó pero por algún motivo no se difundió el resultado (en EEUU 20% de los estudios realizados nunca se difunden y más del 50% de las presentaciones en congresos)[5] , irremediablemente repe- tiremos un mismo estudio para obtener la misma respuesta. ¡Asegurémonos en este caso de difundir nuestros resultados![6] RELEVANTE El esfuerzo requerido para responder una pregunta de inves- tigación hace que sea fundamental que la pregunta sea rele- vante para el conocimiento científico, para políticas de salud o para futuras investigaciones. Una buena manera de evaluar si una pregunta es relevante es considerar cuánto aportará nuestra pregunta al avance cientí- fico, si aporta a las políticas actuales de salud o guiar a futuras investigaciones. ¡El solo hecho de que la pregunta carezca de respuesta hace que sea relevante! Si bien no debiera ser un impedimento que la pregunta no tuviera una relevancia obvia de gran impacto, se puede modificar las preguntas para que se encuentren diri- gidas al aspecto más relevante del área de desconocimiento.
  • 13. 13 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Obviamente si el conocimiento se basara sólo en los visiona- rios que contestaron preguntas de máxima relevancia en un determinado paradigma de conocimiento, ¡el conocimiento no habría llegado tan lejos! Las preguntas más irrelevantes pue- den tener implicaciones inesperadas que pueden tener un alto impacto en el futuro o en otros contextos. PLAUSIBILI- DAD BIOLÓGICA ¿Es posible construir un mecanismo biológico o de otra natu- raleza que una la exposición con el evento? Una pregunta que permita identificar el concatenado de eventos biológicos que relacionan la exposición con un evento será mejor. Esta característica es un agregado a los criterios FINER origi- nales. Es una de los postulados de Bradford Hill para identificar asociaciones causales.[7,8] En nuestra opinión, es un aspecto valioso a considerar durante la construcción de una pregunta de investigación. La revisión y reflexión sobre el mecanismo biológico tiene un impacto directo en la maduración y cons- trucción de preguntas de investigación. En algunos casos se conocerá perfecto en un determinado momento todos los mecanismos implicados. En otros casos no se conoce completamente los mecanismo, pero puede ser vital revisar la biología relacionada con la pregunta para al menos estar seguro que lo que se conoce al respecto no contradice nuestra pregunta de investigación. Por ejemplo, se conocen perfectamente los eventos que deben ocurrir en el desarrollo de un cáncer de colon. En otros casos puede no conocerse tan acabadamente los mecanismos por los cuales se desarrolla un determinado síntoma del espectro autista en ciertas ocasiones. La cantidad de conocimiento relacionado que permite armar un mecanismo biológico, cambia con el momento histórico. La plausibilidad es un concepto que es ex- tensible a cualquier otro tipo de pregunta que implique otro mecanismo que podría ser descrito como plausibilidad como por ejemplo psicológica, social, antropológica o física que sea necesario para relacionar una exposición con un resultado. ¿Cómo se utilizan los aspectos de la pregunta? Es esperable que los aspectos enunciados se superpongan y en ocasiones sea difícil distinguir cual de los aspectos se está discutiendo. No es nuestra intención revisar las características de la pregunta como si fueran estancas, exhaustivas y excluyentes. Estos aspectos son una guía que sirve para reflexionar sobre las preguntas de investigación, refinar y madurarlas. Durante la etapa de construc- ción de una pregunta de investigación, suelen coexistir varias preguntas simila- res relacionadas. En esta situación, estos atributos de la pregunta sirven para se-
  • 14. 14 leccionar cuál es la mejor pregunta para ser eje de un trabajo de investigación. A su vez, es posible modificar la pregunta para que sea dirigida hacia un área de desconocimiento o de mayor relevancia, mayor interés o mayor factibilidad. Es ideal que en la selección de la pregunta eje del proyecto se intente maximizar todas los aspectos mencionados en la tabla anterior. Aunque es claro que no es posible maximizar todos estos aspectos a la vez. La pregunta más relevante puede no ser factible. La que más me interesa puede no ser la más novedosa. Por ejemplo, podría ser que la pregunta que me resultara más interesante ¿la observación de ciertas imágenes, genera cambios en la activación de ciertas áreas corticales del cerebro?, no sea factible por falta de disponibilidad de re- cursos para hacer resonancias magnéticas funcionales en tiempo real. Podría reformular para ver el impacto sobre el ánimo a través de un cuestionario de au- tocompletado. Este cambio de la pregunta, podría hacer más factible un estudio de investigación cambiando la variable de resultado. Si mi pregunta específica fuera ¿Cuál es la frecuencia de enfermedades oncohe- matológicas en los pacientes con Lupus Eritematoso Sistémico? Pero, si la fre- cuencia fuera muy baja de nuevos casos de enfermedad oncohematológicas, podríamos modificar por enfermedades oncológicas. ¿O tal vez por todas las enfermedades autoinmunes como población? Este cambio de evento o de po- blación modifica la pregunta dramáticamente, pero acerca la factibilidad. ¿Cómo se clasifican las preguntas de investigación? Existen formas diferentes de clasificar las preguntas de investigación. Por ejem- plo, las preguntas de investigación pueden ser clasificadas en descriptivas o analíticas. En las preguntas descriptivas, el investigador se pregunta cómo es algo en particular. ¿Cómo es la frecuencia? ¿Cuál es la prevalencia? ¿Cuál es la incidencia? ¿Cómo es el tiempo al desarrollo de un determinado evento? ¿Cuá- les son los factores de riesgo para el desarrollo de una condición? ¿Y los facto- res protectores? Las preguntas descriptivas en sí no puede transformarse en una hipótesis direc- tamente. Siempre se responden estimando un parámetro poblacional. Como la frecuencia de una determinada característica; en estos casos, se espera que en los resultados de una pregunta descriptiva se presente la estimación del pará- metro que se pretendía conocer, acompañado de intervalos de confianza. Por el contrario, las preguntas analíticas son preguntas de asociación entre dos variables. Naturalmente tienen la estructura de una hipótesis evaluable (o tes- teable), por lo cual es fácil expresarlas como hipótesis. En este caso existe asi- metría entre las variables de la pregunta, una funciona como una variable de exposición y otra como una variable de respuesta. ¿Los pacientes tratados con la droga 1 tienen mejor calidad de vida que los pacientes tratados con la droga 2? En este caso, las drogas 1 o 2 son la exposición, y la calidad de vida es la respuesta.
  • 15. 15 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Las preguntas causales son analíticas. Por ejemplo ¿La exposición a plastifican- tes en la comida causa síndrome metabólico? ¿La exposición solar controlada y breve causa fotoenvejecimiento? ¿Es un determinado tratamiento más eficaz y seguro para controlar la hipertensión arterial? No toda pregunta analítica es cau- sal ¿La eritrosedimentación extremadamente elevada es un factor pronóstico de mortalidad? En la respuesta a una pregunta analítica deberia haber una medida de asocia- ción. La medida de asociación brinda mucha información: direccionalidad, y magnitud de la asociación entre la variable de exposición y la variable de res- puesta. A su vez, nos interesara saber el p valor como resultado de un test de hipótesis para evaluar la pregunta analítica o los intervalos de confianza de la medida de asociación. Ambos métodos brindan información similar sobre los resultados de una pregunta analítica. ¿Qué estructura tiene un pregunta de investigación? Las preguntas descriptivas responden a la estructura simplificada ¿Cómo es A en C? donde A es lo que interesa conocer y C la población blanco a la que se pretende generalizar los resultados. ¿Cómo es la sobrevida libre de enfermedad de los pacientes con estadio 4 de cáncer de pulmón en Latinoamérica? Las preguntas analíticas responden a la estructura general simplificada ¿A se asocia a B en C? donde A es la variable de exposición, B la variable de resul- tado y C la población blanco. ¿La estrategia educativa centrada en aprendizaje basado en problemas genera conocimiento más significativo en estudiantes de secundario en Argentina? Para las preguntas analíticas se puede utilizar el acrónimo PICOTS para enunciar todos los componentes necesarios: Población, Intervención/exposición, Compa- rador, Outcome/resultado, Temporalidad y Escenario (setting).[9] Por supuesto el orden de los componentes no es lo importante, sino su presencia o ausencia. Este acrónimo fue propuesto en el marco de la lectura crítica de las prácticas basadas en la evidencia, con foco en estudios experimentales.[10] De ahí su es- tructura y su máxima utilidad para estudios con preguntas analíticas y experi- mentales. Es una herramienta útil para la presentación transparente y completa de preguntas analíticas. Es fundamental remarcar que toda pregunta tiene una población de referencia C. La población blanco a la que se pretende generalizar los resultados. A los fines de la claridad, se omitió la población en la gran mayoría de las preguntas de juguete presentadas en este apartado. Intente identificar los componentes de las preguntas de ejemplo.
  • 16. 16 ¿Cómo expresar la hipótesis de investigación? La hipótesis es una afirmación que hace el investigador antes de conducir la investigación, como respuesta a la pregunta central del estudio. Siempre es una afirmación y tiene el mismo contenido que la pregunta analítica: A se asocia a B en C, donde A es la exposición, B es la variable de resultado y C la población blanco. Por ejemplo la pregunta de mi estudio puede ser ¿A mayor índice de masa corporal es mayor la mortalidad de origen cardiovascular? Y la hipótesis de mi estudio sería la afirmación “A mayor índice de masa corporal la mortalidad de origen cardiovascular es mayor”. Las hipótesis simples son las que tienen sólo una exposición y sólo una variable de respuesta. Las que tienen más de uno de estos componentes se llaman hipótesis complejas. Esta estructura específica, permitirá aplicar métodos estadísticos específicos. Por esta razón, muchas veces se las llama hipótesis en sentido estadístico. Apli- cando esta definición, las preguntas descriptivas no tienen hipótesis en este sentido. Una hipótesis específica puede ser verdadera o falsa, pero no las dos cosas a la vez. Es posible utilizar métodos estadísticos para testear cuál es la probabilidad de que una hipótesis sea verdadera utilizando un estudio de investigación. Se llama inferencia a este método de obtener información en una muestra para sacar conclusiones sobre el comportamiento de una población blanco. En este caso utilizaremos la información de los individuos incluidos en la muestra de un estudio, para evaluar si la hipótesis es verdadera o falsa en la población blanco de la cual proviene la muestra. Esto se realiza a través de un procedimiento que se llama testeo de hipótesis que describiremos más adelante. En muchos casos se utiliza el término hipótesis del estudio en un sentido más amplio que el estrictamente formal que acabamos de enunciar. En estos casos, se utiliza hipótesis como sinónimo de lo que el investigador espera encontrar a priori. En estos casos, no es exclusiva de las preguntas analíticas. El investigador podría decir “Nuestra hipótesis es que el índice de masa corporal incrementa la mortalidad debido a ...” Lo que el investigador cree que va a pasar con los resul- tados no requiere métodos estadísticos específicos. ¿Cuál es la relación entre pregunta, hipótesis y objetivos? En general pregunta, hipótesis y objetivos expresiones de lo mismo. Deben es- tar 100% alineados en un determinado estudio. No es esperable que los com- ponentes sean totalmente diferentes entre los tres. Los objetivos son acciones concretas alineadas con las preguntas del estudio. Para la pregunta descriptiva ¿Cuál es la prevalencia de obesidad entre los es- tudiantes de medicina en Ciudad Autónoma de Buenos Aires?, es esperable un objetivo “Estimar la prevalencia de obesidad entre los estudiantes de medicina en Ciudad Autónoma de Buenos Aires”. En este caso no hay una hipótesis pre- definida.
  • 17. 17 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK La pregunta analítica ¿Es mayor la prevalencia de obesidad en los estudiantes de medicina que en los estudiantes de abogacía de Ciudad Autónoma de Bue- nos Aires? En este caso una hipótesis apropiada podría ser “La prevalencia de obesidad en los estudiantes de medicina es mayor que en los estudiantes de abogacía de Ciudad Autónoma de Buenos Aires”. El objetivo podría ser “Eva- luar la asociación entre obesidad y estudiar medicina o abogacía en estudiantes universitarios de Ciudad Autónoma de Buenos Aires”. ¿Qué componentes de PICOTS faltan en este caso? ¿Cuántas preguntas tiene un estudio? Un estudio tiene idealmente una pregunta central, la cual es la pregunta princi- pal eje del estudio. El protocolo de una propuesta de investigación se construirá sobre una pregunta central. En sentido estricto el protocolo es el método que se utilizara para contestar una pregunta de investigación. En este sentido conten- drá todas las decisiones que se toman para contestar la pregunta. Se seleccio- nará el diseño más apropiado a la pregunta central; la población más adecuada a la pregunta central; los métodos estadísticos más apropiados a la pregunta, y todo el resto de las decisiones en función de contestar la pregunta central del estudio. Esta es la razón por la cual la pregunta es el eje del protocolo y del es- tudio de investigación. Preguntas adicionales pueden requerir diseños diferentes, muestreos diferen- tes, poblaciones diferentes, tamaños muestrales diferentes. En este caso puede que los componentes del protocolo queden desalineados con las preguntas y objetivos. Si el protocolo tiene múltiples preguntas, es fundamental que al me- nos requieran el mismo diseño, la misma población y el resto de materiales y métodos definidos para contestar las preguntas adicionales. Es un error muy común intentar responder más de una pregunta con un estudio de investigación. La mejor opción es definir una pregunta central única. Es una práctica ineficiente intentar contestar más de una pregunta de investigación con un mismo estudio. En general genera desprolijidades y es difícil alinear todos los componentes del estudio a varias preguntas de investigación a la vez, como es esperable. Por ejemplo un estudio cuya pregunta central es ¿La exposición a concentracio- nes altas de partículas ambientales genera mayor cantidad de exacerbaciones de enfermedad pulmonar obstructiva crónica (EPOC) en pacientes con EPOC? Tiene implícito los siguientes objetivos que corresponden a preguntas acceso- rias necesarias para responder de manera apropiada la pregunta central del estudio: • Evaluar la asociación entre la exposición a concentraciones altas de partículas ambientales y cantidad de exacerbaciones de EPOC en pacientes con EPOC.
  • 18. 18 • Estimar la exposición a concentraciones altas de partículas ambientales. • Estimar la frecuencia de exacerbaciones de EPOC en pacientes con EPOC. • Describir las principales características de los pacientes con EPOC/las exacerbaciones. • Es claro que algunas son objetivos principales y otros secundarios. ¿Cuáles y por qué?
  • 19. 19 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK ¿Qué es la población del estudio? Según Leon Gordis, la epidemiología es el estudio de la distribución y deter- minantes de los estados relacionados con la salud o eventos en poblaciones específicas y su aplicación al control de los problemas de salud, con el fin de maximizar la salud de las poblaciones.[11,12] Podríamos definir la población como un conjunto de individuos con características específicas, referidas a un espacio y tiempo.[11] Las características específicas podrían referirse a una condición clíni- ca, una exposición, una enfermedad, un subgrupo de individuos o cualquier otro segmento sobre el que interese conocer su comportamiento. En sentido más amplio se puede llamar población al conjunto de unidades de observación. En esta última definición, se incluyen unidades de observación que podrían corres- ponder a conjuntos de individuos o el mismo individuo en diferentes momentos o incluso situaciones diferentes. El método epidemiológico que utilizamos para contestar preguntas de investi- gación, requiere que seamos específicos con la población bajo estudio. Las pre- guntas de investigación están siempre referidas a una población. Las preguntas descriptivas quieren conocer cómo se comporta un determinado parámetro en una población. Las preguntas analíticas se preguntan si una asociación es ver- dadera en una determinada población. No existe pregunta que no esté referida a una determinada población. De la misma manera los resultados de un estudio en particular se extrapolan a una determinada población. Esta es la razón por la cual debe quedar definida con claridad tanto en el protocolo como en un artículo de investigación. ¿Qué tipos de poblaciones hay? Considerando una pregunta específica, en general se describen 3 tipos de po- blación: la población blanco, la población accesible y la muestra. Describiremos la población para la pregunta ¿La broncoaspiración se asocia con mayor severi- dad de las exacerbaciones de los pacientes con EPOC? La población blanco es la población sobre la que se quieren generalizar los re- POBLACIÓN 2
  • 20. 20 sultados y por lo tanto, las preguntas se plantean siempre sobre esta población. La población blanco se describe por características clínicas y demográficas y está formada por todos los individuos con una determinada característica, in- cluyendo los que la tuvieron, los que la tienen y los que la van a tener. Con esta definición operativa, ni siquiera los censos representan la totalidad de una población blanco. Desde este punto de vista, la población blanco es teórica e inabarcable. No es posible siquiera conocer qué tamaño tiene, ni conocer nada sobre su comporta- miento. En nuestro ejemplo, la población blanco serían todos los pacientes con EPOC, incluyendo los que van a tener desde el momento que lo desarrollen, los que tienen y conocen su diagnóstico en la actualidad, los que no y los que tuvieron EPOC en el pasado. Esta forma de definirla, implica que si conozco algo sobre esta población blanco, podré generalizar lo que conozca al próximo pa- ciente con esa condición que diagnostique. En esto nos basamos en la toma de decisiones clínicas en el consultorio o en cualquier ámbito permanentemente. La población accesible es una parte de la población blanco que está disponible y potencialmente podría incluirse en el estudio. Se define por características geográficas, temporales y de accesibilidad. Por ejemplo: todos los EPOC de la Ciudad Autónoma de Buenos Aires en 2017 podría ser una población accesible. Probablemente todos los EPOC asistidos en un determinado centro de salud de la Ciudad Autónoma de Buenos Aires en 2017 sea una población accesible mejor definida. La muestra corresponde a la fracción de la población accesible que efectiva- mente se incluye en un determinado estudio. La muestra es lo opuesto a la población blanco en el sentido de que puedo conocer todo: su tamaño, la dis- tribución de los diferentes factores, su comportamiento y sus características. En general, tiene un tamaño definido previamente de acuerdo a la estimación de tamaño muestral. Si tomo 100 pacientes de la población accesible y los invito a participar de mi estudio, ellos constituirán mi muestra. La muestra tiene la ventaja de ser tangible y es posible obtener mediciones con- cretas de las variables que le interesan al investigador a los fines de responder su pregunta. A través de las mediciones que se realizan en la muestra, utilizan- do métodos estadísticos, podremos hacer inferencia sobre lo que ocurre en la población blanco. Esta es la razón por la cual es fundamental que la población accesible represente lo que ocurre en la población blanco y de igual manera, que la muestra represente lo que ocurre en la población blanco.
  • 21. 21 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Figura 2. En A se muestra la relación entre la población blanco, pobla- ción accesible y muestras. Se espera que la muestra del estudio repre- sente el mismo fenómeno que ocurre en la población blanco. Para que eso ocurra debe haber una correspondencia perfecta entre lo que ocu- rre en la población blanco y lo que observo en mi muestra. En la figura B se muestra un esquema que representa una tabla de doble entrada en la población blanco y la misma proporción exacta de cada cuadrante en la población accesible y la muestra. POBLACIÓN BLANCO POBLACIÓN BLANCO MUESTRA POBLACIÓN ACCESIBLE POBLACIÓN ACCESIBLE MUESTRA A B ¿En que parte se define la población blanco de un estudio? La pregunta de investigación define la población blanco del estudio. A su vez, se repite en la hipótesis y los objetivos. Al responder esta pregunta, esta será la población a la cual se extrapolan los resultados de un estudio.
  • 22. 22 La población blanco se define con precisión en los criterios de inclusión. Los criterios de inclusión son las condiciones que debe cumplir una unidad de ob- servación para ser elegible para participar de un estudio de investigación. Los criterios de inclusión deben definir sin ambigüedades las características que se debe tener para pertenecer a la población blanco sobre la que se intenta con- testar una pregunta de investigación. La población accesible a su vez se descri- be principalmente en los criterios de inclusión también. Los criterios de exclusión en general responden al respeto por los principios éticos de autonomía, y no maleficencia, restricción como método para controlar potenciales confundidores y decisiones prácticas (problemas con accesibilidad, comprensión, adherencia, entre otros). Los dos primeros son necesarios y fun- damentales. Los dos segundos pueden potencialmente generar sesgos y es muy importante considerarlos con cuidado antes de utilizarlos o al leer un artí- culo de investigación. Se respeta la autonomía cuando se deja explícito en los criterios de exclusión que no se va a incluir participantes que no decidan libre e informadamente su participación en el estudio. Se respeta el principio ético de no maleficencia cuando se excluyen los participantes que pudieran tener algún perjuicio por la participación en el estudio o pudiera comprometer su seguridad. En los estudios experimentales es fundamental que un comité de ética evalúe y apruebe la rela- ción entre los beneficios y los riesgos de la participación en el estudio. Para la pregunta ¿la droga A previene las exacerbaciones de EPOC en pacien- tes adultos con EPOC?, los criterios de inclusión deben tomar una definición validada de EPOC de acuerdo a la mejor evidencia conocida, características demográficas acordes (como podría ser mayores a 60 años), que se atiendan en el Centro de Salud D de la Ciudad Autónoma de Buenos Aires durante 2017. Los criterios de exclusión podrían ser la negativa a participar o al proceso de consentimiento informado, hipersensibilidad conocida o sospechosa a la droga A o sus componentes, contraindicaciones para recibir A. A su vez podría restrin- gir mi estudio a no fumadores que vivan en la ciudad, cerca del centro de salud donde se realizará el estudio. Ser adherente habitual en la toma de medicación o estar cerca del centro donde se realiza el estudio son criterios que se suelen agregar a los criterios de exclu- sión del estudio con el fin de mejorar la eficiencia y disminuir la pérdida de los participantes. Este tipo de criterios de exclusión comprometen la forma en que la muestra representa la población blanco ¿Por qué? A su vez en ocasiones se restringe el grupo etario del estudio a una población poco mórbida donde los eventos graves como la muerte son extremadamente improbables, por ejemplo, Pacientes entre 60 y 75 años. Este tipo de restricción en la edad o las comorbilidades hace que luego los resultados no sean extrapo- lables a los pacientes muy ancianos o con comorbilidades. Ambos grupos son muy frecuentes en la práctica clínica cotidiana.
  • 23. 23 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Nunca los criterios de exclusión son la negativa de los criterios de inclusión. Los criterios de exclusión son las excepciones. Si un participante coincide con los criterios de inclusión, si presenta al menos un criterio de exclusión está excluido del estudio. Figura 3. En este ejemplo se muestra una descripción de criterios de inclusión y de exclusión: Spontaneous bacteremia and spontaneous bacterial peritonitis share similar prognosis in patients with cirrhosis: a cohort study.* Este es un resumen de los criterios detallados ampliados que se detallan en el protocolo del estudio.
  • 24. (
  • 25. ) ≥
  • 26.  
  • 27. 
  • 28.  
  • 30. € (
  • 31. )
  • 33.  * Marciano S, Dirchwolf M, Bermudez CS, Sobenko N, Haddad L, Genre Bert F, et al. Spontaneous bac- teremia and spontaneous bacterial peritonitis share similar prognosis in patients with cirrhosis: a cohort study. Hepatol Int. 2017; doi:10.1007/s12072-017-9837-7. Con permiso de los autores ¿En que parte se describe la muestra? Los individuos que forman parte de la muestra deben cumplir todos los criterios de inclusión y no tener ningún criterio de exclusión. Sólo se tiene una muestra cuando el estudio finaliza. La sección de resultados de un artículo científico em- pieza con un diagrama de flujo que presenta la población accesible y la muestra del estudio.[13,14] Asimismo también suele brindar información de la permanencia en el estudio. Tanto el ingreso como la permanencia en el estudio son funda- mentales para asegurar que la muestra representa la población blanco y evaluar la potencial presencia de sesgos de selección.
  • 34. 24 La descripción de la muestra se realiza en el análisis descriptivo de la misma sección resultados. Describir la muestra del estudio permite al lector conocer cuál es la verdadera población que se terminó incluyendo en el estudio. Esta información nos permite rápidamente saber si los resultados del estudio son extrapolables a la población sobre la cual quisiera aplicar los resultados. Si el estudio incluyó sólo pacientes EPOC entre 55 y 70 años sin comorbilida- des, y en la primer tabla del artículo todos tienen cerca de 60 años ¿a qué po- blación blanco son generalizables los resultados? ¿Puedo aplicar los resultados a mis pacientes de consultorio? ¿A cuáles? Figura 4. Este es un ejemplo de descripción en una tabla de los resul- tados del mismo artículo que presentamos anteriormente: Spontaneous bacteremia and spontaneous bacterial peritonitis share similar progno- sis in patients with cirrhosis: a cohort study.*
  • 35. ( ) (=) All variables collected at time of diagnosis of infection. All qualitative variables expressed an absolute numbers and percentages. All quantitative variables expressed as median and interquartile range (IQR) HCC hepatocellular carcinoma, INR international normalized ratio, SIRS systemic inflamatory response syndrome, MELD Model for End-Stage Liver Disease * Available in 125 patients. Age (years) Male gender Cirrhosis etiology Viral hepatitis Alcohol Autoimmune hepatitis Primary biliary cholangitis Other HCC Ascites Creatinine (mg/dL) Leukocyte count (x 103 /mm3 ) Total bilirubin (mg/dL) Serum albumin (g/dL) INR Serum sodium (mEq/L) SIRS* MELD score Child-Pugh score Variable 63 (53-69) 73 (58%) 39 (31%) 28 (22%) 16 (13%) 13 (10%) 30 (24%) 23 (18%) 106 (84%) 1.1 (0.8-1.6) 7.6 (5.0-10.1) 4.4 (2.1-7.6) 2.6 (2.2-2.9) 1.8 (1.5-2.2) 133 (129-137) 70 (56%) 20 (16-26) 10 (9-12) All (n=126) 62 (53-69) 42 (59%) 27 (38%) 15 (21%) 9 (13%) 5 (7%) 15 (21%) 12 (17%) 51 (72%) 1 (0.8-1.4) 7.3 (4.7-9.4) 3.8 (1.9-6.1) 2.6 (2-3) 1.8 (1.4-2.1) 134 (129-137) 38 (54%) 19 (14-25) 10 (9-12) Spontaneous bacteremia (n=71) 65 (51-69) 31 (56%) 12 (22%) 13 (24%) 7 (13%) 8 (15%) 15 (26%) 11 (20%) 55 (100%) 1.3 (0.8-1.9) 7.8 (5.6-12.1) 6.4 (3.1-9.0) 2.6 (2-3) 1.95 (1.6-2.8) 132 (127-136) 32 (58%) 24 (18-31) 11 (9-12) Spontaneous bacterial peritonitis (n=55) 0.83 0.75 0.17 0.65 0.001 0.041 0.24 0.003 0.74 0.03 0.10 0.66 0.001 0.34 * Marciano S, Dirchwolf M, Bermudez CS, Sobenko N, Haddad L, Genre Bert F, et al. Spontaneous bac- teremia and spontaneous bacterial peritonitis share similar prognosis in patients with cirrhosis: a cohort study. Hepatol Int. 2017; doi:10.1007/s12072-017-9837-7. Con permiso de los autores
  • 36. 25 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK ¿Cómo se toma una muestra? Se llama técnica de muestreo al método para seleccionar unidades de obser- vación a los fines de un estudio de investigación. En la investigación cualitativa, las técnicas de muestreo permiten seleccionar los participantes del estudio para representar la población blanco. Se dividen en técnicas probabilísticas y no pro- babilísticas. En un muestreo probabilístico, los individuos de la población accesible tienen una probabilidad conocida de estar en la muestra. Ejemplos de este tipo de muestreo son el muestreo probabilístico simple, el muestreo sistemático, el muestreo consecutivo, el muestreo por estratos y el muestreo por clusters. Al- gunos tipos de muestreo no probabilístico son el muestreo por conveniencia y el muestreo en bola de nieve. En la investigación cualitativa las muestras se toman de manera diferente. En este caso el objetivo de la muestra no es utilizar técnicas estadísticas para hacer inferencia sobre una población blanco, sino comprender un fenómeno. Por lo tanto, las unidades de observación se eligen específicamente por ser la mejor fuente del fenómeno bajo estudio, representando un punto de vista valioso y representativo a los ojos del investigador. La técnica de muestreo se define en base a las necesidades de la pregunta de investigación y aspectos técnicos como capacidad de evaluación de pacientes en el tiempo. Se describe en el protocolo y se sostiene a lo largo del estudio. Muchas de las técnicas más complejas requieren ajustes de la estimación de tamaño muestral o de los métodos estadísticos que se utilizarán en el estudio. ¿Cuáles son las diferencias entre los tipos de muestreo probabilístico? El muestreo aleatorio simple consiste en tomar al azar una muestra de una lista. Para este tipo de muestreo es necesario tener una lista de la población accesi- ble previamente para seleccionar los individuos. Es muy fácil de realizar, ya que se puede utilizar cualquier software que sea capaz de generar números aleato- rios como planillas de cálculos o paquetes de análisis estadísticos. Se dice que la probabilidad es conocida de pertenecer a la muestra aleatoria simple porque si debo tomar 50 pacientes de una población accesible de 500, la probabilidad de estar incluido en la muestra es 0,1 para cualquier individuo de la población accesible. Por el contrario si carezco de la lista completa, es necesario utilizar otras técni- cas que permiten tomar muestras aleatorias, aun en ausencia de la lista com- pleta de la población accesible, como el muestreo sistemático. El inicio debe ser aleatorio para que sea considerado como muestreo probabilístico. Este tipo de muestreo es particularmente útil si los individuos que forman parte de la población accesible van a incluirse en la población accesible en el tiempo. Los pacientes que van a requerir una colecistectomía o los pacientes que consultan a una central de emergencias de adultos son ejemplos de estas situaciones.
  • 37. 26 Si mi pregunta requiere tomar una muestra prospectiva de los pacientes que llegan a la guardia en un determinado período, puedo utilizar el muestreo siste- mático. Si mi probabilidad de inclusión es 0,1, quiere decir que incluiré 1 de cada 10 pacientes que consulten a la guardia. El muestreo sistemático requiere que en los pacientes ordenados por orden de llegada, incluiría el paciente número 10, el número 20, el número 30, etc. Es importante asegurarse que no exista periodicidad asociada a la frecuencia de muestreo. Si existiera alguna variable asociada a la periodicidad de la frecuencia de muestreo, podríamos cometer un sesgo al utilizar este tipo de muestreo. ¿Cómo elijo la frecuencia de muestreo? depende principalmente de la capaci- dad y recurso disponible para las evaluaciones. Si tengo recurso disponible para evaluar 1 de cada 5 pacientes que consultan, entonces es posible plantear una probabilidad de estar en la muestra de 0,2. ¿Qué pasa si tengo capacidad de incorporar 1 de cada 3? ¿o 1 de cada 2? Puedo tomar una frecuencia de mues- treo de 0,33 o de 0,5. En el mismo sentido, el muestreo consecutivo es un caso particular de muestreo probabilístico sistemático con relación 1 de 1. La frecuen- cia de muestreo sistemático se define previamente y no se cambia durante la implementación de un estudio. Se llama cluster o conglomerado a grupos naturales de individuos como pue- den ser los alumnos de una escuela. Por definición los individuos de un mismo cluster se parecen más entre sí, que con los individuos de otros clusters. Son ejemplos de cluster, los pacientes de un hospital, los pacientes de un médico de cabecera, entre otros. En el muestreo por clusters, se seleccionan al azar los clusters de unidades de observación y no los individuos en particular. Este tipo de muestreo, requiere utilizar tipos de análisis estadísticos que consideren el natural agrupamiento de las unidades de observación en esos clusters. Asi- mismo, requiere considerar esta estructura en clusters en el cálculo del tamaño muestral. En el muestreo estratificado, la probabilidad de estar en la muestra es fija por estratos. Por ejemplo: si me interesa tener 50% de hombres y 50% de muje- res en una muestra de una población accesible que tiene 500 hombres y 1000 mujeres, la probabilidad de ingresar al estudio en los hombres será 0,1 y en las mujeres 0,05. En algunos casos me interesa representar un determinado estrato que es de particular importancia para mi pregunta de investigación, pero que hay pocos individuos. Puedo utilizar un muestreo por estratos para asegurarme de incluir suficientes pacientes del estrato que me interesa en el estudio. En este tipo de muestreo, es necesario utilizar métodos estadísticos específicos para ponderar los estimadores muestrales por los tamaños de los estratos. Muchas encuestas, como La Encuesta Nacional de Examen de Salud y Nutrición (NHA- NES),[15] utilizan probabilidades de muestreo por estratos de zonas por ejemplo. Luego ponderan los resultados obtenidos en cada zona para estimar cómo se comporta un parámetro en toda la población.
  • 38. 27 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Se llama muestreo multietápico a todas las técnicas que combinan estos tipos de muestreo en diferentes etapas. Requieren ajustes del tamaño muestral y de los métodos estadísticos. En líneas generales, la técnica más simple será la más apropiada y la más fácil de diseñar, implementar y controlar su calidad. Para las técnicas más complejas, es una buena idea buscar ayuda de alguien con expe- riencia en el campo de muestreos complejos.
  • 39. 28
  • 40. 29 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK ¿Qué es un diseño? El diseño de un estudio es una estructura estándar con características predefi- nidas que se selecciona para responder una pregunta de investigación especí- fica. Es un componente principal de un estudio de investigación que determina aspectos fundamentales como el grado de evidencia a generar, fortalezas, de- bilidades, complejidad, factibilidad, calidad, costos, temporalidad, entre otros. Existe una gran variedad de diseños y clasificaciones. Nos enfocaremos sólo en los más importantes y sus aspectos principales. ¿Cómo se clasifican? Los diferentes diseños pueden clasificarse de diferentes maneras de acuerdo a distintos atributos. La importancia de la clasificación radica en conocer qué quiere decir que un determinado diseño caiga en una determinada categoría. Conocer las ventajas y desventajas de una categoría, permite que clasificar un diseño tenga sentido. Clasificar solo es útil si nos dice algo del comportamiento o las características del estudio. De acuerdo a sus características se pueden clasificar con respecto a la pregunta de investigación (descriptivos o analíticos), de acuerdo a las unidades de obser- vación (individuales o poblacionales), de acuerdo a la temporalidad (retrospecti- vos o prospectivos), de acuerdo a la naturaleza de la exposición (observaciona- les o experimentales). Figura 5. En este esquema se muestra una simplificación de la clasifica- ción de diseños más comunes. DISEÑOS Observacionales Experimentales Ensayos Clínicos Cuasiexperimentales Ecológicos Cortes transversales Casos y controles Cohortes DISEÑOS DE ESTUDIOS DE INVESTIGACIÓN 3
  • 41. 30 Con respecto a las unidades de observación Los diseños pueden clasificarse de acuerdo con las unidades de observación en individuales o poblacionales. Los estudios individuales son muchísimo más frecuentes. Se trata de cualquier estudio que realiza mediciones a nivel del individuo. En estos casos es posible conocer el valor de las mediciones de cada variable a nivel individual. Por ende va a ser posible clasificar a los individuos participantes de acuerdo al nivel de exposición y al nivel de variable de respuesta. La gran fortaleza es que para estimar asociaciones causales es necesario obtener mediciones individuales. En los estudios poblacionales, las unidades de observación son poblaciones. Típicamente las mediciones son frecuencias o tasas de exposición o de eventos. En este tipo de diseños no es posible saber si quien tuvo una determina expo- sición es el mismo individuo que tiene un determinado evento. Este fenómeno se llama falacia ecológica. Se clasifica habitualmente como un sesgo de infor- mación. Se presenta porque intentamos sacar conclusiones a nivel individual, utilizando mediciones agregadas en poblaciones en un nivel superior.[16] Si mi pregunta fuera ¿Cuál es la asociación entre el consumo de carne por per- sona y la tasa de cáncer colorrectal?, es posible obtener las tasas de consumo de carne por persona de todos los países de latinoamérica y la tasa de cáncer colorrectal de la misma manera. En ambos casos son datos disponibles, de fácil y rápido acceso y de bajo costo. Debido a que las mediciones se encuentran agregadas al nivel de la población, no es posible identificar si los individuos que más carne consumen son los que más probabilidad de desarrollar cáncer tienen. A su vez sólo podré sacar conclusiones a nivel de las poblaciones, con baja evidencia en sentido causal. Otro ejemplo de estudio con mediciones po- blacionales es Cancer incidence in adults living in the vicinity of nuclear power plants in France, based on data from the French Network of Cancer Registries.[17] Con respecto a la temporalidad Los diseños pueden clasificarse de acuerdo con la temporalidad en retrospec- tivos y prospectivos. La diferencia entre los estudios retrospectivos y prospec- tivos es el momento en el que ocurre la variable de resultado. Agregamos a esta clasificación los estudios de series temporales y los ambispectivos o retro prospectivos. En los estudios retrospectivos, la variable de resultado ya ocurrió en el momento que decidimos incluir a un individuo en el estudio. Es decir, al momento de incluir los individuos en el estudio, el evento de interés ya ocurrió o no. Los diseños más frecuentes que entran dentro de esta categoría son los cortes transversales y los casos y controles. Por ejemplo, en este estudio Geographic region: Does it matter in cutaneous melanoma of the head and neck? los autores utilizaron información retrospectiva para identificar y evaluar las características de los me- lanomas de manera retrospectiva.[18]
  • 42. 31 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Por ejemplo si mi pregunta es ¿existe asociación entre la exposición a asbestos y el desarrollo de cáncer de laringe? y decido estudiarlo incluyendo a pacientes con cáncer de laringe y controles sin cáncer de laringe, la naturaleza del estudio es retrospectiva. En estos casos las variables independientes se recuperan de la información disponible sobre exposiciones previas al desarrollo o no del evento. Esto puede generar que recordar las exposiciones o recuperar información de exposiciones previas sea potencialmente un problema. En los estudios prospectivos por definición, la inclusión de los participantes es previa a que ocurra el evento de interés. En este caso es posible medir las expo- siciones previamente al desarrollo de los eventos. Esta condición aporta fortale- za causal ya que la preexistencia de la exposición al evento de interés es una de los requisitos para evaluar asociaciones causales. Son típicamente prospectivos los estudios de cohorte prospectiva y los ensayos clínicos. En los estudios ambispectivos se incluyen pacientes retrospectivamente y pros- pectivamente a la vez. Este tipo de diseño se utiliza muchas veces, por ejemplo, para registros de enfermedades raras. En estos casos se consensúa un set de datos posible para los pacientes retrospectivos y los prospectivos. La principal dificultad es la heterogeneidad de la calidad y disponibilidad de la información. Un ejemplo de este tipo de estudios es Quality of Life in Patients with Osteopo- rotic Vertebral Compression Fractures.[19] Los estudios que utilizan bases de datos secundarias son por definición retros- pectivos. En este caso se utilizan bases de datos recolectadas con otro objetivo diferente de la investigación. Estas bases pueden ser administrativas, registros, datos rutinarios, etc. En este caso la información ya está recolectada y fue me- dida de acuerdo a otros objetivos. No es posible controlar o definir una forma estándar de medición dado que ya se realizaron. La información que no fue me- dida no estará disponible. A su vez, es común que presenten gran cantidad de datos perdidos y heterogeneidad en las mediciones. Estos problemas se solu- cionan con captura de información primaria, es decir un sistema de recolección de datos diseñado a los fines de la pregunta de investigación. Un ejemplo de es- tudio utilizando bases de datos secundarias es Do influenza and pneumococcal vaccines prevent community-acquired respiratory infections among older peo- ple with diabetes and does this vary by chronic kidney disease? A cohort study using electronic health records,[20] Otro ejemplo es Comparative effectiveness research using electronic health records: impacts of oral antidiabetic drugs on the development of chronic kidney disease.[21] Con respecto a la naturaleza de la exposición Con respecto a la naturaleza de la exposición, se puede clasificar los estudios en observacionales o experimentales. Adicionalmente, existen estudios quasi experimentales que son aquellos donde falta alguno de los componentes de los estudios experimentales como pueden
  • 43. 32 ser los diseños antes - después de una determinada intervención. Un ejemplo de este tipo de estudios es Evaluating influenza vaccination campaigns beyond coverage: a before-after study among health care workers.[22] En este estudio los autores evaluaron el efecto de una campaña educativa sobre los profesiona- les de salud, comparando antes y después de la implementación de la campaña. Los estudios observacionales son aquellos en que el investigador para contes- tar su pregunta de investigación sólo observa. Observar no es una actividad pasiva en este sentido, ya que implica observar lo que ocurre de manera activa y recuperar la información de manera estandarizada. El investigador no indica procedimientos adicionales sino que se limita a obtener información del cuidado habitual de los pacientes. Pueden existir variaciones en el cuidado, pero típica- mente no se le indican procedimientos o exposiciones adicionales. Está ampliamente documentado que los participantes de un estudio, modifican su comportamiento por el solo hecho de ser observados. Este cambio en el comportamiento en los participantes que se saben observados, se llama efecto Hawthorne.[23] Este efecto está presente en todos los estudios que involucren sujetos de investigación de manera prospectiva. En los estudios experimentales el investigador administra una exposición. Los estudios experimentales más comunes son los ensayos clínicos en los cuales el investigador administra la exposición bajo estudio. Esta administración de la ex- posición, sólo es posible con las exposiciones administrables. Es decir que no se podrá hacer estudios experimentales con exposiciones potencialmente dañinas (fumar, radiación o exposición a agroquímicos) o con exposiciones no adminis- trables (como polimorfismos genéticos o historia de interacciones sociales de un individuo). Algunos ejemplos de exposiciones administrables son tratamientos (farmacológicos o no), vacunas, métodos de diagnóstico, educación, entre otras. ¿Cuáles son los tipos de diseños más frecuentes? Los tipos más frecuentes de diseño son los ensayos clínicos, las cohortes, los estudios de casos y controles, los cortes transversales y los estudios ecológicos. A continuación presentaremos las características principales de cada uno de los diseños clásicos. ¿Cómo se define un ensayo clínico? En los ensayos clínicos el investigador evalúa el efecto sobre un evento, de una exposición administrada por el investigador. En sentido estricto son cohortes experimentales, donde el investigador administra una exposición y sigue a los participantes en el tiempo en busca de los que desarrollan un evento de interés. Son siempre experimentales y prospectivos. A su vez los ensayos clínicos pue- den ser aleatorios, controlados, y ciegos entre otros.
  • 44. 33 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK Pueden tener una o más ramas de exposición. Se llama ramas de exposición a los diferentes niveles de exposición, como por ejemplo dieta A o dieta B. Los ensayos clínicos con más de una rama son los más comunes y permiten obtener información de eficacia y seguridad de las intervenciones. La eficacia de una exposición es el efecto deseado o buscado. Por ejemplo: una medicación para el tratamiento de hipertensión es eficaz cuando controla adecuadamente la pre- sión de una población específica de pacientes hipertensos. La medicación es segura si el perfil de efectos adversos es apropiado para una determinada situa- ción clínica de una población específica. La relación entre eficacia y seguridad es un aspecto fundamental de cualquier ensayo clínico. Se llaman controlados a los ensayos clínicos que tienen más de una rama de exposición. Generalmente en estos casos, una de las ramas actúa como control. Las ventajas principales de los ensayos clínicos son la posibilidad de obtener información causal sobre la asociación entre la exposición bajo estudio y el evento de interés cuando es posible aleatorizar la exposición. Las principales desventajas son el costo y el tiempo de la implementación y la complejidad del diseño, implementación y control de calidad. Por ejemplo si mi pregunta es ¿El uso de una aplicación para smartphones (te- léfonos celulares móviles inteligentes) con estrategias de gamificación para el control del peso corporal, es más eficaz que el consejo médico habitual en adultos con obesidad? En este caso puedo plantear un ensayo clínico con dos ramas: una rama expuesta a la aplicación de smartphones y otra rama expuesta a consejo habitual de descenso de peso. Los participantes serán asignados al azar a una rama u otra del estudio. Los seguiremos en el tiempo por un período de 6 meses y compararemos el descenso de peso en ambos grupos. Si bien no son las publicaciones más frecuentes, existen muchos ejemplos en la literatura de ensayos clínicos. Como Assessment of the effectiveness of physical activity interventions in the Brazilian Unified Health System donde se asignaron adultos a diferentes intervenciones y se evaluó su efecto en el descenso de peso.[24] Se trata de un estudio experimental no aleatorizado. ¿Qué es el ciego o enmascaramiento? Los participantes que se saben tomando un placebo reportan menos efectos adversos aunque los sientan. Los participantes que se saben tomando un prin- cipio activo presentan más efectos adversos. Los participantes que se saben tomando un principio activo, que creen que es mejor, reportan mucha más efica- cia y bienestar que los participantes que toman una medicación que creen que es inferior. Esto representa un sesgo de información ya que los participantes reportan sistemáticamente diferente de acuerdo a en qué rama del estudio se encuentran. A su vez los médicos podrían preguntar diferente o seguir diferente o solicitar diferentes estudios o indicar medicación adicional a sus pacientes si saben la rama del estudio en la cual está un determinado participante.
  • 45. 34 El ciego o enmascaramiento es el ocultamiento de la rama de exposición a uno o más actores del estudio. Se puede ocultar al paciente, al médico, al evaluador, a quien realiza el análisis estadístico. Todos los actores podrían potencialmente estar afectados por su subjetividad, por lo cual se recomienda cegar siempre que sea técnica y éticamente posible. Es posible utilizar el ciego incluso en es- tudios observacionales donde pudieran existir sesgos de información relaciona- dos con la subjetividad. Los estudios no ciegos o abiertos se parecen más a la práctica clínica real, pero son mucho más susceptibles de sesgos de información por reporte diferencial de los pacientes o por recuperación de la información diferencial. A su vez son problemas frecuentes el uso diferencial de estudios de test diagnósticos o las cointervenciones de acuerdo a conocer en qué rama del estudio está un pacien- te. En muchos casos como los estudios incluidos en este metanálisis Efficacy and safety of insulin glargine compared to other interventions in younger and older adults: a pooled analysis of nine open-label, randomized controlled trials in pa- tients with type 2 diabetes, no es posible enmascarar las intervenciones.[25] ¿Qué efecto podría tener sobre los resultados que los pacientes conozcan su rama de intervención? Una desventaja del ciego es que aumenta la complejidad del estudio. Requiere el desarrollo de mecanismos para asegurar el ciego y mantenerlo durante todo el estudio. Así también requiere mecanismos de ruptura de ciego ante eventua- les necesidades clínicas. Por ejemplo si un paciente en un estudio consulta a la guardia con un dolor precordial, puede ser fundamental tener disponible un me- canismo para que los médicos que lo asistan tengan la posibilidad de conocer en qué rama del estudio está, para tomar acciones en el cuidado de emergencia del paciente. ¿Para qué sirve la asignación al azar de tratamiento? En los ensayos clínicos la exposición bajo estudio es administrada por el inves- tigador. Esta única posibilidad exclusiva de este diseño permite usar la aleatori- zación como herramienta para decidir quien recibe la exposición. Es decir, si mi pregunta fuera ¿es la droga A más eficaz que la droga B en el tratamiento de la hipertensión crónica en adultos? Al asignar al azar los participantes del estudio a recibir la droga A o la droga B, se eliminan las diferencias entre los grupos. Sólo es posible aleatorizar exposiciones administrables y cuando existe Equi- poise. Equipoise quiere decir que no se conoce que ninguna de las ramas del estudio sea más eficaz o más segura antes de iniciar el estudio.[26] Es decir, no hay evidencia a priori de eficacia y seguridad entre las ramas del estudio. En la práctica clínica múltiples factores intervienen en la decisión de iniciar un tratamiento y con qué principio activo. Se trata de un decisión activa en la cual participa el médico y el paciente decidiendo cual es el mejor tratamiento para la situación clínica particular. Esto hace que en la práctica clínica, los pacientes
  • 46. 35 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK que tomaron la droga A podrían ser diferentes a los que toman la droga B. Ima- ginemos que la droga B pudiera causar enfermedad coronaria, entonces existe la posibilidad que los médicos decidan dar la droga A a los pacientes con facto- res de riesgo coronario y no la droga B. Por esta razón, probablemente, ambos grupos no serían comparables por las diferencias en sus factores de riesgo co- nocidos y desconocidos. Este problema es una constante de los estudios ob- servacionales. Este fenómeno se llama confusión por indicación. La asignación aleatoria a droga A o droga B elimina el sesgo de confusión por indicación, ya que nadie elige quien recibe droga A o droga B, sino que se asigna a un grupo u otro aleatoriamente. Que ambos grupos sean similares en todas sus características con excepción de la exposición a A o B, podría enunciarse como que son intercambiables. La intercambiabilidad promedio es una propiedad de la causalidad que dice que los individuos que reciben la droga A, se hubieran comportado igual que los que reciben la droga B, si hubieran recibido droga B. Es decir, con respecto a su probabilidad de tener el evento condicional al tratamiento que recibieron, son intercambiables. La intercambiabilidad es la propiedad más importante de la causalidad y es exclusiva de los ensayos clínicos aleatorizados.[27] Si la aleatorización funciona, los dos grupos resultantes serán idénticos en todas sus características con excepción de que unos fueron expuestos a la droga A y otros a la droga B. La aleatorización es una estrategia para tratar confundidores que tiene el potencial de eliminar el efecto de los confundidores conocidos, los desconocidos e incluso los no medibles. Sólo funciona cuando el tamaño mues- tral es lo suficientemente grande. Algunos ejemplos de estudios aleatorizados son: A Bivalent Meningococcal B Vaccine in Adolescents and Young Adults,[28] Limited screening with versus without,(18) F-fluorodeoxyglucose PET/CT for occult malignancy in unprovoked venous thromboembolism: an open-label randomised controlled trial,[29] Primary isoniazid prophylaxis against tuberculosis in HIV-exposed children,[30] y Outco- mes of a Coaching-Based WHO Safe Childbirth Checklist Program in India.[31] En estos estudios se aleatorizaron diferentes exposiciones: una vacuna, diferentes estrategias diagnósticas, un preparado farmacéutico o una estrategia educativa, respectivamente. ¿Cómo se clasifican los ensayos clínicos? Los ensayos clínicos pueden clasificarse acuerdo a diferentes criterios. Por ejemplo, durante el desarrollo y evaluación de los fármacos nuevos se desarro- llan diferentes fases con diferentes objetivos, diseños y particularidades que se resumen en la siguiente tabla.
  • 47. 36 Fase Objetivo Individuos de estudio Fase preclínica Estudio de farmacocinética, diferentes tipos y niveles de toxicidad. Animales Fase I Datos incipientes de toxicidad, dosis máxima tolerada, vía de administración. Individuos sanos Fase II Actividad clínica y respuesta, dosis y frecuencia. Pacientes 100 Fase III Comparación de seguridad y eficacia; comparación con tratamiento conocido o placebo. 1000 pacientes Fase IV Farmacovigilancia, eficacia a largo plazo, efectividad, detección de efectos adversos raros. Población general una vez comercializado Los ensayos clínicos farmacológicos son los estudios experimentales clásicos que utilizan exposiciones farmacológicas. En estos estudios es común la compa- ración con otro principio activo o con un placebo. Dentro de los ensayos clínicos no farmacológicos se agrupan una gran cantidad de exposiciones diferentes no farmacológicas, como: quirúrgicas, tecnología, educativas, diagnósticas, con- ductuales, entre otros. Con respecto a las ramas del ensayo clínico, se puede dividir en estudios de ra- mas paralelas o cruzadas. En los primeros, la asignación a rama de intervención se mantiene constante durante todo el estudio. Por el contrario en los ensayos clínicos con ramas cruzadas, los participantes son asignados a una exposición y luego de un período de wash out, reciben la otra exposición del estudio. Este diseño sólo puede aplicarse a eventos de interés reversibles. Por ejemplo en este estudio se evaluó el efecto de 3 dietas diferentes sobre la presión arterial y el perfil lipídico en pacientes ambulatorios sanos Comparison of the DASH (Dietary Approaches to Stop Hypertension) diet and a higher-fat DASH diet on blood pressure and lipids and lipoproteins: a randomized controlled trial.[32] En este estudio de ramas cruzadas, todos los participantes recibieron las 3 dietas por 3 semanas, separadas por 2 semanas cada una. El orden en el que recibie- ron cada dieta fue al azar. Existe un subtipo de ensayo clínico denominado factorial. En este tipo de dise- ño, se estudia simultáneamente el efecto de 2 intervenciones diferentes y su combinación. Los diseños factoriales son muy eficientes para estudiar el efecto
  • 48. 37 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK de dos intervenciones en simultáneo. Por ejemplo en este estudio se evaluó el efecto de la dieta, el ejercicio o la combinación sobre el peso y su repercusión metabólica en mujeres obesas lactantes a través de un diseño factorial Diet and exercise interventions among overweight and obese lactating women: randomi- zed trial of effects on cardiovascular risk factors.[33] En los estudios de superioridad, el investigador cree que una de las dos ramas del ensayo clínico es superior a la otra. Por ejemplo, si interesa evaluar la efica- cia de un nuevo tratamiento para el control de la ansiedad versus placebo. Por el contrario es común que no sea ético dejar sin tratamiento a los participantes de un estudio de investigación ya que existen tratamientos disponibles de cono- cida eficacia. En ese contexto, cualquier nuevo tratamiento interesa demostrar que al menos no es inferior que los tratamientos de mejor cuidado recomen- dado disponible. Estos estudios se llaman estudios de no inferioridad y tienen particularidades en su diseño, tamaño muestral, análisis estadístico y métodos. Por ejemplo en este estudio se evaluó el uso de antibióticos profilácticos en la colecistectomía laparoscópica de bajo riesgo Antibiotic Prophylaxis in Laparos- copic Cholecystectomy: A Randomized Controlled Trial.[34] Si bien está plantea- do como un estudio de superioridad, impresiona que la pregunta del estudio es una pregunta de no inferioridad. ¿En qué se diferencian los ensayos clínicos pragmáticos de los clásicos? De acuerdo a su diseño específico se los puede clasificar en ensayos clínicos clásicos y pragmáticos. Los ensayos clínicos clásicos, de eficacia o tradicionales son situaciones muy artificiales donde se estudia la eficacia de una intervención sobre un determinado resultado. Los pacientes incluidos en el estudio se selec- cionan para ser similares, adherentes y tener baja probabilidad de abandonar el estudio. A su vez se incluye un determinado grupo etario que tenga baja frecuencia de eventos adversos y dentro de lo posible pocas comorbilidades adicionales. Los métodos de seguimiento de los participantes son intensivos, invasivos y muy diferentes de la práctica habitual. Los pacientes incluidos son muy parecidos entre sí. Esta situación maximiza la validez interna y la eficiencia del estudio, pero compromete la validez externa. Es fácil imaginarse lo difícil que es extrapolar los resultados de los estudios clíni- cos clásicos a la población de la práctica clínica habitual: en el consultorio los pa- cientes son cada vez más ancianos, son frecuentes las múltiples comorbilidades y tratamientos farmacológicos. Los pacientes reales no cumplen con las visitas ni son completamente adherentes. Las decisiones sobre tratamientos, estudios diagnósticos o conductas se discuten y consensúan entre el paciente, su equipo médico tratante y la familia. No siempre toman la medicación, cuando la toman, no siempre la toman bien ni de la misma manera. Son muy variables y diferentes entre sí y su seguimiento puede ser errático y personal. La efectividad es la medida de cómo funciona una determinada intervención en
  • 49. 38 un escenario más real y no tan artificial como son los ensayos clínicos clásicos. Estos estudios se llaman pragmáticos y son más parecidos a la práctica clínica habitual. Los pacientes son diferentes, con comorbilidades, similares a la prác- tica clínica habitual. El seguimiento es más parecido al seguimiento habitual de los pacientes en el mundo real. Si bien aportan información más parecida a lo que pasa en la realidad con las indicaciones de tratamiento, requieren tamaños muestrales mucho más grandes. Una herramienta apropiada para clasificar a los estudios en pragmáticos o clási- cos es el PRECIS-2 que permite asignar puntajes a la características del diseño para definir si se trata de un estudio pragmático o clásico.[35] La herramienta mide diferentes aspectos como elegibilidad, reclutamiento, seguimiento, flexibilidad, organización, seguimiento, eventos primarios y análisis. Con esta herramienta es posible clasificar los estudios en ensayos de eficacia o efectividad. ¿Cómo se define un estudio de cohorte? En los estudios de cohorte el investigador incluye los pacientes de acuerdo a su exposición y los sigue en el tiempo en busca de los participantes que desarro- llan eventos. Las cohortes implican un período de seguimiento para los partici- pantes. Pueden ser retrospectivas o prospectivas. Pueden tener una única rama o varias ramas de exposición diferente y permiten estimar riesgos. La medida natural de asociación es el riesgo relativo o la razón de tasas de incidencia. En las cohortes retrospectivas se incluyen los individuos en un momento hacia atrás en el tiempo y se los sigue retrospectivamente para identificar quienes de- sarrollaron el evento durante el tiempo de seguimiento. Las cohortes retrospec- tivas requieren recuperación de información retrospectiva que puede provenir de historias clínicas, historias clínicas electrónicas, otras bases de datos secun- darias. En las cohortes prospectivas se incluyen respectivamente los participan- tes y se los sigue en el tiempo hasta que desarrollan el evento. La pregunta ¿Cuál es la asociación entre el consumo de losartán y la mortali- dad en los pacientes EPOC? se podría construir una cohorte retrospectiva con pacientes que consumieron losartan en el futuro y pacientes que no consumie- ron losartán y seguirlos retrospectivamente para identificar los eventos de fa- llecimiento.[36] En este caso requerimos un registro de fármacos y de eventos de muerte. Otro ejemplo de cohorte retrospectiva es Do influenza and pneu- mococcal vaccines prevent community-acquired respiratory infections among older people with diabetes and does this vary by chronic kidney disease? A cohort study using electronic health records, que utilizó historias clínicas electró- nicas[20] . Otro ejemplo adicional es la cohorte prospectiva más famosa: el estudio de Framingham.[37] Por el contrario la pregunta ¿El aprendizaje basado en problemas se asocia a conocimiento más duradero en estudiantes de medicina? podría contestarse con una cohorte retrospectiva de estudiantes de 2 universidades una que utiliza
  • 50. 39 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK aprendizaje tradicional y otra basado en problemas y seguirlos en el tiempo. En este caso, es posible que se requiera captura primaria de información no dis- ponible previamente. Otro ejemplo de estudio de cohorte retrospectiva es The incidence of venous thromboembolism in patients with overt hyperthyroidism: a retrospective multicentre cohort study.[38] Las cohortes a su vez pueden ser cerradas o abiertas. Las cohortes cerradas implican el mismo tiempo de seguimiento para todos los individuos pertene- cientes a la cohorte. En cambio en las cohortes abiertas o dinámicas los tiempos de seguimiento pueden ser diferentes para los distintos participantes. En este caso se deberán usar los métodos estadísticos apropiados para las cohortes dinámicas o métodos para datos censurados (ver más adelante Métodos para datos censurados). Las cohortes son eficientes para exposiciones infrecuentes. También permiten estudiar más de un evento simultáneamente. Permiten medir las exposiciones antes que los eventos, asegurando así la preexistencia de las exposiciones a los eventos. La relación temporal es uno de los criterios de causalidad postulados por Bradford Hill para identificar asociaciones causales,[7,8] por lo cual aportan mayor información con fortaleza causal. Las principales desventajas de las cohortes prospectivas son la dificultad en su implementación, el costo y tiempo que requiere para completarse. La principal desventaja de las cohortes retrospectivas es la validez de la información y la calidad de las mediciones y registros retrospectivos. Por ejemplo, las historias clínicas pueden registrar información muy incompleta. A su vez es imposible estandarizar como se tomó la información o como se evaluaron los pacientes de manera retrospectiva. ¿Cómo se define un estudio de casos y controles? En los estudios de casos y controles, los participantes se incluyen por haber tenido un evento (casos) o por no haberlo tenido (controles). En este caso se busca retrospectivamente recuperar información sobre su exposición previa a la ocurrencia del evento. En los estudios de casos y controles no se puede estimar riesgos, pero si odds. La natural medida de asociación de los estudios de casos y controles el es odds ratio (OR, ver más adelante Variables, medidas de resu- men y medidas de asociación). Debido a que en general los casos son escasos, se puede incrementar el ta- maño de los controles ganando poder adicional para detectar diferencias que verdaderamente existen. En el caso más común se mantiene igual tamaño para casos y controles, pero puede incrementarse el tamaño de los controles hasta 5 veces y se sigue ganando poder adicional. Más allá de 1 caso por cada 5 contro- les, no se gana poder adicional. Esta misma estrategia puede aplicarse a otros diseños como ensayos clínicos o cohortes, variando el tamaño relativo de las ramas de exposición o de los grupos de exposición, respectivamente.
  • 51. 40 Los casos y controles pueden estar anidados en cohortes. El casos y controles anidado en una cohorte tiene mayor calidad ya que permite recuperar infor- mación de mejor calidad con respecto a las exposiciones. Asimismo, permite determinar la preexistencia de la exposición al evento. Por ejemplo, si mi pregunta es ¿un determinado polimorfismo de un gen es- pecífico predispone a melanoma? es posible identificar casos de melanoma y seleccionar controles de población general del mismo sexo y edad utilizando un diseño de casos y controles. Otro ejemplo de estudio de casos y controles es Risk factors for infection following prostate biopsy - a case control study.[39] Estos estudios son muy eficientes para el estudio de eventos raros (casos poco frecuentes) y permiten estudiar varias exposiciones al mismo tiempo. La gran restricción es la incapacidad para medir algunas exposiciones por falta de in- formación. A su vez el desafío más grande de los estudios de casos y controles es asegurar que tanto casos como controles provienen de la misma población. ¿Qué es el matcheo? ¿Para qué sirve? El matcheo o apareamiento es una técnica para controlar el efecto de confun- didores. Si decido matchear por sexo y edad por ejemplo, es porque son con- fundidores importantes y deseamos controlar su efecto. En este caso, por cada caso de sexo femenino de 30 años, deberíamos incluir un control sexo femenino y de la misma edad. De esta manera al matchear los controles con los casos, nos aseguramos que los casos y los controles son iguales en su proporción de sexo femenino y en la edad. El matcheo requerirá métodos estadísticos específicos para datos apareados ya que los casos y los controles matcheados dejan de ser independientes entre sí. El matcheo no va a permitir comparar el sexo ni la edad entre casos y controles ya que nos ocupamos de que sean iguales. A su vez, puede no ser suficiente y persistir confusión residual. En este caso se deberá posteriormente ajustar el efecto de la confusión residual con otro método como análisis multivariado. Si bien no es una estrategia excluyente de los estudios de casos y controles, es frecuente su uso en este diseño. Un ejemplo de matcheo en un estudio de casos y controles es A case-control study of the risk of cutaneous melanoma as- sociated with three selenium exposure indicators.[40] Un ejemplo de una cohorte en la que matchearon por propensity score es Concurrent Chemoradiothera- py in Curatively Resected Gallbladder Carcinoma: A Propensity Score-Matched Analysis.[41] ¿Cómo se define un estudio de corte transversal? En los estudios de cohorte transversal, se seleccionaron participantes por per- tenecer a una población específica. Son siempre retrospectivos, pueden ser descriptivos o analiticos. La natural medida de frecuencia en este caso es la prevalencia y la medida de asociación la razón de prevalencias.
  • 52. 41 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK En este tipo de estudio, se realizan las mediciones de eventos y exposiciones en el mismo momento del tiempo. Esto no quiere decir que ocurre exactamente en el mismo día, quiere decir que se trata del mismo momento conceptual para to- dos los participantes. Por ejemplo si me interesa responder ¿Cuál es la prevalen- cia de colonización por pseudomonas multirresistentes en pacientes de terapia intensiva a los 7 días de ingreso a la terapia? o ¿Cuál es la prevalencia de dolor a las 24 horas post cirugía de cadera? Son preguntas referidas a un momento conceptual específico y no a un momento calendario específico. Los estudios de corte transversal son susceptibles a la presencia de causalidad reversa, ya que no es posible en la mayoría de las exposiciones, definir con claridad la preexistencia de una exposición en particular con respecto a un de- terminado evento. La gran ventaja de este tipo de estudio es la simpleza y facilidad de su diseño e implementación. Los estudios de corte transversal generan escasa información causal, pero permiten evaluar múltiples asociaciones a la vez. Este estudio re- presenta un ejemplo de corte trasversal analítico donde se identificaron factores asocados a calidad de vida Factors associated with health-related quality of life among overweight or obese adults.[42] ¿Cómo se define un estudio ecológico? Los estudios ecológicos son poblacionales por definición. En estos estudios las unidades de observación están medidas en niveles de poblaciones y no de in- dividuos. Es natural presentar la asociación de las tasas como coeficientes de correlación o aplicar modelos de regresión a situaciones más complejas. Es el diseño más apropiado cuando una determinada exposición varía natural- mente entre las poblaciones o cuando el efecto de una exposición ocurre a nivel de la población como las campañas de vacunación. En este estudio se evaluó la pregunta ¿existe asociación entre la exposición a arsénico en el agua y el de- sarrollo de cáncer de próstata? Arsenic in drinking water and prostate cancer in Illinois counties: An ecologic study.[43] Como todos los estudios ecológicos, está sujeto al fenómeno de falacia ecoló- gica. La falacia ecológica se clasifica como un sesgo de información en el cual la exposición y el efecto no se miden en el mismo nivel que me interesa hacer inferencia.[16,44] No se puede asegurar que exista una relación causal a nivel indi- vidual ya que no contamos con información individual del grado de exposición a arsénico de los individuos que desarrollaron cáncer y los que no. Es decir, no se puede saber si esta asociación se sostiene a nivel individual. Este diseño se utiliza ampliamente en la salud pública para la toma de decisio- nes y para medir el impacto de las políticas en salud sobre indicadores agrega- dos poblacionales. En este ejemplo se evaluó el efecto de la vacunación para rotavirus sobre la tasa de internaciones de niños menores a 5 años Impact of Rotavirus Vaccination in Germany, utilizando información agregada poblacio-
  • 53. 42 nal[45] . En el estudio de las campañas de vacunación, parte del efecto se produce a nivel poblacional ya que una población con mayor porcentaje de individuos vacunados se resiste al contagio entre las personas (efecto manada o inmuni- dad de grupo).[46] La gran ventaja de los diseños ecológicos es su facilidad de implementación y bajo costo, ya que los datos son en general recolectados por sistemas de datos rutinarios. La desventaja más grande es que son los estudios que aportan menor fortaleza en sentido causal. Tienen un enorme valor en la generación de infor- mación para salud pública y gestión de salud. ¿Cúal es el mejor diseño? Si bien es común ordenar los diseños por el grado de evidencia que son capa- ces de generar. Es interesante resaltar que la clasificación de la evidencia de- pende del grado de fortaleza causal que se puede generar con un determinado tipo de estudio. Los ensayos clínicos aleatorizados son los que generan mayor evidencia causal, pero no todas las preguntas pueden contestarse con ensayos clínicos. No existe un diseño único para contestar todas las preguntas. Cada pre- gunta tiene un mejor diseño para contestarla. El diseño más apropiado depende de la pregunta de investigación. Por ejemplo ¿Cuál es la prevalencia de esclerosis múltiple en las poblaciones urbanas de Argentina? es una pregunta que se contesta con un estudio de corte transversal o de prevalencia. ¿Cuál es el efecto de una campaña de vacunación antigripal sobre las inter- naciones por neumonía en una determinada población? Es una pregunta que podría contestarse apropiadamente con un estudio de intervención poblacional antes y después de la implementación de la campaña. Si mi interés como investigador es generar y validar un instrumento pronósti- co para identificar los individuos con EPOC que tengan mayor probabilidad de morir o internarse en un año luego de una internación, probablemente el mejor diseño sea una cohorte prospectiva. Pero se podría contestar apropiadamente con una cohorte retrospectiva. Si mi pregunta fuera ¿el consumo crónico de estatinas mejora las interacciones de los pacientes con enfermedades autoinmunes? probablemente requeriría un ensayo clínico aleatorizado para su respuesta. Sin embargo, se podría aproximar a través de una cohorte retrospectiva. También podría contestarse con un estu- dio de casos y controles. Cada aproximación tendrá sus ventajas y desventajas. Si pensamos en la pregunta ¿la circuncisión reduce la transmisión del HIV? ¿Cuantas formas hay de contestarla? ¿Qué ventajas y que desventajas tendría cada diseño seleccionado para contestarla?
  • 54. 43 MERCK INVESTIGA - BIOESTADÍSTICA HANDBOOK VARIABLES, MEDIDAS DE RESUMEN Y MEDIDAS DE ASOCIACIÓN 4 ¿Qué son las variables? Se podría definir las variables como toda porción de la realidad que puede ser medida. Se llama variable a cualquier aspecto que es posible conceptualizar y potencialmente podría tomar valores diferentes entre individuos o unidades de observación. Con el instrumento apropiado se puede medir cualquier aspecto de la realidad: fisiológicas, medicación, sociales, demográficas, comportamien- tos, genéticas, fisiopatológicas, culturales, económicas, entre muchas otras. Algunos ejemplos de variables son el sexo que puede tomar valores masculino y femenino. El género comprendido como identidad sexual en relación con la sociedad y la cultura, puede aproximarse con escalas diferentes y puede tomar diferentes valores en un determinado espectro, existiendo diferentes formas para medir y representarlo. La edad, la presión arterial, el consumo de una de- terminada medicación, su dosis, la presencia o ausencia de una enfermedad como la colitis ulcerosa, la exposición a un tóxico como la radiación ambiental, el nivel socioeconómico, el antecedente familiar de depresión, la calidad de vida, la zona de residencia, el tiempo al infarto o la muerte son algunos ejemplos de variables. Cuando una herramienta mide apropiadamente el concepto de interés en un determinado contexto, se dice que está validada. Se llama validación de un ins- trumento de medición, al proceso de acumulación de evidencia sobre la capaci- dad de un instrumento para representar un concepto de interés. Por ejemplo, la depresión es un constructo no medible directamente. Es un concepto que sirve para tomar conductas y creemos corresponde a un estado psicológico de rele- vancia. Algunos instrumentos para la medición de depresión son Beck Depres- sion Inventory,[47] Hamilton Rating Scale for Depression[48] y Montgomery Asberg depression Rating Scale.[49] Cada una de estas escalas tiene sus propiedades particulares para la medición y representación del concepto depresión. En un determinado estudio, al seleccionar la población blanco sobre la que se generalizarán los resultados, se utilizan variables. Los criterios de selección son variables en el mundo real, que fijo para delimitar la población blanco de mi es- tudio. De esta manera, en mi estudio estas variables pasan a ser constantes. Por
  • 55. 44 ejemplo, si un estudio incluirá pacientes mayores a 65 años con infarto agudo de miocardio de Argentina, las variables edad mayor de 65 (Sí) , infarto agudo de miocardio (Sí) y país de origen (Argentina) pasan a ser constantes. ¿Cómo se clasifican las variables? Las variables se pueden clasificar de diferentes maneras. Habitualmente se las clasifica de acuerdo a la naturaleza de la información que contiene en dos gran- des grupos: cuantitativas y categóricas. Las variables cuantitativas representan números verdaderos. Que sean números implica que las operaciones matemáticas tienen sentido usando las variables cuantitativas. A su vez pueden clasificarse en variables cuantitativas continuas y las discretas. Las cuantitativas continuas son las variables en las cuales todo valor entre dos mediciones tiene sentido. Por ejemplo, la altura, el peso, la presión arterial y cualquier medida de tiempo. Las fracciones tienen sentido y tanta importancia como los números enteros. Un individuo puede medir 1,7 y otro 1,8. Medir 1,75 es posible y tiene sentido. A su vez entre 1,7 y 1,75, está el 1,725. Todos estos núme- ros tienen una interpretación natural, son posibles y tienen sentido. Las variables cuantitativas discretas son aquellas variables en las cuales sólo tie- nen sentido los números enteros. Corresponden a las cuentas de cosas, como cantidad de hijos o cantidad de eventos de infarto que tuvo un individuo duran- te su seguimiento. El aumento de una unidad es siempre igual y homogéneo: para pasar de 1 a 2 hijos, es necesario agregar la misma cantidad de hijos, que para pasar de 3 a 4 hijos. Nadie tiene 2 infartos y medio ni 1,333... hijos. Si bien las fracciones no tienen sentido, en muchas ocasiones se suelen tratar como variables continuas a los fines prácticos. En muchas ocasiones las variables con- tinuas se discretizan debido a la resolución de la herramienta de medición. Por ejemplo, muchas veces en las mediciones de tiempo que es naturalmente con- tinua, se suelen discretizar por ejemplo, en días u horas de acuerdo al problema bajo estudio. Las variables categóricas son aquellas que corresponden a categorías exhaus- tivas y mutuamente excluyentes. Los individuos se clasifican en categorías. Es- tas categorías pueden codificarse utilizando números. Esto facilita el análisis de muchos de los paquetes estadísticos. Estos números equivalentes a los códigos de las categorías no son números en realidad sino códigos numéricos que iden- tifican las categorías. Las operaciones matemáticas con estos códigos no tienen sentido. Se dividen en ordinales y nominales. Las variables categóricas ordinales son las que las categorías tienen un orden natural. Suelen representar una variable continua atrás no observable. Los es- cores y escalas corresponden a esta categoría. Como el score de Charlson que representa el grado de comorbilidad de un paciente. Un charlson de 2 tiene más comorbilidad que un score de 1. A su vez un score de 5 es mayor que un score