Este documento describe los 6 pasos necesarios para elaborar un Critically Appraised Topic (CAT) en radiología. Estos pasos incluyen: 1) formular una pregunta clínica siguiendo la estrategia PICO, 2) realizar una búsqueda bibliográfica sistemática utilizando descriptores clave y bases de datos, 3) seleccionar los artículos con los niveles de evidencia más altos, 4) realizar una lectura crítica de los artículos seleccionados, 5) aplicar las conclusiones al contexto clínico, y 6) gener
La radiografía de tórax se considera la técnica de elección en el estudio inicial de la patología cardiaca. Se debe realizar una valoración no sólo de la silueta cardiaca, sino también de la vascularización e intersticio pulmonar y de los grandes vasos. Se recomienda realizar dos proyecciones: posteroanterior (PA) y lateral.
ntestino delgado—Los músculos del intestino delgado mezclan los alimentos con jugos digestivos del páncreas, hígado e intestino y empujan la mezcla hacia adelante para continuar el proceso de digestión. Las paredes del intestino delgado absorben el agua y los nutrientes digeridos incorporándolos al torrente sanguíneo. A medida que continúa la peristalsis, los productos de desecho del proceso digestivo pasan al intestino grueso.
La radiografía de tórax se considera la técnica de elección en el estudio inicial de la patología cardiaca. Se debe realizar una valoración no sólo de la silueta cardiaca, sino también de la vascularización e intersticio pulmonar y de los grandes vasos. Se recomienda realizar dos proyecciones: posteroanterior (PA) y lateral.
ntestino delgado—Los músculos del intestino delgado mezclan los alimentos con jugos digestivos del páncreas, hígado e intestino y empujan la mezcla hacia adelante para continuar el proceso de digestión. Las paredes del intestino delgado absorben el agua y los nutrientes digeridos incorporándolos al torrente sanguíneo. A medida que continúa la peristalsis, los productos de desecho del proceso digestivo pasan al intestino grueso.
La radiografía básica de abdomen sigue siendo hoy en día una técnica de imagen útil, nos ayuda en el manejo diagnóstico del paciente y, en ocasiones, nos permite llegar al diagnóstico sin necesidad de realizar más pruebas complementarias. La escasa rentabilidad diagnóstica de la radiografía de abdomen en patología urgente contrasta con el elevado número de exploraciones que se realizan. Los médicos de atención primaria y de urgencias deben conocer las importantes limitaciones de la radiografía de abdomen en el manejo diagnóstico de la patología abdominal aguda y restringir su empleo. Para ello, es imprescindible una adecuada selección clínica de los pacientes candidatos a estudio de imagen, que permite un empleo ágil de técnicas alternativas más rentables como la ecografía o la tomografía computarizada.
Su nombre(del latín glandem 'bellota', ulam 'pequeño' y del griego antiguo θυρεοειδής 'en forma de escudo'). Pesa entre 15 y 30 gramos.
Tiene la forma de una mariposa, de color gris rosada y está compuesta por dos lóbulos que asemejan las alas de una mariposa, un lóbulo derecho y un lóbulo izquierdo conectados por el istmo. La glándula está situada en la parte frontal del cuello a la altura de las vértebras C5 y T1, junto al cartílago tiroides, yace sobre la tráquea que rodea hasta alcanzar posteriormente al esófago y está cubierta por la musculatura pretiroidea, el músculo platisma del cuello, el tejido subcutáneo y la piel. Durante el proceso de la deglución, la glándula tiroides se mueve, perdiendo su relación con las vértebras.
La radiografía básica de abdomen sigue siendo hoy en día una técnica de imagen útil, nos ayuda en el manejo diagnóstico del paciente y, en ocasiones, nos permite llegar al diagnóstico sin necesidad de realizar más pruebas complementarias. La escasa rentabilidad diagnóstica de la radiografía de abdomen en patología urgente contrasta con el elevado número de exploraciones que se realizan. Los médicos de atención primaria y de urgencias deben conocer las importantes limitaciones de la radiografía de abdomen en el manejo diagnóstico de la patología abdominal aguda y restringir su empleo. Para ello, es imprescindible una adecuada selección clínica de los pacientes candidatos a estudio de imagen, que permite un empleo ágil de técnicas alternativas más rentables como la ecografía o la tomografía computarizada.
Su nombre(del latín glandem 'bellota', ulam 'pequeño' y del griego antiguo θυρεοειδής 'en forma de escudo'). Pesa entre 15 y 30 gramos.
Tiene la forma de una mariposa, de color gris rosada y está compuesta por dos lóbulos que asemejan las alas de una mariposa, un lóbulo derecho y un lóbulo izquierdo conectados por el istmo. La glándula está situada en la parte frontal del cuello a la altura de las vértebras C5 y T1, junto al cartílago tiroides, yace sobre la tráquea que rodea hasta alcanzar posteriormente al esófago y está cubierta por la musculatura pretiroidea, el músculo platisma del cuello, el tejido subcutáneo y la piel. Durante el proceso de la deglución, la glándula tiroides se mueve, perdiendo su relación con las vértebras.
La mycoplasmosis aviar es una enfermedad contagiosa de las aves causada por bacterias del género Mycoplasma. Esencialmente, afecta a aves como pollos, pavos y otras aves de corral, causando importantes pérdidas económicas en la industria avícola debido a la disminución en la producción de huevos y carne, así como a la mortalidad.
3. Los
6
pasos
necesarios
para
elaborar
Critically
Appraised
Topics
453
Tabla 1 Ejemplos de preguntas siguiendo la estrategia PICO
Pregunta clínica Formulación de la pregunta Paciente o
problema (P)
Intervención (I) Comparación con el
estándar de referencia (C)
Outcome (O)
¿Qué prueba es mejor para el
diagnóstico de litiasis renal? ¿La
urografía intravenosa o el TC sin
contraste?3
En pacientes con sospecha
de litiasis renal ¿la TC sin
contraste es superior a la
urografía intravenosa para
su diagnóstico?
Pacientes con
sospecha de
litiasis de tracto
urinario
TC sin contraste Urografía intravenosa Agudeza diagnóstica
(sensibilidad y
especificidad)
¿Es útil la radiografía convencional
de tórax en la detección precoz
de cáncer de pulmón?4
En pacientes fumadores ¿es
útil la radiografía de tórax
en el diagnóstico de cáncer
de pulmón?
Pacientes
fumadores
Radiografía
convencional de
tórax
Tasa de mortalidad
por cáncer de pulmón
¿Sería muy caro realizar una
ecografía abdominal para
excluir el aneurisma de aorta?5
En pacientes asintomáticos
¿es la ecografía abdominal
una estrategia
costo-efectiva para excluir
el aneurisma de aorta
abdominal?
Pacientes mayores
de 60 años,
asintomáticos
Ecografía-doppler
abdominal
Costes
Tasa de mortalidad
por aneurisma de
aorta
¿Radiofrecuencia (RF) o cirugía en
las metástasis hepáticas?6
En pacientes con metástasis
hepáticas de carcinoma de
colon, ¿es mejor la RF o la
resección quirúrgica?
Pacientes con
metástasis
hepáticas de
carcinoma
colorrectal
RF Resección quirúrgica Índice de recidiva
anual o tasa de
mortalidad
¿Qué efectos secundarios pueden
derivar de una TC torácica en
mujeres gestantes?
En mujeres gestantes ¿se
puede hacer una TC
torácica si hay sospecha
alta de tromboembolismo
pulmonar?
Mujeres gestantes
con sospecha alta
de
tromboembolismo
pulmonar
TC torácico Tasa de
malformaciones o
muertes fetales
¿Qué fiabilidad tiene el diámetro
del apéndice cecal para el
diagnóstico de apendicitis
aguda?
En la sospecha de
apendicitis aguda ¿es útil el
diámetro del apéndice
cecal mediante ultrasonidos
para su diagnóstico?
Pacientes con
sospecha clínica
de apendicitis
aguda
Ultrasonidos:
diámetro del
apéndice cecal
Anatomía patológica Agudeza diagnóstica:
sensibilidad y
especificidad
PICO: Patient Intervention Comparation Outcome.
4. 454
C.
García
Villar
Tabla 2 Ejemplos de traducción de preguntas a términos de búsqueda
Pregunta PICO Paciente o
problema
OB Intervención OB Comparación OB Outcomes
¿Es mejor la TC sin contraste que la urografía
intravenosa para detectar cálculos
urinarios?3
Urinary calculi AND Tomography, x-ray
computed OR
Multidetector
Computed
Tomography OR
tomography, spiral
computed
AND Urography AND Diagnosis OR
sensitivity and
specificity
¿Se debe realizar radiografía simple de tórax
en pacientes fumadores para cribar el
cáncer de pulmón?4
Smoking AND lung
cancer AND mass
screening OR early
detection of
cancer
AND Radiography AND Mortality
¿Es una estrategia costo-efectiva realizar una
ecografía abdominal para excluir un
aneurisma de aorta abdominal (AAA)?5
Aortic aneurysm,
abdominal
AND Ultrasonography AND Costs and cost
analysis
¿Cuánto más efectiva es la radiofrecuencia que
la cirugía en pacientes con metástasis
hepáticas de carcinoma de colon?6
Liver neoplasm OR
liver neo-
plasm/secondary
AND Catheter ablation AND Liver neo-
plasm/surgery
AND Complications OR
efficacy OR
recurrence OR
mortality
¿Es la TC segura de realizar en mujeres
gestantes con sospecha alta de
tromboembolismo pulmonar?
Pulmonary
embolism AND
Pregnant women
AND Tomography, x-ray
computed OR
Multidetector
Computed
Tomography
AND Fetal development
OR fetal mortality
¿Qué agudeza diagnóstica tiene el diámetro
del apéndice cecal por ultrasonidos en el
diagnóstico de apendicitis aguda?
Appendicitis AND Ultrasonography AND Pathology AND Diagnosis OR
sensitivity and
specificity
PICO: Patient Intervention Comparation Outcome.
5. Los 6 pasos necesarios para elaborar Critically Appraised Topics 455
Un instrumento que nos puede resultar útil es el sitio web
HONselect11
. Se trata de un catálogo de términos médicos
y un integrador de búsqueda que recupera dichos térmi-
nos. Incluye además un verificador ortográfico, que ayuda
a seleccionar la palabra correcta en caso de duda. También
hay que conocer cómo usar los operadores boleanos (OB)
(AND, OR, NOT), que permiten combinar las diferentes par-
tes de nuestra pregunta PICO para que todos sus términos
queden integrados (tabla 2). Si tras introducir las palabras
clave y los OB no encontramos ninguna referencia, hay que
probar a ser menos restrictivos. Por ejemplo, si se quiere
responder a la pregunta sobre la detección precoz de cán-
cer de pulmón que figura en la tabla 2, no se obtiene ningún
resultado al buscar por los términos exactos en la base de
datos de PUBlic MEDline (PubMed). Este hecho puede expli-
carse porque al introducir el artículo, se ha pasado por
alto alguno de los términos principales que se han incluido
en la búsqueda. En un segundo intento, incluyendo úni-
camente los términos «screening» AND «lung cancer» AND
«radiography», sí aparecen artículos relevantes.
Planificación de la búsqueda: dónde buscar
Para jerarquizar la información y facilitar una búsqueda sis-
temática, Haynes creó en 2001 la pirámide de la evidencia12
que inicialmente contaba con 4 niveles y que posterior-
mente ha evolucionado hasta 613
(fig. 1)14
. La base de la
pirámide la constituyen los estudios originales (ensayos clí-
nicos, estudios de cohortes, estudios caso-control y estudios
longitudinales). Cuanto más alto sea el escalón, más válido
será el documento y más relevantes sus conclusiones.
A) Bases de datos de estudios originales
A.1. PUBlic MEDline Central. Depende de la National
Library of Medicine (NLM) de los Estados Unidos de
América15
, que incluye entre otras la base de datos MEDlars
on LINE (MEDLINE) de la que depende PUBlic MEDline Cen-
tral (PubMed). Contiene el tesauro más conocido y usado en
ciencias de la salud (términos Medical Subject Headings -
-
-
MeSH). El formulario de búsqueda aparece en la página de
inicio, donde se debe introducir el término que se quiere
buscar, ya sea genérico o específico, en el casillero princi-
pal. Se pueden combinar varios términos mediante los OB.
También se puede concretar nuestra búsqueda utilizando los
límites (limits) que aparecen en el margen izquierdo.
A.2. Excerpta Medica dataBASE. Excerpta Medica data-
BASE (EMBASE)16
está editada por la Fundación Internacional
Excerpta Medica y es propiedad de Elsevier Science en los
Países Bajos. Es la segunda base de datos más grande. Tam-
bién contiene un tesauro y permite buscar términos, solos o
combinados, mediante OB. A diferencia de PubMed, EMBASE
no tiene acceso libre17
.
A.3. Google Scholar18
. Se creó en el 2004 como una divi-
sión de Google especializada en buscar e identificar material
bibliográfico publicado de carácter científico y académico.
Una limitación es que no tiene Thesaurus, y es compli-
cado delimitar sus resultados. Además de artículos, en su
búsqueda utiliza otras fuentes como libros de texto, resú-
menes de congresos y tesis. Esto hace que los resultados
encontrados puedan ser diferentes de los que localizamos
a través de PubMed, por lo que ambos buscadores pueden
usarse de forma combinada19
.
B. Fuentes secundarias
Los conceptos «fuentes secundarias» y «publicaciones
secundarias» son diferentes. Publicaciones secundarias son
los estudios de síntesis (revisiones sistemáticas y metaa-
nálisis), que resumen y sintetizan resultados de múltiples
investigaciones primarias basados en una pregunta especí-
fica. En la pirámide de Haynes, la evidencia de estos estudios
es superior a la de los estudios originales, que se incluyen
tanto en bases de datos de artículos originales (ya que son
publicados en revistas y aportan conclusiones diferentes)
como en fuentes secundarias como la Cochrane Library20
.
Fuentes secundarias son las publicaciones que revisan
revistas tradicionales evaluando los artículos publicados y
seleccionando los que tienen mayor relevancia científica.
Se componen de un resumen estructurado y del comenta-
rio de un experto. El ACP Journal Club21
y Evidence-Based
Medicine22
son las 2 revistas pioneras en publicaciones
secundarias. En la tabla 3 se resumen las diferentes fuentes
secundarias, con ejemplos de cada una de ellas20-
-
-31
.
Al elaborar un CAT hay que buscar la información
siguiendo la pirámide de Haynes. Debe diferenciarse un CAT
práctico (para resolver una duda puntual lo más rápida-
mente posible) de escribir un CAT para publicar. Ante la
pregunta urgente: ¿qué prueba es mejor para confirmar un
tromboembolismo pulmonar, una TC o una gammagrafía de
perfusión? se necesita una respuesta rápida. La búsqueda
debe comenzar en el vértice de la pirámide de Haynes,
comprobando que no hay ningún sistema de apoyo a las
decisiones clínicas que resuelva la duda. Pero al descender
un nivel sí aparece una guía de práctica clínica con nive-
les de evidencia y grados de recomendación que indica que
la mejor prueba para confirmar un tromboembolismo pul-
monar es la TC. Como ya hemos obtenido respuesta a la
pregunta que nos plantean, no tenemos que seguir buscando
en los niveles inferiores. No obstante, el objetivo de esta
nueva Sección de Radiología es elaborar documentos de sín-
tesis novedosos y que sean de utilidad para los radiólogos.
Por tanto las conclusiones de los CAT que se publiquen se
establecerán a partir de estudios originales o estudios de
síntesis.
Establecer los niveles de evidencia
Suponiendo, como un ejemplo práctico, que al finalizar la
búsqueda se han encontrado 6 documentos: 2 series de casos
(el primero con 20 pacientes y el segundo con 150), una
revisión sistemática narrativa, 2 ensayos clínicos y un metaa-
nálisis, ¿tienen todos la misma relevancia científica? ¿Cuál
de ellos se escogería? Para contestar a la pregunta, se esta-
blecieron los niveles de evidencia que se basan en el rigor
científico del diseño del estudio32
. Estos niveles van desde el
1 (la mejor evidencia) al 5 (la evidencia menos sólida). Tras
valorar el grado de evidencia, se establece el grado de reco-
mendación de un determinado procedimiento: A (altamente
recomendable), B (recomendable), C (poco recomendable)
y D (nada recomendable).
En el año 2000 el Centro del Servicio Nacional de Salud
para la Medicina Basada en la Evidencia, Oxford, Reino Unido
6. 456 C. García Villar
Sistemas
Ejemplos
Sistemas de información computerizados
para la toma de decisiones
Sumarios
Sinopsis de
síntesis
Síntesis
Database of abstracts of
reviews of effects (dare)
Revisiones sistemáticas
(Cochrane library)
Revistas que contienen
resúmenes de artículos de
buena calidad metodológica
Guías de práctica clínica basadas en la
evidencia y libros basados en la evidencia
Sinopsis de estudios
Estudios
Estudios originales
publicados en revistas
Figura 1 Pirámide de la Evidencia «6S» adaptada del esquema original de DiCenso, Byley y Haynes11
.
Tabla 3 Ejemplos de fuentes secundarias
Tipo Correlación con la
pirámide de Haynes
Características Ejemplos
Sistemas de apoyo a las
decisiones clínicas
(Computerised decision
support systems)
Nivel 1 (vértice) Introducimos los datos de nuestro
paciente y, automáticamente, el
programa genera unas
recomendaciones que resumen la
mejor evidencia
Sistema de apoyo a las
decisiones clínicas para
predecir las variaciones en la
circulación cerebral en niños
con ventilación mecánica23
Manejo de pacientes
anticoagulados en Atención
Primaria en Reino Unido24
Sumarios Nivel 2 Integran la información basada en la
evidencia sobre un problema
específico
Son actualizados regularmente
Guías de práctica clínica:
The National Guidelines
Clearinghouse25
The Scottish
Intercollegiate guidelines26
Informes de Agencias de
Tecnología Sanitaria27
ClinicalEvidence28
Up to Date29
Sinopsis de síntesis Nivel 3 Sintetizan y agrupan los datos de
revisiones sistemáticas que tienen
buena calidad metodológica
Se componen de un resumen de la RS
y de comentarios sobre su calidad
metodológica y su aplicabilidad
Database of Abstracts of
Reviews of Effects (DARE) de la
Universidad de York30
Síntesis Nivel 4 Revisiones sistemáticas y metaanálisis Cochrane Library20
Trip database31
Sinopsis de estudios
originales
Nivel 5 Revistas que contienen resúmenes de
artículos primarios de buena calidad
metodológica, con un comentario
añadido
ACP Journal Club21
Evidence Based Medicine22
(The National Health Service Centre for Evidence-Based
Medicine) (CEBM) clasificó los niveles de evidencia y los
grados de recomendación en diferentes tablas depen-
diendo de que la pregunta que se quiera contestar
sea sobre diagnóstico, tratamiento, pronóstico, efectos
adversos o análisis económico33
. Tras una década de apli-
cación, se ha realizado una nueva clasificación (tabla 4)
que simplifica la anterior, suprimiendo las subdivisiones
de los niveles (antes el nivel 1 comprendía el 1 a, 1 b y
1 c). A las categorías anteriores, añaden la de detección
7. Los
6
pasos
necesarios
para
elaborar
Critically
Appraised
Topics
457
Tabla 4 Nueva clasificación de los niveles de evidencia de la Universidad de Oxford33
Preguntas Nivel 1 Nivel 2 Nivel 3 Nivel 4 Nivel 5
Diagnóstico: ¿Sirve esta prueba
para confirmar o descartar la
enfermedad?
Revisiones sistemáticas
de estudios
longitudinales con
aplicación consistente
del estándar de
referencia y
enmascaramiento
Estudios
longitudinales
individuales con
aplicación
consistente del
estándar de
referencia y
enmascaramiento
Estudios no consecutivos
o estudios sin aplicación
consistente del estándar
de referencia
Estudios casos-controles
o aquellos que no
aplican bien el estándar
de referencia
El resultado final
se explica en base
a un
razonamiento*
Pronóstico: ¿Qué sucederá si no
se realiza la intervención?
Revisión sistemática de
estudios de cohortes
prospectivas
Estudios
individuales de
cohortes
prospectivas
Estudio de cohorte
inicial o estudio del
grupo control de un
ensayo clínico
Series de casos o
estudios casos-controles
o estudios de cohortes
pronósticas de poca
calidad
El resultado final
se explica en base
a un
razonamiento*
Tratamiento: ¿Me ayudará esta
intervención?
Revisión sistemática de
ensayos clínicos
randomizados
Ensayo clínico
randomizado o
estudios
observacionales
con efectos
importantes
Cohorte controlada no
randomizada o estudios
de seguimiento
Serie de casos, estudios
casos-controles o
estudios controlados
históricamente
El resultado final
se explica en base
a un
razonamiento*
Efectos adversos: ¿Cuáles son
los efectos secundarios
derivados de esta
intervención?
Revisión sistemática de
ensayos clínicos, RS
estudios anidados
caso-control, o estudios
observacionales con
efecto dramático
Ensayos clínicos
individuales,
estudios
observacionales
con efectos
importantes
Cohortes controlada no
randomizada (se
considera que hay un
número suficiente para
excluir un efecto
adverso)
Series de casos,
caso-control o estudios
controlados
históricamente
El resultado final
se explica en base
a un
razonamiento*
Cribado: ¿Sirve esta prueba
para detección precoz?
Revisión sistemática de
ensayos clínicos
randomizados
Ensayos clínicos
randomizados
Cohortes controladas no
randomizadas/estudio
de seguimiento
Series de casos,
caso-control o estudios
controlados
históricamente
El resultado final
se explica en base
a un
razonamiento*
* Implica una inferencia desde el mecanismo, que asegura que la intervención produce un desenlace relevante para el paciente. Se une la intervención con el desenlace clínico. Fuente:
Oxford Centre for Evidence-Based Medicine Web site. Explanation of the 2011 Oxford Centre for Evidence-Based Medicine Levels of Evidence (Background Document)34.
8. 458
C.
García
Villar
Tabla 5 Nociones de lectura crítica dependiendo del tipo de estudio
Tipo de estudio Diseño del estudio Resultados Ejemplos de listados de
comprobación
Casos y controles Se explica cómo se han reclutado tanto los casos cómo los
controles
La exposición se midió de forma precisa y objetiva (tipo de
variables analizadas, relación temporal, enmascaramiento)
Se han tenido en cuenta el potencial de los factores de
confusión
Odds ratio (OR)
Intervalos de confianza (precisión)
Considerar los criterios de Bradford
Hills (secuencia temporal o gradiente
dosis-respuesta)
Cohortes La cohorte seleccionada es representativa de una población
definida y los sujetos se clasificaron en el grupo de
exposición siguiendo el mismo procedimiento
La exposición se midió de forma precisa y utilizando
variables objetivas
Los métodos de medida eran similares en los diferentes
grupos
El seguimiento de los pacientes fue lo suficientemente largo
Riesgo relativo (RR)
Intervalos de confianza (precisión)
Análisis de los factores de confusión
Considerar los criterios de Bradford
Hills
Sensibilidad de pruebas
diagnósticas
La prueba a evaluar se encuentra bien descrita para que
pueda reproducirse
Se define lo que es un resultado positivo y negativo
Explican los criterios de inclusión y exclusión
Existe una evaluación ciega de los resultados
Se comparan todos los casos con el estándar de referencia
Sensibilidad
Especificidad
Razones de probabilidad o Likehood
ratios (positiva y negativa)
Intervalos de confianza (precisión)
Standards for the Reporting
of Diagnostic accuracy
studies (STARD)46
Ensayos clínicos Los grupos de pacientes son equivalentes al comienzo del
estudio y se tratan de forma similar a excepción de la
intervención
La asignación del tratamiento fue aleatoria
Se consideran adecuadamente todos los pacientes hasta el
final del estudio
Se mantuvieron ciegos al tratamiento los pacientes, los
clínicos y el personal del estudio
NNT
Riesgo relativo
Hazard ratio
Intervalos de confianza
Delphi list47
Revisiones sistemáticas
y metaanálisis
Los estudios seleccionados tienen un diseño apropiado para
contestar a la pregunta, aportando un nivel de evidencia lo
más alto posible
Se ha comprobado si se han incluido los estudios más
importantes y relevantes
Se ha considerado la calidad de los estudios seleccionados,
sometiéndolos individualmente a un proceso de lectura
crítica
Valorar el resultado global de la
revisión, si los resultados están
claramente presentados
Si hay resultados muy variables
debemos conocer los motivos
En caso de expresarse
numéricamente, analizar las medidas
realizadas (OR, NNT)
Intervalos de confianza
Quality of reporting of
Meta-analyses (QUORUM)48
Preferred Reporting Items
for Systematic Reviews and
Meta-Analyses (PRISMA)49
Assessment of multiple
systematic reviews
(AMSTAR)50
9. Los 6 pasos necesarios para elaborar Critically Appraised Topics 459
Tabla
5
(continuación)
Tipo
de
estudio
Diseño
del
estudio
Resultados
Ejemplos
de
listados
de
comprobación
Análisis
económico
Se
define
la
perspectiva
del
análisis:
evaluación
económica
completa
(compara
costes
y
efectos),
si
se
evalúa
una
sola
opción
o
si
se
comparan
varias
alternativas
Se
describe
la
intervención
o
intervenciones:
quién
las
hará,
a
quién
se
aplica,
dónde
y
con
qué
frecuencia
Se
exponen
si
existen
pruebas
de
la
efectividad
de
la
intervención
o
del
programa
evaluado
(a
partir
de
ensayos
clínicos,
a
partir
de
investigación
de
síntesis
o
a
partir
de
otros
tipos
de
estudios
Se
identifican
los
efectos
de
la
intervención
(o
intervenciones)
se
miden
y
se
valoran
adecuadamente
Se
identifican
los
costes
en
que
se
incurre
por
la
intervención
(intervenciones)
midiéndolos
y
valorándolos
adecuadamente
Se
explica
si
se
aplican
las
tasas
de
descuento
a
los
costes
de
la
intervención
y/o
a
los
efectos
Costes
(directos
o
indirectos)
-
años
vida
Costes-QUALY
(años
ajustados
por
calidad
de
vida)
Beneficio
neto
Costes
incrementales
(los
generados
por
el
uso
de
una
alternativa
en
vez
de
la
otra)
Análisis
de
sensibilidad
(cuánto
cambiaría
el
resultado
si
en
un
modelo
cambiamos
variables
relacionadas
con
los
costes
o
con
la
efectividad)
NNT:
número
necesario
para
tratar;
QUALY:
QUality-Adjusted
Life
Years.
precoz o cribado y suprimen la categoría sobre análisis
económico34
.
Aunque continúan otorgando a la revisión sistemática el
mayor nivel de evidencia, especifican que si tiene errores
metodológicos, puede ser bajada de nivel y, al contrario, un
estudio individual que demuestre un efecto de gran mag-
nitud, puede alcanzar un mayor nivel de evidencia en esta
clasificación35
.
Lectura crítica de los artículos
Antes de analizar cómo está escrito un artículo, deben
tenerse en cuenta algunas consideraciones generales:
- Fecha de publicación. A veces trabajos muy bien diseñados
han sido publicados hace más de 5 años. En estos casos,
sus conclusiones pueden estar ya desfasadas y debemos
esperar nuevas investigaciones.
- Tipo de diseño. Por ejemplo, si se quiere responder una
pregunta sobre eficacia terapéutica, no basta con las con-
clusiones de un artículo que analiza 5 casos, sino que
deberíamos buscar un ensayo clínico o un metaanálisis que
agrupe varios ensayos.
- Artículos con conclusiones contradictorias. En una primera
fase se selecciona aquel que tenga el diseño más ade-
cuado. Si tras analizarlo se encuentran muchos sesgos, se
debe evaluar críticamente los otros.
Una vez que se han seleccionado el artículo o los artículos
que mejor responden a la pregunta, hay que saber si cumple
unos requisitos mínimos de calidad. La revista que lo publica
o el nombre de sus autores no deben condicionar nuestra
decisión. Se debe realizar una lectura crítica36-
-
-38
, buscando
errores metodológicos o de análisis de resultados. Así se sabe
si sus conclusiones son válidas o si por el contrario, contiene
sesgos importantes que pueden limitar el estudio39-
-
-42
.
Para servir de guía a los profesionales, se han elaborado
los listados de verificación o comprobación. Consisten en
una lista pormenorizada de todos los aspectos y matices
que se deben valorar en un artículo para comprobar que
está bien elaborado. Estas preguntas varían en función del
diseño del estudio, si bien la mayoría de las respuestas se
obtienen dentro de la sección de «Material y métodos» y
de «Resultados». Las listas de verificación son múltiples, y
de especial interés la iniciativa Critical Appraisal Skills Pro-
gramme Español (CASP-e), que ha desarrollado sus propios
listados. Cada uno consta de 10 preguntas, que varían en
función del diseño del estudio43-
-
-45
. Si no encontramos una
respuesta válida para los aspectos fundamentales de un artí-
culo, los resultados pueden quedar invalidados porque sus
conclusiones sean erróneas.
En la tabla 5 se muestra un resumen con los diferen-
tes aspectos que hay que tener en cuenta dependiendo del
diseño de estudio y los nombres de las principales plantillas
de verificación que se han diseñado para realizar una lectura
crítica más ágil y eficaz46-
-
-50
.
Aunque el objetivo de este artículo no es convertir
al lector en un experto en estadística, sí es conveniente
conocer los principales parámetros que pueden resultar de
utilidad para interpretar un estudio. En la tabla 6 puede
10. 460 C. García Villar
Tabla 6 Principales parámetros estadísticos
Concepto Definición Interpretación
Sensibilidad (S) Probabilidad de diagnosticar a un individuo
como enfermo cuando realmente lo está
S = VP/VP + FN
Indica la capacidad de la prueba para
detectar enfermos: si queremos descartar
un diagnóstico, debemos usar un test muy
sensible: si el resultado es negativo, es muy
probable que el paciente realmente esté
sano
Especificidad (E) Probabilidad de diagnosticar a un individuo
como sano cuando realmente está sano
E = VN/VN + FP
Indica la capacidad de la prueba para
detectar sanos: si la prueba es muy
específica, significa que si da un resultado
positivo es muy probable que el paciente se
encuentre enfermo
Valor predictivo positivo
(VPP)
Probabilidad de que un individuo con un
resultado positivo tenga la enfermedad
VPP = VP/ VP + FP
Probabilidad de que el sujeto esté enfermo
conociéndose que su prueba resultó positiva
Ejemplo: VPN 30% (la probabilidad de que
un individuo que ha dado positivo en el test
esté enfermo es del 30%)
Valor predictivo negativo
(VPN)
Probabilidad de que un individuo con un
resultado negativo esté sano
VPN = VN/VN + FN
Probabilidad de que el sujeto esté sano
conociéndose que su prueba resultó
negativa
Ejemplo: VPN 95% (la probabilidad de que
un individuo que ha dado negativo en el
test esté sano es del 95%)
Razones de probabilidad
(Likelihood ratios)
positiva y negativa
Indican en qué medida el resultado del test
apoya la presencia o ausencia de la
enfermedad
RP + = S /(1-esp)
RP - = (1-S)/E
Positiva: con cuánta más probabilidad
encontraremos un resultado positivo en una
persona enferma. Cuanto mayor sea el
cociente, más capacidad diagnóstica
demuestra la prueba
Negativa: con cuánta más probabilidad
encontraremos un resultado negativo en
una persona sana. Cuanto más se aproxime
a 0, más capacidad de excluir la
enfermedad tiene la prueba
Riesgo relativo (RR) Riesgo de desarrollar la enfermedad en el
grupo de tratamiento/riesgo de desarrollar
la enfermedad en el grupo control
RR = 1 (no hay diferencia entre grupos)
RR < 1 el tratamiento reduce el riesgo de
enfermedad
RR > 1 el tratamiento incrementa el riesgo
de enfermedad
Odds ratio (OR) Medida de eficacia de un tratamiento. Se
calcula dividiendo el cociente de las Odds
del tratamiento y las Odds de los controles
OR = 1 el efecto del tratamiento no es
diferente del efecto del control
OR > 1 el efecto del tratamiento es mayor
en los casos que en los controles
OR < 1 el efecto del tratamiento es menor
en los casos que en los controles
Riesgo absoluto (RA) Diferencia entre los riesgos de desarrollar
el evento en el grupo de tratamiento y el
control
RA = 0 (no hay diferencia entre grupos)
RA +: el tratamiento es beneficioso
RA -: el tratamiento es nocivo
Hazard ratio Compara las probabilidades condicionales
de presentar el evento en el siguiente
instante de tiempo con la condición de que
no se haya presentado antes del inicio de
ese instante
Desde el punto de vista práctico es similar
al RR, pero implica velocidad-tiempo hasta
alcanzar un evento
Número necesario a
tratar
Número mínimo de pacientes que es
necesario tratar para obtener una curación
atribuible a su eficacia
NNT = 1/ (tratados-placebo)
Si se cura un 20% de los pacientes tratados
y un 15% de los pacientes sometidos a
placebo la eficacia atribuible sería 5%,
debiendo tratar a 20 personas (1/20-15)
para conseguir una curación que fuera
efecto del tratamiento
11. Los 6 pasos necesarios para elaborar Critically Appraised Topics 461
encontrarse un resumen de todos ellos, con sus fórmulas y
su interpretación51-
-
-53
.
Comprobar la validez externa (aplicar)
Una vez comprobada la validez interna de un estudio, debe
también comprobarse su validez externa54
. Esto es saber si
sus conclusiones pueden ser aplicadas a nuestro medio ya
que pueden existir enormes diferencias entre 2 poblaciones.
Lo que resulta de utilidad en alguna parte del mundo, puede
no ser útil en nuestro ámbito. Esto es algo que afecta a todos
los estudios, independientemente del diseño empleado. Lo
primero que se debe valorar es si los pacientes presentan las
mismas características en cuanto a sexo, edad y estadio de
la enfermedad. También hay que conocer si la enfermedad
tiene una prevalencia similar entre su población y la nuestra.
Un aspecto fundamental en diagnóstico por imagen es equi-
parar los parámetros técnicos de los equipos utilizados en
la investigación con los propios55
, así como la programación
empleada.
Si se plantea comprar un equipo nuevo, también se debe
efectuar un análisis de coste-efectividad para valorar si los
resultados obtenidos justifican los gastos teóricos de adqui-
sición.
También se deben valorar aspectos relacionados con la
seguridad de los pacientes. Es importante establecer si los
beneficios que se derivan del estudio justifican los ries-
gos derivados de la radiación o del empleo de medios de
contraste.
Finalmente también hay que analizar si las conclusiones
del estudio son lo suficientemente importantes como para
cambiar nuestra conducta.
Establecer las recomendaciones
Una vez comprobado que los estudios publicados tienen un
diseño adecuado, no presentan sesgos importantes y que sus
conclusiones son extrapolables a nuestro medio, establece-
remos las recomendaciones56
. En el caso de no encontrar
artículos adecuados que respondan a la pregunta, hay 2
opciones: esperar nuevas publicaciones o bien diseñar un
estudio cuyas conclusiones logren una respuesta válida57
.
Conclusión
Los CAT o temas evaluados críticamente surgen de la nece-
sidad de encontrar una respuesta rápida y de calidad para
una pregunta clínica concreta. Son resúmenes de los artícu-
los de investigación que contestan con la mejor evidencia a
esa pregunta. Constituyen una herramienta útil en nuestra
práctica diaria así como un recurso docente para enseñar
medicina basada en la evidencia (MBE)2
. En diagnóstico
por imagen se pueden elaborar CAT para comparar prue-
bas diagnósticas, evaluar técnicas de cribado o para evaluar
tratamientos entre otros. Para elaborarlos siempre se deben
seguir 6 pasos: 1) formular la pregunta; 2) realizar una bús-
queda sistemática y eficiente en la bibliografía; 3) aplicar
los niveles de evidencia (escogiendo aquellos artículos que
tengan mayor nivel); 4) realizar una lectura crítica de los
artículos escogidos; 5) aplicar las conclusiones a nuestro
entorno; y 6) establecer las recomendaciones pertinentes.
Responsabilidades éticas
Protección de personas y animales. Los autores declaran
que para esta investigación no se han realizado experimen-
tos en seres humanos ni en animales.
Confidencialidad de los datos. Los autores declaran que en
este artículo no aparecen datos de pacientes.
Derecho a la privacidad y consentimiento informado. Los
autores declaran que en este artículo no aparecen datos de
pacientes.
Conflicto de intereses
La autora declara no tener ningún conflicto de intereses.
Bibliografía
1. Kelly AM, Cronin P. How to perform a critically apprai-
sed topic: Part 1 ask, search, apply. AJR Am J Roentgenol.
2011;197:1039-
-
-47.
2. García Villar C. Critically Appraised Topics (CATs): Una
nueva oportunidad de publicación en Radiología. Radiología.
2013;55:431-
-
-7.
3. Shine S. Urinary calculus: IVU vs CT renal stone? A critically
appraised topic. Abdom Imaging. 2008;33:41-
-
-3.
4. Dominioni L, Poli A, Mantovani W, Pisani S, Rotolo N, Paolucci M,
et al. Assessment of lung cancer mortality reduction after chest
X-ray screening in smokers: A population-based cohort study in
Varese, Italy. Lung Cancer. 2013;80:50-
-
-4.
5. Cosford PA, Leng GC. Screening for abdominal aortic aneurysm.
Cochrane Database Syst Rev. 2007;2:CD002945.
6. McGrane S, McSweeney SE, Maher MM. Which patients will bene-
fit from percutaneous radiofrequency ablation of colorectal
liver metastases? Critically appraised topic. Abdom Imaging.
2008;33:48-
-
-53.
7. Kelly AM. Evidence-based radiology: Step 1-ask. Semin Roent-
genol. 2009;44:140-
-
-6.
8. Vilanova JC. Revisión bibliográfica del tema de estudio de un
proyecto de investigación. Radiología. 2012;54:108-
-
-14.
9. Gómez de la Cámara A. La búsqueda y utilización de la mejor
información en la toma de decisiones médicas. Semergen.
2002;28:291-
-
-3.
10. Mochon Bezares G, Sorli Rojo A. Tesauros de Ciencias de la Salud
en Internet. Rev Esp Doc Cient. 2007;30:107-
-
-24.
11. HONSelect Web site. [publicado Feb 1999; consultado 17 May
2013]. Disponible en: http://www.hon.ch/HONselect/index
sp.html
12. Haynes RB. Of studies, syntheses, synospses and systems: The
‘‘4S’’ evolution of services for finding current best evidence.
ACP J Club. 2001;134:A11-
-
-13.
13. Dicenso A, Bayley L, Haynes RB, ACP J Club Editorial. Accessing
pre-appraised evidence: Fine-tuning the 5 S model into a 6 S
model. Ann Intern Med. 2009:151. JC3-2, JC3-3.
14. García Villar C. Radiología basada en la evidencia ¿qué es y cómo
se practica? Radiologia. 2011;53:326-
-
-34.
15. US National Library of Medicine National Institutes of Health
Web site. [actualizado 8 May 2013; consultado 16 May 2013].
Disponible en: http://www.ncbi.nlm.nih.gov/pubmed
12. 462 C. García Villar
16. EMBASE Biomedical Answers Web site. [actualizado 23 Jul 2013;
consultado 20 May 2013]. Disponible en: http://www.embase.
com/home
17. Bahaadinbeigy K, Yogesan K, Wooton R. MEDLINE versus EMBASE
and CINAHL for telemedicine searches. Telemed J E Health.
2010;16:916-
-
-9.
18. Google Scholar Web site. [publicado Ene 2004; consultado 17
May 2013]. Disponible en: http://scholar.google.es/
19. Nourbakhsh E, Nugent R, Wang H, Cevik C, Nugent K. Medi-
cal literature searches: A comparison of PubMed and Google
Scholar. Health Info Libr J. 2012;29:214-
-
-22.
20. The Cochrane Library Web site. [publicado Ene 1993; consultado
5 Jun 2013]. Disponible en: http://www.cochrane.org/
21. ACP Journal Club Web site. [publicado May 1999; consultado 20
Jun 2013]. Disponible en: http://www.acpjc.org/
22. Evidence-Based Medicine Web site. [publicado Ene 2000; con-
sultado 31 May 2013]. Disponibe en: http://ebm.bmj.com/
23. Tehrani FT. A computerized decision support system to predict
the variations in the cerebral blood flow of mechanically venti-
lated infants. Comput Biol Med. 2013;43:1402-
-
-6.
24. Fitzmaurice DA, Hobbs FD, Murria ET, Bradley CP, Holder R.
Evaluation of computerized decision support for oral anticoa-
gulation managment based in primary care. Br J Gen Pract.
1996;46:533-
-
-5.
25. National Guidelines Clearinghouse Web site. [publicado Ago
2007; consultado 28 May 2013]. Disponible en: http://www.
guideline.gov/index.aspx
26. The Scottish Intercollegiate guidelines Web site. [publicado Feb
2001; consultado 7 Jun 2013]. Disponible en: http://www.sign.
ac.uk/
27. International Net of Assessment Health Technologies Agen-
cies. [publicado Nov 1993; consultado 7 Jun 2013]. Disponible:
http://www.inahta.org/
28. Clinical Evidence Web site. [publicado May 2007; consul-
tado 20 Jun 2013]. Disponible en: http://clinicalevidence.
bmj.com/ceweb/index.jsp
29. Up To Date Web site. [publicado Ene 2000; consultado 7
Jun 2013]. Disponible en: http://www.uptodate.com/home/
index.html
30. Center of Reviews and Dissemination, University of York Web
site. Database of Reviews of Effects (DARE). [publicado Feb
1994; consultado 26 Jun 2013]. Disponible en: http://www.crd.
york.ac.uk/crdweb/Home.aspx
31. Trip Database Web site. [publicado Abr 1997; consultado 10 Jun
2013]. Disponible en: http://www.tripdatabase.com/
32. Harbour R, Miller J. A new system for grading recommendations
in evidence based guidelines. BMJ. 2001;323:334-
-
-6.
33. Center for Evidence Based Medicine at the University of Oxford
Web site. [publicado Oct 2011; consultado 6 Jun 2013]. Dispo-
nible en: http://www.cebm.net/index.aspx?o=1025
34. Oxford Centre for Evidence-Based Medicine Web site. Expla-
nation of the 2011 Oxford Centre for Evidence-Based
Medicine Levels of Evidence (Background Document). [publi-
cado Oct 2011; consultado 24 Jun 2013]. Disponible en:
http://www.cebm.net/index.aspx?o=5653
35. Howick J, Glasziou P, Aronson JK. Problems with using mecha-
nisms to solve the problem of extrapolation. Theor Med Bioeth.
2013;34:275-
-
-91.
36. Budoyec JJ, Kahn CE. Evidence-based radiology: A primer in
reading scientific articles. AJR Am J Roentgenol. 2010;195:1-
-
-4.
37. Blackmore CC, Black WC, Jarvik JG, Langlotz CP. A critical
synopsis of the diagnostic and screening radiology outcomes
literature. Acad Radiol. 1999;6:8-
-
-18.
38. Kelly AM, Cronin P. How to perform a critically appraised topic:
Part 2, appraise, evaluate, generate, and recommend. AJR Am
J Roentgenol. 2011;197:1048-
-
-55.
39. Blackmore CC. Critically assessing the radiology literature. Acad
Radiol. 2004;11:134-
-
-40.
40. Black WC. How to evaluate the radiology literature. AJR Am J
Roentgenol. 1990;154:17-
-
-22.
41. Cronin P. Evidence-based radiology: Step 3–critical appraisal of
diagnostic literature. Semin Roentgenol. 2009;44:158-
-
-65.
42. Dodd JD, McEneaney PM, Malone DE. Evidende-based radiology:
How to quickly assess the validity and strength of publications in
the diagnostic radiology literature. Eur Radiol. 2004;14:915-
-
-22.
43. Cabello JB. Plantilla para ayudarte a entender un Estudio de
Diagnóstico. En: Guías CASPe de Lectura Crítica de la Literatura
Médica, Cuaderno I. Alicante: CASPe; 2005. p. 22-
-
-5.
44. Cabello JB. Plantilla para ayudarte a entender una Revisión Sis-
temática. En: Guías CASPe de Lectura Crítica de la Literatura
Mëdica, Cuaderno I. Alicante: CASPe; 2005. p. 48-
-
-50.
45. Critical Appraisal Skills Programme Web site. [actuali-
zado Ene 2014; consultado 10 Ene 2014]. Disponible en:
www.redcaspe.org
46. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP,
Irwig LM, et al. Towards complete and accurate reporting of
studies of diagnostic accuracy: The STARD Initiative. Radiology.
2003;226:24-
-
-8.
47. Verhagen AP, de Vet HC, de Bie RA, Kessels AG, Boers M,
Bouter LM, et al. The Delphi list: A criteria list for quality
assessment of randomized clinical trials for conducting syste-
matic reviews developed by Delphi consensus. Clin Epidemiol.
1998;51:1235-
-
-41.
48. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF.
Improving the quality of reports of meta-analyses of randomized
controlled trials: The QUORUM statement. Quality of Reporting
of Meta-analyses. Lancet. 1999;354:1896-
-
-900.
49. Liberati A, Altman DG, Tetzlaff J, Mulrow C, Gotzsche PC,
Ioannidis JP, et al. The PRISMA statement for reporting sys-
tematic reviews and meta-analyses of studies that evaluate
healthcare interventions: Explanation and elaboration. PLoS
Med. 2009;6:e1000100.
50. Shea BJ, Grimshaw JM, Wells GA, Boers M, Andersson N, Hamel
C, et al. Development of AMSTAR: A measurement tool to assess
the methodological quality of systematic reviews. BMC Med Res
Methodol. 2007;15:7-
-
-10.
51. Maceneaney PM, Malone DE. The meaning of diagnostic test
results: A spreadsheet for swift data analysis. Clin Radiol.
2000;55:227-
-
-35.
52. Bluestein DA, Archer LR. The sensitivity, specificity and pre-
dictive value of diagnostic information: A guide for clinicians.
Nurse Pract. 1991;16:39-
-
-45.
53. Martínez-González MA, Alonso A, López Fidalgo J. ¿Qué es una
hazard ratio? Nociones de análisis de supervivencia. Med Clin.
2008;131:65-
-
-72.
54. Sadigh G, Parker R, Kelly AM, Cronin P. How to write a critically
appraised topic (CAT). Acad Radiol. 2012;19:872-
-
-88.
55. Cronin P. Evidence-based radiology: Step 4-apply. Semin Roent-
genol. 2009;44:180-
-
-1.
56. Cronin P. Evidence-based radiology: Step 5-evaluate. Semin
Roentgenol. 2009;44:182-
-
-3.
57. Atkins D, Best D, Briss PA, Eccles M, Falck-Ytter Y, Flottorp S,
et al. Grading quality of evidence and strength of recommen-
dations. BMJ. 2004;328:1490.