Lectura crítica de artículos y guías de práctica clínica
1. LECTURA CRÍTICA DE
ARTÍCULOS Y GUÍAS DE
PRÁCTICA CLÍNICA
Juan V Quintana Cerezal
.
Médico de familia
Técnico de la UD de MFyC de Alicante
juanvquintana@gmail.com
www.udalicante.blogspot.com
3. Objetivos
Conocer y manejar las principales herramientas para leer
sistemáticamente cualquier trabajo de investigación y
guía de práctica clínica.
Familiarizarse con las clasificaciones de los niveles de
evidencia.
Conocer y utilizar las distintas páginas de búsqueda y
recopilación de guías de práctica clínica.
4. Lectura crítica:
Descubrir si el método y los resultados son
válidos para producir información útil
Rafael Bravo. 2009
Imagen: http://www.tarotida.com
6. Algo de estadística
Intervalo de confianza
Rango dentro del cual está el valor real.
A más corto, mayor certeza.
Ver más en:
http://www.slideshare.net/jgdedios/anlisis-crtico-de-un-ensayo-clinico
http://www.seh-lelha.org/oddsratio.htm
http://www.seh-lelha.org/nnt.htm
6
7. Algo de estadística
Análisis por intención de tratar
Se analizan todos los pacientes como
pertenecientes al grupo asignado, aunque se
hayan perdido (abandono, fallecimiento…)
7
8. Algo de estadística
Riesgo Relativo. RR
Cuánto es más probable que ocurra un suceso en
un grupo frente a otro.
Odds Ratio. OR
Veces que ocurre un suceso en un grupo frente a
cuántas no ocurre.
8
9. Algo de estadística
Número Necesario a
Tratar. NNT
Nº de pacientes que es
necesario tratar con el
tratamiento experimental
en lugar de con el
control, para prevenir un
suceso.
Ver más en:
http://www.slideshare.net/jgdedios/anlisis-crtico-de-un-ensayo-clinico
http://www.seh-lelha.org/oddsratio.htm
http://www.seh-lelha.org/nnt.htm
9
12. Entre otras, ahí dispones de diferentes plantillas para
lectura crítica, en función del tipo de estudio que desees
evaluar: cualitativos, revisiones sistemáticas, casos y
controles…
16. Definiciones
Calidad de la evidencia : hasta qué punto podemos
confiar en que el estimador del efecto es correcto.
Fuerza de una recomendación : hasta qué punto
podemos confiar en que poner en práctica una
recomendación conllevará más beneficios que riesgos.
udalicante@gva.es udalicante.blogspot.com
16
17. Niveles de evidencia
Niveles de evidencia - Graduación de los diseños de estudio
Canadian Task Force on Preventive Health Care (CTFPHC)
I Evidencia a partir de ensayos clínicos aleatorizados
II-1 Evidencia a partir de ensayos clínicos sin aleatorización
II-2 Evidencia a partir de estudios de cohortes y casos y controles,
preferiblemente realizados por más de un centro o grupo de
investigación.
II-3 Evidencia a partir de comparaciones en el tiempo o entre sitios,
con o sin la intervención; podrían incluirse resultados espectaculares
provenientes de estudios no aleatorizados
III Opinión de expertos, basados en la experiencia clínica; estudios
descriptivos o informes de comités de expertos
udalicante@gva.es udalicante.blogspot.com
17
18. Grados de recomendación
Grados de recomendación para las intervenciones
específicas de prevención
Canadian Task Force on Preventive Health Care
(CTFPHC)
A Existe buena evidencia para recomendar la intervención clínica de
prevención
B Existe moderada evidencia para recomendar la intervención clínica
de prevención
C La evidencia disponible es conflictiva y no permite hacer recomendaciones
a favor o en contra de la intervención clínica preventiva; sin embargo, otros
factores podrían influenciar en la decisión.
D Existe moderada evidencia para recomendar en contra de la
intervención clínica de prevención
E Existe buena evidencia para recomendar en contra la intervención
clínica de prevención
I Existe evidencia insuficiente (en cantidad y en cualidad) para hacer
una recomendación; sin embargo, otros factores podrían influenciar en la
decisión.
udalicante@gva.es udalicante.blogspot.com
18
19. Niveles de evidencia
Niveles de evidencia para estudios de intervención
NICE (Adaptado de SIGN)
1++ Metaanálisis de gran calidad , revisiones sistemáticas de ensayos clínicos
aleatorizados o ensayos clínicos aleatorizados con muy bajo riesgo de sesgos .
1+ Metaanálisis de gran calidad , revisiones sistemáticas de ensayos clínicos aleatorizados
o ensayos clínicos aleatorizados con bajo riesgo de sesgos .
1- Metaanálisis de gran calidad , revisiones sistemáticas de ensayos clínicos aleatorizados
o ensayos clínicos aleatorizados con alto riesgo de sesgos* .
2++ Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos-controles ,
o estudios de cohortes o de casos-controles de alta calidad, con muy bajo riesgo de confusión,
sesgos o azar y una alta probabilidad de que la relación sea causal.
2+ Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión,
sesgos o azar y una moderada probabilidad de que la relación sea causal.
2- Estudios de cohortes o de casos y controles con alto riesgo de sesgo*
3 Estudios no analíticos , como informe de casos y series de casos
4 Opinión de expertos
* Los estudios con un nivel de evidencia ‘–‘ no deberían utilizarse como base para elaborar una
recomendación
udalicante@gva.es udalicante.blogspot.com
19
20. Grados de recomendación
- Al menos un meta-análisis, o un ensayo clínico aleatorio categorizados como 1++, que sea
A NICE 1++ directamente aplicable a la población diana, o - Una revisión sistemática o un ensayo clínico
aleatorio o un volumen de evidencia con estudios categorizados como 1+, que sea directamente
1+ aplicable a la población diana y demuestre consistencia de los resultados- Evidencia a partir de la
apreciación de NICE
B 2++ Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente
aplicables a la población objeto y que demuestren globalmente consistencia de los resultados,
extr1++, Extrapolación de estudios calificados como 1++ o 1+.
1+
C 2+ - Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente
aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 2++.
extr2++
D 3, 4 - Evidencia nivel 3 o 4, o- Extrapolación de estudios calificados como 2+ o- Consenso formal
Extr2+
consenso
D Consenso Un buen punto de práctica (BPP) es una recomendación para la mejor práctica basado en la
experiencia del grupo que elabora la guía
(BPP)
IP Recomendación a partir del manual para procedimientos de intervención de NICE
20
21. Otras clasificaciones
U.S. Preventive Services Task Force
De las más usadas. Similar a la canadiense
Buena/moderada/insuficiente A/B/C/D/I
Agency for Healthcare Research and Quality
(AHRQ)
Ia/Ib/IIa/IIb/III/IV
Centre for Evidence-Based Medicine, Oxford
1 a/1b/1c/2 a/2b/2c/3 a/3b/4
Scottish Intercollegiate Guidelines Network,
SIGN
Similar a la NICE
22. Ejemplo de formulación de recomendación
Resumen de la evidencia
2+ La realización de ejercicio físico de forma regular reduce el riesgo de enfermedad coronaria y
cerebrovascular (100;103). Una mejor condición física global, asociada a una mayor intensidad del
ejercicio disminuye el riesgo de muerte (101), de forma independiente del grado de obesidad (99).
1+ Los programas de ejercicio físico de intensidad aeróbica y anaeróbica son eficaces en la mejora del
control glucémico (reducciones de HbA1c de 0,6%) y pueden mejorar la respuesta a insulina y los
niveles de TG (97;98).
1++ En pacientes con DM tipo 2, motivados y sin complicaciones avanzadas, la combinación de ejercicio
de intensidad aeróbica y anaeróbica es superior a cada una de las modalidades por separado en
cuanto a la mejora del control glucémico (98).
1+ La mayoría de las intervenciones incluyen tres sesiones por semana en días no consecutivos, el
ejercicio se realiza de forma supervisada y es progresivo (97;98).
Recomendación
A En pacientes con DM tipo 2, se recomienda la realización de ejercicio físico regular y continuado, de
intensidad aeróbica o anaeróbica o preferiblemente la combinación de ambos. La frecuencia
recomendada es de tres sesiones semanales en días alternos, progresivas en duración e intensidad y
preferiblemente supervisado.
23.
24. Calidad de la evidencia entre
los estudios para cada variable
Resumen de Tipo de estudio
Escenario resultados: RESTAR SUMAR
Pregunta variables • Limitaciones
metodológicas
• Asociación fuerte
• Dosis respuesta
• Inconsistencia • Factores confusores
• Evidencia indirecta reducen el efecto
• Datos escasos o
imprecisos Calidad: alta, moderada,
Importancia relativa • Alta probabilidad baja, muy baja
sesgo de información
para la toma de decisiones :
• poco importante (1-3)
• importante pero no clave (4 y 6 )
• clave (7-9)
Calidad global de la evidencia: alta, moderada, baja, muy baja
BALANCE
• Beneficios netos Recomendaciones
• Beneficios con aceptación de • Fuerte a favor
riesgos • Débil a favor
• Beneficios inciertos con
• Fuerte en contra
aceptación de riesgos
• Débil en contra
• Ausencia de beneficios netos
25. IMPORTANCIA DE LAS VARIABLES DE
RESULTADO
MORTALIDAD.
CLAVE para
la toma de
FRACASO DEL TTO
decisiones
EFECTOS ADVERSOS
CALIDAD DE VIDA
Importante,
DURACIÓN DE LA pero no clave
ESTANCIA
HOSPITALARIA
GASOMETRIA No
ARTERIAL importantes
para los
FEV1 pacientes
26. Criterios GRADE para valorar la calidad de la
evidencia para cada variable de resultado clave
Calidad de Diseño de Disminuir si Aumentar si
la estudio
evidencia
Alta (4) ECA limitación de la calidad del Asociación:
estudio -evidencia de una fuerte asociación: RR > 2 ó < 0,5
Moderada -Importante (-1) basado en estudios observacionales sin factores de
-muy importante (-2) confusión (+1).
Baja Observacional -Evidencia de una muy fuerte asociación RR > 5 ó <
Inconsistencia -importante 0,2 basada en evidencia sin posibilidad de sesgos
Muy Cualquier otra (-1) (+2)
baja(1) evidencia
Evidencia directa Gradiente dosis respuesta (+1)
-Alguna incertidumbre (-1)
-gran incertidumbre (-2) Todos los posibles factores confusores podrían haber
reducido el efecto observado (+1)
Datos escasos o imprecisos
(-1)
Alta probabilidad de sesgo
de notificación (-1)
26
27. Ejemplo de formulación de recomendación con GRADE
comienda la introducción precoz del tratamiento con
en el asma leve persistente, tanto en niños como en adultos
mendación fuerte, calidad de la evidencia científica alta).
28. Cómo localizar GPC
Basada en Haynes RB, ACP J Club 2006;145(3):A8
http://www.serviciofarmaciamanchacentro.es/index.php?option=com_content&view=article&id=232&Itemid=275
31. Cómo evaluar una GPC.
AGREE II
23 ítems agrupados en 6 dominios
Alcances y objetivo (3 ítems)
Participación de los implicados (4)
Rigor en la elaboración (7)
Claridad (3)
Aplicabilidad (4)
Independencia (2)
Puntuación de 1 a 7
1 hora y media para su valoración total
A más evaluadores (mínimo 4), mejores resultados de fiabilidad.
udalicante@gva.es udalicante.blogspot.com
31
32. Dominio 1. Alcance y objetivo
1. El(los) objetivo(s) general(es) de la guía está(n) específicamente
descrito(s).
2. El(los) aspecto(s) de salud cubierto(s) por la guía está(n)
específicamente descrito(s).
3. La población (pacientes, público, etc.) a la cual se pretende
aplicar la guía está específicamente descrita.
Dominio 2. Participación de los implicados
4. El grupo que desarrolla la guía incluye individuos de todos los
grupos profesionales relevantes.
5. Se han tenido en cuenta los puntos de vista y preferencias de la
población diana (pacientes,público, etc.).
6. Los usuarios diana de la guía están claramente definidos.
33. Dominio 3. Rigor en la elaboración
7. Se han utilizado métodos sistemáticos para la búsqueda de la
evidencia.
8. Los criterios para seleccionar la evidencia se describen con
claridad.
9. Las fortalezas y limitaciones del conjunto de la evidencia están
claramente descritas.
10. Los métodos utilizados para formular las recomendaciones
están claramente descritos.
11. Al formular las recomendaciones han sido considerados los
beneficios en salud, los efectos secundarios y los riesgos.
12. Hay una relación explícita entre cada una de las
recomendaciones y las evidencias en las que se basan.
13. La guía ha sido revisada por expertos externos antes de su
publicación.
14. Se incluye un procedimiento para actualizar la guía.
34. Dominio 4. Claridad
15. Las recomendaciones son específicas y no son ambiguas.
16. Las distintas opciones para el manejo de la enfermedad o
condición de salud se presentan claramente.
17. Las recomendaciones clave son fácilmente identificables.
Dominio 5. Aplicabilidad
18. La guía describe factores facilitadores y barreras para su
aplicación.
19. La guía proporciona consejo y/o herramientas sobre cómo las
recomendaciones pueden ser llevadas a la práctica.
20. Se han considerado las posibles implicaciones de la aplicación
de las recomendaciones sobre los recursos.
21. La guía ofrece criterios para monitorización y/o auditoria.
Dominio 6. Independencia
22. Los puntos de vista de la entidad financiadora no han influido
en el contenido de la guía.
23. Se han registrado y abordado los conflictos de intereses de los
miembros del grupo elaborador de la guía.
35. no hay puntuaciones mínimas que diferencien entre guías
de alta y baja calidad. A criterio del usuario y del
contexto
udalicante@gva.es udalicante.blogspot.com
35
36. (Práctica)
Evaluar por grupos (1 guía/2grupos) el área de Rigor en
la elaboración de la GPC:
EPOC 2010
Lumbalgia 2007
Diabetes gedaps2011
udalicante@gva.es udalicante.blogspot.com
36
37. Para llevar a casa
RR, OR, NNT
CASPe. Herramientas para lectura crítica de artículos
CONSORT. Lista de comprobación para ensayos clínicos
y otros
Niveles de evidencia. Sistema GRADE.
GuíaSalud, Pubmed-ClinicalQueries y Tripdatabase.
Localización de guías.
Método AGREE II
udalicante@gva.es udalicante.blogspot.com
37
Notas del editor
juicios secuenciales acerca de: 1) La calidad de la evidencia en los diferentes estudios para cada uno de los resultados importantes; 2) Los resultados clave para una decisión; 3) La calidad global de la evidencia para estos resultados claves; 4) El balance entre beneficios y riesgos y, 5) La fuerza de las recomendaciones. escoger las variables de resultado (ya sean de beneficios o de riesgos) y juzgar la calidad de la evidencia (validez) de los diferentes estudios de donde proceden las variables de resultado
La calidad de la evidencia indica hasta qué punto podemos confiar en que el estimador del efecto es correcto y la fuerza de una recomendación significa hasta qué punto podemos confiar en que poner en práctica una recomendación conllevará más beneficios que riesgos. GRADE propone realizar juicios secuenciales acerca de: 1) La calidad de la evidencia en los diferentes estudios para cada uno de los resultados importantes; 2) Los resultados clave para una decisión; 3) La calidad global de la evidencia para estos resultados claves; 4) El balance entre beneficios y riesgos y, 5) La fuerza de las recomendaciones. La calidad de la evidenciaEl primer paso consiste en escoger las variables de resultado (ya sean de beneficios o de riesgos) y juzgar la calidad de la evidencia (validez) de los diferentes estudios de donde proceden las variables de resultado, considerando su diseño, la calidad metodológica, la consistencia y si la evidencia es directa o indirecta (directness).El diseño del estudio se refiere al tipo de estudio, que en términos generales se clasifica en Ensayo Clínico Aleatorizado (ECA) y estudio observacional. El punto de partida de la calidad de la evidencia es de alta para el ECA y de baja para los estudios observacionales (tabla 1).La calidad del estudio hace referencia a los métodos utilizados y a su realización. Cada tipo de estudio se define por unos criterios que se deben juzgar para cada resultado clave. La calidad de la evidencia puede bajar en (-1) (-2), en función de las limitaciones de los ECA y aumentar o disminuir en el caso de los estudios observacionales (tabla 1).La consistencia se refiere a la similitud en las estimaciones del efecto entre los estudios para las variables de resultado. Si hay inconsistencias importantes sin una causa que lo explique, la calidad puede igualmente disminuir (-1) (tabla 1).El tipo de evidencia directa o indirecta indica hasta qué punto los sujetos, las intervenciones, las comparaciones y los resultados de los estudios son similares a la pregunta de nuestro interés. En el caso de existir algún grado de incertidumbre acerca de si la evidencia es directa, se disminuye una o dos categorías. Todos estos componentes descritos nos clasifican la calidad de la evidencia para cada variable de resultado. Una calidad alta indica que es muy poco probable que nuevos estudios modifiquen nuestra confianza en el resultado estimado; una calidad moderada, que es probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; una calidad baja, que es muy probable que nuevos estudios tengan un impacto importante en la confianza que tenemos en el resultado estimado y que éstos puedan modificar el resultado; y una calidad muy baja que cualquier resultado estimado es incierto. Los resultados clave para una decisiónEn esta etapa se escogen aquellas variables de resultado que son claves para tomar una decisión. La puntuación de cada una de las variables de resultado va del 1 al 9: una puntuación entre 1 y 3, define a la variable como poco importante; de entre 4 y 6, como importante y de entre 7 y 9, como clave.La calidad global de la evidenciaSe valora la calidad global de la evidencia considerándola según el nivel de calidad mas bajo conseguido por las variables de resultado claves. Si las variables claves incluyen riesgos o daños, éstas deberían tenerse en cuenta, aún incluso habiendo incertidumbre de si la evidencia es directa. Si la evidencia para todas las variables claves favorece a la misma alternativa y hay evidencia de alta calidad para algunas, aunque no para todas las variables, la calidad global se puede considerar alta. Evidencias débiles sobre riesgos y daños poco importantes no deberían disminuir el grado de evidencia global.El balance entre beneficios y riesgosEs aconsejable que los juicios sobre el balance entre beneficios y riesgos, se lleven a cabo antes de considerar los costes y teniendo en cuenta tanto las variables claves como las importantes. Las preguntas a responder son: ¿Cuál es la magnitud del beneficio y hasta qué punto los resultados son reproducibles y precisos?, ¿Cuál es la magnitud del riesgo, daño y la carga que representan y hasta qué punto los resultados son reproducibles y precisos? ¿Hasta qué punto los beneficios superan a los riesgos, daños y la carga que representan?. ¿Los beneficios compensan a los riesgos, daños y la carga que representan?. Este balance se clasifica en: beneficios netos, balance entre beneficios y riesgos, balance incierto, ausencia de beneficios netos y riesgos netos.La fuerza de las recomendacionesEn una última etapa se juzga la fuerza de la recomendación y los juicios requieren consideraciones acerca de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre beneficios y riesgos, la contextualización de la evidencia a las circunstancias específicas (valores y preferencias), la incertidumbre sobre el riesgo basal, así como la consideración de los costes (utilización de recursos). Las categorías de recomendaciones sugeridas por GRADE son: Hazlo (do it), probablemente hazlo (probably do it), no recomendación, probablemente no lo hagas (probably don’t do it), no lo hagas. (don’t do it).Hazlo (‘’recomendamos’’ o ‘’deberíamos recomendar’’) es un recomendación fuerte a favor de e indica que los beneficios claramente sobrepasan los riesgos y que la gran mayoría de personas bien informadas harían la misma elección (alta confianza, poca incertidumbre). En este caso la mayoría de los pacientes recibirían la intervención sin necesidad de ayuda en la decisión y no se esperaría mucha variación en la práctica clínica. Probablemente hazlo (‘’sugerimos’’, ‘’podríamos’’, ‘consideramos’’), es una recomendación débil a favor de, e indica que la mayoría de personas bien informadas harían la misma elección, pero un grupo sustancial no la llevaría a cabo (incertidumbre significativa) y que los beneficios y los riesgos están equilibrados o son inciertos. En este caso será útil la ayuda en la decisión y se espera mucha variación en la práctica clínica. En este caso la decisión se realizará teniendo en cuenta otros factores y se espera mucha variación en la práctica clínica. Este mismo razonamiento se aplicará a la recomendación de no hacer y probablemente no hacer.La información sobre GRADE y sus publicaciones están disponibles en http://www.gradeworkinggroup.org/. La publicación del BMJ y otros materiales de trabajo se han traducido al castellano (Upshur RE, 2003) y están accesibles en la web de GRADE. GRADEpro es el software para elaborar las recomendaciones siguiendo la sistemática descrita previamente. El grupo de trabajo está avanzando en la mejora del propio sistema y en la aplicación del mismo a los estudios de diagnóstico y de coste-efectividad. Actualmente varias organizaciones están interesadas en GRADE: Cochrane, WHO, American College of Chest Physicians, UpToDate, etc. La sociedad española de medicina familiar y comunitaria (semFYC) está también considerando adoptar el sistema de clasificación de GRADE para la elaboración de sus recomendaciones (NICE, 2005)
Explicar los principales motores de búsqueda, con ejemplos previamente trabajados. Pubmed Tripdatabase NGC NICE
Navegar por el portal comentando la historia de GS (ver ppt adjunto sobre GS) y partes que componen el portal
Como profesionales sanitarios desearíamos disponer de GPC en las que tuviésemos confianza de que se han evitado los sesgos potenciales producidos en su desarrollo, las recomendaciones tuvieran validez interna y externa y fuesen útiles en la práctica, que no es más que la definición de una GPC de calidad (Field MJ, 1992; Hayward RS, 1995). Tanto en nuestro país como en otros, se han llevado a cabo estudios para conocer si las GPC publicadas cumplen estos requisitos mínimos (REDEGUIAS, 2003; Navarro MA, 2005; Shekelle PG, 2001), obteniéndose resultados en los que se demuestra una baja calidad de las mismas, lo cual sin duda viene corroborado por el hecho de que, a pesar de ser una herramienta sumamente útil para la toma de decisiones clínicas, su aceptación por parte de la profesión sanitaria sigue siendo escasa y la implantación de las mismas también En el año 1998 comienza una colaboración internacional entre 13 países (Appraisal of Guidelines, Research and Evaluation Colaboration (AGREE)) cuyos objetivos eran:Desarrollar criterios comunes para la elaboración de GPCDefinir cuales deberían ser los criterios de calidad que deberían cumplir las GPCEstablecer un modelo de evaluación y monitorización de dichos criterios de calidadPromover la difusión de estos criterios entre los miembros participantes y demás Comunidad Científica, favoreciendo las colaboraciones internacionales.