Pruebas diagnósticas y de tamizaje: sensibilidad, especificidad y valores predictivos
1. 1
UNIVERSIDAD NACIONAL DE COLOMBIA. FACULTAD DE MEDICINA. DEPARTAMENTO DE SALUD
PÚBLICA
EPIDEMIOLOGÍA BÁSICA / 2013-I
GUIA DE ESTUDIO TEMA: PRUEBAS DIAGNÓSTICAS Y PRUEBAS DE TAMIZAJE. CONCEPTOS
SENSIBILIDAD, ESPECIFICIDAD, VALORES PREDICTIVOS.
DOCENTE: ZULMA CONSUELO URREGO MENDOZA.MD.MgSc.PhD.
OBJETIVOS:
Al finalizar el seguimiento de ésta guia, el estudiante estará en capacidad de:
1) Reflexionar en torno a los conceptos de “normal” y “patológico” en el campo de la
salud.
2) Identificar las diferencias y similitudes centrales entre pruebas diagnósticas y pruebas
de tamizaje.
3) Distinguir los conceptos de sensibilidad, especificidad, y valores predictivos, en una
prueba diagnóstica o de tamizaje.
4) Reconocer una buena prueba de tamizaje.
5) Poder caracterizar los procesos de detección sistemática de enfermedades o factores
predictivos de enfermedad.
INTRODUCCIÓN:
Bien sea en el terreno de la clínica para establecer tratamientos con base en la identificación de
personas que sufren efectivamente de una enfermedad, o en el terreno de la salud pública para
organizar programas de detección sistemática de enfermedades y factores de riesgo/protectores,
las pruebas diagnósticas o para el tamizaje ocupan un lugar central dentro del proceso de
organización de la acción del profesional de la salud. La epidemiología encuentra allí aplicación
proporcionando herramientas para poder identificar las propiedades de las pruebas empleadas,
con el fin de facilitar la selección de aquellas que resulten las más adecuadas para un caso dado, o
permitir una interpretación apropiada de resultados obtenidos en un contexto específico, de
modo que cuente con información que apoye el trazado de intervenciones clínicas o de salud
públicas acordes con la necesidad planteada por el problema que se analiza. A continuación,
revisaremos los principales conceptos relativos a las pruebas diagnósticas o de tamizaje, y
realizaremos algunos ejercicios prácticos que faciliten la operación de los conceptos.
1. LO NORMAL Y LO PATOLÓGICO EN EL TERRENO DE LA SALUD – ENFERMEDAD
De acuerdo con teóricos como Daniel Offer y Melvin Sabshin, existen cuatro perspectivas
reflejadas en la literatura científica para definir la normalidad: a) Normalidad como
ausencia de enfermedad; b) Normalidad como utopía, a modo de conjunto de atributos
que conducen a un funcionamiento óptimo; c) Normalidad como promedio, con base en el
principio matemático de la curva de distribución normal; d) Normalidad como proceso que
resulta de la interacción de sistema a través de los cuales el organismo logra adaptaciones
efectivas a lo largo del tiempo1
.
Desde el punto de vista de las pruebas diagnósticas, para discriminar quien es “normal” de
quien es “anormal” se determinan los “rangos de referencia de la prueba” empleando el
criterio estadístico, basado en cómo se distribuyen las diferentes características tomadas
1
Sadock, B. Signs and syntoms in psychiatry. In: Kaplan and Sadock´s comprehensive textbook of psychiatry.7
th
ed.
Philadelphia:Lippincott William and Wilkins; 2000. P. 677-8.
2. 2
en cuenta (por ejemplo, las mediciones de tensión arterial, el peso, la talla, etc.), a lo largo
de una campana de Gauss2
, construida en el marco de mediciones realizadas a un numero
grande de voluntarios sanos. Se define como “rango normal” a aquel comprendido entre
2 desviaciones estándar del promedio, mostrados como +2 y -2; en dicho rango se ubica el
95% de la población analizada, dejando un 5% de valores en el “rango de lo anormal”,
2.5% por encima y 2.5% por debajo. Tome en cuenta que esta “normalidad estadística” no
es equivalente a la “normalidad biológica”3
.
De acuerdo con lo anterior, ¿dónde estaría ubicado el rango normal de las mediciones,
por ejemplo de tensión arterial, efectuadas en una gran población de voluntarios sanos,
graficadas hipotéticamente a continuación?. Indíquelo sobre el dibujo.
2. LAS PRUEBAS DIAGNÓSTICAS Y LAS PRUEBAS DE ORO
Bajo el concepto de prueba diagnóstica se aglutinan todos aquellos exámenes de
laboratorio, metodologías de diagnóstico clínico, imágenes diagnósticas, pruebas
psicológicas, y otras medios, que son empleados con el fin de identificar en las personas
enfermedades o defectos no diagnosticados previamente4
.
Pero, ¿cómo distinguir INEQUIVOCAMENTE mediante pruebas diagnósticas a quienes
efectivamente padecen una enfermedad de quienes no la padecen?. Para ello, desde el
campo clínico han sido definidos criterios o pruebas diagnósticas “de oro” (gold standard),
a partir de cuya aplicación resulta inequívoco afirmar que alguien tiene una enfermedad.
Por “prueba de oro” debemos entender aquella que se constituye en la mejor disponible
entre las conocidas en un momento histórico dado. De acuerdo con la patología en
cuestión, la prueba de oro puede ser el diagnóstico efectuado por un experto con base en
criterios clínicos estandarizados, una biopsia, una resonancia magnética nuclear, una
necropsia, o cualquier otro tipo de prueba reconocida5
.
El uso previo de un criterio de oro para identificar, sin temor de equivocarse, a quienes
tienen una enfermedad es un requisito imprescindible para poder examinar la utilidad
diagnóstica de cualquier nueva prueba o prueba no evaluada. Con el tiempo, sería posible
incluso que la prueba nueva se convirtiera en la prueba de oro de su momento, y así
sucesivamente. “El investigador debe cerciorarse de que el criterio de oro utilizado ha sido
2
Tamizaje y pruebas de diagnóstico: Validez y repetición; Sensibilidad y Especificidad. Department of epidemiology Johns Hopkins
University. 1996. 14 p.
3
Osorno, J; Llanos,G; Osorno, G. "Epidemiología para clínicos" En: Colombia 1999. Ed:Corporación Editora
Médica del Valle ISBN: 9589530877.
4
Mazuera del Hierro, M (1999) “Curso Modular. Epidemiología Básica”. Universidad de Antioquia. 528 p
5
Riegelman,R; Hirsch,R (1992) “Cómo estudiar un estudio y probar una prueba: Lectura crítica de la literatura médica”. Publicación
científica No. 531 de la Organización Panamericana de la Salud. Segunda Edición. Washington. 268 p.
3. 3
realmente establecido como la mejor referencia posible, antes de usarlo como base de
comparación”6
.
3. CAPACIDAD DE LAS PRUEBAS PARA EFECTUAR DISCRIMINACIÓN DIAGNÓSTICA
Con frecuencia sucede que es difícil interpretar los resultados de una prueba diagnóstica
para diferenciar personas sanas de enfermas, porque la distribución de los resultados
obtenidos por unas y otras puede llegar a superponerse. Del mismo modo en que la
ilustración siguiente muestra cómo algunos de quienes se consideran inocentes de un
delito resultan en realidad culpables, mientras algunos de quienes se consideran culpables
resultan en realidad inocentes, también algunos resultados de pruebas diagnósticas en
personas realmente sanas arrojan los mismos valores obtenidos por otras personas
realmente enfermas, y viceversa:
Es por ello que se hace necesario establecer “puntos de corte” en los resultados de las
pruebas de diagnóstico, para poder dirimir mediante ellas a quien se considerará en
posesión de resultados “normales” (luego se le dará por sano), y a quien se le considerará
en posesión de resultados “anormales” (luego se asumirá como enfermo). La sensibilidad y
especificidad de la prueba diagnóstica dependerá del punto de corte que se elija con esos
fines.
Además de lo anterior, tenga en cuenta que la EXACTITUD DE UNA PRUEBA (capacidad de
identificar el valor verdadero) puede verse afectada por factores de dos tipos:
Variaciones en la prevalencia de la enfermedad.
Variaciones en el punto de corte para la tamización.
Mientras que la PRECISIÓN DE LA PRUEBA ( Confiabilidad, capacidad de la prueba para dar
resultados invariables en mediciones repetidas) , se puede afectar en tres tipos de situaciones:
Variaciones del examinador.
Variaciones del examinado.
Variaciones del instrumento.
6
Riegelman,R; Hirsch,R (1992) “Cómo estudiar un estudio y probar una prueba: Lectura crítica de la literatura médica”. Publicación
científica No. 531 de la Organización Panamericana de la Salud. Segunda Edición. Washington. 268 p.
Zona de superposición de resultados que genera
dificultades para la interpretación
4. 4
4. LOS CONCEPTOS DE SENSIBILIDAD, ESPECIFICIDAD, VALORES PREDICTIVOS.
La SENSIBILIDAD es una medida de la probabilidad de que la prueba de un
resultado positivo cuando la enfermedad está presente: si una prueba diera un
resultado positivo (anormal) en todos los casos que tienen la enfermedad, su
sensibilidad sería del 100%; 100% de capacidad de detectar a una persona que
está enferma. Esta prueba no daría falsos negativos7
. Algunas definiciones
equivalentes sobre la sensibilidad pueden ser: “Sensibilidad es la habilidad de una
prueba para identificar correctamente aquellos que TIENEN la enfermedad” 8
; o
“Sensibilidad es la capacidad de la prueba para detectar como enfermos a los que
verdaderamente lo son”.
La ESPECIFICIDAD es la medida de la probabilidad de que la prueba resulte
negativa cuando la enfermedad no está presente. Un resultado negativo (normal)
en todos los pacientes que no tienen la enfermedad equivale a una especificidad
del 100%; 100% de capacidad para confirmar que una persona está sana. Esta
prueba con especificidad perfecta no daría falsos positivos9
. Se han construido
varias definiciones igualmente apropiadas para la especificidad tales como:
“Especificidad es la habilidad de una prueba para identificar correctamente
aquellos que NO tienen la enfermedad” 10
; o “Especificidad es la capacidad de la
prueba para detectar como sanos a los que verdaderamente lo son”.
La VALIDEZ DE UNA PRUEBA se define como la habilidad para identificar
correctamente quienes tienen una enfermedad y quienes no la tienen11
.
Especificidad y Sensibilidad son los dos componentes de la validez de una prueba.
Ya hemos visto que una prueba diagnóstica proporciona datos capaces de
modificar en algún sentido las probabilidades de que se efectúe el diagnostico de
una enfermedad en un individuo; los indicadores de sensibilidad y especificidad
son los que permiten establecer el rendimiento operativo de una prueba
diagnóstica, trazando su mayor o menor calidad12
. Los criterios de sensibilidad y
especificidad son igualmente aplicables a las pruebas de tamización.
VALOR PREDICTIVO POSITIVO13
: es la probabilidad de que un individuo con la
prueba positiva tenga la enfermedad. Indica la proporción de enfermos entre los
7
Osorno, J; Llanos,G; Osorno, G. "Epidemiología para clínicos" En: Colombia 1999. Ed:Corporación Editora
Médica del Valle ISBN: 9589530877.
8
Tamizaje y pruebas de diagnóstico: Validez y repetición; Sensibilidad y Especificidad. Department of epidemiology Johns Hopkins
University. 1996. 14 p.
9
Osorno, J; Llanos,G; Osorno, G. "Epidemiología para clínicos" En: Colombia 1999. Ed:Corporación Editora
Médica del Valle ISBN: 9589530877.
10
Tamizaje y pruebas de diagnóstico: Validez y repetición; Sensibilidad y Especificidad. Department of epidemiology Johns Hopkins
University. 1996. 14 p.
11
Tamizaje y pruebas de diagnóstico: Validez y repetición; Sensibilidad y Especificidad. Department of
epidemiology Johns Hopkins University. 1996. 14 p.
12
Las pruebas de tamizaje en salud pública. Vigilancia epidemiológica. No. 35, Vol. 21, Sem. 35, 2004..
Disponible en: http://www.dgepi.salud.gob.mx/boletin/2004/sem35/pdf/edit3504.pdf
13
Mazuera del Hierro, M (1999) “Curso Modular. Epidemiología Básica”. Universidad de Antioquia. 528 p
5. 5
que tuvieron una prueba positiva. Entre mayor sea la prevalencia de una
enfermedad en una población mayor será su valor predictivo positivo (Teorema
de Bayes). Además si la prevalencia de la enfermedad y la sensibilidad
permanecen constante, un aumento en la especificidad aumenta el valor
predictivo positivo, pues se hacen menores los falsos positivos.
VALOR PREDICTIVO NEGATIVO: es la probabilidad de que la enfermedad no esté
presente cuando el individuo obtiene una prueba negativa
PRUEBA FALSO POSITIVO: ocurre cuando la prueba es anormal, es decir da
positiva, pero la persona no padece en realidad la enfermedad. La proporción de
falsos positivos es el complemento de la especificidad de la prueba.
PRUEBA FALSO NEGATIVO: ocurre cuando el resultado de la prueba es normal (da
negativo) pero la persona si padece la enfermedad. La proporción de falso
negativos es el complemento de la sensibilidad.
Lo anterior deja planteado que al aplicar una prueba diagnóstica o de tamizaje) en una población
dada, existen cuatro grandes posibilidades de resultados:
Que la persona tenga la enfermedad y tenga la prueba positiva = VERDADEROS POSITIVOS
Que la persona no tenga la enfermedad, pero tenga la prueba positiva = FALSOS
POSITIVOS
Que la persona tenga la enfermedad, y tenga la prueba negativa = FALSOS NEGATIVOS
Que la persona no tenga la enfermedad y tenga la prueba negativa = VERDADEROS
NEGATIVOS
¿Cómo podremos conocer cuál es la sensibilidad y especificidad, o sus valores predictivos de una
prueba, conociendo la distribución de personas a quienes se aplicó la prueba, a lo largo de las
cuatro posibilidades que acaban de ser descritas?
5. CALCULO DE SENSIBILIDAD, ESPECIFICIDAD, VALOR PREDICTIVO POSITIVO, VALOR
PREDICTIVO NEGATIVO
Con base en lo anterior, organicemos los diferentes grupos de resultados posibles de
obtener cuando una prueba diagnóstica o de tamización es aplicada en una población
dada; asumamos que en éste caso se trata de una prueba de tamización.
6. 6
ESQUEMA DE ESTUDIO PARA LAS PRUEBAS DE TAMIZACIÓN
ENFERMOS SANOS Total
RESULTADOS
PRUEBA +
a
Tienen la
enfermedad y tienen
la prueba positiva
VERDADEROS
POSITIVOS (VP)
b
No tienen la
enfermedad y tienen
la prueba positiva
FALSOS POSITIVOS
(FP)
a + b
TOTAL DE PRUEBAS
POSITIVAS
(VP + FP )
RESULTADOS
PRUEBA -
c
Tienen la
enfermedad y tienen
la prueba negativa
FALSOS NEGATIVOS
(FN)
d
No tienen la
enfermedad y tienen
la prueba negativa
VERDADEROS
NEGATIVOS
(VN)
c + d
TOTAL DE PRUEBAS
NEGATIVAS
(FN + VN)
Total a + c
TOTAL DE
ENFERMOS
(VP+FN)
b + d
TOTAL DE SANOS
(FP+VN)
N
A partir de allí, y con base en las definiciones anotadas atrás, los cálculos se realizarían como sigue:
SENSIBILIDAD = VP/(VP+FN) = a / (a+c)
ESPECIFICIDAD = VN/ (FP + VN) = d / (b+d)
VALOR PREDICTIVO POSITIVO = VP/ (VP+FP) = a / (a+b)
VALOR PREDICTIVO NEGATIVO = VN/ (FN+VN)= d/ (c+d)
PROPORCIÓN DE FALSOS NEGATIVOS = 1 – Sensibilidad.
PROPORCIÓN DE FALSOS POSITIVO = 1 – Especificidad.
Para practicar lo anterior, a partir de los resultados de una serie de pruebas para sífilis realizadas a
12.011 sueros, empleando el FTA – ABS como “Prueba de Oro”, y comparando tales resultados con
los obtenidos con las pruebas SERODIA y DETERMINE, CALCULE para cada una de esas dos
pruebas en comparación con el “gold estándar”: SENSIBILIDAD, ESPECIFICIDAD, VALORES
PREDICTIVOS POSITIVO Y NEGATIVO. Con base en lo anterior, complete el Cuadro No. 1. A
continuación, escriba una interpretación narrativa para cada uno de los resultados obtenidos,
basada en las definiciones presentadas en la guía.
7. 7
Fuente: García, S; et al (2008) Sensibilidad y especificidad de dos pruebas treponémicas para el diagnóstico
serológico de la sífilis. ENF INF MICROBIOL 2008 (28) 2 : 46 – 50.
CUADRO No. 1
SENSIBILIDAD Y ESPECIFICIDAD DE SERODIA Y DETERMINE
FTA – ABS Prueba de referencia SERODIA (%) DETERMINE (%)
Sensibilidad = a/(a+c)
Especificidad = d/(b+d)
Valor predictivo positivo = a/(a+b)
Valor predictivo negativo = d / (c+d)
Donde:
a = prueba desarrollada positiva y estándar de oro positivo.
b = prueba desarrollada positiva y estándar de oro negativo.
c= prueba desarrollada negativa y estándar de oro positivo.
d=prueba desarrollada negativa y estándar de oro negativo.
6. PRUEBAS DE TAMIZAJE Y PROGRAMAS DE TAMIZACIÓN
Se les llama pruebas de tamizaje a aquellas pruebas diagnósticas que poseen una sensibilidad muy
alta, con lo cual resultan útiles para filtrar a los individuos enfermos de los sanos, pues si salen
negativas, “descartan virtualmente la enfermedad”14
. Serían deseables las pruebas de tamizaje
muy sensibles y muy especificas, pero esta condición es infrecuente en una prueba15
.
14
Las pruebas de tamizaje en salud pública. Vigilancia epidemiológica. No. 35, Vol. 21, Sem. 35, 2004.. Disponible en:
http://www.dgepi.salud.gob.mx/boletin/2004/sem35/pdf/edit3504.pdf
15
Bonita, R; et al (2008)Epidemiología básica. Segunda edición. Washington, OPS. 269 p.
8. 8
El propósito central de los programas de tamización, también llamados programas de detección
sistemática de la enfermedad, es la detección precoz de la enfermedad con el fin de poder
mejorar el pronóstico mediante la implementación de medidas de intervención desde la fase
asintomática de la misma, a través de la aplicación de pruebas rápidas y a gran escala para
evidenciar enfermedades en personas aparentemente sanas . También se incluye bajo éste
concepto la identificación e intervención de factores de riesgo, en especial los que sean
modificables16,17.
Los requisitos que ha de cumplir un programa de detección sistemática son los siguientes18
:
El costo debe valorarse en función del número de casos detectados y las consecuencias de
no llevar a cabo la detección. La prevalencia del periodo preclínico de la enfermedad debe
ser alta en la población a estudiar.
El período de adelanto diagnóstico (intervalo entre el momento en que la enfermedad
puede determinarse mediante una prueba de detección y el momento en que suele
diagnosticarse en los pacientes con síntomas) debe ser prolongado.
El tratamiento precoz debe ser más eficaz que el instaurado luego del desarrollo clínico
evidente de la enfermedad (sesgo de duración).
Una prueba de detección sistemática debe ser de bajo costo, fácil de aplicar, aceptable por
el público, confiable y válida, con una apropiada sensibilidad y especificidad para las
funciones de tamizaje.
Con base en lo anterior, discuta con su grupo:
¿Cuál de las pruebas contrastadas con la “prueba reina” en el ejemplo sobre detección de
sífilis en suero le impresiona como con mejores condiciones para desempeñarse como una
prueba de tamizaje?. Justifique su respuesta.
De ejemplos de programas de prevención primaria, basados en la detección sistemática,
que conozcan los miembros de su grupo, mencionando la mayor cantidad de
características sobre ellos, inclusive las pruebas de tamizaje que utilizan.
Actualmente en el país la llamada “Ley de Víctimas” establece prioridades para la atención
integral en salud mental, en perspectiva reparadora, de las personas víctimas de violencia
en el marco del conflicto armado interno colombiano. ¿considera Ud. que serían útiles y
aplicables los programas de tamización aplicados a ésta población?. En caso de
considerarlos aplicables, ¿cuáles serían sus argumentos, y cuáles las posibles pruebas de
tamizaje seleccionadas (seleccione con su grupo, entre las que conozcan)?. En caso de que
los considere inaplicables, ¿cuáles serían sus argumentos, y cuales las posibilidades
alternativas para facilitar la detección y el acceso de las víctimas a los servicios de salud
mental ordenados por norma para ellos?.
16 16
Mazuera del Hierro, M (1999) “Curso Modular. Epidemiología Básica”. Universidad de Antioquia. 528
17
Bonita, R; et al (2008)Epidemiología básica. Segunda edición. Washington, OPS. 269 p.
18
Bonita, R; et al (2008)Epidemiología básica. Segunda edición. Washington, OPS. 269 p.