T R A S P L A N T E S S I G L O X X I
MÉTODOSESTADÍSTICOSENELTRASPLANTERENAL
1
MÉTODOS
ESTADÍSTICOS EN
EL TRASPLANTE
RENAL
B i b l i o t e c a d e
TRASPLANTESSIGLOXXI
Bibliotecade
1
07.04-CEL-L05
Roche Farma, S. A.
C/ Eucalipto, 33.
28016 Madrid
Tel. 91 324 81 00 - Fax 91 324 83 50
www.roche.es
www.roche-trasplantes.com
T R A S P L A N T E S S I G L O X X I
MÉTODOS
ESTADÍSTICOS EN
EL TRASPLANTE
RENAL
B i b l i o t e c a d e
1
Paginas iniciales 4/10/04 12:37 Página 1
Edificio Vértice Antonio López, 249 - 1º
28041 - MADRID
ISBN Obra completa: 84-96305-20-1
ISBN Primer volumen: 84-96305-21-X
D.L.:
©2004 DRUG FARMA S.L.
Reservados todos los derechos. Ninguna parte de esta publicación puede ser reproducida sin el permiso escrito del titular del Copyright.
Esta publicación se ha realizado con la colaboración de Roche Farma.
DRUG
Paginas iniciales 4/10/04 12:37 Página 2
3
ÍNDICE
Presentación 7
M. Arias
Introducción 9
M. Arias
Estadística en Biomedicina: una herramienta peligrosa 11
M. Delgado, J. Llorca
Esquema general de análisis estadístico de una población
trasplantada 31
R. Escallada, M. Arias
Curvas de vida y supervivencia en el tratamiento sustitutivo
de la insuficiencia renal: diálisis y trasplante renal 67
V. Abraira, C. Quereda
El concepto de semivida como predictor de la supervivencia
a largo plazo 135
R. Escallada
De las bases de datos a los programas estadísticos 149
J. C. Ruiz San Millán
Resultados del trasplante renal: ensayos clínicos y registros 163
J. Pascual, D. Hernández
Paginas iniciales 4/10/04 12:37 Página 3
Paginas iniciales 4/10/04 12:37 Página 4
ÍNDICE DE AUTORES
COORDINADOR
Manuel Arias
Jefe de Servicio y Catedrático de Nefrología
Hospital Universitario Marqués de Valdecilla (Santander)
AUTORES
Victor Abraira
Unidad de Bioestadística Clínica
Hospital Ramón y Cajal (Madrid)
Miguel Delgado Rodríguez
Catedrático de Medicina Preventiva y Salud Pública
Universidad de Jaén
Rafael Escallada Cotero
Nefrólogo
Director Centro de Diálisis DIALSAN (Santander)
Domingo Hernández
Miembro del Grupo de Medicina Basada en la Evidencia en Trasplante Renal de la
Sociedad Española de Nefrología. Médico Adjunto
Servicio de Nefrología. Hospital Universitario de Canarias (Tenerife)
Javier Llorca Díaz
Profesor Titular de Medicina Preventiva y Salud Pública
Universidad de Cantabria
Julio Pascual Santos
Miembro del Grupo de Medicina Basada en la Evidencia en Trasplante Renal de la
Sociedad Española de Nefrología. Médico Adjunto
Servicio de Nefrología. Hospital Ramón y Cajal (Madrid)
Carlos Quereda
Servicio de Nefrología
Hospital Ramón y Cajal (Madrid)
Juan Carlos Ruiz San Millán
Médico Adjunto
Servicio de Nefrología
Hospital Universitario Marqués de Valdecilla (Santander)
5
Paginas iniciales 4/10/04 12:37 Página 5
7
PRESENTACIÓN
TRASPLANTES SIGLO XXI
“La imposibilidad de una obra no es siempre motivo
para no emprenderla, siempre que el autor no se haga,
con respecto a ella, demasiadas ilusiones“
(Ortega y Gasset).
Una serie monográfica y continuada sobre trasplantes plantea una serie de dificultades
que la acercan a la utopía, pero el reto está en aproximar lo más posible esta utopía a la re-
alidad. Ya en sí, es difícil definir claramente el objetivo y los fines de una serie de monogra-
fías sobre trasplante renal en estos días de avalancha de información fácilmente accesible.
Hemos valorado la conveniencia y necesidad de abordar tópicos de actualidad junto con
otros básicos que convenga poner al día. Esta biblioteca estará integrada por monografías
que tendrán principio y fin en sí mismas, desarrolladas por expertos en cada materia, y
editadas en un formato cómodo y coleccionable.
Esta idea de Roche Trasplantes se pone en marcha hoy con esta primera entrega sobre
Métodos estadísticos en trasplante renal. La continuidad de la serie depende de todos
nosotros.
Manuel Arias
Cap 01 4/10/04 12:45 Página 7
Cap 01 4/10/04 12:45 Página 8
9
INTRODUCCIÓN
MÉTODOS ESTADÍSTICOS
EN EL TRASPLANTE RENAL
¿Es mejor ciclosporina que tacrolimus en el trasplante renal de cadáver?
¿Tiene valor la compatibilidad HLA en el emparejamiento actual donante-receptor en
trasplante de riñón de cadáver en pacientes hipersensibilizados?
¿La supervivencia de los injertos a largo plazo es diferente en los pacientes a los que se
les retiran los esteroides?
¿Es mejor la diálisis o el trasplante en pacientes diabéticos tipo 2?
Hablar de trasplante es hablar de estadística y de comparaciones. Nos movemos entre
decisiones que intentan equilibrar los buenos resultados con la ausencia de efectos
secundarios en un contexto de múltiples factores que intervienen sobre un paciente
concreto en el que el aislamiento de una variable no es posible como suele suceder en
el laboratorio o en los modelos animales experimentales.
Del análisis correcto de la propia experiencia se pueden deducir pautas de comporta-
miento en nuestro círculo asistencial que son exportables en el caso de suponer una
mejoría o cambio positivo sobre lo existente.
La exposición de estas experiencias propias tienen que hacerse a través de revistas
científicas y sometidas a revisión por expertos, en la que, lógicamente, el análisis esta-
dístico va a ser fundamental. Las posibilidades de error y manipulación de la estadística
en biomedicina han dado lugar a una leyenda negativa que arrastra un cierto escepticis-
mo que perjudica el rigor científico. Frases como “la estadística es la herramienta que
permite torturar los datos hasta que canten” expresan ese desencanto que muchas
veces está basado en la ignorancia o el conocimiento incompleto de las técnicas y fun-
damentos de la estadística.
La falta de formación durante generaciones, ahora en vías de mejora, ha llevado a la
adquisición desordenada de conocimientos y al autodidactismo con la consiguiente
inseguridad y falta de dominio en esta materia.
Cap 01 4/10/04 12:45 Página 9
10
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
La disciplina y el rigor en la recogida de datos es el primer paso ineludible que obliga,
muchas veces, a una autocrítica sobre nuestros documentos clínicos y bases de datos
y a una permanente renovación.
Sobre la base de unos datos rigurosos y bien seleccionados, la herramienta que es la
estadística hará “cantar” a los datos sin necesidad de torturarlos sino orientados a con-
testarnos a las preguntas que nos preocupen y a proporcionarnos ayuda en la toma de
decisiones complejas en las que nada es blanco o negro.
Seguiremos necesitando el consejo de expertos, como los que he tenido la suerte de
coordinar en esta monografía, pero una puesta al día teórica, con el mayor correlato
práctico que puede permitir el formato libro, parecía necesario en el ámbito que es el
trasplante renal.
Con esta idea diseñamos el contenido de este primer volumen de la serie de monogra-
fías Trasplantes Siglo XXI en el que hemos podido contar con una serie de personas
que reúnen la condición de expertos en el tema y de ser amigos. Esta segunda cualidad
es la que ha hecho posible que acepten esta tarea, buscando un hueco entre sus
muchas ocupaciones, lo que les agradezco profundamente.
Si en algún momento este libro ayuda a alguien a solucionar o, por lo menos, a plante-
ar correctamente el análisis de una población de trasplantados renales y a analizar
correctamente los métodos empleados en trabajos y propuestas de ensayos clínicos,
nos daremos por satisfechos.
Manuel Arias
Cap 01 4/10/04 12:45 Página 10
ESTADÍSTICA EN BIOMEDICINA:
UNA HERRAMIENTA PELIGROSA
M. Delgado, J. Llorca
INTRODUCCIÓN
En este apartado se expondrán una serie de errores frecuentes en el análisis de datos
en la literatura médica. En lo posible, se utilizarán ejemplos sobre trasplantes, pero ello
no significa que los artículos sobre trasplantes cometan estos errores con más frecuen-
cia; ocurren también en otros campos de la investigación médica. Claro está que para la
valoración de estos errores, es imprescindible que, dentro de la sección de métodos de
un artículo, se aborde la metodología estadística empleada, y sorprende que aún haya
estudios en los que no se describen estas técnicas (Verran et al. 2001, Antonopoulos et
al. 2001).
En la primera sección, se establecen las diferencias entre asociación estadística y cau-
salidad, para lo que es necesario definir el sesgo de confusión. La segunda sección
se centra en separar los modelos predictivos de los explicativos; son dos tipos de
modelos que se obtienen como resultado de las mismas técnicas de análisis multiva-
riable, pero que deben interpretarse de forma diferente. La sección 3 aborda un pro-
blema habitual en el análisis de supervivencia: la existencia de seguimientos incom-
pletos, que obliga a introducir el concepto de “censura”; se discuten las “censuras”
informativa y no informativa y, como consecuencia, el problema de riesgos competi-
tivos de muerte, una situación en la que el análisis de supervivencia requiere técnicas
distintas de las utilizadas habitualmente. En la sección 4, se discute la asunción de
proporcionalidad que permite emplear la regresión de Cox, una técnica de uso habi-
tual para estimar supervivencia. En la sección 5, se abordan algunos errores menos
típicos que se han encontrado al revisar la literatura sobre trasplantes (uso de técni-
cas estadísticas inadecuadas, errores en la comunicación de resultados,etc.).
11
Cap 02 4/10/04 12:46 Página 11
12
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Finalmente, en la sección 6 se aborda el recordatorio de otras consideraciones meto-
dológicas aparte del análisis de datos.
ASOCIACIÓN Y CAUSALIDAD
Uno de los objetivos más frecuentes en un estudio sobre trasplantes es medir la aso-
ciación entre dos variables. Por ejemplo, los investigadores pueden estar interesados en
comprobar si un injerto renal, procedente de un donante vivo, está más o menos aso-
ciado a la supervivencia inmediata del injerto que si procediera de un donante cadáver.
Igualmente, podría investigarse si un trasplante cardíaco tiene mejor pronóstico a largo
plazo, cuando hay compatibilidad HLA, que cuando sólo hay compatibilidad ABO.
Esta fuerza de asociación se suele medir empleando el riesgo relativo (RR) en cualquie-
ra de sus formas. En el ejemplo del injerto renal, probablemente se presentaría la razón
de odds (odds ratio, OR) obtenida por regresión logística; y en el ejemplo del pronóstico
a largo plazo, probablemente se mediría la razón de tasas (hazards ratio) mediante la
regresión de Cox. En ambos casos, la interpretación que se hace es la misma: si el RR
es mayor de 1, el factor estudiado está asociado a una menor supervivencia. Sin embar-
go, es frecuente que en la literatura médica se cometa el error de interpretar un riesgo
relativo mayor de 1 como si el factor (injerto de donante vivo o compatibilidad ABO) fuera
la causa de mayor supervivencia. Para mostrar la diferencia es necesario aclarar el con-
cepto de causa.
La existencia de asociación estadística es el punto de partida para establecer, entre dos
variables, una relación de causalidad (Rothman y Greenland, 2000). Se han enumerado
muchos criterios de causalidad pero, en definitiva, se reducen a comprobar que la causa
presumible preceda, en el tiempo, al efecto, y que la asociación observada no se deba
a la existencia de sesgos en la selección de la muestra, en la recogida de datos, en su
análisis o a que no se considere la interferencia que producen otras causas (el sesgo de
confusión). En el supuesto de que un estudio haya sido correctamente realizado (sin ses-
gos de selección, información o análisis incorrecto), el motivo fundamental, para que
exista asociación pero no causalidad, es la presencia de factores de confusión.
Factores de confusión
Para comprender qué es un factor de confusión, considérese el siguiente ejemplo hipo-
tético: se quiere comparar la mortalidad intrahospitalaria de los trasplantes cardíacos en
dos hospitales (A y B). Los resultados iniciales se presentan en la Tabla I. Se observa que
un RR = 2, lo que sugiere que la mortalidad en el hospital A es el doble que en el hos-
pital B. Sin embargo, los investigadores se dieron cuenta de que en el hospital A se rea-
lizaban más trasplantes de emergencia, los cuales tienen una mayor mortalidad quirúr-
gica. Entonces, surge la pregunta: ¿la mayor mortalidad en el hospital A se debe a que
Cap 02 4/10/04 12:46 Página 12
en el mismo se hacen peor los trasplantes (relación causal)?, ¿o se debe a que los tras-
plantes se realizan en situación de emergencia (factor de confusión)? Para comprobarlo,
analizaron por separado la mortalidad en el trasplante de emergencia y en el trasplante
sin emergencia. Los resultados se muestran en la Tabla II.
En los pacientes que reciben un trasplante de emergencia, la mortalidad en el hospital A
es la misma que en el B (RR = 1,0); en cuanto a los que reciben el trasplante de forma
programada, la mortalidad en ambos hospitales es también casi la misma (RR = 1,1). Este
resultado muestra que las diferencias entre ambos hospitales no se deben al hospital
mismo (relación causal), sino que hay otra variable –la emergencia quirúrgica– que “con-
funde” la relación entre hospital y mortalidad. En este caso, se dice que la emergencia
quirúrgica es un “factor de confusión”.
13
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Análisis crudo
Muerte Supervivencia Total Riesgo relativo
intrahospitalaria
Hospital A 40 360 400
Hospital B 25 475 500
40/400
= 2,0
25/500
Tabla II. Mortalidad intrahospitalaria en el trasplante cardíaco en dos hospitales.
Análisis estratificado en función de la emergencia.
Cirugía de emergencia
Muerte Supervivencia Total Riesgo relativo
intrahospitalaria
Hospital A 35 65 100
Hospital B 17 33 50
Cirugía programada (sin emergencia)
Muerte Supervivencia Total Riesgo relativo
intrahospitalaria
Hospital A 5 295 300
Hospital B 8 442 450
Tabla I. Mortalidad intrahospitalaria en el trasplante cardíaco en dos hospitales.
35/100
= 1,0
17/50
5/300
= 1,1
8/450
Cap 02 4/10/04 12:46 Página 13
La relación entre las tres variables (hospital, mortalidad y emergencia) se muestra en la
Figura 1. Para saber si una variable es un factor de confusión es necesario comprobar
tres criterios:
• Criterio 1: el factor de confusión es un factor de riesgo del efecto independiente de
la exposición o variable que se estudia. En nuestro ejemplo, la cirugía de emergen-
cia es un factor de riesgo de la mortalidad en cualquier hospital.
• Criterio 2: el factor de confusión está asociado al factor que se estudia. En el ejem-
plo, la cirugía de emergencia es más frecuente en el hospital A.
• Criterio 3: el factor de confusión no es una consecuencia del factor que se estudia
(ni tampoco consecuencia del efecto). En el ejemplo, este criterio se cumple si el
hospital A no demora el trasplante hasta que se produce la emergencia.
Control de factores de confusión en el análisis
¿Qué debe hacer el investigador en el análisis cuando encuentra un factor de confusión?
Hay básicamente dos alternativas: análisis estratificado (como el que se ha realizado en
este ejemplo) y análisis multivariable. El análisis estratificado, que debe realizarse siem-
pre antes del multivariable para tener un mejor conocimiento de los datos, sólo es útil
cuando hay uno o dos factores de confusión, porque puede ser inmanejable, con un
número mayor, el número de estratos. El análisis multivariable consiste en introducir
dentro del modelo (por ejemplo, de regresión logística o de regresión de Cox), la varia-
14
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Censura:
Vivos con función
del injerto
Fallo:
Muertos con fun-
ción del injerto
Fallo:
Vivos con fracaso
del injerto
Censura:
Vivos con función
del injerto
Censura:
Muertos con fun-
ción del injerto
Fallo:
Vivos con fracaso
del injerto
(a) (b)
Figura 1. Dos formas de analizar la supervivencia del injerto. En (a), la muerte con fun-
ción se considera fallo; en (b), la muerte con función se considera dato censurado. En
(b), la muerte actúa como un riesgo competitivo: si aumenta la mortalidad, disminuye
el riesgo de fracaso del injerto.
Cap 02 4/10/04 12:46 Página 14
ble de interés y los factores de confusión. En el ejemplo que se está presentando, se
utilizaría la regresión logística en la que se relacionaría la probabilidad de muerte con el
hospital y con la cirugía de emergencia.
Un problema añadido se presenta cuando hay un gran número de variables candidatas
a ser incluidas en el modelo de regresión. ¿Cuáles de ellas deben seleccionarse? ¿Existe
alguna regla de selección? Un procedimiento que frecuentemente se utiliza de forma
errónea es la regresión paso a paso (stepwise regression). En la regresión paso a paso
es el ordenador quien decide –con la ayuda de un algoritmo estadístico– las variables
que se incluyen en el modelo; esto puede hacer que se seleccionen variables irrelevan-
tes o que no sean factores de confusión (con lo que los intervalos de confianza serán
mayores y descenderá la significación estadística), o que algunos factores de confusión
no sean seleccionados (con lo que las OR obtenidas no serán correctas: estarán sesga-
das). Es la aproximación que utilizaron Shahinian et al. (2003) en un análisis de factores
de riesgo de enfermedad linfoproliferativa tras el trasplante, con un estudio de casos y
controles, emparejados, en una relación 1:2 (20 casos y 40 controles).
La regresión paso a paso sólo debería utilizarse en tres situaciones (Katz, 1999):
a) cuando se pretende obtener un modelo predictivo con el menor número posi-
ble de variables (ver más adelante Modelos predictivos y explicativos), b) cuando
se intenta minimizar el impacto de los datos que no constan (missing data), o c)
cuando la muestra es escasa.
Si se pretende obtener una estimación ajustada de la OR o del RR, un procedimien-
to más adecuado es el sugerido por Delgado-Rodríguez y Llorca (2001):
1. Revisar la bibliografía para identificar los factores de riesgo o los protectores cono-
cidos y su posible asociación con la exposición. Cualquier variable que haya sido
identificada previamente como factor de riesgo o protector del efecto en estudio
deberá ser considerada como posible factor de confusión.
2. Eliminar los factores de riesgo o protectores que se consideren variables interme-
dias entre la exposición y el efecto.
3. Realizar un análisis estratificado: la relación entre la exposición y el efecto debe
estudiarse estratificando por cada una de las variables que han quedado después
del paso 2. Esto permite identificar los factores de confusión y las interacciones.
4. Realizar un modelo multivariable, paso a paso (exploratorio), con todas las variables
identificadas en el paso 3. Para ello, se parte de un modelo en el que el efecto es
la variable dependiente y la exposición de interés es el regresor. A continuación, se
permite la introducción progresiva de las variables que tengan una p <0,2. Cada fac-
tor de confusión debe ser introducido como una sola variable (es decir, si se pre-
tende ajustar por edad, ésta debe introducirse como variable continua, no categori-
zándola). Este procedimiento tiene el inconveniente de que trabaja solamente con
los sujetos de los que existe información completa de todas las variables.
15
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 15
5. Realizar un modelo multivariable saturado con las variables que han sido seleccio-
nadas en el paso anterior. Aunque tenga las mismas variables, este modelo puede
ser distinto del obtenido en el paso 4: suponga que en el paso 4 se intentan valo-
rar, como posibles factores de confusión, la edad, el sexo, la clase social, el consu-
mo del alcohol y el de tabaco. Aunque el modelo seleccione sólo la edad y el sexo,
los cálculos se realizarán solamente con los sujetos de los que se dispone de la
información relativa a las cinco variables. En el modelo saturado del paso 5, en cam-
bio, intervienen todos los sujetos de los que se conocen la edad y el género, aun-
que no se conozcan la clase social y el consumo de alcohol y tabaco.
6. Aproximación heurística: realizar nuevos modelos, sacando e introduciendo las varia-
bles del modelo saturado, para retener aquellas que cambian el coeficiente de la
exposición en más del 10% respecto del modelo saturado.
MODELOS PREDICTIVOS Y EXPLICATIVOS
Los modelos multivariables pueden tener básicamente dos finalidades: identificar las cau-
sas que explican un resultado (se habla entonces de modelos explicativos) o predecir el
resultado –haya o no una relación causal– (es el caso de los modelos predictivos). En ambos
casos, se utilizan las mismas técnicas multivariables (regresión logística, de Poisson, de
Cox, etc.), pero la forma de construir el modelo y de interpretarlo cambia completamente.
Modelos explicativos
Los modelos explicativos son del tipo de los presentados en la sección anterior: se
desea medir la asociación de una variable con un resultado y se introducen otras varia-
bles, en el modelo, con la finalidad de obtener estimaciones correctas (ajustadas) del
riesgo relativo. Observe que estos modelos tienen finalidad causal, por ello es necesa-
rio tener presente los factores de confusión y las interacciones e introducirlos en el
modelo siguiendo el procedimiento que se ha descrito en la sección Control de factores
de confusión en el análisis. En los modelos explicativos es incorrecto dejar en manos
del ordenador la selección automática de las variables (por ejemplo, mediante la regre-
sión paso a paso). Se trata de los modelos más utilizados.
Modelos predictivos
En ocasiones, el investigador desea elaborar un modelo que prediga cuándo se va a
producir el resultado, aunque no exista una relación causal entre las variables del mode-
lo y el resultado. Por ejemplo, los criterios de Ramson para la pancreatitis no provocan
la muerte, pero la predicen. En la elaboración de un modelo predictivo, las variables no
se seleccionan por la asociación que tengan con el resultado (la muerte, el fracaso del
injerto,etc.) sino por su capacidad para clasificar a los pacientes en dos grupos: los que
tendrán un trasplante exitoso o los que tendrán un fracaso. En el modelo predictivo, por
16
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 02 4/10/04 12:46 Página 16
lo tanto, no es de interés calcular el riesgo relativo, ni tener en cuenta los factores de
confusión o las interacciones. En este caso, sí puede ser correcto dejar al ordenador la
selección de las variables paso a paso.
Por ejemplo, Smits et al. (2003), en un excelente artículo, elaboraron un modelo predic-
tivo sobre la supervivencia en la lista de espera para trasplante cardíaco en Alemania,
para ello realizaron una regresión de Cox múltiple paso a paso, utilizando los 889 pacien-
tes que entraron en la lista de espera en 1997. Hay que señalar dos datos del artículo:
1) en todo momento mantienen la interpretación del modelo como predictivo (no cau-
sal); 2) el modelo obtenido fue validado con los 897 pacientes que entraron en lista de
espera en 1998.
Debe destacarse especialmente este segundo punto; cualquier modelo funciona bien (y
mejor que otros modelos) en la muestra que se ha utilizado para elaborarlo; por ello, los
modelos predictivos deben ser validados siempre. Para la validación puede utilizarse una
muestra independiente de la que se empleó en la generación del modelo (como en
Smits et al.) o puede dividirse al azar la muestra inicial en dos grupos: un grupo se utili-
za para generar el modelo y el otro para validarlo.
Es frecuente el error de interpretar como causal un modelo predictivo. Loucaidou et al.
(2003) utilizaron un modelo de Cox para predecir la muerte en 83 trasplantes renales con
rechazo. La variable más fuertemente asociada fue la existencia de rechazo vascular; los
autores concluyeron que eran necesarios mejores medios para prevenir y tratar el recha-
zo vascular. Lo que se desea destacar en esta sección es que el modelo elegido (pre-
dictivo) no era adecuado para llegar a esa conclusión (al margen de que sea o no cierta),
era necesario un modelo explicativo en el que el riesgo relativo de cada tipo de rechazo
se ajustara por sus factores de confusión.
En el trabajo mencionado de factores de riesgo de enfermedad linfoproliferativa post-
trasplante (Shahinian et al. 2003), no queda claro a priori cuál es la actitud de los auto-
res. Da la impresión de que buscan una explicación causal, ya que la hipótesis de parti-
da es que el virus de Epstein-Barr se relaciona con la enfermedad linfoproliferativa. Sin
embargo, aclara la cuestión la forma en que construyen el modelo, mediante regresión
escalonada y permitiendo la inclusión de variables con p <0,1 (hubiera sido mejor el cri-
terio de p <0,2, tanto más cuanto la muestra es reducida). Esto indica una finalidad pre-
dictiva y no explicativa. Los autores afirman que “este estudio es el primero en demos-
trar que, tras el control de otros factores de riesgo potenciales, los pacientes que son
negativos al virus de Epstein-Barr se enfrentan a un riesgo duradero de una enfermedad
linfoproliferativa en un periodo más allá de un año”. En el modelo escalonado entraron
tan sólo dos variables: la seronegatividad al virus y el sexo (la única variable por la que
se ajustó). En realidad, no hicieron una aproximación correcta para hacer la afirmación,
ya que no trataron al sesgo de confusión de manera adecuada.
17
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 17
18
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
TIPOS DE CENSURA Y RIESGOS COMPETITIVOS
DE MUERTE
En el seguimiento de trasplantados, el tipo de análisis más utilizado es el de supervi-
vencia (por ejemplo, curvas de Kaplan-Meier, test log-rank, regresión de Cox). En este
tipo de análisis -que será desarrollado en detalle por un capítulo posterior en este libro-
se estudia el tiempo transcurrido entre dos fenómenos: el que marca la incorporación
del paciente al estudio (por ejemplo, la recepción del injerto) y el que determina el fallo
o la variable de finalización –end point– (por ejemplo, la muerte del receptor). Una de las
características, que hacen especial el análisis de supervivencia, es que el seguimiento
de algunos pacientes no está completo: hay pacientes que continúan vivos en el
momento de finalizar el estudio o hay otros pacientes cuyo seguimiento se ha perdido.
Se dice que estos pacientes están censurados por la derecha.
La primera condición para que un análisis de supervivencia sea correcto es que la com-
pleción del seguimiento sea similar en los grupos que se comparan, esto es, que un
grupo no sea seguido durante más tiempo que otro. Por ejemplo, en un estudio sobre
trasplantes de donantes vivos de riñones, con evidencia arteriográfica de enfermedad
renovascular leve, se emparejaron este grupo de pacientes (n = 28) por edad del donan-
te y del receptor (sin especificar el intervalo de emparejamiento), con un grupo de tras-
plantados con riñones normales. No se dan datos de seguimiento, pero éste fue clara-
mente diferencial en los dos grupos: hubo diez censuras en el primer grupo, antes de los
cuatro años de seguimiento, frente a tres en el grupo de comparación (Hiramoto et al.
2002), probablemente debido a que fueron posteriores en el tiempo los trasplantes con
riñones afectados. Esto puede sesgar completamente la comparación.
Falta de descripción del mecanismo de censura
Un error frecuente es realizar el análisis de supervivencia sin aclarar en qué consiste la
censura. Por ejemplo, en el seguimiento de trasplantados es frecuente que se analice
como variable de finalización el fracaso del injerto. El problema es: ¿los pacientes que han
muerto, se consideran fallos o se consideran datos censurados? Otero et al. (2003) com-
pararon las curvas de supervivencia (obtenidas por Kaplan-Meier) de dos grupos de tras-
plantados: 40 de donantes con latido cardíaco y 20 de donantes sin latido cardíaco. Las
curvas de supervivencia se realizaron con dos variables de finalización alternativas: la
muerte del paciente o el fracaso del injerto. No constan detalles sobre cómo se hicieron
las censuras. Obsérvese en la Figura 1 que, en este ejemplo, la supervivencia hasta el
fracaso del injerto puede estudiarse de dos formas distintas: en la primera (a la izquierda
de la figura), el efecto es el fracaso del injerto; la muerte y continuar vivo con injerto fun-
cionante se consideran como datos censurados. En la segunda (a la derecha de la Figura
1), el end point es el fracaso del injerto o la muerte del paciente; los únicos datos cen-
surados son los de los pacientes que continúan vivos y con función del injerto. Con los
Cap 02 4/10/04 12:46 Página 18
datos del artículo no se puede conocer cuál de las dos opciones se ha utilizado. En cam-
bio, Loucaidou et al. (2003) y Sánchez-Fructuoso et al. (2003) sí especifican que la super-
vivencia del injerto se hizo censurando la muerte con función del injerto.
Riesgos competitivos
En este apartado se trata de un problema muy frecuente en los estudios clínicos (Llorca
y Delgado-Rodríguez, 2000), y especialmente, en los trasplantes: los riesgos competiti-
vos de muerte. Los riesgos competitivos ocurren cuando dos o más efectos “compiten”
por el mismo paciente. Por ejemplo, en el hospital A se sigue a 200 pacientes en los que
se ha realizado un trasplante de médula ósea como tratamiento de una leucemia. La fina-
lidad del estudio es conocer la tasa de recidiva. Si en este grupo se presentara un núme-
ro anormalmente alto de muertes por sepsis, el número de recidivas sería menor (se dice
entonces que la sepsis compite con la recidiva). Si estas cifras se comparan con las del
hospital B –en el que se evitan las sepsis– se tendrá la falsa impresión de que en B hay
mayor tasa de recidivas. El problema fundamental es que el análisis de supervivencia
debe realizarse por métodos diferentes cuando existen riesgos competitivos.
Las técnicas habituales de análisis de supervivencia asumen que las censuras no son
informativas, es decir, que si los sujetos pudieran seguirse más allá del momento en que
se han censurado, tendrían la misma tasa de mortalidad que los pacientes no censura-
dos (Lee et al. 1997). Otra forma de expresar lo mismo es diciendo que la censura ocu-
rre al azar, con independencia de la variable de finalización. Esta no es una asunción
insignificante.
El ejemplo de la Figura 1b, muestra una situación especialmente frecuente en el estu-
dio de trasplantes. Al estudiar como variable de finalización el fracaso del injerto, hay
dos tipos de censura: pacientes que continúan vivos con función y pacientes que han
muerto con función del injerto. Realmente, estos dos tipos de censura: ¿se comportan
igual? ¿Se cumple en ambas situaciones la asunción de independencia? Probablemente,
sea fácil admitir que los pacientes vivos con función, si el estudio continuara, tendrían
fracaso del injerto con la misma tasa que los pacientes que ya lo han sufrido. Sería, por
lo tanto, una censura no informativa y se podrían utilizar los métodos habituales de aná-
lisis de supervivencia. En cambio, es difícil creer que los pacientes fallecidos, si hubie-
ran continuado vivos, habrían tenido la misma tasa de fracaso.
Si se suponen, por ejemplo, dos causas de muerte que ocurren mientras el injerto sigue
funcionando: un paciente muere atropellado por un coche y otro paciente muere por una
sepsis secundaria a una infección del órgano trasplantado. Claramente, la primera muer-
te sería independiente del fracaso del injerto, pero la segunda no. Los pacientes con
infección del injerto tendrán otros factores asociados que se relacionan con el fracaso
del órgano (mayor tiempo de isquemia, mayor tiempo quirúrgico, mayor edad, etc.).
19
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 19
Este ejemplo muestra que algunos tipos de censura son informativos, es decir, si los
pacientes con esa censura (muerte con función, en este caso) hubieran continuado en
el estudio, habrían tenido una tasa de fracaso distinta de los pacientes que se han podi-
do seguir completamente (Prentice et al. 1978). En este caso, los métodos habituales
de análisis de supervivencia (Kaplan-Meier, por ejemplo) son inadecuados porque tratan
ambos tipos de censura como si fueran iguales (Leung et al. 1997).
La Figura 2 muestra los resultados de una simulación con 1.000 pacientes, utilizando
tasas de fracaso del injerto de 10/1.000 pacientes-año y de mortalidad con función de
5/1.000 pacientes-año. Con el análisis de Kaplan-Meier (que trata la mortalidad con fun-
ción como censura no informativa), la probabilidad de padecer un fracaso del injerto
antes de los diez años es del 66%; en cambio, con el método de decrementos múlti-
ples (que analiza la mortalidad como riesgo competitivo), este riesgo desciende hasta el
54%. Esta es la regla general: no tener en cuenta los riesgos competitivos de muerte
aumenta la proporción de fracasos (Yan et al. 2000).
Las alternativas para el análisis de supervivencia en presencia de riesgos competitivos son
varias: método de decrementos múltiples (Nelson 1969, Aalen 1978), el uso de cadenas
20
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 2. Probabilidad de fracaso de un injerto. Con la estimación de Kaplan-Meier
(curva superior) se acumula el 66% de fracasos en diez años. Con el método de decre-
mentos múltiples, que tiene en cuenta la muerte como riesgo competitivo (curva infe-
rior) se acumula sólo el 54% de fracasos.
Probabilidad
Tiempo (en años) tras el trasplante
54,1% 65,8%
Cap 02 4/10/04 12:46 Página 20
de Markov (Llorca y Delgado-Rodríguez 2001) o el método de Lin que, además, aporta una
forma de comparar curvas de supervivencia en lugar del –inadecuado en esta situación–
test de log-rank (Lin 1997). Los artículos científicos de metodología sobre riesgos compe-
titivos han derivado, en gran medida, del campo de los trasplantes (Pepe et al. 1993).
REGRESIÓN DE COX
Y ASUNCIÓN DE PROPORCIONALIDAD
La regresión de Cox (Cox 1972) es el método más usado para medir los riesgos relati-
vos en el análisis de supervivencia. El punto más problemático de la regresión de Cox
es que es necesario que las funciones de riesgo sean proporcionales, en otras palabras,
si durante el primer año los pacientes mayores de 65 años tienen tres veces mayor ries-
go de morir que los menores de 65 años, en el segundo año también deberían tener tres
veces más riesgo (obsérvese que esto no significa que la mortalidad en el primer año
sea igual que en el segundo). Un ejemplo clásico es la comparación entre el trasplante
de médula ósea y la quimioterapia en el tratamiento de la leucemia aguda no linfoblás-
tica (Appelbaum et al. 1984); durante el primer año la supervivencia de los pacientes con
quimioterapia era mayor pero, a partir del año y medio, esta tendencia se invertía: no se
cumplía la asunción de proporcionalidad, y por tanto, la regresión de Cox habría sido
inadecuada.Una de las formas de comprobar la asunción de proporcionalidad, se pre-
21
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Figura 3. Comprobación gráfica de la asunción de proporcionalidad mediante transfor-
maciones logarítmicas. Las curvas son paralelas, lo que sugiere que la asunción de
proporcionalidad se cumple y se puede utilizar la regresión de Cox.
-In(-In(Probabilidaddesupervivencia))
In (tiempo de seguimiento)
Cap 02 4/10/04 12:46 Página 21
senta en las Figuras 3 y 4. Se representan las curvas de supervivencia y el tiempo de
seguimiento transformados logarítmicamente. En la Figura 3, las curvas son paralelas,
lo que indica que se cumple la proporcionalidad y se puede utilizar la regresión de Cox.
En la Figura 4, las curvas se cortan, esto es, no se cumple la asunción de proporciona-
lidad y la regresión de Cox no debería utilizarse.
La asunción de proporcionalidad puede comprobarse tanto por métodos gráficos (Hess
1995) como por métodos numéricos (Grambsch y Therneau 1994). La mayoría de los artí-
culos revisados elaboran modelos de Cox sin justificar la asunción de proporcionalidad
(Loicaidou et al. 2003, Meier-Kriesche et al. 2003, Smits et al. 2003). Sánchez-Frutuoso et
al. (2003) sí señalan explícitamente que la comprueban, aunque no indican por qué méto-
do. En el uso de la regresión de Cox se pueden encontrar otros errores. Loicaidou et al.
(2003) estimaron un modelo de Cox multivariable, introduciendo doce variables sin selec-
cionar por ningún procedimiento. Siete de ellas tenían valores de p mayores de 0,4 (y cua-
tro, mayores de 0,7). Sólo dos variables tenían p <0,05. La muestra estaba formada por
83 trasplantes renales con rechazo; no consta cuántos murieron en el seguimiento. Esto
plantea un problema importante de tamaño de muestra. Clásicamente se recomienda
que, en el estudio, haya al menos diez muertes (fallos) por cada variable que se desee
introducir en el análisis multivariable; en este estudio de Loicaidou et al., para introducir
doce variables habrían sido necesarias, al menos, 120 muertes. Además, una variable con
22
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 4. Comprobación gráfica de la asunción de proporcionalidad mediante transfor-
maciones logarítmicas. Las dos curvas se cruzan, con esto se descarta la asunción de
proporcionalidad y no se debe utilizar la regresión de Cox.
-In(-In(Probabilidaddesupervivencia))
In (tiempo de seguimiento)
Cap 02 4/10/04 12:46 Página 22
tres categorías mutuamente excluyentes (rechazo: borderline, celular y vascular) tiene las
tres categorías en el modelo; esto no es ni siquiera un error. Es completamente imposi-
ble, lo que hace pensar que los autores realmente no han llevado a cabo una regresión
multivariable, sino doce regresiones simples. Por último, en la presentación de resultados
se utiliza, equivocadamente, el término hazard, cuando se debería emplear hazards ratio.
MISCELÁNEA DE ERRORES ESTADÍSTICOS
A continuación, se presentan algunos ejemplos de errores u omisiones metodológicas
típicas, extraídos de la literatura científica sobre trasplantes. La lista no es exhaustiva y
puede presentarse, igualmente, en otros campos de la investigación médica.
Significación estadística e importancia clínica
Es frecuente que la presentación de resultados estadísticos se limite a determinar si hay
o no significación estadística sin considerar la importancia que pueda tener para la clíni-
ca el resultado. Por ejemplo, en un estudio en el que se comparara la fracción de eyec-
ción ventricular (FEV), tras el trasplante en pacientes mayores y menores de 65 años, la
significación estadística dependería de: a) el tamaño de muestra, b) la variabilidad de la
FEV en esa muestra (medida por su varianza), y c) la diferencia de la FEV media en los
dos grupos estudiados. Si el número de sujetos en el estudio fuera muy grande y la
varianza de la FEV fuera pequeña, una diferencia de 3% en la FEV podría llegar a ser
estadísticamente significativa (valor p <0,05), aunque esta diferencia tuviera muy poca
importancia clínica. En cambio, un estudio con pocos pacientes podría encontrar una
diferencia del 20% en la FEV (mucho más importante clínicamente), pero que no fuera
significativa estadísticamente. En la mayoría de los estudios, el objetivo debería ser
obtener una medida del efecto (diferencia de medias, RR, etc.). El valor de p no es un
objetivo en sí mismo, sino que complementa la medida del efecto indicando la probabi-
lidad de que el efecto se deba al azar.
La presentación del valor de p es llamativa, en muchos artículos se presenta el valor
numérico sólo si está por debajo de 0,05, y si está por encima se presenta como “no
significativo”(Jose et al. 2003, Omoto et al. 2003, Liu et al. 2003, Sadeghi et al. 2003,
Bartosh et al. 2003). El valor 0,05 es completamente arbitrario y se continúa utilizando
sólo por tradición; realmente hay poca diferencia entre p = 0,04 y p = 0,06. Una prácti-
ca más adecuada es informar del valor de p (cualquiera que sea) y dejar que el lector juz-
gue si es relevante o no para interpretar el estudio.
Errores en la selección de la prueba estadística
En un estudio, 21 ratas Lewis recibieron un trasplante renal. A continuación, fueron ale-
atorizadas en tres grupos y cada uno recibió un tratamiento (clodronato encapsulado en
23
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 23
liposomas, liposomas con suero salino fosfatado y suero salino). Se midieron los nive-
les de varios anticuerpos. Mediante un análisis de la varianza (ANOVA) se compararon
las medias y los porcentajes entre los dos primeros grupos; no se hizo comparación con
el tercer grupo (Jose et al. 2003). En este estudio hay varios errores: en primer lugar, el
ANOVA no se puede utilizar para comparar porcentajes; en segundo, el tamaño de la
muestra (siete en cada grupo) es muy pequeño para emplearlo; por último, en el estu-
dio hay tres grupos y se ha excluido uno de ellos de la comparación.
Más adecuados fueron los análisis de Sánchez-Fructuoso et al. (2003) y Thervet et al.
(2003) que utilizaron el método de Kruskal-Wallis. Thervet et al. compararon la dosis dia-
ria de tacrolimus en 80 pacientes con trasplante renal, dividiéndolos en tres grupos
según el genotipo CYP3A5. El test de Kruskal-Wallis permitió comparar simultánea-
mente los tres genotipos.
Woeste et al. (2003) siguieron a un grupo de receptores de trasplantes renal y pancreá-
tico simultáneos, y compararon la supervivencia entre los que desarrollaban una infección
abdominal y los que no. Aplicaron una prueba estadística para comparar las medias de
supervivencia (68,4 meses con infección abdominal y 87,6 meses sin ella). Esta compa-
ración carece de sentido ya que es característico de los análisis de supervivencia que
existan datos censurados, es decir, hay pacientes para los que el seguimiento no se ha
completado porque continúan vivos al finalizar el estudio. En cambio, para calcular la
media es necesario disponer del tiempo hasta la muerte de todos los pacientes: la media
no puede calcularse con datos censurados (salvo que se haya utilizado un modelo para-
métrico, la regresión de Weibull, por ejemplo). Lo que realmente parece haberse calcu-
lado en este estudio es la media de seguimiento, pero el seguimiento no sólo depende
de la fecha de la muerte, sino también de la fecha del trasplante. Los pacientes tras-
plantados en el último periodo han tenido menor seguimiento, aunque continúen con
vida; si en ese periodo se produce un aumento de las infecciones abdominales, se encon-
trará que el seguimiento de los infectados es menor que el de los no infectados.
Los estudios de casos y controles no son frecuentes en el literatura científica sobre tras-
plantes, aunque también se realizan. Con frecuencia, estos diseños son emparejados
(ver por ejemplo, Shahinian et al. 2003, Marcén et al. 2002). En estos diseños el análi-
sis multivariable adecuado es la regresión logística condicional y no la convencional.
Omisión de información
Es bastante frecuente que no se dé información suficiente en la sección de métodos
sobre el tipo y condiciones de uso de las pruebas estadísticas. Oscila desde la ausencia
absoluta (con ejemplos dados al comienzo de este capítulo), pasando por problemas de
índole menor, como no especificar el tipo de análisis multivariable realizado (Humar et al.
2001), o incluso, ser críptico en lo que se realiza, por ejemplo, en un artículo se men-
24
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 02 4/10/04 12:46 Página 24
ciona que “se utilizaron ecuaciones de estimación generalizadas para evaluar la signifi-
cación de las variables independientes y se usaron técnicas de modelación mixta para
el examen de los datos longitudinales, incluyendo medidas repetidas” (Chueh y Kahan
2003).
Uno de los problemas que más frecuentemente se encuentra, es la no mención de la
predeterminación del tamaño de la muestra. Es recomendable en general, pero pre-
ceptiva en los ensayos clínicos por razones éticas; hay que utilizar tan sólo los pacien-
tes necesarios para dirimir una duda razonable entre dos tratamientos. Es llamativa la
frecuencia con la que no se hace referencia a este aspecto (Goggins et al. 2003,
Dresske et al. 2003, Van Gelder et al. 2003, Matl et al. 2003) o no se da información sufi-
ciente para comprobar si la estimación es correcta (Charpentier et al. 2003).
En los ensayos clínicos se realizan con frecuencia análisis antes de finalizar el ensayo
(análisis intermedios). Se realizan para ver si se ha alcanzado el beneficio esperado o si,
por el contrario, es poco probable que se observen diferencias al final. Estos ensayos
deben realizarse siguiendo una regla estadística preespecificada (análisis secuencial,
regla de O’Brien-Fleming, etc.), que debe figurar en los métodos y que, sin embargo, no
se aprecia (Stratta et al. 2003).
Conviene dar los números y no sólo ofrecer porcentajes. Por ejemplo, en una encuesta
sobre profilaxis infecciosa renal en centros trasplantadores estadounidenses, Batiuk et al.
(2002) indican que respondieron claramente menos los centros que realizaban menos
de 25 trasplantes, pero no se menciona en ningún momento su número, por lo que no
se puede cuantificar la repercusión de esta falta de respuesta.
OTRAS CONSIDERACIONES METODOLÓGICAS
Los errores estadísticos son fácilmente solucionables pero lo que no tiene solución en
un estudio son los problemas en la selección de la muestra y los problemas de recogi-
da de información. La imposición de la llamada medicina basada en la “evidencia”
(mejor traducida por “pruebas”) ha dado lugar a listados de verificación para publicar y
evaluar lo publicado, pero que en definitiva contribuyen a la formación en metodología
de investigación. En estos listados se incluyen aspectos estadísticos y de diseño gene-
ral de un estudio.
La primera de estas listas ha sido la declaración CONSORT (Altman et al. 2001) para
ensayos clínicos aleatorizados, un tipo de estudio especialmente frecuente en el campo
del trasplante. Se comprueba que es escaso el grado de aproximación entre lo publica-
do en el campo del trasplante renal y las recomendaciones CONSORT. Aspectos esen-
ciales como la aleatorización (cómo se ha hecho, no sólo decir que se aleatorizó), si es
ocultada su secuencia, etc., no se mencionan con mucha frecuencia.
25
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 25
Los estudios sobre pruebas diagnósticas son menos frecuentes en el campo del tras-
plante. En este campo también se ha elaborado un listado de aspectos claves, las nor-
mas STARD, para la realización y publicación de estudios en este ámbito (Bossuyt et al.
2003). Se pueden aplicar, por ejemplo, al estudio de Lobo et al. (2002), en el que se valo-
ró si los linfocitos digeridos con pronasa mejoran la sensibilidad y la especificidad en la
detección de antígenos de histocompatibilidad. Los métodos de laboratorio están per-
fectamente descritos, pero los estadísticos están ausentes. Tampoco se describe la pro-
cedencia de las muestras, aspecto clave para juzgar un estudio de este tipo.
Un diseño frecuente en el campo de la clínica es la cohorte retrospectiva, para aprove-
char la información contenida en la historia clínica. Aquí no se ha emitido por ninguna
organización ninguna lista de verificación. No obstante, hay una serie de limitaciones
que se expondrán brevemente. Se emplean con frecuencia, en los trasplantes, las
cohortes retrospectivas del tipo pre-post; por ejemplo, antes de 1994 se actuaba de una
manera y, a partir de esta fecha, de otra. Con posterioridad, se compara la superviven-
cia en esas dos situaciones, para concluir, con frecuencia, que en el segundo periodo la
supervivencia ha mejorado (ver por ejemplo, Kimball et al. 2002, Jungraithmayr et al.
2003). Este tipo de comparaciones son siempre problemáticas, ya que el efecto perio-
do (los cambios seculares en pacientes, donantes, habilidades terapéuticas) es difícil de
evitar. Siempre en estos casos hay que comparar las características basales de los
pacientes y hay que eliminar el sesgo de confusión mediante técnicas de análisis mul-
tivariable. El problema es menor, pero sigue existiendo, cuando las cohortes retrospec-
tivas se solapan en su seguimiento, hasta que la segunda opción terapéutica triunfa
sobre la primera (ver por ejemplo, Langer y Kahan 2003).
Las cohortes retrospectivas también se utilizan para ver el resultado de opciones tera-
péuticas simultáneas en el tiempo. Por ejemplo, para comprobar cómo funcionan los
pacientes urémicos diabéticos trasplantados, se compararon 42 pacientes trasplantados
sólo de riñón, con 162 con doble trasplante de riñón-páncreas y 37 trasplantados con
riñón más islotes pancreáticos (Fiorina et al. 2003). Aquí es obligado, al igual que lo afir-
mado en el párrafo anterior, realizar una comparación de las características basales de
los pacientes de los diferentes grupos que influyan en el pronóstico, y ajustar mediante
técnicas de análisis multivariable para eliminar la interferencia de las diferencias. No obs-
tante, conviene que el investigador se plantee cuáles son las razones que motivaron en
el pasado una acción concreta, porque ello puede sesgar completamente el resultado.
Un aspecto común a muchos diseños es que no se dan datos de procedencia de los
pacientes. Se asume así el carácter universal que tienen los pacientes, lo que en reali-
dad no es así. Los centros y los profesionales difieren en muchas características y pue-
den motivar que los resultados de la muestra de un hospital no sean generalizables a
los pacientes tratados en otros. Es fundamental, para juzgar un estudio, conocer de
dónde y cómo vienen los pacientes. Por ejemplo, Szládek et al. (2003) valoraron el virus
26
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 02 4/10/04 12:46 Página 26
TT en 92 trasplantados y 66 individuos sanos, sin aclarar en ningún momento la proce-
dencia, especialmente de los llamados “sanos”. Igualmente, siguieron a 31 pacientes,
pero no se indica quiénes ni las razones que motivaron el seguimiento.
CONCLUSIÓN
El desarrollo informático ha puesto una gran cantidad de herramientas estadísticas a dis-
posición de los investigadores. Existe el peligro de que el investigador aprenda una serie
de recetas sobre cómo usar la estadística (al estilo de los manuales de preparación para
el MIR) en lugar de buscar un conocimiento estadístico específico, o que se confíe a la
ayuda del ordenador la elección del método estadístico a emplear en cada caso. De la
misma forma que un matemático armado con un bisturí no se convierte en neurociruja-
no, un médico armado con el manual del SPSS no se convierte en estadístico.
Aunque a veces se cometen errores realmente elementales, es más frecuente que el
error se deba a la aplicación rutinaria de pruebas estadísticas, sin conocer si realmente
están indicadas en esa situación. Tres ejemplos típicos son el uso de procedimientos de
regresión, paso a paso, para ajustar por factores de confusión, la utilización del método
de Kaplan-Meier en presencia de riesgos competitivos, o el empleo de la regresión de
Cox sin que se dé la proporcionalidad de riesgos.
BIBLIOGRAFÍA RECOMENDADA
1. Aalen OO. Nonparametric estimation of partial transition probabilities in multiple
decrement models. Annals Statistics 1978; 6: 534-45.
2. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The Revised
CONSORT Statement for Reporting Randomized Trials: Explanation and Elaboration.
Ann Intern Med 2001; 134: 663-94.
3. Antonopoulos IM, Nahas WC, Mazzucchi E, Ianhez LE, Saldanha LB, Arap S.
Comparison of palpation-guided and ultrasound-guided biopsies in transplanted kid-
neys. Clin Transplant 2001; 15: 393-6.
4. Appelbaum FR, Dahlberg S, Thomas ED, et al. Bone marrow transplatation or che-
motherapy after remission induction for adults with acute nonlymbphoblastic leuke-
mia. Ann Intern Med 1984; 101: 581-8.
5. Bartosh SM, Leverson G, Robillard D, Sollinger HW. Long-term outcomes in pedia-
tric renal transplant recipients who survive into adulthood. Transplantation 2003; 76:
1195-2000.
6. Batiuk TD, Bodziak KA, Goldman M. Infectious disease prophylaxis in renal transplant
patients: a survey of US transplant centers. Clin Transplant 2002; 16: 1-8.
7. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al.
Towards complete and accurate reporting of studies of diagnostic accuracy: the
STARD initiative. BMJ 2003; 326: 41-4.
27
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 27
8. Cox DR. Regression models and life-tables. J Royal Stat Soc (B) 1972; 39: 187-220.
9. Charpentier B, Rostaing L, Berthoux F, Lang P, Civati G, Touraine JL, et al. A three-
arm study comparing immediate tacrolimus therapy with antithymocyte globulin
induction therapy followed by tacrolimus or cyclosporine A in adult renal transplant
recipients. Transplantation 2003; 75: 844-51.
10. Chueh SC, Kahan BD. Dyslipidemia in renal transplant recipients treated with a siro-
limus and cyclosporine-based immunosuppressive regimen: incidence, risk factors,
progression, and prognosis. Transplantation 2003; 76: 375-82.
11. Delgado-Rodríguez M, Llorca J. Sesgos. En: Piédrola Gil: Medicina Preventiva y
Salud Pública. 10ª ed. Barcelona: Masson 2001.
12. Dresske B, Zavazava N, Jenisch S, Exner B, Lenz P, El Mokhtari NE, et al. WOFIE
synergizes with calcineurin-inhibitor treatment and early steroid withdrawal in kid-
ney transplantation. Transplantation 2003; 75: 1286-91.
13. Fiorina P, Folli F, Maffi P, Placidi C, Venturini M, Finzi G, et al. Islet transplantation
improves vascular diabetic complications in patients with diabetes who underwent
kidney transplantation: a comparison between kidney-pancreas and kidney-alone
transplantation. Transplantation 2003; 75: 1296-301.
14. Goggins WC, Pascual MA, Powelson JA, Magee C, Tolkoff-Rubin N, Farrell ML et al.
A prospective, randomized, clinical trial of intraoperative versus postoperative
Thymoglobulin in adult cadaveric renal transplant recipients. Transplantation 2003;
76: 798-802.
15. Grambsch PM, Therneau TM. Proportional hazards tests and diagnostics based on
weighted residuals. Biometrika 1994; 81: 515-26.
16. Hess KR. Graphical methods for assessing violations of the proportional hazards
assumption in Cox regression. Stat Med 1995; 14: 1707-23.
17. Hiramoto JS, LaBerge JM, Neymark E, Hirose R. Live donor renal transplants using
kidneys with arteriographic evidence of mild renovascular disease. Clin Transplant
2002; 16: 24-9.
18. Humar A, Kerr SR, Ramcharan T, Gillingham KJ, Matas AJ. Peri-operative cardiac
morbidity in kidney transplant recipients: incidence and risk factors. Clin Transplant
2001; 15: 154-8.
19. Jose MD, Ikezumi Y, van Rooijen N, Atkins RC, Chadban SJ. Macrophages act as
effectors of tissue damage in acute renal allograft rejection. Transplantation 2003;
76: 1015-22.
20. Jungraithmayr T, Staskewitz A, Kirste G, Boswald M, Bulla M, Burghard R, et al.
Pediatric renal transplantation with mycophenolate mofetil-based immunosuppres-
sion without induction: results after three years. Transplantation 2003; 75: 454-61.
21. Katz MH. Multivariable analysis: A practical guide for clinicians. Cambridge
University Press, Cambridge, 1999.
22. Kimball P, Wagner B, King A, Fisher RA, Dawson S, Cotterell A, et al. Comparison of
two drug regimens upon clinical outcome among renal transplant recipients with
positive flow cytometric crossmatches. Clin Transplant 2002; 16: 290-4.
28
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 02 4/10/04 12:46 Página 28
23. Langer RM, Kahan BD. Sirolimus does not increase the risk for postoperative throm-
boembolic events among renal transplant recipients. Transplantation 2003; 76: 318-23.
24. Lee ET, Go OT. Survival analysis in Public Health research. Annu Rev Public Health
1997; 18: 105-34.
25. Leung KM, Elshoff RM, Afifi AA. Censoring issues in survival analysis. Ann Rev
Public Health 1997; 18: 83-104.
26. Lin DY. Non-parametric inference for cumulative incidence functions in competing
risks studies. Stat Med 1997; 16: 901-10.
27. Liu CL, Fan ST, Lo CM, Wei WI, Yong BH, Lai CL, et al. Live-donor liver transplanta-
tion for acute-on-chronic hepatitis B liver failure. Transplantation 2003; 76: 1174-9.
28. Lobo PI, Isaacs RB, Spencer CE, Pruett TL, Sanfey HA, Sawyer RG, et al. Improved
specificity and sensitivity when using pronase-digested lymphocytes to perform flow-
cytometric crossmatch prior to renal transplantation. Transpl Int 2002; 15: 563-9.
29. Loucaidou M, Mclean AG, Cairns TDH, Griffith M, Hakim N, Palmer A, et al. Five-
year results of kidney transplantation under tacrolimus-based regimes: the persis-
ting significance of vascular rejection. Transplantation 2003; 76: 1120-2.
30. Llorca J, Delgado-Rodríguez M. Competing risks analysis using Markov chains:
impact of cerebro-vascular and ischaemic heart disease in cancer mortality. Int J
Epidemiol 2001; 30: 99-101.
31. Llorca J, Delgado-Rodríguez M. Competing risks in absence of independence.
Impact of AIDS on liver function failure mortality, and lung cancer on ischemic heart
disease mortality. J Clin Epidemiol 2000; 53: 1145-9.
32. Marcén R, Morales JM, Fernández-Juárez G, Andrés A, Pascual J, Rodicio JL, et al.
Risk factors of ischemic heart disease after renal transplantation. Transplant Proc
2002; 34: 394-5.
33. Matl I, Bachleda P, Lao M, Michalsky R, Navratil P, Treska V, et al. Safety and effi-
cacy of an alternative basiliximab (Simulect) regimen after renal transplantation:
administration of a single 40-mg dose on the first postoperative day in patients recei-
ving triple therapy with azathioprine. Transpl Int 2003; 16: 45-52.
34. Meier-Kriesche HU, Baliga R, Kaplan B. Decreased renal function is a strong risk
factor for cardiovascular death after renal transplantation. Transplantation 2003;
75: 1291-5.
35. Nelson W. Hazard plotting for incomplete failure data. J Quality Technology 1969;
1: 27-52.
36. Onoto K, Tanabe K, Tokumoto T, Shimmura H, Ishida H, Toma H. Use of candesar-
tan cilexetil decreases proteinuria in renal transplant patients with chronic allograft
dysfunction. Transplantation 2003; 76: 1170-4.
37. Otero A, Gómez-Gutiérrez M, Suárez F, Arnal F, Fernández-garcía A, Aguirrezabalaga
J, et al. Liver transplantation form Maastricht category 2 non-heart-beating donors.
Transplantation 2003; 76: 1068-73.
38. Pepe MS, Longton G, Pettinger M, Mori M, Fisher DL, Storb R. Summarizing data
on survival, relapse, and chronic graft-versus-host disease after bone marrow trans-
29
ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA
Cap 02 4/10/04 12:46 Página 29
plantation: Motivation and description of new methods. Br J Haematol 1993; 83:
602-7.
39. Prentice RL, Kalbfleisch JD, Peterson AV, Flournoy N, Farewell VT, Breslow NE. The
analysis of failure times in the presence of competing risks. Biometrics 1978; 34:
541-54.
40. Rothman KJ, Greenland S. Hill’s criteria for causality. En: Gail MH, Benichou J (eds).
Encyclopedia of epidemiologic methods. Wiley, Chichester, 2000: 428-31.
41. Sadeghi M, Daniel V, Wiesel M, Hergeseli O, Opelz G. High urine sIL-6R as a predic-
tor of late graft failure in renal transplant recipients. Transplantation 2003; 76: 1190-4.
42. Sánchez-Fructuoso AI, Prats D, Pérez-Contín MJ, Marqués M, torrente J, Conesa J,
et al. Increasing the donor pool using en bloc pediatric kidneys for transplant.
Transplantation 2003; 76: 1180-4.
43. Shahinian VB, Muirhead N, Jevnikar AM, Leckie SH, Khakhar AK, Luke PP, et al.
Epstein-Barr virus seronegativity is a risk factor for late-onset posttransplant lympho-
roliferative disorder in adult renal allograft recipients. Transplantation 2003; 75: 851-6.
44. Smits JMA, Deng MC, Hummel M, de Meester J, Schoendube F, Scheld HH, et al.
A prognostic model for predicting waiting-list mortality for a total national cohort of
adult heart-transplant candidates. Transplantation 2003; 76: 1185-90.
45. Stratta RJ, Alloway RR, Lo A, Hodge E. Two-dose daclizumab regimen in simulta-
neous kidney-pancreas transplant recipients: primary endpoint analysis of a multi-
center, randomized study. Transplantation 2003; 75: 1260-6.
46. Szladek G, Juhasz A, Asztalos L, Szoke K, Murvai M, Szarka K, et al. Persisting TT
virus (TTV) genogroup 1 variants in renal transplant recipients. Arch Virol 2003; 148:
841-51.
47. Thervet E, Anglicheau D, King B, Schlageter MH, Cassinat B, Beaune P, et al. Impact
of cytochrome p450 3A5 genetic polymorphism on tacrolimus doses and concen-
tration-to-dose ratio in renal transplant recipients. Transplantation 2003; 76: 1233-5.
48. Van Gelder T, ter Meulen CG, Hene R, Weimar W, Hoitsma A. Oral ulcers in kidney
transplant recipients treated with sirolimus and mycophenolate mofetil.
Transplantation 2003; 75: 788-91.
49. Verran DJ, deLeon C, Chui AK, Chapman JR. Factors in older cadaveric organ donors
impacting on renal allograft outcome. Clin Transplant 2001; 15: 1-5.
50. Woeste G, Wullstein C, Vogt J, Zapletal C, Bechstein WO. Value of donor swabs for
intra-abdominal infection in simultaneous pancreas-kidney transplantation.
Transplantation 2003; 76: 1073-8.
51. Yan Y, Moore RD, Hoover DR. Competing risk adjustment reduces overstimation of
opportunistic infection rates in AIDS. J Clin Epidemiol 2000; 53: 817-22.
30
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 02 4/10/04 12:46 Página 30
31
ESQUEMA GENERAL
DE ANÁLISIS ESTADÍSTICO
DE UNA POBLACIÓN
TRASPLANTADA
R. Escallada, M. Arias
INTRODUCCIÓN
En este capítulo, trataremos de definir cómo se debe describir correctamente una po-
blación trasplantada, así como las diferentes pruebas estadísticas que, progresiva-
mente, es necesario realizar para un análisis estadístico correcto: estadística descripti-
va, estadística comparativa básica y estadística comparativa más compleja. Para ello,
además de una breve explicación teórica, utilizaremos ejemplos basados en una serie
real de pacientes trasplantados, analizada estadísticamente con el programa informáti-
co SPSS, uno de los más usados en la actualidad (además, un tanto por ciento muy
elevado de las normas que exponemos, son perfectamente aplicables a otros progra-
mas). Este programa estadístico es muy complejo y nosotros utilizaremos, muy proba-
blemente, menos del 10% de sus utilidades para un análisis completo de una serie de
pacientes trasplantados, pero lógicamente no es propósito de este capítulo explicar
exhaustivamente el SPSS, sino dar normas básicas y prácticas para poder utilizarlo sin
conocerlo a fondo.
DESCRIPCIÓN DE UNA POBLACIÓN
TRASPLANTADA
Como en cualquier otro tipo de población o muestra en la que se estudien hechos bioló-
gicos, los datos que manejaremos serán de dos tipos: cuantitativos o variables continuas
(por ejemplo: edad, niveles sanguíneos de parámetros biológicos o de fármacos, dosis de
Cap 03 4/10/04 12:46 Página 31
32
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 1
CAUSAMUE
Frequency Percent Valid Percent Cumulative Percent
Valid ACV 155 53,3 53,3 53,3
ANX 8 2,7 2,7 56,0
OTR 4 1,4 1,4 57,4
TCE 124 42,6 42,6 100,0
Total 291 100,0 100,0
Total 291 100,0
Statistics
N
Valid Missing
CAUSAMUE 291 0
Tabla I
Cap 03 4/10/04 12:46 Página 32
fármacos, cifras de tensión arterial, etc.) y cualitativos o variables cualitativas-disconti-
nuas (por ejemplo: sexo, estado del paciente o del injerto, tipo de inmunosupresión, gra-
do de riesgo cardiovascular, etc.) (Figura 1). En cualquiera de los dos tipos de datos, la
presentación más sencilla y comprensible es la distribución de frecuencias, sobre todo
cuando el número de pacientes y/o datos es elevado, como suele ocurrir en las poblacio-
nes trasplantadas. La distribución de frecuencias en las variables cualitativas-discontinuas
es obvia y se limita a describir el número y/o el porcentaje de casos de cada clase. Con el
programa SPSS, esta distribución se realiza de la siguiente manera: hemos seleccionado
en la barra de herramientas la sección Statistics para, después, ir a las secciones que
pueden verse resaltadas en la
figura; después, únicamente
deberemos seleccionar la o
las variables cualitativas que
deseemos analizar (en este
caso, la causa de muerte del
donante) y dar OK. El progra-
ma nos responderá en una
pantalla SPSS Output de la
manera indicada en la Tabla I.
En ella podemos observar el
número de casos válidos (291),
si en alguno no se ha rellenado
adecuadamente la respuesta
(en este caso ninguno) y el nú-
mero, el porcentaje sobre el to-
tal de la serie (incluidos en su
caso, los pacientes sin res-
puesta a esta variable en con-
creto), el porcentaje sobre los casos válidos y el porcentaje acumulado. Esta información po-
demos trasformarla en un gráfico, simplemente seleccionando en la barra de herramientas
(Figura 2) la sección Graphs y eligiendo, después, el tipo de gráfico que deseemos y que sea
más adecuado para una buena compresión visual (en este caso concreto, lo más convenien-
te sería un gráfico de barras, como vemos en el ejemplo, o uno de sectores) (Figura 3).
En el caso de las variables continuas, la distribución de frecuencias consistirá en dividir
el conjunto de datos en una serie de grupos o intervalos, cuyos límites máximos y míni-
mos deberemos decidir según nuestro criterio, aunque es conveniente tener en cuenta
unos principios básicos:
• No es aconsejable que el número de intervalos sea demasiado grande (en ningún
caso, mayor de 10-15).
33
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 2
Cap 03 4/10/04 12:46 Página 33
• En general, es conveniente
que los intervalos sean de
igual magnitud, es decir,
homogéneos (por ejem-
plo, intervalos de edad de
10 en 10 años), aunque a
efectos estadísticos es
perfectamente válida la
comparación entre grupos
no homogéneos (por
ejemplo, pacientes meno-
res de 15 años vs. pacien-
tes entre 15 y 50 años vs.
pacientes mayores de 50
años).
• Los límites de cada interva-
lo deben tener la misma
precisión numérica que
los datos introducidos: por
ejemplo, si utilizamos un decimal para introducir los valores de creatinina plasmáti-
ca, la división de los diferentes intervalos también deberá ser un decimal (por
ejemplo, menor de 1,5 mg/dL, entre 1,5 y 3,0 mg/dL, mayor de 3,0 mg/dL).
• Los intervalos nunca deben solaparse lo que, aunque parece obvio, es uno de los
errores más frecuentes. Así, es muy habitual ver tablas o gráficos en los que la dis-
34
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 3
CAUSA MUERTE DONANTE
TCEOTRANXACV
%
60
50
40
30
20
10
0
Figura 4
Cap 03 4/10/04 12:46 Página 34
tribución de grupos es, por ejemplo, de este tipo: edad entre 0-20, 20-40, 40-60 y
60-80. Esto conlleva un error primario, ya que no sabremos en qué grupo se han in-
cluido los casos con valores límite; por ejemplo, los pacientes que tienen 20 años,
¿en qué grupo están, en el primero o en el segundo? Lo correcto hubiera sido ha-
cer la distribución de esta manera: edad entre 0-20, 21-40, 41-60 y 61-80.
La forma idónea de presentar estos intervalos es mediante una tabla que debe incluir
siempre el número total de casos y el de cada grupo, y el porcentaje (aunque si el nú-
mero es pequeño, es
preferible indicar las ci-
fras absolutas, por ejem-
plo, 6/10 en vez de 60%)
sobre el total de la
muestra.
La representación gráfi-
ca más útil de la distribu-
ción de frecuencias de
una variable continua es
el histograma, muy fácil
de realizar con el progra-
ma SPSS: en la barra de
herramientas seleccio-
namos la sección Sta-
tistics y, a continuación,
las que se ven en la
Figura 4.
Automáticamente, el pro-
grama nos mostrará el
histograma de la variable
que hayamos selecciona-
do; en este ejemplo, la creatinina plasmática al primer año, con o sin la curva de distribu-
ción normal (Figura 5). Una vez descritos de manera genérica los datos de cada variable,
el siguiente paso es la definición del conjunto de los mismos, analizando su tendencia y
su dispersión.
El análisis de la tendencia se realiza, fundamentalmente, mediante la media y la media-
na (otra medida es la moda, pero es mucho menos utilizada al tener un interés muy li-
mitado). La media tiene como principal ventaja su fácil comprensión y cálculo, y que es
con mucho la medida más utilizada para realizar las comparaciones estadísticas, ya que
los test más precisos y comunes se basan en ella. Su gran desventaja es que está fuer-
35
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 5
Creatinina 1º año post-trasplante
5,004,504,003,503,002,502,001,501,00
%
100
80
60
40
20
0
Cap 03 4/10/04 12:46 Página 35
temente influida por los valores extremos, en especial en las series de datos cortas (se
da la circunstancia en muchas ocasiones de que un solo dato, excesivamente alto o ba-
jo, hace que un porcentaje muy elevado de los valores estén por encima o por debajo
del valor de la media), por esto, es muy interesante complementar la información que
nos proporciona con la mediana, que no es más que el valor equidistante entre los ex-
tremos de la serie de datos, de tal manera que la mitad de los mismos son inferiores a
ella y la otra mitad superiores, por lo cual no está influida por los valores extremos. Sin
embargo, no es habitual en la comparación de poblaciones al haber muy pocos test que
la utilicen, por lo que está prácticamente limitada a su uso como parámetro descriptivo.
Una vez conocida la tendencia de una serie de datos, deberemos analizar su dispersión
o variación. Lógicamente, la primera y más obvia medida de variación es el rango de la
muestra, es decir, los valores máximo y mínimo y su diferencia, pero carece de valor pa-
ra realizar pruebas estadísticas y únicamente tiene valor informativo. Sin duda alguna, la
medida de dispersión
más frecuentemente
usada en estadística
médica, es la desvia-
ción estándar de la
media, cuyo valor in-
fluye decisivamente
en la existencia real de
diferencias entre dos
poblaciones. Además,
de manera indirecta,
nos puede resultar
muy útil para depurar
valores no reales por
errores en la introduc-
ción de los datos (lo
cual no es raro, sobre
todo en series gran-
des) y que nos pueden
alterar de manera significativa la media, y por tanto, las comparaciones posteriores. Por
ejemplo, es fácil confundirse al teclear el valor de cualquier parámetro con decimales,
simplemente con olvidar la coma, el valor se multiplica por 10 o por 100 (glucemia: 90,8
ó 908 mg/dL; ácido úrico: 7,26 ó 726 mg/dL). Teniendo en cuenta que, en una serie de
datos con una distribución relativamente simétrica (media y mediana con valores muy
cercanos), la media ±2 desviaciones estándar supone aproximadamente el 95% de las
observaciones, todos los valores que estén por encima o por debajo deberían ser com-
probados en la fuente original de los datos. En resumen, la descripción de todas las va-
riables cuantitativas de una serie trasplantada debe incluir, necesariamente, el cálculo
36
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 6
Cap 03 4/10/04 12:46 Página 36
de la media, la mediana y la desviación estándar de la media. Estos cálculos son muy fá-
ciles y rápidos con el SPSS ya que, no solamente podemos realizar todas las pruebas a
la vez, sino que además nos permite hacerlo con varias variables al mismo tiempo, tal y
como puede verse en el ejemplo posterior, en el que vamos a calcular los parámetros ci-
tados en la evolución de la función renal: creatinina plasmática y aclaramiento de la cre-
atinina al séptimo día, primer, tercer y sexto mes, y primer año.
De nuevo y, como en casos anteriores, deberemos ir a la sección Statistics y, a conti-
nuación, las que se ven en la Figura 6.
A continuación, elegiremos las variables que deseemos analizar, teniendo en cuenta
que este programa las ordena por orden alfabético y no por el orden en que nosotros las
hemos colocado en la tabla de datos, y seleccionaremos los parámetros estadísticos
mencionados, como en la Figura 7.
Después de pulsar Continue y OK el programa nos mostrará la siguiente tabla y datos
(Tabla II).
En ella podemos ver el número de casos válidos y en los que no existen datos, la media
y la mediana, y las medidas de dispersión: desviación estándar, rango y valores máximo
y mínimo. Como puede verse en este caso, la muestra no es demasiado homogénea,
sobre todo en lo que respecta a valores máximos y mínimos, por lo que sería muy con-
veniente comprobar si son correctos todos los valores que estén por encima y por de-
bajo de la media ±2 DE (por ejemplo, en el caso del aclaramiento de la creatinina a los
seis meses, deberíamos asegurarnos de que son ciertos todos los valores >131, aun-
37
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 7
Cap 03 4/10/04 12:46 Página 37
38
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
que no sería necesario hacerlo con los valores más bajos, ya que la media 2 DE es infe-
rior al valor mínimo. De este modo, podemos estar seguros de trabajar con una muestra
depurada y de calidad.
ESTADÍSTICA BÁSICA
A no ser que estemos ante un trabajo epidemiológico meramente descriptivo, lo habi-
tual es que queramos hacer comparaciones entre grupos de diversos parámetros, con
el fin de saber si existen diferencias reales entre ellos. Dependiendo del tipo de pará-
metro que queramos analizar, deberemos utilizar un tipo de test estadístico u otro.
Comparación simple de medias
Utilizaremos preferentemente el test t de Student al ser la prueba más precisa y usada
habitualmente para este fin. Esta prueba, sin embargo, tiene una condición para su uso
correcto y es que debe ser aplicada en poblaciones con una distribución normal, lo cual es
asumible, en la práctica, cuando el tamaño de la muestra es razonable (más de 30 casos).
En los casos de poblaciones pequeñas, deberíamos comprobar si efectivamente la distri-
bución es normal o no, lo cual es muy sencillo con el SPSS. Por ejemplo, queremos saber
si los valores de creatinina sérica, en el primer mes post-trasplante, suponiendo que no tu-
viéramos una muestra superior a 30 pacientes, tiene una distribución normal y, por lo tan-
to, se pueden utilizar los test que describimos a continuación. Únicamente debemos se-
leccionar los campos que se ven en la Figura 8 y marcar en Test Distribution el campo
Normal. El resultado nos indicará si la variable tiene una distribución normal o no (Tabla III).
Dependiendo del tipo de poblaciones que queramos comparar, utilizaremos en el pro-
grama SPSS distintos tipos.
N
Valid Missing Mean Median Std. Range Minimum Maximum
Deviation
CLCR180 249 42 68,65 66,11 32,29 267 6 273
CLCR30 280 11 55,76 54,96 26,04 146 1 147
CLCR360 236 55 73,60 69,44 33,13 257 20 277
CLCR7 291 0 33,95 29,17 27,80 134 0 134
CLCR90 267 24 66,00 64,17 31,32 204 3 208
CR180 249 42 1,702 1,500 0,781 5,6 0,6 6,2
CR30 280 11 2,079 1,700 1,276 9,7 0,7 10,4
CR360 236 55 1,699 1,500 0,679 4,1 0,8 4,9
CR7 291 0 4,237 3,200 2,874 11,9 0,8 12,7
CR90 267 24 1,753 1,500 0,844 7,4 0,8 8,2
Tabla II. Statistics.
Cap 03 4/10/04 12:46 Página 38
Comparación de dos poblaciones independientes
En este caso, comparamos los valores medios de uno o más parámetros en dos series
de casos, cuyos individuos no son los mismos: por ejemplo, el valor de la creatinina
plasmática al primer año post-trasplante de los pacientes que han sufrido rechazo agu-
do o no. El proceso de análisis en el SPSS es el que se observa en las pantallas de la
Figura 9.
Una vez seleccionado el test, como se ve en la figura, se seleccionan la o las variables
que queramos comparar (Test Variables) y la variable que define los individuos de cada
grupo (Grouping Variable), en este caso, los pacientes con rechazo agudo o no (Figura 10).
El resultado nos da la correspondiente información en la Tabla IV.
39
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
CR30
N 280
Normal Parameters Mean 2,079
Std. Deviation 1,276
Most Extreme Absolute 0,218
Differences
Positive 0,218
Negative -0,167
Kolmogorov-Smirnov Z 3,654
Asymp. Sig. (2-tailed) 0,000
a. Test distribution is Normal
b. Calculated from data
Tabla III. One-Sample Kolmogorov-Smirnov Test.
Group Statistics
RA N Mean Std. Deviation Std. Error Mean
CR360 Sí 56 1,964 0,827 0,111
No 127 1,583 0,577 5,116E-02
Independent Samples Test
Levene’s t-test for Std.
Test for Equality of Sig. Mean Error
Equality F Sig. Mean t df (2-tailed) Difference Difference
CR360 Equal 8,960 0,003 3,589 181 0,000 0,382 0,106
variances
assumed
Equal 3,132 79,484 0,002 0,382 0,122
variances
not assumed
Tabla IV
Cap 03 4/10/04 12:46 Página 39
40
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 8
Figura 9
Figura 10
Cap 03 4/10/04 12:47 Página 40
Como vemos en la tabla, el programa nos indica el valor de t y su significación esta-
dística tanto para el caso en que la varianza de los dos grupos sea igual (en este caso
p = 0,000), como distinta (p = 0,002). Usaremos los resultados para varianzas iguales
si el tamaño de las muestras es igual; en caso contrario, se debe comprobar si es sig-
nificativo el test de igualdad de varianzas (F). En caso afirmativo, se utilizan los valores
de varianzas desiguales y, en caso negativo, los de las varianzas iguales. En nuestro
ejemplo, al ser las muestras desiguales, debemos ver el resultado de F que, en este
caso, es significativo por lo que debemos concluir que la creatinina al primer año es
mayor en el grupo de pacientes con rechazo agudo (1,96 ± 0,83 vs. 1,58 ± 0,58) con
una significación estadística de p = 0,002).
Comparación de dos poblaciones pareadas
En este caso, se compara un mismo parámetro en la misma población, pero en dos mo-
mentos distintos. Por ejemplo, queremos saber si, en nuestra serie, existen diferencias
entre la creatinina del primer mes y la del primer año cuando el paciente ha tenido algún
episodio de rechazo agudo. Para ello, lo primero que debemos hacer es seleccionar es-
te subgrupo de pacientes (Figura 11).
Una vez seleccionados los casos, procederemos de manera semejante al apartado an-
terior, pero seleccionando el test para muestras pareadas y la o las parejas de variables
que queremos analizar (Figura 12). El resultado se expresa en la Tabla V.
41
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 11
Cap 03 4/10/04 12:47 Página 41
La conclusión que podemos ex-
traer, es que la creatinina al año es
menor que en el primer mes (1,96
± 0,83 vs. 2,41 ± 1,22), que existe
una correlación significativa entre
ambas (p = 0,001) y que la diferen-
cia es estadísticamente significati-
va (p = 0,005).
Comparación de tres o más
poblaciones independientes
El caso típico es la comparación de
un parámetro en una serie de pa-
cientes que puede dividirse en tres
o más grupos. Por ejemplo, en nues-
tra serie queremos saber si existe
diferencia en la creatinina al primer
año, dependiendo del número de
episodios de rechazo agudo. Para
ello, utilizaremos el análisis de la va-
rianza de un sentido (One-way ANO-
42
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean
Pair 1 CR30 2,409 56 1,217 163
CR360 1,964 56 0,827 0,111
Paired Samples Correlations
N Correlation Sig.
Pair 1 CR30 & CR360 56 0,442 0,001
Paired Samples Test
Paired Std. Std. 95% t df Sig.
Differences Deviation Error Confidence (2-tailed)
Mean Mean Interval
of the
Difference
Lower Upper
Pair 1 CR30- 0,445 1,129 0,151 0,142 0,747 2,947 55 0,005
CR360
Tabla V
Figura 12
Cap 03 4/10/04 12:47 Página 42
VA), de la manera indicada
en las Figuras 13 y 14.
El SPSS nos permite, ade-
más, la comparación de los
grupos entre sí, para saber
entre cuáles exactamente
hay diferencias significati-
vas y con qué grado de sig-
nificación. Para ello, como
vemos en las imágenes,
debemos seleccionar el bo-
tón Post Hoc... y, en la ven-
tana que se abre, los test
estadísticos que deseamos
utilizar. Cada uno de ellos
tiene, teóricamente, sus
ventajas e inconvenientes y
su aplicación más correcta
a determinadas poblacio-
nes, pero su explicación de-
tallada escapa al propósito
de este capítulo. Única-
mente, indicar que los más
usados y que se adaptan
mejor a la mayor parte de
las poblaciones que vamos
a estudiar en series de tras-
plantes, son los test de
Bonferroni, Tukey, Scheffe
y el de Stephen-Newman-
Keuls (este último, sólo pa-
ra comparaciones aparea-
das).
Los resultados que nos pro-
porciona el programa, tie-
nen la estructura mostrada
en la Tabla VI.
En esta primera tabla, se
nos indica el resultado de la
43
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 13
Figura 14
Cap 03 4/10/04 12:47 Página 43
ANOVA, con el valor de F y la significación estadística que, en este caso, es p = 0,000.
Por tanto, ya podemos afirmar que el número de rechazos agudos influye significativa-
mente en la creatinina plasmática al primer año.
En la Tabla VII se nos indica el resultado de la comparación múltiple entre los grupos,
mediante una tabla en la que podemos ver el test estadístico correspondiente, los di-
44
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
ANOVA
CR360
Sum of Squares df Mean Square F Sig.
Between Groups 12,371 2 6,186 15,021 0,000
Within Groups 95,949 233 0,412
Total 108,320 235
Tabla VI
Multiple Comparisons
Dependent Variable: CR360
(I) NºRA (J) NºRA Mean Std. Sig. 95%
Difference Error Confidence
(I-J) Interval
Lower Upper
Bound Bound
Tukey HSD 0 1 -0,346 0,095 0,001 -0,568 -0,124
2 -1,417 0,325 0,000 -2,178 -0,656
1 0 0,346 0,095 0,001 0,124 0,568
2 -1,071 0,331 0,003 -1,847 -0,296
2 0 1,417 0,325 0,000 0,656 2,178
1 1,071 0,331 0,003 0,296 1,847
Scheffe 0 1 -0,346 0,095 0,002 -0,579 -0,112
2 -1,417 0,325 0,000 -2,217 -0,617
1 0 0,346 0,095 0,002 0,112 0,579
2 -1,071 0,331 0,006 -1,887 -0,256
2 0 1,417 0,325 0,000 0,617 2,217
1 1,071 0,331 0,006 0,256 1,887
Bonferroni 0 1 -0,346 0,095 0,001 -0,574 -0,117
2 -1,417 0,325 0,000 -2,200 -0,634
1 0 0,346 0,095 0,001 0,117 0,574
2 -1,071 0,331 0,004 -1,869 -0,274
2 0 1,417 0,325 0,000 0,634 2,200
1 1,071 0,331 0,004 0,274 1,869
Tabla VII
Cap 03 4/10/04 12:47 Página 44
versos cruces entre ellos y el resultado de la significación o no de cada cruce. En nues-
tro ejemplo, podemos observar cómo existen diferencias significativas entre todos los
grupos y con cualquier test aplicado. Lógicamente, el valor de p puede ser diferente se-
gún el test, pero suele haber muy pocas diferencias como observamos en nuestro
ejemplo.
Comparación de proporciones
En muchas ocasiones tenemos la necesidad de comparar, en dos o más poblaciones in-
dependientes, el porcentaje de pacientes que tienen una característica determinada con
el porcentaje de los que cumplen determinados criterios, por ejemplo, en nuestro ejem-
plo nos podría interesar saber si el porcentaje de injertos no funcionantes se ve influido
por la causa de la muerte del donante. También existe la posibilidad de que necesite-
mos comparar porcentajes en muestras apareadas, es decir, si hay un cambio significa-
tivo en el porcentaje de un parámetro en la misma población de pacientes cuando cam-
bia una característica de ese
mismo grupo, por ejemplo, el
porcentaje de pacientes con
hipercolesterolemia tras una
intervención terapéutica (cam-
bio de tratamiento inmunosu-
presor, tratamiento con hipoli-
pemiantes, etc.).
El método estadístico más uti-
lizado para este tipo de com-
paración es el test CHI cua-
drado, que en el SPSS se rea-
liza de la manera expuesta en
las Figuras 15 y 16.
En este ejemplo, queremos
comprobar si la causa de
muerte del donante influye en la superviencia del injerto de manera global. El resultado
del test CHI cuadrado se muestra en la Tabla VIII.
Como vemos en la primera tabla, la diferencia más importante existe entre los injertos
no funcionantes (N): el 20,2% procedían de donantes por ACVA vs. el 11,5% de donan-
tes por TCE. En la segunda tabla, podemos comprobar que esta diferencia es estadísti-
camente significativa: p = 0,034. En esta misma tabla observamos que el programa rea-
liza, de manera automática, la prueba exacta de Fisher; este test se debe tener en
cuenta únicamente si las frecuencias esperadas, no las reales, son pequeñas (<5 en al-
45
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 15
Cap 03 4/10/04 12:47 Página 45
46
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 16
CAUSAMUE Total
ACV TCE
SITUACIO F Count 85 87 172
Expected 92,8 79,2 172,0
Count
% of Total 33,7% 34,5% 68,3%
N Count 51 29 80
Expected 43,2 36,8 80,0
Count
% of Total 20,2% 11,5% 31,7%
Total Count 136 116 252
Expected 136,0 116,0 252,0
Count
% of Total 54,0% 46,0% 100,0%
Chi-Square Tests
Value df Asymp. Sig. Exact Sig. Exact Sig.
(2-sided) (2-sided) (1-sided)
Pearson Chi-Square 4,514 1 0,034 – –
Continuity Correction 3,956 1 0,047 – –
Likelihood Ratio 4,563 1 0,033 – –
Fisher’s Exact Test – – – 0,042 0,023
N of Valid Cases 252 – – – –
Tabla VIII. SITUACIO * CAUSAMUE Crosstabulation.
Cap 03 4/10/04 12:47 Página 46
guna de las casillas de la primera tabla), lo cual no ocurre en nuestro ejemplo. En mu-
chas ocasiones esta circunstancia se interpreta erróneamente y lleva a pensar, equivo-
cadamente, que no puede utilizarse la prueba CHI cuadrado cuando hay un valor real ce-
ro o muy pequeño, por lo que
debemos insistir en que son
los valores esperados los que
influyen en el test estadístico.
La prueba CHI cuadrado tam-
bién puede utilizarse cuando
hay más de dos grupos en una
o las dos variables compara-
das, por ejemplo, analizar si
existen diferencias en el por-
centaje de injertos funcionan-
tes al primer año, dependien-
do del régimen inmunosupre-
sor, que habitualmente tiene
más de dos alternativas. El
método que debemos utilizar,
es exactamente igual al des-
crito para una comparación
2x2 y los resultados, en el
SPSS, se presentan de mane-
ra muy similar. Desde luego,
cuanto mayor sea el número de categorías de las variables, mayor deberá ser el tamaño
de la muestra para que se puedan conseguir diferencias significativas: si algunas de las
frecuencias son menores de dos o más de la mitad son menores de cinco, deberemos
agrupar casos, en caso de que conceptualmente sea posible, o bien, descartar algún
grupo por tamaño de muestra insuficiente.
Comparación de dos poblaciones con distribución
NO normal
En el caso de tener un tamaño de muestra pequeño y que no se ajuste a una distribu-
ción normal, lo que hemos comprobado de la manera descrita anteriormente, debere-
mos utilizar pruebas estadísticas no paramétricas, siendo las más extendidas el test
de Mann-Whitney y el test de Wilcoxon, que realizaremos como muestran las
Figuras 17 y 18.
En este ejemplo, queremos comparar la creatinina sérica al primer año post-trasplante
entre los pacientes que tuvieron uno o dos episodios de rechazo agudo, para lo cual
47
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 17
Cap 03 4/10/04 12:47 Página 47
hemos seleccionado en Noparametric
Tests el apartado 2 Independient sam-
ples, la variable cr360 y el nºra 1 ó 2, ya
que el número de pacientes con dos re-
chazos agudos es de cuatro (n muy baja
y sin distribución normal). El resultado
que nos da el programa (Tabla IX) es
que las diferencias no son significativas
(p = 0,112).
De una manera muy similar deberemos
trabajar si la muestra es apareada, es
decir, la misma población de pacientes
en dos momentos distintos de evolu-
ción. Siguiendo con el mismo ejemplo,
queremos saber si existen diferencias
entre la función renal, al primer mes y al
primer año, en aquellos pacientes con
dos episodios de rechazo agudo (Fi-
guras 19 y 20).
En este caso seleccionaremos en
Noparametric Tests el apartado 2 Related
Samples, el Test de Wilcoxon y las varia-
bles cr30–cr360. El resultado, que tam-
poco es estadísticamente significativo,
se nos presenta en la Tabla X.
48
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 18
Figura 20
Figura 19
Cap 03 4/10/04 12:47 Página 48
Comparación de tres o más poblaciones
con distribución NO normal
En el caso de que el número de grupos de pacientes sea mayor de dos, deberemos uti-
lizar otro tipo de prueba estadística pero con una metodología, en el SPSS, muy similar:
49
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Ranks
NºRA N Mean Rank Sum of Ranks
CR360 1 63 33,04 2081,50
2 4 49,13 196,50
Total 67
Test Statistics
CR360
Mann-Whitney U 65,500
Wilcoxon W 2081,500
Z -1,603
Asymp. Sig. (2-tailed) 0,109
Exact Sig. [2*(1-tailed Sig.)] 0,112
a. Not corrected for ties
b. Grouping Variable: NºRA
Tabla IX
Ranks
N Mean Rank Sum of Ranks
CR360 - CR30 Negative 3 2,00 6,00
Ranks
Positive 1 4,00 4,00
Ranks
Ties 0
Total 4
a. CR360 <CR30
b. CR360 >CR30
c. CR30 = CR360
Test Statistics
CR360 - CR30
Z -0,365
Asymp. Sig. (2-tailed) 0,715
a. Based on positive ranks
b. Wilcoxon Signed Ranks Test
Tabla X
Cap 03 4/10/04 12:47 Página 49
en Noparametric Tests seleccionaremos el apartado K Independent Samples... y el Test
de Kruskal-Wallis, seleccionando la o las variables a analizar y la que define los subgru-
pos. En este ejemplo, queremos saber si existen diferencias en la función renal, al pri-
mer año, dependiendo del nú-
mero de episodios de rechazo
agudo (Figuras 21 y 22).
El resultado es que existe di-
ferencia estadísticamente sig-
nificativa (p = 0,000) a pesar
de tener un grupo de pacien-
tes bajo (únicamente cuatro
casos con dos episodios de
rechazo agudo) (Tabla XI).
Otra posibilidad es que quera-
mos analizar si existen dife-
rencias en una población que
no se ajusta a una distribución
normal en tres o más momen-
tos de su evolución, para lo
cual deberemos utilizar el test
de Friedman que, en el SPSS,
se realiza de la siguiente ma-
nera: en Noparametric tests
seleccionamos K Related Samples y, en la ventana siguiente, las variables que quera-
mos comparar y el test de Friedman. En este ejemplo, queremos analizar si hay diferen-
cias en la función renal de los pacientes con dos o más rechazos agudos en cuatro mo-
mentos de su evolución a lo largo del primer año post-trasplante (Figuras 23 y 24).
50
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 21
Figura 22
Cap 03 4/10/04 12:47 Página 50
El resultado, en este caso concreto, es que no hay diferencias significativas (p = 0,417)
a lo largo de la evolución de estos cuatro pacientes (Tabla XII).
Correlación y regresión
Otro de los puntos básicos en el análisis estadístico de una población trasplantada, es
estudiar si existe relación significativa entre dos parámetros, para lo cual utilizaremos
los test de correlación y regresión que tienen mucho en común, pero con conceptos de
análisis distintos. En el caso de la correlación, lo único que buscamos es saber si existe
una relación significativa entre dos variables cuantitativas, mientras que con la regresión
51
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Ranks
Nº RA N Mean Rank
CR360 0 169 107,94
1 63 142,15
2 4 192,00
Total 236
Test Statistics
CR360
Chi-Square 16,315
df 2
Asymp. Sig. 0,000
a. Kruskal Wallis Test
b. Grouping Variable: NºRA
Tabla XI
Descriptive Statistics
N Mean Std. Deviation Minimum Maximum
CR30 4 3,025 1,617 1,8 5,4
CR90 4 2,325 1,147 1,4 4,0
CR180 4 3,375 1,889 1,5 5,5
CR360 4 3,000 1,519 1,5 4,9
Test Statistics
N 4
Chi-Square 2,842
df 3
Asymp. Sig. 0,417
a. Friedman Test
Tabla XII
Cap 03 4/10/04 12:47 Página 51
estudiamos si un parámetro varía (parámetro que denominamos variable dependiente) a
medida que varía otro (variable independiente). Como puede verse, la diferencia con-
ceptual es muy sutil, pero queda
más clara con dos ejemplos: en
una población trasplantada quere-
mos saber si existe relación entre
las cifras de glucemia y las de co-
lesterol plasmático; como, en prin-
cipio, ninguno de los dos paráme-
tros es dependiente del otro, utili-
zaremos el cálculo de la correla-
ción para saber si la relación es
significativa o no existe relación.
Sin embargo, si queremos saber si
la relación entre las dosis de ci-
closporina y sus niveles plasmáti-
cos es estadísticamente significa-
tiva, utilizaremos la regresión line-
al, ya que debemos suponer, lógi-
camente, que los segundos au-
mentan a medida que aumenta-
mos la dosis.
En el SPSS, tanto
su cálculo como su
representación grá-
fica son sencillas de
realizar. En nuestra
serie, por ejemplo,
nos interesa saber
si la creatinina del
séptimo día tiene
relación con el tiem-
po de isquemia fría
(Figura 25).
El coeficiente de co-
rrelación más usado es el de Pearson y nos servirá en la gran mayoría de las ocasiones.
El resultado se nos presenta de la siguiente manera en la Tabla XIII.
Como podemos ver, existe una correlación positiva (coeficiente de Pearson = 0,212) en-
tre ambas variables que es estadísticamente significativa p = 0,01, es decir, podemos
52
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 24
Figura 23
Cap 03 4/10/04 12:47 Página 52
53
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 25
Figura 27
Isquemia fría (horas)
4842363024181260
Creatininasérica7ºdiapost-trasplante(mg/dl)
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Figura 28
Figura 26
Cap 03 4/10/04 12:47 Página 53
afirmar que en esta serie, a medida que aumenta el tiempo de isquemia fría, mayor es
el valor de la creatinina plasmática al séptimo día. La representación gráfica se consigue
como indican las Figuras 26 y 27.
El gráfico resultante (Figura 28) puede modificarse fácilmente de manera similar a otros
tipos de programas gráficos.
Debemos recordar que la correlación no significa necesariamente causalidad, como po-
dríamos inferir del ejemplo anterior, sino que dos variables tienden a estar relacionadas.
Esta relación puede deberse efectivamente a que una de ellas influye en la otra (como
muy probablemente ocurra en este caso) o porque alguna otra variable, o más de una,
influyan en las dos relacionadas en el mismo sentido.
En cuanto al cálculo de la regresión, el método es muy similar, por ejemplo, en nuestra
serie queremos saber si efectivamente existe una tendencia a elegir receptores de más
edad a medida que el donante es mayor (Figuras 29 y 30).
54
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Correlations
CR7 ISQFRI
CR7 Pearson Correlation 1,000 0,212
Sig. (2-tailed) 0,0 0,001
N 252 246
ISQFRI Pearson Correlation 0,212 1,000
Sig. (2-tailed) 0,001 0,0
N 246 246
** Correlation is significant at the 0.01 level (2-tailed)
Tabla XIII
Figura 29 Figura 30
Cap 03 4/10/04 12:47 Página 54
El resultado se refleja en la Ta-
bla XIV.
Como podemos comprobar, la
variable dependiente (edad del
receptor) aumenta (coeficiente
de regresión R positivo = 0,493)
a medida que aumenta la edad
del donante (variable indepen-
diente o predictora) de manera
estadísticamente significativa
(p = 0,000).
La representación gráfica, aun-
que puede seleccionarse directa-
mente cuando se realiza el test
estadístico, en el SPSS es mucho más sencillo realizarla, de la misma manera que hi-
cimos con la correlación. El resultado en este caso concreto se muestra en el gráfico
de la Figura 31.
55
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Variables Entered/Removed
Model Variables Entered Variables Removed Method
1 AGEDON , Enter
a. All requested variables entered
b. Dependent Variable: AGEREC
Model Summary
Model R R Square Adjusted R Std. Error
Square of the Estimate
1 0,493 0,243 0,240 11,84
a. Predictors: (Constant), AGEDON
ANOVA
Model Sum of df Mean F Sig.
Squares Square
1 Regression 11269,981 1 11269,981 80,421 0,000
Residual 35034,447 250 140,138
Total 46304,429 251
a. Predictors: (Constant), AGEDON
b. Dependent Variable: AGEREC
Tabla XIV
Edad del donante
80706050403020100
Edaddelreceptor
80
70
60
50
40
30
20
10
Figura 31
Cap 03 4/10/04 12:47 Página 55
ESTADÍSTICA AVANZADA
En muchas ocasiones, las pruebas estadísticas para comparar o relacionar variables que
hemos descrito anteriormente, no nos responden a todas las preguntas que nos plantea
un análisis estadístico completo de una población trasplantada, fundamentalmente
cuando, sobre uno o varios parámetros, puede influir más de una variable (el ejemplo tí-
pico es el análisis de factores de riesgo; sobre la aparición de cardiopatía isquémica pue-
den influir la edad, el sexo, la tensión arterial, la hipercolesterolemia, etc.). La cuestión a
responder desde el punto de vista estadístico es si todas las variables que influyen tie-
nen la misma significación estadística, si unas influyen, a su vez, sobre otras, por lo que
estas últimas pierden importancia, y cuáles son las que realmente tienen peso estadísti-
co por sí mismas.
Para analizar todo lo planteado anteriormente tenemos que recurrir a métodos estadísti-
cos para variables múltiples que conocemos genéricamente como análisis multivarian-
te. En este capítulo, describiremos la forma de realizar las dos pruebas más usadas en
la estadística médica: la regresión múltiple y la regresión logística.
Regresión múltiple
Este método estadístico se utiliza
para investigar si, sobre una varia-
ble numérica continua y simple,
influyen varias variables indepen-
dientes y cuáles de ellas alcanzan
significación estadística. Para rea-
lizarla seguiremos los pasos si-
guientes: en primer lugar, iremos
al apartado Regression de estadís-
ticas y elegiremos Linear, tal y co-
mo vemos en la Figura 32.
En la siguiente ventana, elegire-
mos la variable que deseamos
analizar (dependiente) y después
todas aquellas que pensamos que
puedan influir en ella (independientes). En nuestro ejemplo, queremos analizar si la
edad del donante, el tiempo de isquemia fría, el número de incompatibilidades, el título
de anticuerpos, la edad del receptor y el número de rechazos (variables independientes)
influyen, y cuáles en la función renal al primer año (variable dependiente). Para ello colo-
caremos cr360 en la casilla Dependent, y todas las demás en la casilla Independent(s)
(Figura 33). El resultado se refleja en la Tabla XV.
56
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 32
Cap 03 4/10/04 12:47 Página 56
Se confirma que todas las varia-
bles solicitadas han sido analiza-
das y, en caso contrario, cuáles
no, y se muestra la significación
de cada una de ellas (Tabla XVI).
En este ejemplo, podemos ver có-
mo únicamente las edades de do-
nante y de receptor y el número de
rechazos agudos tienen peso esta-
dístico por sí mismas (p = 0,000,
p = 0,018 y p = 0,000), mientras
que las demás no alcanzan signifi-
cación. Esto no quiere decir que, si
las analizásemos una a una por se-
parado, no pudieran ser significati-
vas; por ejemplo, un título alto de
anticuerpos podría influir negativamente en la función del injerto, pero si lo analizamos con-
juntamente con las demás, pierde importancia estadística.
57
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 33
Variables Entered/Removed
Model Variables Entered Variables Removed Method
1 NºRA, AGEDON, MISMDR, , Enter
ISQFRI, ACACT, AGEREC
a. All requested variables entered
b. Dependent Variable: CR360
Tabla XV
Coefficients
Model Unstandardized Std. Error Standardized t Sig.
Coefficients B Coefficients Beta
1 (Constant) 1,342 0,232 5,794 0,000
AGEDON 1,437E-02 0,003 0,350 5,181 0,000
ISQFRI 1,438E-03 0,008 0,011 0,182 0,856
MISMDR -1,554E-02 0,063 -0,015 -0,247 0,805
ACACT -4,494E-03 0,004 -0,077 -1,262 0,208
AGEREC -8,116E-03 0,003 -0,161 -2,380 0,018
NºRA 0,422 0,083 0,311 5,103 0,000
a. Dependent Variable: CR360
Tabla XVI
Cap 03 4/10/04 12:47 Página 57
En un análisis más completo pode-
mos realizar esta misma prueba,
pero en dos o más subgrupos de la
población global. Por ejemplo, si
queremos realizar exactamente lo
mismo que anteriormente, pero
solamente en los pacientes que no
tuvieron función renal inmediata,
únicamente tenemos que indicar la
variable correspondiente y su valor;
en nuestro ejemplo corresponde a
igf = 0 (inmediate graft function =
0), en la casilla Selection Variable,
como se ve en la siguiente figura
(Figura 34). Cambiando esta condi-
ción, podremos realizar cuantos
subgrupos queramos.
En este caso, el nuevo resultado se aprecia en la Tabla XVII.
Como podemos observar, en este subgrupo de pacientes, únicamente se mantiene el
número de rechazos agudos, perdiendo significación estadística las edades del donante
y del receptor como factores que influyen en la creatinina al primer año post-trasplante.
Regresión logística
Como hemos visto, la regresión múltiple se utiliza cuando la variable dependiente es nu-
mérica o continua. Cuando queremos analizar los factores que pueden influir en una va-
58
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Coefficients
Model Unstandardized Std. Error Standardized t Sig.
Coefficients B Coefficients Beta
1(Constant) 1,105 0,307 3,593 0,001
AGEDON 4,383E-03 0,004 0,117 1,064 0,291
ISQFRI 1,832E-02 0,011 0,174 1,683 0,097
MISMDR -6,951E-02 0,090 -0,079 -0,776 0,440
ACACT 1,512E-04 0,005 0,003 0,029 0,977
AGEREC -3,400E-03 0,005 -0,082 -0,736 0,464
NºRA 0,505 0,119 0,440 4,236 0,000
a. Dependent Variable: CR360
b. Selecting only cases for which IGF = ,00
Tabla XVII
Figura 34
Cap 03 4/10/04 12:47 Página 58
riable cualitativa o dicotómica, deberemos utilizar la regresión logística. Ejemplos muy tí-
picos serían analizar los factores que influyen en la situación del injerto, funcionante o
no funcionante, o los factores de riesgo de padecer o no cardiopatía isquémica y otros
semejantes.
Dentro de los parámetros que po-
demos incluir como variables inde-
pendientes, es decir, como facto-
res con posible influencia sobre la
circunstancia que estamos anali-
zando (variable dependiente), es-
tán tanto variables numéricas
(edad, creatinina sérica, niveles de
inmunosupresores, niveles de co-
lesterol, tensión arterial, etc.) co-
mo variables cualitativas (sexo, ti-
po de inmunosupresión, causa de
muerte del donante, etc.).
El método a seguir para realizar es-
ta prueba con el SPSS, es el si-
guiente: en primer lugar, seleccio-
namos Logistic en el
apartado Regression
de estadísticas, co-
mo se ve en la Fi-
gura 35.
En la ventana si-
guiente, elegiremos
la variable depen-
diente que desea-
mos analizar (en es-
te caso, será la situa-
ción del injerto: fun-
cionante o no funcio-
nante) y, a continua-
ción, todas las varia-
bles que pensemos que puedan influir (en este caso, por ejemplo, edad del donante y
del receptor, causa de la muerte, función renal inicial y a los 30 y 90 días, rechazo agu-
do, etc.), como puede verse en la Figura 36. El resultado del test se presenta en la Tabla
XVIII.
59
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 35
Figura 36
Cap 03 4/10/04 12:47 Página 59
Total number of cases: 291 (Unweighted)
Number of selected cases: 291
Number of unselected cases: 0
Number of selected cases: 291
Number rejected because of missing data: 41
Number of cases included in the analysis: 250
Dependent Variable Encoding:
Original Internal
Value Value
F 0
N 1
Parameter
Value Freq Coding
(1) (2) (3) (4)
CAUSAMUE
TCE 106 1,000 0,000 0,000 0,000
ANX 6 0,0001 0,000 0,000 0,000
ACV 119 0,000 0,000 1,000 0,000
17 0,000 0,000 0,000 1,000
OTR 2 0,000 0,000 0,000 0,000
RA
Sí 67 1,000 0,000 0,000
No 137 0,000 1,000 0,000
0 36 0,000 0,000 1,000
1 10 0,000 0,000 0,000
Dependent Variable. SITUACIO
Beginning Block Number 0. Initial Log Likelihood Function
-2 Log Likelihood 296,47666
* Constant is included in the model.
Beginning Block Number 1. Method: Enter
Variable(s) Entered on Step Number
1. AGEDON
CAUSAMUE
ISQFRI
ACACT
MISMATC
AGEREC
RA
NºRA
CR7
CR30
CR90
60
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Tabla XVIII
Cap 03 4/10/04 12:47 Página 60
Estimation terminated at iteration number 4 because
Log Likelihood decreased by less than, 01 percent.
-2 Log Likelihood 246,030
Goodness of Fit 248,609
Cox & Snell - R^2 0,183
Nagelkerke - R^2 0,263
Chi-Square df Significance
Model 50,447 16 0,0000
Block 50,447 16 0,0000
Step 50,447 16 0,0000
Classification Table for SITUACIO
The Cut Value is ,50
Predicted
F N Percent Correct
F I N
Observed
F F I 168 I 12 I 93,33%
N N I 46 I 24 I 34,29%
Overall 76,80%
Variables in the Equation
Variable B S.E. Wald df Sig R Exp(B)
AGEDON 0,0152 0,0137 1,2295 1 0,2675 0,00001 0,0153
CAUSAMUE 3,6108 4 0,4612 0,0000
CAUSAMUE(1) -0,2306 1,7842 0,0167 1 0,8972 0,0000 0,7941
CAUSAMUE(2) -0,7934 1,9613 0,1636 1 0,6858 0,0000 0,4523
CAUSAMUE(3) -0,7355 1,7977 0,1674 1 0,6824 0,0000 0,4793
CAUSAMUE(4) 0,4889 1,9281 0,0643 1 0,7998 0,0000 1,6305
ISQFRI 0,0109 0,0308 0,1261 1 0,7225 0,0000 1,0110
ACACT -0,0051 0,0137 0,1405 1 0,7077 0,0000 0,9949
MISMATC 0,0353 0,1417 0,0621 1 0,8032 0,0000 1,0359
AGEREC 0,0143 0,0143 0,9956 1 0,3184 0,0000 1,0144
RA 2,5866 3 0,4598 0,0000
RA(1) -0,5548 0,9029 0,3776 1 0,5389 0,0000 0,5742
RA(2) 0,8305 1,6655 0,2486 1 0,6180 0,0000 2,2944
RA(3) 1,4923 1,6539 0,8141 1 0,3669 0,0000 4,4472
NºRA 1,8437 1,3927 1,7525 1 0,1856 0,0000 6,3196
CR7 -0,0731 0,0702 1,0848 1 0,2976 0,0000 0,9295
CR30 0,4795 0,2469 3,7724 1 0,0521 0,0773 1,6152
CR90 0,6002 0,3176 3,5703 1 0,0588 0,0728 1,8225
Constant -5,1190 3,1106 2,7082 1 0,0998
61
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Cap 03 4/10/04 12:47 Página 61
Como podemos observar, la presentación de los resultados es bastante compleja, pero para
nuestro propósito, los datos que más nos pueden interesar son: en primer término, se nos
describe el número de casos totales, perdidos por falta de datos y los incluidos finalmente en
el análisis. El siguiente aspecto que nos interesa, es el listado de los parámetros que se han
analizado para que podamos comprobar que están todos los que nos interesan. Al final debe-
mos fijarnos en la significación estadística de cada variable. En este ejemplo, vemos que no
hay ningún factor que tenga peso, por sí mismo, cuando se analiza conjuntamente con los de-
más respecto a la situación del injerto (ninguna p es <0,05). Al igual que en el caso de la re-
gresión múltiple, puede ser que en el análisis estadístico básico univariante sí haya significa-
ción estadística; una posible explicación es que exista una interacción más o menos intensa
entre ellos, que haga que pierdan importancia individual. Otra posibilidad es que el número de
parámetros estudiados sea demasiado grande para la muestra que tenemos. Lógicamente,
cuantos más factores introducimos en el análisis multivariante, mayor deberá ser la población
para que podamos llegar a conclusiones estadísticamente aceptables.
Un aspecto práctico importante es que este test nos indica automáticamente el riesgo
relativo: se trata del valor Exp(B), y que en nuestro ejemplo se especifica debajo del
nombre de cada variable analizada.
Al igual que hicimos con la regresión múltiple, podemos dividir la población en subgru-
pos. Teniendo en cuenta que disminuiremos la n, debemos intentar que estos subgru-
pos tengan un tamaño mínimo y no realizar análisis multivariante en poblaciones de me-
nos de 30-50 sujetos. El procedimiento es igual que el anterior, pero especificando una
variable y un valor de la misma en el apartado Select: en este caso, vamos a seleccionar
el subgrupo de pacientes retrasplantados (txpac = greater than 1). El resultado se pre-
senta de idéntica forma (Figura 37).
RESUMEN
Cuando nos enfrentamos al análisis estadístico de una población trasplantada, existen
dos planteamientos básicos: un primer paso, que consiste en un estudio general, y otro
más específico, que es el análisis de supervivencia, y que se describe perfectamente
en otro de los capítulos.
El estudio general estadístico debe realizarse de una forma ordenada y sistemática que
incluye varios pasos escalonados, que hemos descrito anteriormente y que intentare-
mos sintetizar de la siguiente manera:
1. Descripción de la muestra, tal y como se definió en la primera parte del capítulo.
2. ¿Existen diferencias en los parámetros cuantitativos entre dos grupos de pacientes
independientes?
62
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 03 4/10/04 12:47 Página 62
• Los dos grupos que queremos comparar, tienen un número de casos mayor de
30: test t de Student.
• El tamaño de alguno de los dos grupos es inferior a 30:
• Comprobar si la distribución es normal.
• En caso afirmativo: test t de Student.
• En caso negativo: test de Mann-Whitney y test de Wilcoxon.
3. ¿Existen diferencias en parámetros cuantitativos entre un mismo grupo de pacientes
en dos momentos de la evolución?
• El grupo que queremos comparar tiene un número de casos mayor de 30: test t de
Student para muestras apareadas.
• El tamaño del grupo es inferior a 30:
• Comprobar si la distribución es normal.
• En caso afirmativo: test t de Student para muestras apareadas.
• En caso negativo: test de Wilcoxon.
4. ¿Existen diferencias en parámetros cuantitativos entre tres o más grupos de pacien-
tes independientes?
63
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Figura 37
Cap 03 4/10/04 12:47 Página 63
• Todos los grupos tienen un número de casos mayor de 30 o hemos comprobado
que se ajustan todos a una distribución normal: test de ANOVA.
• Algún grupo NO tiene una distribución normal: test de Kruskal-Wallis.
5. ¿Existen diferencias en los parámetros cuantitativos entre un grupo de pacientes en
tres o más momentos de su evolución?
• Todos los grupos tienen un número de casos mayor de 30 o hemos comprobado que se
ajustan todos a una distribución normal: test de ANOVA para mediciones repetidas.
• Algún grupo NO tiene una distribución normal: test de Friedman.
6. ¿Existen diferencias en parámetros cualitativos entre dos grupos de pacientes inde-
pendientes?
• Los dos grupos tienen frecuencias esperadas pequeñas: test Chi cuadrado con
prueba exacta de Fisher.
• No se esperan frecuencias pequeñas en los grupos: test Chi cuadrado.
7. ¿Existen diferencias en parámetros cualitativos en un grupo de pacientes en dos mo-
mentos de su evolución?
• Test de McNemar o Kappa.
8. ¿Existen diferencias en parámetros cualitativos entre tres o más grupos de pacientes
independientes?
• Los dos grupos tienen frecuencias esperadas pequeñas: test Chi cuadrado con
prueba exacta de Fisher.
• No se esperan frecuencias pequeñas en los grupos: test Chi cuadrado.
9. ¿Existe relación entre dos parámetros cuantitativos?
• Las dos variables son independientes, en teoría, la una de la otra, pero queremos sa-
ber si guardan relación: test de correlación de Pearson.
• Suponemos, en teoría, que una variable depende de otra (aumenta o disminuye cuan-
do ésta cambia de valor) y queremos saber si guardan relación: test de regresión.
10. ¿Existe algún parámetro que pueda verse influido, teóricamente, por dos o más fac-
tores?
• La variable a estudiar es numérica continua, así como los factores que puedan in-
fluirla: test de regresión múltiple.
64
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 03 4/10/04 12:47 Página 64
• La variable a estudiar es cualitativa dicotómica y los factores que pueden influir son
numéricos o categóricos (es decir, variables cuantitativas o cualitativas): test de re-
gresión logística.
BIBLIOGRAFÍA RECOMENDADA
1. Pardell H, Cobo E, Canela J. Manual de Bioestadística. Barcelona: Masson; 1986.
2. Leaverton PE. A review of Biostatistics: A program for self-instruction. Boston: little,
Brown and Company; 1989.
3. Carrasco JL. El método estadístico en la investigación médica. Madrid: Editorial
Ciencia 3; 1989.
4. Schwartz D. Métodos estadísticos para médicos y biólogos. Barcelona: Editorial
Herder; 1991.
5. Broughton Pipkin F. Medical statistics made easy. Edimburgo: Churchill Livingstone;
1984.
6. Goldberg M. La Epidemiología sin esfuerzo. Madrid: Ediciones Díaz Santos; 1994.
7. Carrasco JL, López Giménez MR. Ejercicios y problemas de Estadística Biomédica.
Madrid: Editorial Ciencia 3; 1985.
8. Dawson-Saunders B, Trapp RG. Bioestadística médica. México D.F.: Editorial El
Manual Moderno; 1993.
9. Colton T. Estadística en medicina. Barcelona: Ediciones Científicas y Técnicas
(Masson – Salvat Medicina); 1993.
10. Sarriá A, Domenech JM. Análisis multivariante en ciencias de la salud. Laboratori
d´Estadística Aplicada i Modelització. Universitat Autónoma de Barcelona.
Barcelona: Editorial SIGNO; 1993.
11. Domenech JM. Métodos estadísticos en ciencias de la salud. Laboratori
d´Estadística Aplicada i Modelització. Universitat Autónoma de Barcelona.
Barcelona: Editorial SIGNO; 1994.
65
ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA
Cap 03 4/10/04 12:47 Página 65
135
EL CONCEPTO DE SEMIVIDA
COMO PREDICTOR
DE LA SUPERVIVENCIA
A LARGO PLAZO
R. Escallada
CONCEPTO DE SEMIVIDA
En los anteriores capítulos hemos descrito cómo analizar una población trasplantada,
tanto desde el punto de vista general como, más concretamente, desde el punto de vis-
ta del análisis de la supervivencia. En todos los casos hemos trabajado con datos reales
de evolución. En este capítulo, se va a introducir e intentar definir un aspecto muy rela-
cionado con la supervivencia, pero que se basa, fundamentalmente, en una proyección
matemático-estadística, es decir, no necesariamente trabajaremos con datos reales de
evolución. Este concepto es lo que denominamos semivida.
Como su nombre indica, la semivida de supervivencia de una población es el tiempo en el
que la mitad de esa población continúa viva o funcionante: por ejemplo, si el 50% de los
injertos llegan funcionantes a los 12,5 años, ésta será la semivida. Como podemos dedu-
cir de esta definición simple, estamos ante una medida de la supervivencia a largo plazo.
Sin embargo, en múltiples ocasiones el tiempo de evolución de una población trasplan-
tada concreta es demasiado corto para que se pierdan el 50% de los casos, o bien, la su-
pervivencia es muy buena y tardaríamos muchos años en alcanzar el 50% de supervi-
vencia. Es por esto por lo que necesitamos algún sistema que nos permita estimar esta
cifra sin llegar al 50% real.
Otra utilidad de calcular la semivida es que podemos intuir resultados a largo plazo en po-
co tiempo de evolución, para que podamos, en su caso, tomar decisiones más precoz-
Cap 05 4/10/04 12:49 Página 135
136
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
mente que si tuviésemos que esperar a la pérdida del 50% de la población. Por ejemplo,
¿cuál es la influencia de un nuevo inmunosupresor en la supervivencia del injerto? A esta
pregunta deberemos dar dos respuestas: la primera, su influencia en la supervivencia a
corto plazo (inmunosupresión de inducción), que habitualmente se describe durante el
primer año, y la segunda, su influencia en la supervivencia a largo plazo, para lo cual cal-
cularemos la semivida estimada. Si, en este ejemplo, el nuevo fármaco eleva la supervi-
vencia al primer año, pero mantiene constante la semivida, es claramente un inmunosu-
presor mejor de inducción e indiferente de mantenimiento, por lo cual, decidiremos su
uso con base a otras razones (menor toxicidad, menor coste, etc.) distintas a su eficacia.
Al analizar la supervivencia a largo plazo de una población trasplantada, nuestra expe-
riencia nos dice que los mayores cambios en la supervivencia del paciente y del injerto,
cuando comparamos dos o más curvas de supervivencia, ocurren durante el primer año,
produciéndose después una lenta y progresiva pérdida de pacientes e injertos, pero de
manera mucho más paralela. Este hecho es claramente evidente cuando comparamos
poblaciones trasplanta-
das que han llegado fun-
cionantes al primer post-
trasplante.
En el ejemplo siguiente
usaremos la base de da-
tos real que ya emplea-
mos en otro capítulo de
este libro; podemos ver
la diferencia en la super-
vivencia del injerto entre
pacientes que han sufri-
do rechazo agudo o no
(Figura1).
Como podemos obser-
var, la gran diferencia de
supervivencia entre am-
bas poblaciones se establece ya desde el primer año, siendo las curvas a partir de ese
momento casi paralelas, como puede verse más claramente si, únicamente, analizamos
aquellos pacientes que han llegado con injerto funcionante al primer año, para lo cual
tendremos que seleccionar, en la hoja de cálculo del SPSS, aquellos casos cuya duración
del injerto sea mayor de un año (Figuras 2 y 3).
Si repetimos la comparación de las curvas de supervivencia, el resultado es el reflejado
en la Figura 4.
Figura 1
Cap 05 4/10/04 12:49 Página 136
Como vemos, las dos curvas se superponen hasta aproximadamente el cuarto año, año
en que los pacientes con antecedentes de rechazo agudo pierden los injertos con más
frecuencia (aunque a partir de este año el número de casos empieza a ser bajo y, por lo
tanto, con menor valor estadístico).
137
EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO
Figura 2
Figura 3
Cap 05 4/10/04 12:49 Página 137
Lógicamente, la realiza-
ción de un cálculo pre-
dicitivo o, dicho de otro
modo, de una proyec-
ción estadística, debe
basarse en el hecho de
que los eventos (en es-
te caso, la muerte del
receptor o la pérdida
del injerto) se producen
de manera razonable-
mente constante a lo
largo de la evolución.
Es decir, en nuestro ca-
so, que la pérdida de in-
jertos o el número de
fallecimientos anuales
esté en un rango estre-
cho entre los distintos
años. Como hemos vis-
to, esto no se produce de ninguna manera durante el primer año post-trasplante, por lo
que, cuando calculamos la semivida estimada de una población trasplantada, debere-
mos hacerlo siempre en el grupo de pacientes que llegan vivos y con injerto funcionan-
te al primer año, ya que es a partir de este momento, cuando se produce lo que podría-
mos denominar una fase de riesgo constante que hace que el logaritmo natural de la
curva de supervivencia sea prácticamente lineal, permitiéndonos fácilmente realizar la
extrapolación necesaria para calcular la semivida.
CÁLCULO DE LA SEMIVIDA
La fórmula para el cálculo de la semivida es muy sencilla aunque, como veremos, tedio-
sa en su realización, por lo que intentaremos describir métodos más rápidos y sencillos
y prácticamente con igual exactitud:
semivida estimada = T log(2) / n de eventos
Donde T es el tiempo de supervivencia acumulado después del primer año y n de
eventos el número de pacientes fallecidos o el número de injertos que dejaron de fun-
cionar después del primer año.
El mayor problema del método es que tenemos que ir sumando, si usamos al pie de la
letra esta fórmula, la supervivencia (por encima del año) de todos y cada uno de los ca-
138
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 4
Cap 05 4/10/04 12:49 Página 138
sos. Por ejemplo, si queremos saber la semivida de las dos poblaciones de las que he-
mos calculado las curvas de supervivencia anteriormente, esto es, de los pacientes con
y sin antecedentes de rechazo agudo, para ello debemos consultar la tabla que, previa a
la curva, nos proporciona el SPSS cuando utilizamos el método Kaplan-Meier, en la que
se nos informa de la supervivencia de cada caso (Tablas I y II).
Como puede fácilmente adivi-
narse, este sistema es laborio-
so y tedioso, por lo que utiliza-
mos un sistema más simple y
que, además, nos permite te-
ner al mismo tiempo la repre-
sentación gráfica.
En el SPSS, seleccionaremos
Kaplan-Meier en el apartado
Survival de Statistics (Figura 5).
En la pantalla siguiente, selec-
cionaremos la variable que nos
indica la duración del injerto o
del paciente, la situación (fun-
cionante o no funcionante, o
bien, vivo o muerto) y el factor
que queramos comparar, en su
139
EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO
Figura 6
Figura 5
Cap 05 4/10/04 12:49 Página 139
140
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Factor RA=NO
Time Status Cumulative Standard Cumulative Number
Survival Error Events Remaining
1,0603 F 0 125
1,1507 N 0,9920 0,0080 1 124
1,3068 F 1 123
1,3973 F 1 122
1,4000 F 1 121
1,4603 F 1 120
1,5151 F 1 119
1,5781 N 0,9837 0,0115 2 118
1,6329 N 0,9753 0,0141 3 117
1,6466 F 3 116
1,8630 F 3 115
1,8986 F 3 114
1,8986 F 3 113
2,0164 N 0,9667 0,0164 4 112
2,0329 F 4 111
2,0767 N 0,9580 0,0184 5 110
2,1068 F 5 109
2,1699 N 0,9492 0,0202 6 108
2,3260 F 6 107
2,3425 F 6 106
2,3425 F 6 105
2,4548 F 6 104
2,4904 N 0,9401 0,0220 7 103
2,5123 F 7 102
2,5151 F 7 101
2,6027 F 7 100
2,6027 F 7 99
2,6685 N 0,9306 0,0237 8 98
2,7068 F 8 97
2,7589 F 8 96
2,7863 F 8 95
2,7863 F 8 94
2,8055 F 8 93
2,9808 N 0,9206 0,0255 9 92
2,9863 F 9 91
3,0055 N 0,9105 0,0272 10 90
3,0822 F 10 89
3,1836 F 10 88
3,2740 F 10 87
3,3397 F 10 86
3,3562 F 10 85
3,4466 F 10 84
3,4548 F 10 83
3,4575 F 10 82
3,4959 F 10 81
3,5836 F 10 80
3,6438 F 10 79
3,6438 F 10 78
Tabla I. Survival Analysis for DURACION.
Cap 05 4/10/04 12:49 Página 140
141
EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO
3,6795 F 10 77
3,6849 F 10 76
3,6877 N 0,8985 0,0293 11 75
3,7781 F 11 74
3,9315 F 11 73
3,9863 F 11 72
4,1178 F 11 71
4,1644 F 11 70
4,2959 F 11 69
4,4247 F 11 68
4,4247 F 11 67
4,5014 F 11 66
4,5068 F 11 65
4,5699 F 11 64
4,6356 F 11 63
4,6849 F 11 62
4,7041 F 11 61
4,7233 F 11 60
4,9671 F 11 59
5,0384 F 11 58
5,0466 F 11 57
5,0877 F 11 56
5,0877 F 11 55
5,1041 F 11 54
5,1589 F 11 53
5,2000 F 11 52
5,2137 F 11 51
5,2301 F 11 50
5,4521 F 11 49
5,4849 F 11 48
5,4932 N 0,8798 0,0342 12 47
5,4986 F 12 46
5,5205 N 0,8606 0,0384 13 45
5,5479 F 13 44
5,6575 N 0,8411 0,0422 14 43
5,7370 F 14 42
5,8082 F 14 41
5,8301 F 14 40
5,8438 F 14 39
6,0356 F 14 38
6,0822 F 14 37
6,0822 F 14 36
6,1151 F 14 35
6,2575 F 14 34
6,2575 F 14 33
6,2740 F 14 32
6,5151 F 14 31
6,5452 F 14 30
6,5589 F 14 29
6,7178 F 14 28
6,7178 F 14 27
6,7890 F 14 26
6,8466 F 14 25
6,8466 F 14 24
Cap 05 4/10/04 12:49 Página 141
caso (en este ejemplo, vamos a analizar la semivida de los injertos con y sin anteceden-
tes de rechazo agudo).
En el campo Options... deberemos seleccionar Log survival como Plot (curva) que debe
dibujar el SPSS (Figura 6).
Una vez obtenidas las gráficas correspondientes, en función logarítmica, debemos, des-
de el propio SPSS, editar el gráfico y en el apartado Options... de Chart elegiremos
Show Subgroups y Fit line Total (para la serie completa), y Subgroups si estamos com-
parando poblaciones como es nuestro caso (Figuras 7 y 8). Por último, únicamente nos
queda preparar la gráfica para poder determinar el punto de intersección entre el 50% y
la línea de supervivencia, viendo a qué valor del eje X corresponde, el cual será la semi-
vida (Figura 9).
Cuanto más subdividida esté la escala del eje X, más precisa será la medida de la semi-
vida estimada, aunque al ser un valor predictivo y con el que no haremos cálculos, no es
7,0137 F 14 23
7,0603 F 14 22
7,2329 N 0,8028 0,0549 15 21
7,2658 F 15 20
7,3096 F 15 19
7,4164 F 15 18
7,5918 F 15 17
7,6000 F 15 16
7,6329 F 15 15
7,6658 F 15 14
7,6959 F 15 13
7,7616 F 15 12
7,7616 F 15 11
7,8411 F 15 10
7,8658 F 15 9
7,9233 F 15 8
7,9342 F 15 7
8,6082 F 15 6
8,6329 F 15 5
8,6822 F 15 4
8,7452 F 15 3
8,8164 F 15 2
8,9205 F 15 1
8,9507 F 15 0
Number of cases: 126
Censored: 111 (88,10%)
Events: 15
Survival Time Standard Error 95% Confidence Interval
Mean 8,0246 0,2207 (7,5919; 8,4572)
(Limited to 8,9507)
142
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 05 4/10/04 12:49 Página 142
imprescindible una cifra excesivamente precisa. En nuestro ejemplo, podríamos afirmar,
como vemos en el gráfico de la Figura 10, que:
• La semivida estimada de
nuestra población general
es de 12 años.
• La semivida estimada de la
población con anteceden-
tes de rechazo agudo dismi-
nuye hasta los 8-8,5 años.
• La semivida estimada de la
población sin rechazo agu-
do alcanza los 18 años.
Si quisiéramos más precisión,
únicamente deberemos modifi-
car el gráfico (como si de un
zoom se tratase) hasta conse-
143
EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO
Figura 7
Figura 8
Cap 05 4/10/04 12:49 Página 143
144
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Factor RA=SÍ
Time Status Cumulative Standard Cumulative Number
Survival Error Events Remaining
1,0329 N 0,9821 0,0177 1 55
1,4438 F 1 54
1,9068 N 0,9640 0,0250 2 53
2,3041 N 0,9458 0,0305 3 52
2,6301 F 3 51
2,8521 F 3 50
2,9507 N 0,9269 0,0352 4 49
3,0438 F 4 48
3,1315 N 0,9075 0,0394 5 47
3,2356 F 5 46
3,3397 F 5 45
3,5452 F 5 44
3,5836 F 5 43
3,6219 N 0,8864 0,0438 6 42
3,7781 N 0,8653 0,0476 7 41
3,8603 N 0,8442 0,0509 8 40
3,9315 F 8 39
4,0712 N 0,8226 0,0540 9 38
4,1178 F 9 37
4,1616 F 9 36
4,2055 F 9 35
4,2548 F 9 34
4,4411 N 0,7984 0,0576 10 33
4,5041 F 10 32
4,5644 F 10 31
4,6192 F 10 30
4,8493 N 0,7718 0,0615 11 29
5,0603 F 11 28
5,3068 F 11 27
5,4438 N 0,7432 0,0655 12 26
5,4493 F 12 25
5,8000 F 12 24
5,8082 F 12 23
6,0137 N 0,7109 0,0702 13 22
6,0192 F 13 21
6,1151 F 13 20
6,2521 F 13 19
6,2767 F 13 18
6,2904 F 13 17
6,4630 F 13 16
6,5151 F 13 15
6,5836 F 13 14
6,8247 N 0,6601 0,0815 14 13
7,3397 F 14 12
7,6082 F 14 11
7,6438 N 0,6001 0,0936 15 10
7,6685 F 15 9
7,6904 F 15 8
Tabla II. Survival Analysis for DURACION.
Cap 05 4/10/04 12:49 Página 144
145
EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO
guir la que nos parezca adecua-
da, que no debe ser, a nuestro
modo de entender, de más de un
decimal de año (Figura 11).
Como vemos, los valores antes
mencionados podemos concretar-
los más y serían exactamente: 12,2
años para la población general; 8,2
años para el grupo de rechazo agu-
do y 17,8 para el grupo sin rechazo
agudo.
Este método, aunque no muy or-
todoxo en teoría, es mucho más
sencillo y rápido que el uso de la fórmula cuando se coge práctica, y sus valores son bá-
sicamente iguales, aunque lógicamente siempre podemos calcular exactamente la se-
mivida estimada directamente con la fórmula antes descrita.
Lógicamente, la significación estadística de estas diferencias nos vendrán determina-
das por los test que comparan curvas de supervivencia y que se explicaron perfecta y
detalladamente en otro capítulo de este libro.
Figura 9
7,6959 F 15 7
7,7315 F 15 6
7,8438 F 15 5
7,9233 F 15 4
7,9260 F 15 3
8,7397 F 15 2
8,8164 F 15 1
8,9507 F 15 0
Number of cases: 56
Censored: 41 (73,21%)
Events: 15
Survival Time Standard Error 95% Confidence Interval
Mean 7,3000 0,3567 (6,6009; 7,9991)
Limited to 8,9507)
Survival Analysis for DURACION
Total Number Number Percent
Events Censored Censored
RA NO 126 15 111 88,10
RA SÍ 56 15 41 73,21
Overall 182 30 152 83,52
Cap 05 4/10/04 12:49 Página 145
146
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 10
Figura 11
BIBLIOGRAFÍA RECOMENDADA
1. Cook DJ. Long-term survival of kidney allografts. In: Terasaki PL. Ed. Clinical
Transplant 1987. Los Angeles: UCLA Tissue Typing Laboratory; 1987.
Cap 05 4/10/04 12:49 Página 146
2. Dawson-Saunders B, Trapp RG. Bioestadística médica. México D.F.: Editorial El
Manual Moderno; 1993.
3. Pardell H, Cobo E, Canela J. Manual de Bioestadística. Barcelona: Masson; 1986.
4. Domenech JM. Métodos estadísticos en Ciencias de la Salud. Laboratori d´Es-
tadística Aplicada i Modelització. Universitat Autónoma de Barcelona. Barcelona:
Editorial SIGNO; 1994.
147
EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO
Cap 05 4/10/04 12:49 Página 147
67
CURVAS DE VIDA
Y SUPERVIVENCIA EN EL
TRATAMIENTO SUSTITUTIVO
DE LA INSUFICIENCIA RENAL:
DIÁLISIS Y TRASPLANTE RENAL
V. Abraira, C. Quereda
EL ANÁLISIS DE SUPERVIVENCIA EN MEDICINA
COMO DESCRIPTOR DEL PRONÓSTICO
Y EN LOS ESTUDIOS DE TRATAMIENTO
Una de las funciones básicas de la medicina y de los médicos es realizar apreciaciones
pronósticas que informen al paciente y a su entorno sobre la evolución más probable de
la enfermedad y que ayuden a la toma de decisiones sobre la realización de las distintas
intervenciones posibles. Estas intervenciones o instrumentos terapéuticos se encami-
nan, precisamente, a modificar el pronóstico espontáneo o la historia natural de la enfer-
medad, transformándola en un sentido positivo. El estudio de los determinantes que
condicionan el pronóstico y el análisis, acerca de si una nueva intervención terapéutica
realmente mejora los resultados de una precedente, constituyen objetivos paradigmáti-
cos de la investigación clínica.
Sin duda, la primera preocupación de una persona enferma es conocer en qué medida la
enfermedad puede interferir en su expectativa de vida. El estudio de la mortalidad y el
tiempo que transcurre entre el comienzo de la enfermedad y la muerte o el tiempo de
supervivencia, constituyen, por tanto, la prioridad para cualquier estudio de pronóstico.
Pero, por extensión, forman parte del mismo muchas otras consecuencias de la enfer-
medad (remisión, recidiva, complicaciones, secuelas, rechazo agudo, etc.) que interesan
Cap 04 4/10/04 12:48 Página 67
68
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
al paciente y forman parte del proceso de toma de decisiones del médico. Estas varia-
bles, que pueden manifestarse o no a lo largo de la enfermedad y a mayor o menor in-
tervalo desde su inicio, se denominan resultados de interés, acontecimientos o even-
tos (events en la terminología anglosajona).
La producción de estos resultados está condicionada, no sólo por la interacción enfer-
medad-terapéutica, sino por la presencia en el enfermo de una serie de circunstancias
clínicas o epidemiológicas que predicen la probabilidad de que se produzca alguno de los
resultados de interés en distintos momentos evolutivos. Estas variables, denominadas
factores pronósticos, condicionan la aparición de un determinado resultado de interés
o, al menos, se relaciona tan estrechamente con él como para poder ser utilizado como
predictor del mismo.
Es evidente el impacto que la introducción de los trasplantes ha tenido en la superviven-
cia de pacientes que, a consecuencia de distintas enfermedades, sufren un deterioro
terminal de órganos vitales (riñones, hígado, corazón, pulmones, páncreas, etc.). Así, la
expectativa de vida en los enfermos que han llegado a una fase terminal de la insuficien-
cia renal (por ejemplo, con filtrado glomerular inferior a 5 mL/min) se limita a pocos me-
ses, pudiendo modificarse esta nefasta evolución con las intervenciones de tratamiento
substitutivo de la insuficiencia renal terminal (diálisis y trasplante). Sin embargo, sabe-
mos que la supervivencia con estos tratamientos es muy variable, en función de los fac-
tores pronósticos que influyen en la misma (edad, raza, comorbilidad, etc.) y de la tera-
péutica efectuada (mejoría de las técnicas de diálisis, nuevos inmunosupresores, etc.).
Dentro de un concepto amplio, podemos distinguir dos situaciones que implican tam-
bién diferencias de diseño y de interpretación:
1. El estudio de la influencia de variables o de factores pronósticos que presentan los
enfermos a nivel basal, sobre el curso de la enfermedad, definido por la evolución
temporal de uno o varios resultados de interés (estudios de pronóstico en sentido
estricto).
2. La influencia de una determinada actuación terapéutica, sobre los resultados de in-
terés y, por tanto, su modificación potencial del pronóstico en relación a la evolución
natural o a otra u otras alternativas terapéuticas (estudios de tratamiento).
Es evidente que ambas circunstancias constituyen el eje fundamental de la investiga-
ción clínica.
El análisis de la supervivencia en los estudios
sobre el pronóstico
En el primer supuesto, es decir, el estudio de los factores pronósticos propiamente
dichos, el análisis trata de establecer, dentro de unos márgenes de probabilidad, la
Cap 04 4/10/04 12:48 Página 68
predicción del curso futuro de la enfermedad, individualizando, analizando y cuantifi-
cando las circunstancias o variables que condicionan la evolución. Por ejemplo, el es-
tudio de factores (edad, tipaje, comorbilidad, etc.) que influyen en la evolución del
trasplante renal.
Normalmente es imposible, o no ético, asignar pacientes aleatoriamente a distintos
factores pronósticos. Por esta razón, el mejor diseño para identificar la presencia y de-
terminar el riesgo asociado a un factor pronóstico suele ser un estudio de cohorte.
En estos estudios, los investigadores siguen la evolución de uno o más grupos de enfer-
mos (cohortes) expuestos a diferentes niveles del factor pronóstico y observan si se
produce o no el resultado de interés (supervivencia, recurrencia, complicaciones, etc.)
con el fin de averiguar el riesgo atribuible a la presencia de estas variables, comparando
los resultados obtenidos en enfermos portadores y no portadores del citado factor.
Por tanto, un estudio ideal de cohorte consta de una muestra bien definida de individuos
representativos de la población que deseamos estudiar, con un mínimo de dos exáme-
nes transversales (inicial y final). Utiliza criterios objetivos para evitar la producción de
sesgos, tanto para fijar el inicio del estudio (tiempo 0) en todos los casos, así como para
la terminación del mismo (cierre del estudio) y para definir el resultado o acontecimiento
de interés.
Pueden ser prospectivos, retrospectivos o bidireccionales. La orientación temporal
contempla siempre la determinación de la exposición (factores pronósticos o de ries-
go) previamente al desarrollo del evento de interés (muerte, complicaciones, etc.).
Para que los resultados de un estudio de cohorte sean generalizables, la muestra se-
leccionada debe ser representativa de la población diana y sus resultados analizados
sobre la base de los factores pronósticos que, de una forma independiente, determi-
nen el resultado.
El pronóstico puede también estudiarse con el modelo de diseño de casos y contro-
les. La utilización de éste, requiere que los investigadores analicen variables de inte-
rés de individuos que han experimentado un determinado resultado de la enferme-
dad (muerte, complicación, etc.) y compararlos con controles que no lo hayan pre-
sentado.
La posibilidad de que se produzcan sesgos al seleccionar los casos y los controles, así
como la naturaleza retrospectiva de la recogida de datos (que a menudo depende de la
precisión de la recogida de datos en los protocolos o historias clínicas o de la memoria
del paciente o sus familiares), limita la capacidad probatoria de este diseño.
Asimismo, estos estudios no pueden proporcionar información sobre el riesgo absolu-
to de un episodio sino sólo, y de un modo indirecto, del riesgo relativo (RR).
69
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 69
El análisis de la supervivencia en los estudios
sobre tratamiento
En los estudios que tratan de evaluar la eficacia de un tratamiento, la estrategia de dise-
ño es completamente diferente. Ahora la prioridad consiste en asegurar, mediante las
técnicas de aleatorización, la comparabilidad entre el grupo experimental y el control.
Esta metodología es muy potente para objetivar diferencias en la aparición de los resul-
tados de interés entre los distintos grupos, pero no es el procedimiento más adecuado
para analizar la influencia sobre estos resultados de las variables pronósticas.
No obstante, puesto que los ensayos aleatorizados rigurosos incluyen documentación
minuciosa de los criterios de inclusión y protocolos estrictos para el seguimiento, los
pacientes de dichos ensayos forman cohortes que también pueden generar información
sobre el pronóstico de una enfermedad.
El principal inconveniente de los ensayos consiste en que, con frecuencia, los pacientes
incluidos no son representativos de la población general con el trastorno, ya que el esta-
blecimiento de los criterios de inclusión y exclusión genera, precisamente, una pobla-
ción seleccionada.
METODOLOGÍA DEL ANÁLISIS
DE SUPERVIVENCIA
Medidas de frecuencia de la enfermedad
y otros eventos
La epidemiología, como ciencia que se ocupa de estudiar el proceso de enfermar en las po-
blaciones humanas, ha desarrollado instrumentos para medir la frecuencia de la enfermedad
y medirla en relación con sus supuestos determinantes. La epidemiología clínica (1) aplica el
método epidemiológico para producir conocimiento sobre el proceso de la práctica clínica;
aplica por tanto los mismos instrumentos, aunque para medir la frecuencia no sólo de la en-
fermedad, sino también de otros eventos que ocurren en la práctica clínica: solicitar una prue-
ba diagnóstica, aplicar un tratamiento, etc. Esto provoca, a veces, alguna confusión terminoló-
gica de la que probablemente no esté exento este texto, en el que se tratan de repasar las
medidas de frecuencia de un evento (en epidemiología suele ser enfermar, usando como re-
ferencia la población general, pero en epidemiología clínica también se habla de curación,
muerte, pérdida del injerto, etc., usando como referencia una población de enfermos).
Prevalencia
Es la proporción de individuos de una población que presentan el evento en un momen-
to o periodo de tiempo determinado. Por ejemplo, la prevalencia de la pérdida del injer-
70
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 70
to en los pacientes con trasplante renal en el hospital Ramón y Cajal, en el año 2001, es
la proporción de pacientes de este hospital que, en el año 2001, perdieron el injerto con
respecto a aquellos que estaban en condiciones de perderlo durante ese año (pacientes
en riesgo). Se calcula:
Sus características son: es una proporción, es decir, el numerador está incluido en el de-
nominador, por lo tanto, no tiene dimensiones y su valor oscila entre 0 y 1, aunque a ve-
ces se expresa como porcentaje; es un indicador estático, que se refiere a un momento
temporal y que indica la carga del evento que soporta la población. Tiene su mayor utili-
dad en los estudios de planificación de servicios sanitarios. En la prevalencia influye la
velocidad de aparición del evento y su duración. Es por ello poco útil en la investigación
causal y de medidas terapéuticas.
Incidencia
La incidencia refleja el número de nuevos eventos en una población susceptible de
que ocurran, durante un periodo de tiempo. Es un índice dinámico que requiere el
seguimiento en el tiempo de la población de interés. Cuando el evento es recurrente
se suele referir a la primera aparición. Se puede medir con dos índices: incidencia
acumulada y densidad (o tasa) de incidencia. La incidencia acumulada es la propor-
ción de individuos que desarrollan el evento durante el periodo de seguimiento. Se
calcula:
Sus principales características son: es una proporción, por lo tanto, no tiene dimensio-
nes y su valor oscila entre 0 y 1, aunque también se suele expresar como porcentaje.
Depende del tiempo de seguimiento que se debe hacer explícito. Se calcula sobre una
cohorte fija, es decir, no se permiten entradas de nuevos individuos durante el segui-
miento.
Es un estimador del riesgo, entendido como probabilidad de que un individuo de la po-
blación experimente el evento en un periodo determinado de tiempo (condicionado a
que pueda ser observado, es decir, a que no muera por otra causa) (2). La principal limi-
tación de este índice proviene del efecto de cohorte fija, puesto que a lo largo del se-
guimiento generalmente se pierden individuos. Imaginemos que, para evaluar la inci-
dencia de la pérdida del injerto, se sigue durante doce meses a un grupo de seis indivi-
duos que han recibido un trasplante renal. La situación podría ser: dos de ellos pierden
el injerto a los tres y a los seis meses, respectivamente, otros dos acaban el segui-
IA(∆t)=
Nº eventos nuevos
Nº individuos susceptibles al comienzo
P=
Nº eventos
Nº individuos en riesgo
71
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 71
miento con el injerto funcionando y otros desaparecen del estudio, también con el in-
jerto funcionando a los cuatro y diez meses, respectivamente. En esta situación la IA,
en un año, es 2/6 o el 33%. Obsérvese la indeterminación de este índice debido a las
pérdidas. En este ejemplo, si se hubiera completado el periodo de observación en to-
dos los individuos, los dos perdidos podrían haber sufrido la pérdida del injerto y la IA
sería tan distinta como el 66%.
Densidad (o tasa) de incidencia
Para evitar la limitación de la incidencia acumulada se define este otro índice de inciden-
cia, la densidad o tasa de incidencia, que es el cociente entre el número de casos nue-
vos ocurridos durante el periodo de seguimiento y la suma de todos los tiempos de ob-
servación. Se calcula:
Sus características son que tiene dimensión de inversa del tiempo, un rango ilimitado a
partir de 0. No depende del tiempo de seguimiento, asumiendo estacionalidad, es decir,
ritmo constante, y no necesita cohorte fija. En el ejemplo anterior:
meses-1
es una forma de representar que su unidad es la inversa del tiempo y que és-
te se ha medido en meses, otra forma de representarlo es persona/mes y, con fre-
cuencia, se usa el año como unidad de tiempo. Evidentemente para pasar de perso-
na/mes a persona/año hay que multiplicar por 12. El resultado anterior se puede ver
como:
Esta es una forma común de expresar la mortalidad de los enfermos sometidos a trata-
miento sustitutivo por insuficiencia renal (diálisis o trasplante). Como en este caso las
densidades de incidencia son bajas, normalmente se expresa como mortalidad por 100
enfermos/año, resultante de multiplicar por 100 la DI expresada como enfermos/año. Es
decir, en el ejemplo anterior la mortalidad sería 0,516 x 100 = 51,6 casos de muerte por
100 enfermos/año.
DI(1,12) = 0,043 meses-1
= 0,516 años-1
Σ
n
∆ti = 3+6+4+10+12+12 = 47 DI(1,12) =
2 = 0,043 meses-1
i=1 47
DI(t1, t2)=
Nº eventos nuevos
Σ
n
∆ti
i=1
72
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 72
Variable tiempo hasta un evento
Sin embargo, en muchos estudios clínicos y también en trasplante, el principal resulta-
do de interés no es la frecuencia de ocurrencia de los eventos, sino el tiempo hasta que
ocurre uno. Este evento puede ser adverso como muerte o fracaso del injerto, o positi-
vo como alta hospitalaria o reincorporación a la vida laboral.
El análisis de este tipo de variable, “tiempo hasta la ocurrencia de un evento”, suele
presentar dos dificultades que impiden realizarlo con las técnicas estadísticas genera-
les, tales como la t de Student, el análisis de la varianza o los modelos de regresión li-
neal. En primer lugar, en la mayor parte de los estudios, la variable tiempo no tiene la
distribución normal que esas técnicas exigen, más bien suele tener una distribución
asimétrica, en la que típicamente los eventos ocurren con mayor frecuencia al principio
que al final del periodo de seguimiento y, aunque podrían intentarse transformaciones
que la normalizaran, existe una segunda dificultad, y es que, en general, al final del pe-
riodo de seguimiento siempre hay individuos en los que no se ha podido observar el
evento y, por lo tanto, en los que el tiempo hasta su ocurrencia es desconocido, si bien
se tiene una información parcial sobre él, es mayor o igual que el tiempo observado. A
este fenómeno se le denomina censura y es el que exige un planteamiento específico
para estas variables, que permita aprovechar la información contenida en los tiempos
censurados.
Al conjunto de técnicas que permiten estudiar la variable tiempo hasta que ocurre un
evento y su dependencia de otras posibles variables explicativas, se le denomina análi-
sis de supervivencia y, aunque este nombre sugiere que el evento es la muerte, se in-
siste en que también puede y debe usarse para analizar el tiempo hasta cualquier otro
evento, como por ejemplo la curación, la aparición de la enfermedad o el rechazo del in-
jerto. En otros ámbitos, como los procesos de control de calidad, se estudia con las
mismas técnicas el tiempo hasta que un cierto producto falla (tiempo de fallo) o el tiem-
po de espera hasta recibir un servicio (tiempo de espera), etc.
Existen tres motivos por los que pueden aparecer las censuras. En primer lugar, por el
fin del estudio. Supóngase, por ejemplo, que para evaluar la eficacia de un nuevo trata-
miento para una enfermedad mortal, se siguieron en el tiempo, durante un año, dos gru-
pos de pacientes. A los pacientes de un grupo se les administró el tratamiento en eva-
luación y, a los del otro, el tratamiento estándar, y se registró la duración del intervalo de
tiempo entre el inicio del tratamiento y la muerte. Al final del estudio puede haber indivi-
duos que no hayan muerto.
La segunda causa es la pérdida del seguimiento. En el ejemplo anterior, algunos de
los individuos pudieron desaparecer del estudio en algún momento del mismo, por di-
versos motivos: cambio de domicilio, falta de interés, etc.
73
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 73
74
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Una última causa de censura es la ocurrencia de un evento competitivo que impida la
observación del evento, por ejemplo, la muerte por alguna otra causa ajena al estudio.
Es ésta la causa de censura a la que hay que prestar más atención en el diseño de los
estudios, como se comentará más adelante. Todos estos tiempos censurados infraesti-
man el tiempo hasta el evento, que siempre ocurrirá, asumiendo que ocurra, en un
tiempo posterior. Las situaciones descritas corresponden a lo que se denomina censu-
ra por la derecha, pero también puede ocurrir la censura por la izquierda, situación
en la que sí se observa el evento, pero en un tiempo posterior al momento en que ocu-
rrió. Por ejemplo, en un estudio que investigue el tiempo hasta la recaída en un cáncer
(tiempo libre de enfermedad) después de la recesión quirúrgica del tumor, si los pacien-
tes fueran examinados seis meses después de la intervención, aquellos que en ese mo-
mento ya presentaran una recidiva, estarían censurados por la izquierda, es decir, el
tiempo observado sobreestima el tiempo libre de enfermedad, que en este caso sería
menor que seis meses. Aunque existen métodos que permiten analizar datos censura-
dos por la izquierda (3), en este texto nos limitaremos a los censurados por la derecha,
que son los más ampliamente usados en la literatura nefrológica.
Hay que tener en cuenta también que la variable es el tiempo hasta que ocurre el evento
y viene definida por la duración del intervalo temporal entre los instantes en que empieza
la observación y ocurre el evento. En general, la observación no comienza en el mismo
instante para todos los individuos, y la manera habitual de registrar los tiempos en la clíni-
ca es mediante las fechas de ocurrencia. Por lo tanto, antes del análisis hay que convertir
el “tiempo de calendario” a “tiempo hasta el evento”. En el esquema de la Figura 1 se
detalla este proceso y los posibles mecanismos de censura para un ejemplo hipotético
de supervivencia tras un trasplante renal. Es importante fijarse en el paciente E, que mue-
re por accidente de tráfico, y que suele plantear un problema en el diseño de estos estu-
dios. Hay autores que prefieren definir el evento de interés como muerte por una causa
relacionada con la enfermedad en estudio, y por tanto, censurarían las muertes por cau-
sas no relacionadas, argumentando con cierto sentido, que una muerte por accidente de
tráfico no debería “contar” si se está evaluando la supervivencia al trasplante renal, mien-
tras que otros prefieren definirlo como muerte por todas las causas. A favor de esta últi-
ma opción, está la dificultad que suele tener la clasificación de una muerte como relacio-
nada o no con la enfermedad en estudio y su tratamiento, y por tanto, la potencial inclu-
sión de sesgos por mala clasificación. En general, la muerte por todas las causas se con-
sidera un evento más robusto que la muerte por causas específicas (4) y sería por ello el
preferido, aunque otras veces se realizan los análisis para las dos definiciones del evento.
Sin embargo, si el evento de interés fuera la pérdida del injerto, una muerte por acci-
dente de tráfico de un paciente con el injerto funcionando sí podría ser considerada una
censura. No obstante, esto no es siempre tan obvio, el accidente puede deberse a in-
farto del conductor y éste estar favorecido por hipertensión arterial o hipercolesterole-
mia del enfermo en relación a malfunción del injerto o a la medicación recibida. El pro-
Cap 04 4/10/04 12:48 Página 74
blema de cómo actuar (si el injerto debe censurarse o considerarse perdido) en casos
de muerte con riñón funcionante, ha sido muy debatido en la literatura sobre trasplan-
tes. Se discute ampliamente este tema en apartados siguientes.
Estudio ejemplo
Consideraremos, como ejemplo para el resto del capítulo, los datos de supervivencia
al trasplante renal de todos los enfermos trasplantados en el hospital Ramón y Cajal
75
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 1. Esquema temporal de un estudio para observar tiempos de espera para un
evento, por ejemplo supervivencia tras un trasplante renal. El estudio empezó el 1 de
enero de 1990, fecha del primer trasplante, se incluyeron todos los pacientes trasplan-
tados hasta el 1 de enero de 2001 y el periodo de seguimiento acabó el 1 de enero de
2002. En A, el eje temporal representa años de calendario y en B, años desde el tras-
plante. Con el círculo en blanco se representan los tiempos censurados y con el cua-
drado negro las muertes (ocurrencia del evento). El individuo A que se transplantó en
enero de 1990 desaparece del estudio en enero de 1993 (sería una censura a los tres
años por pérdida de seguimiento). El B, también trasplantado en enero de 1990, fallece
en junio de 1992 (muerte a los 2,5 años). El C sigue vivo al acabar el estudio (sería un
dato censurado a los doce años por fin del estudio). El D, al que se le trasplanta en fe-
brero de 1991, fallece en marzo de 1999, el tiempo de supervivencia sería ocho años. El
E, que recibe el trasplante en noviembre de 1993, fallece en accidente de tráfico en ju-
lio de 1997 (sería una muerte, o un dato censurado, a los 3,7 años dependiendo de la
definición de evento de interés -véase texto-). El F, al que se le interviene al principio
de 1996, sigue vivo al acabar el estudio, sería un dato censurado a los seis años por fin
del estudio.
Años
A B
Tiempo desde el trasplante
Cap 04 4/10/04 12:48 Página 75
desde el 10 de marzo de 1979 hasta el 31 de diciembre de 2002, el seguimiento aca-
bó el 1 de junio de 2003. Son 917 pacientes, en los que se considerarán dos eventos:
muerte por todas las causas y pérdida del injerto; para ambas, está recogido el tiempo
en meses desde el trasplante. Además, se considerarán la edad al trasplante, el sexo
y el tratamiento farmacológico agrupado (sólo a efectos de este ejemplo) en tres ca-
tegorías: Grupo AZA (azatioprina + prednisona); Grupo CsA (ciclosporina A + predniso-
na o ciclosporina A + prednisona + azatipoprina) y Grupo TACRO (combinaciones de
tacrolimus con prednisona y mofetil-micofenolato o rapamicina). Algunos pacientes
que no podían ser incluidos estrictamente en estos grupos, han sido excluidos. En la
Tabla I se muestra el aspecto de la tabla de datos en SPSS de los diez primeros pa-
cientes.
76
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Tabla I. Aspecto de la tabla de datos, recogidos en formato SPSS, para el estudio
de la supervivencia (enfermo e injerto) del trasplante renal en el hospital Ramón y
Cajal. Además de una variable de identificación (nor), están registrados: la edad
al trasplante en años; el sexo, con los códigos 0 para varón y 1 para mujer; el
tiempo en meses después del trasplante durante el que el injerto funcionó
(meses_ev), con un código (injerto) para indicar si ese tiempo corresponde a una
observación (0), es decir, que en ese tiempo el injerto falló, o a una censura (1)
por fin del estudio, o (2) por pérdida del seguimiento, es decir, que en ese tiempo
se acabó el seguimiento sin que el injerto fallara; el tiempo en meses hasta la
muerte (meses_ex), y un código (estatus) para indicar a qué corresponde
realmente ese tiempo: 1 para muerte, 0 para censura por fin del seguimiento y 2
para censura por pérdida del seguimiento y una última variable para el
tratamiento farmacológico prescrito. Así, el paciente 1, es un varón de 29 años de
edad en el momento del trasplante, cuyo injerto falló a los tres meses del
trasplante y que falleció a los cuatro meses. La paciente 5 es una mujer de 69
años en el momento del trasplante, cuyo injerto falló a los 32 meses y cuyo
seguimiento se perdió a los 219 meses. Mientras que la paciente 9 es una mujer
que tenía 64 años en el trasplante y que, al final del estudio, 278 meses después,
está viva y con el injerto funcionando. Los pacientes mostrados son los primeros
con los que se inició el programa en 1979; todos fueron tratados con azatioprina y
prednisona.
nor edad sexo injerto meses_ev estatus meses_ex trata
1 29 0 0 3 1 4 AZA PRED
2 36 1 0 7 1 240 AZA PRED
3 68 1 0 160 1 160 AZA PRED
4 55 0 0 4 0 280 AZA PRED
5 69 1 0 32 2 219 AZA PRED
6 49 0 0 280 1 280 AZA PRED
7 61 1 0 2 1 198 AZA PRED
8 58 1 0 83 1 278 AZA PRED
9 64 1 1 278 0 278 AZA PRED
10 66 0 0 1 1 1 AZA PRED
Cap 04 4/10/04 12:48 Página 76
Funciones de supervivencia y riesgo
La variable tiempo, hasta que ocurre el evento o tiempo de espera, es una variable alea-
toria que puede ser descrita mediante la habitual función densidad de probabilidad
f(t) que, para una variable continua, es una función a partir de la cual y mediante cálculo
integral o, en la práctica, consultando las tablas correspondientes, se obtiene la probabi-
lidad de que la variable tome valores en un intervalo (5). Sin embargo, generalmente,
este tipo de variables suele describirse y modelizarse mediante otras dos funciones de
probabilidad relacionadas entre sí y con la función densidad: supervivencia y riesgo (6),
que resultan especialmente útiles para los datos con observaciones censuradas.
La probabilidad de supervivencia, representada por la denominada función de supervi-
vencia S(t), es la probabilidad de que, en un individuo de la cohorte, el evento ocurra
(sobreviva, si el evento es muerte) en un tiempo igual o mayor que t. En el ejemplo de la
cohorte de enfermos trasplantados del hospital Ramón y Cajal, para el evento pérdida
del injerto S(2,5), es la probabilidad de que un enfermo mantenga el injerto al menos
dos años y medio, S(3) la probabilidad de que lo mantenga al menos tres años, etc. Es,
por lo tanto, una manera de resumir la información de forma muy relevante en estos
problemas y que, para facilitar su lectura, suele presentarse gráficamente. La Figura 2
muestra la función de supervivencia para el evento pérdida del injerto en la cohorte del
Ramón y Cajal, en la que se observa su característica forma monótona no creciente.
El riesgo (hazard en inglés), representado por la función de riesgo h(t), es la probabili-
dad, por unidad de tiempo, de que un individuo que está en observación en el tiempo t
(ha sobrevivido hasta ese tiempo), tenga el evento justo en ese tiempo. Es decir, repre-
senta la tasa instantánea de eventos en cada tiempo o, dicho con otras palabras, el po-
tencial instantáneo de ocurrencia de eventos por unidad de tiempo, condicionado a que
el evento no ocurrió antes (7). En nuestro ejemplo, la función de riesgo a los dos años
es la densidad de probabilidad de que el injerto falle a los dos años del trasplante, condi-
cionada a que ha funcionado hasta entonces.
Obsérvese que la función de supervivencia S(t) se enfoca en la no ocurrencia del
evento, mientras que la de riesgo h(t) lo hace en la ocurrencia. Además, S(t) es una
probabilidad, mientras que h(t), como f(t), es una densidad de probabilidad por unidad
de tiempo; ello hace más intuitivo el manejo de S(t), por ejemplo, el campo de valores
para S(t) está entre 0 y 1, mientras que para h(t) y f(t) está entre 0 e infinito. Sin em-
bargo, se puede demostrar (6) que estas tres funciones están relacionadas por las ex-
presiones:
h(t)=
f(t)
h(t)= –
d
[InS(t)] S(t) = ∫t
∞
f(x)dx
S(t) dt
77
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 77
Fórmulas que, sin entrar en más detalles, ponen de manifiesto que las tres funciones
son representaciones equivalentes y que, si se conoce una cualquiera de ellas, las de-
más se pueden obtener automáticamente.
A veces, se usa también la función de riesgo acumulada H(t), más difícil de interpre-
tar, que se define como la integral desde 0 a t de la función de riesgo y, en consecuen-
cia, relacionada con la supervivencia por:
Y cuyo uso veremos más adelante (apartado Diagnósticos de la regresión).
Como se ha mencionado en el apartado Variable tiempo hasta un evento, los tiempos
hasta el evento suelen tener distribuciones asimétricas o sesgadas, en las que los tiem-
H(t) = – In S(t)
78
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 2. Función de supervivencia para el evento pérdida del injerto en la cohorte de
pacientes trasplantados del hospital Ramón y Cajal. La gráfica muestra, para cada
tiempo t, la probabilidad de que un enfermo mantenga el injerto al menos t años. Por
ejemplo, la probabilidad de supervivencia a los 11,25 años (11 años y 3 meses) es 0,5.
Una manera gráfica de obtener la mediana de supervivencia es trazando una línea ho-
rizontal desde el valor 0,5 del eje vertical hasta que corte a la curva de supervivencia y
desde este punto de corte, una línea vertical hasta el eje horizontal. El punto de corte
de esta línea con el eje es la mediana, en este ejemplo, 11,25 años.
Supervivenciadelinjerto
Años
Cap 04 4/10/04 12:48 Página 78
pos mayores que los típicos son menos frecuentes y están más dispersos que los tiem-
pos menores. En esta situación, la media no es una buena medida de centralización de
la variable porque la pueden magnificar unos pocos valores atípicamente grandes, y en
consecuencia, la medida de centralización aconsejada es la mediana. La mediana, tam-
bién denominada tiempo de semivida por analogía con la farmacodinámica o vida-me-
dia (half-life en terminología anglosajona), es el tiempo en que la probabilidad de super-
vivencia es igual a 0,5 o, dicho en términos de frecuencia, el tiempo al que sobrevivirá la
mitad de la población y que, por lo tanto, se obtiene fácilmente a partir de la función de
supervivencia:
S (mediana) = 0,5
Gráficamente, se obtiene trazando una línea horizontal desde el valor 0,5 del eje vertical
hasta que corte a la curva de supervivencia y, desde este punto de corte, una línea ver-
tical hasta el eje horizontal, este eje será cortado en la mediana, como se muestra en la
Figura 2.
Objetivos del análisis de supervivencia
En un análisis de supervivencia se pueden establecer tres objetivos, y un estudio puede
tener los tres o sólo alguno de ellos:
• Estimar e interpretar las curvas de supervivencia y/o riesgo, más frecuentemente la
de supervivencia, aunque la de riesgo tiene mayor utilidad para buscar modelos
teóricos, por ejemplo, un riesgo constante a lo largo del tiempo indica un modelo
exponencial, un riesgo creciente o decreciente puede modelizarse mediante la fun-
ción de Weibull, etc.(4, 6, 8).
• Comparar curvas de supervivencia, por ejemplo, entre dos tratamientos, o entre dos
grupos de pacientes establecidos con respecto a cualquier otro criterio: edad, sexo,
historial previo, etc.
• Evaluar la relación de la supervivencia con otras, más de una, variables pronósticas.
En los próximos apartados, se muestran los métodos para cumplir con estos objetivos.
Estimación de la función de supervivencia
(método de Kaplan-Meier)
El método de Kaplan-Meier es un método no paramétrico, es decir, que no asume nin-
guna forma para la función de probabilidad, y por máxima verosimilitud, es decir, que se
basa en maximizar la función de verosimilitud de la muestra (6). Una muestra aleatoria
de tamaño n, estará formada por k tiempos t1 < t2 …< tk en los que se observan even-
tos (en general k ≤ n, es decir, hay menos tiempos que individuos, debido a las censuras
y también a que varios eventos pueden ocurrir en el mismo tiempo). En cada tiempo ti
79
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 79
existen ni “individuos en riesgo” (elementos de la muestra para los que el evento pue-
de ocurrir), y se observan di eventos.
El método asume que los eventos ocurren independientemente unos de otros y que la
información contenida en las censuras es que, para cada una de ellas, el evento ocurre
en un tiempo mayor que el tiempo en que se produce la censura. Con estas asuncio-
nes, la función de riesgo, en cada tiempo, se estima por:
Y la función de supervivencia por:
Como ayuda para entender estas fórmulas, considérense los seis pacientes de la Figura 1,
considerando al paciente E como evento, es decir, que existen tres eventos en los tiem-
pos 2,5, 3,7 y 8, y tres censuras en los tiempos 3, 6 y 12. La manera más cómoda de ha-
cer los cálculos es disponer los datos en una tabla como en la Tabla II.
Aunque a esta estimación está contribuyendo toda la información disponible (eventos
observados y censurados), obsérvese que la función de supervivencia estimada S(t) só-
lo cambia en los tiempos en los que se observan eventos, manteniéndose, por lo tanto,
constante entre esos tiempos y dando lugar a la característica forma escalonada que se
observa en la Figura 2. Si se observaran eventos en todos los individuos, es decir, si no
hubiera censuras, la estimación de la supervivencia por el método de Kaplan-Meier se
reduciría, en cada tiempo, al cociente entre los individuos que no han experimentado el
evento en ese tiempo (supervivientes) y los que empezaron el estudio.
En la Tabla II y en la Figura 3 se pone claramente de manifiesto cómo el efecto de la in-
formación, contenida en las censuras, aumenta la supervivencia estimada en los tiempos
posteriores a ellas. La asunción fundamental del método es que las observaciones cen-
suradas tienen la misma mediana de supervivencia que las observaciones que siguen en
el estudio. Por ejemplo, para la supervivencia del injerto de los pacientes trasplantados
en el hospital Ramón y Cajal, en el tiempo de la mediana de supervivencia (11,25 años,
como se muestra en la Figura 2), que corresponde al tiempo estimado en el que sobrevi-
virían los injertos de la mitad de los pacientes, hay bastantes menos de la mitad de los in-
dividuos iniciales (quedan exactamente 200 individuos de los 917 iniciales). Es decir, a la
estimación de la supervivencia en cualquier tiempo, por ejemplo en la mediana o tiempo
de semivida, están contribuyendo no sólo los pacientes que se observa que sobreviven
hasta ese tiempo, sino también los censurados previamente, en la asunción de que, si
no se hubieran censurado, se comportarían como los que sí siguen.
i
S(ti ) = S(ti-1) (1-h(ti)) = ∏ [1-
dj
]njj=1
h(ti) =
di
ni
80
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 80
Hay que destacar que la forma escalonada de la función de supervivencia es efecto de la es-
timación y que, teóricamente, como el tiempo es una variable continua en la que son posi-
bles todos los valores desde 0, la función de supervivencia debería ser una función “suave”
que, desde el valor S(t) = 1 en t = 0, iría decreciendo hacía S(t) = 0 en el límite en infinito.
Error estándar e intervalo de confianza
de la supervivencia
Es importante destacar también que las estimaciones de Kaplan-Meier se realizan a par-
tir de muestras, y por tanto, presentan una imprecisión cuantificada por el intervalo de
confianza (9), que con una confianza del 95% es:
S(ti) ± 1,96 x EE(S(ti))
Siendo EE(S(ti)) el error estándar de la función de supervivencia en el tiempo ti. Basta
observar que el riesgo está estimado por una proporción para recordar que su error es-
tándar es (5):
81
CURVAS DE VIDA Y SUPERVIVENCIA
Tiempo Ind. en riesgo Eventos Censuras Fun. Riesgo Func. Supervivencia
ti ni di h(ti) S(ti)
2,5 6 1 1/6=0,167 1-0,167=0,833
3 5 1
3,7 4 1 1/4=0,25 0,833x(1-0,25)=0,625
6 3 1
8 2 1 1/2=0,5 0,625x(1-0,5)=0,313
12 1 1
Tabla II. Cálculo de las funciones de riesgo y supervivencia para los datos de la
Figura 1. Nótese que ambas funciones sólo se estiman en los tiempos en los que
se observan eventos, sin embargo, está contribuyendo a la estimación toda la
información disponible (eventos observados y censurados). Cada paciente
censurado está contribuyendo a las dos funciones en los tiempos anteriores a su
censura (tiempos en los que está en observación) y, a través del producto, a la
función de supervivencia en todos los tiempos posteriores. Nótese también que,
si no hubiera censuras, la estimación de la supervivencia por este método
coincidiría, en cada tiempo, con el cociente entre los individuos, que no han
experimentado el evento en ese tiempo (supervivientes) y los que empezaron el
estudio. Si por ejemplo, en el estudio sólo estuvieran estos tres pacientes, la
función de supervivencia sería 2/3, 1/3 y 0, en los tiempos 2,5, 3,7 y 8,
respectivamente.
Cap 04 4/10/04 12:48 Página 81
Y a partir de esta fórmula se puede encontrar una expresión aproximada para el error
estándar de la supervivencia, conocida como fórmula de Greenwood (6):
Nótese que como el número de individuos en riesgo ni va disminuyendo con el paso del
tiempo, debido tanto a los eventos como a las censuras, y en ambas fórmulas ni figura
en el denominador con mayor potencia que en el numerador, estos errores estándar van
aumentando y, por lo tanto, la precisión de la estimación va disminuyendo a lo largo del
eje del tiempo.
La Figura 3 muestra la función de supervivencia, con su intervalo de confianza del 95%,
para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital
Ramón y Cajal, donde se observa el aumento a lo largo del tiempo de la anchura del in-
tervalo. En algunos estudios, la anchura al final del tiempo de seguimiento es tan gran-
de, aunque la mayor parte de las veces no mostrada, que se hace difícil la interpretación
de la curva. Por ello, hay quien recomienda, con poco éxito por ahora, acabar la curva en
un tiempo en el que, alrededor del 10-20% de los pacientes iniciales, estén aún en se-
guimiento (10). Según esta recomendación, las curvas de las Figuras 2 y 3 deberían cor-
tarse en torno a los 15 años. Según nuestra opinión, la recomendación no debería ser
tanto dónde cortar, sino incluir los intervalos de confianza.
Posteriormente (apartado Análisis del proceso de censurado), insistiremos en la impor-
tancia de utilizar estos intervalos de confianza para valorar la precisión de la estimación
de la probabilidad de supervivencia en cada momento, y por tanto, para poder valorar la
utilidad clínica del dato.
Comparación de las curvas de supervivencia
Como los estimadores de Kaplan-Meier son estimadores de máxima verosimilitud y la
teoría establece que estos estimadores son asintóticamente normales, una primera
aproximación para comparar dos curvas de supervivencia, es usar dicha teoría, es decir,
se pueden comparar las estimaciones de las funciones de supervivencia en dos grupos
de individuos S1(t) y S2(t), usando la variable:
S1 (t) – S2 (t)
√ EE
2
(S1(t)) + EE
2
(S2(t))
i-1
EE(S(ti)) = S2
(ti) ∑
dj
nj(nj-dj)j=1
EE(h(ti))= √ di(ni-di)
n3
i
82
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 82
que se distribuye como una normal reducida (6), y por lo tanto se puede usar la tabla
de la normal para calcular el valor p correspondiente a la comparación de las dos esti-
maciones.
De este modo, las comparaciones se tienen que hacer para cada tiempo. Sin embar-
go, generalmente, no interesa comparar para un tiempo predeterminado (a veces sí,
por ejemplo para tiempos de corte muy establecidos como supervivencia a los cinco
años para el cáncer), sino comparar globalmente ambas curvas de supervivencia y,
aunque se podrían comparar por este procedimiento, punto a punto, es un modo de
proceder poco eficiente, ya que no se usan todos los datos en cada comparación y
aparecen los problemas asociados a las comparaciones múltiples (6). En consecuen-
cia, se han desarrollado pruebas para realizar una única comparación global. La más
usada es la conocida como prueba del log-rank y consiste en calcular, en cada tiempo
y para cada grupo, el número de eventos que se esperarían encontrar si no hubiera di-
ferencia entre los grupos para construir un estadístico, que se distribuye como una χ2
83
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 3. Función de supervivencia con su intervalo de confianza al 95% para el evento
pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal.
Obsérvese cómo la anchura del intervalo va aumentando, es decir, la precisión de la
estimación va disminuyendo a medida que pasa el tiempo, como efecto del menor nú-
mero de individuos en observación. En la literatura clínica no es tan usual como debie-
ra la presentación de estos intervalos.
Supervivenciadelinjerto
Años
Años 0 5 10 15 20
Individuos en riesgo 917 474 249 110 29
Cap 04 4/10/04 12:48 Página 83
con g -1 grados de libertad (siendo g el número de grupos), con la suma de las dife-
rencias entre eventos observados y esperados al cuadrado, divididas por los espera-
dos. A partir de este estadístico, se calcula el valor p correspondiente a la compara-
ción global de las supervivencias de los grupos. Este método, además, se puede usar
para comparar más de dos grupos.
La Figura 4 muestra las curvas de supervivencia para las mujeres y los hombres, con sus
intervalos de confianza al 95%, para el evento pérdida del injerto en la cohorte de pacien-
tes trasplantados del hospital Ramón y Cajal. Se observa que a partir de aproximadamen-
te tres años, la supervivencia del injerto es mayor en las mujeres que en los hombres. La
comparación global, mediante la prueba del log-rank, produce un valor p = 0,032. Es de-
cir, con la convención habitual, la diferencia es estadísticamente significativa.
En el apartado Factores que influyen en los resultados de las curvas de superviviencia
enunciaremos los principales elementos a los que hay que prestar atención cuando
84
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 4. Funciones de supervivencia para las mujeres y los hombres, con sus interva-
los de confianza al 95%, para el evento pérdida del injerto en la cohorte de pacientes
trasplantados del hospital Ramón y Cajal. Se observa que aproximadamente hasta los
tres años, la probabilidad de supervivencia del injerto es similar en ambos grupos, pe-
ro a partir de entonces la supervivencia en las mujeres es más alta, manteniéndose por
encima del límite superior del intervalo de confianza de los hombres. El log-rank para
la comparación es 4,60 al que corresponde un valor p = 0,032.
Supervivenciadelinjerto
Años
Cap 04 4/10/04 12:48 Página 84
se diseña o se lee un estudio en el que los datos se analizan con estos métodos.
Estos elementos serán ampliamente discutidos, poniéndolos en relación con la pro-
blemática específica de las poblaciones con insuficiencia renal crónica tratadas con
diálisis o con trasplante renal.
Método actuarial
Hay ocasiones en que no se dispone de observaciones individuales de los eventos, sino
de observaciones agrupadas por intervalos temporales o, incluso, aunque se disponga
de las observaciones individuales, se agrupan para compactar su presentación. Por
ejemplo, los datos de mortalidad para un país durante una década, se suelen agrupar en
intervalos anuales en las denominadas tablas de vida o actuariales, de modo que no se
dispone del tiempo de fallecimiento de cada individuo, sino del número de fallecidos en
cada intervalo, en este caso anual.
Supóngase que hay k intervalos, al principio de cada intervalo i existen ni individuos en
riesgo y, durante el mismo, se producen mi censuras y di eventos. Por lo tanto, en el
conjunto del intervalo el número de individuos en riesgo es variable. Asumiendo que las
censuras se producen homogéneamente a lo largo del intervalo, su número promedio
de individuos en riesgo es:
ni –
mi
2
Y, en consecuencia, el estimador del riesgo para el intervalo será:
hi =
di
ni –
mi
2
Sustituyendo este valor en las fórmulas del apartado Modelo de Kaplan Meier. Es decir,
cambiando en ellas ni por:
ni –
mi
2
se obtiene el estimador de la función de supervivencia en esta situación. A este método
se le conoce como método actuarial. En la Figura 5 se presenta la curva de superviven-
cia para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospi-
tal Ramón y Cajal, obtenida por el método actuarial, definiendo intervalos de un año. Se
observa que es parecida a la de la Figura 2 con el efecto escalón más acusado. La única
ventaja, por lo tanto, sobre el método de Kaplan-Meier es que se puede construir sin da-
tos individualizados.
85
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 85
Análisis multivariante: su necesidad
Hasta aquí se han descrito métodos que cubren los objetivos primero y segundo
enunciados en el apartado Objetivo del análisis de supervivencia, es decir, que permi-
ten estimar la función de supervivencia para un grupo de pacientes y comparar las fun-
ciones de dos o más grupos. Ello es muy útil en la investigación clínica, pero a menu-
do insuficiente, porque con mucha frecuencia es necesario realizar las comparaciones
teniendo en cuenta el efecto de otras variables distintas a la que se utiliza para definir
los grupos. Por ejemplo, en el apartado Error estándar e intervalo de confianza de la
supervivencia, se encontró que la supervivencia del injerto era mejor en las mujeres
que en los hombres, sin embargo la supervivencia puede depender no sólo del sexo,
sino también de otras variables como la edad, el tratamiento o la comorbilidad de cada
paciente, y podría ocurrir que hombres y mujeres sean diferentes con respecto a esas
variables, lo que dificultaría la interpretación de ese resultado. En la comparación con
el método del log-rank se ignora este efecto de otras variables, situación que puede
ser adecuada si los grupos se han seleccionado de modo aleatorio, por ejemplo en un
ensayo clínico, modo de selección que tiende a hacer que los distintos grupos a com-
parar sean homogéneos con respecto a todas las demás variables (quizás no esté de
86
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 5. Función de supervivencia para el evento pérdida del injerto en la cohorte de
pacientes trasplantados del hospital Ramón y Cajal, obtenida por el método actuarial,
definiendo intervalos de un año.
Supervivenciadelinjerto
Años
Cap 04 4/10/04 12:48 Página 86
más recordar que la asignación aleatoria de los grupos no garantiza que sean homogé-
neos, sólo garantiza que los grupos homogéneos sean los más probables), pero en los
estudios observacionales es claramente insuficiente. Por otro lado, el log-rank ofrece
un valor p para la diferencia entre los grupos, pero no estima el tamaño del efecto, es
decir, que hace una evaluación estadística, pero no clínica, de la diferencia entre los
grupos.
El análisis multivariante, en particular los modelos de regresión, permiten hacer ambas
cosas, esto es, evaluar el efecto de una variable teniendo en cuenta (controlando por,
en la terminología clínico-epidemiológica) otras variables, y estimar el tamaño del efec-
to. Además, y a diferencia de los métodos de Kaplan-Meier y log-rank, que requieren
que la variable sea categórica, los modelos de regresión permiten estudiar variables
continuas (por ejemplo, edad o nivel de creatinina), binarias (por ejemplo, sexo), cate-
góricas (por ejemplo, histología o tratamiento) u ordinales (por ejemplo, estadio de un
tumor o estatus funcional).
Modelo acelerado
Hay varios modelos de regresión propuestos (6, 11), como el llamado modelo acelera-
do, en el que se asume que la función de supervivencia para un grupo de pacientes,
en los que se han medido k variables (X1, X2, ..., Xk), es de la forma:
S(t) = S0 (ϕ t)
Siendo S0(t) la función de supervivencia basal (supervivencia cuando todas las va-
riables son cero) y ϕ un factor de aceleración que depende de las variables de la
forma:
ϕ = eβ1X1+...+ βk Xk
Lo relevante del modelo es que el efecto de cada variable es “estirar” o “encoger” la
función de supervivencia a lo largo del tiempo, de acuerdo con la constante ϕ. La
Figura 6 ilustra este modelo en el caso de una única variable, con dos valores, por
ejemplo, X1 = 0 para hombres y X1 = 1 para mujeres. S0(t) es la función de supervi-
vencia para los hombres y S(t) = S0(ϕt) para las mujeres. La proporción de hombres su-
pervivientes en cualquier tiempo t es la misma que la de mujeres en el tiempo t1 = ϕt.
La figura ilustra los casos ϕ = 0,5, el efecto de ser mujer es “encoger” el tiempo a la
mitad y ϕ = 2, el efecto es “alargarlo” al doble.
Otros modelos asumen alguna función de supervivencia paramétrica (6), como por
ejemplo la exponencial, la de Weibull o la log-normal, y se plantea el modelo de regre-
sión para los parámetros de las funciones.
87
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 87
Modelo de riesgo proporcional o de Cox
Sin embargo, el modelo más usado, por su sencillez y facilidad para interpretar los coe-
ficientes, es el denominado modelo de riesgo proporcional o modelo de Cox, que es un
modelo de la forma:
h(t) = h0(t)eβ1X1+...+ βk Xk
Siendo h0(t) la función de riesgo basal.
Otra manera equivalente de expresarlo es:
In [ h(t)
]= β1 X1+...+ βk Xk
h0 (t)
88
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 6. Ilustración del modelo acelerado para una única variable X1 con dos nive-
les, x1 = 0 y x1 = 1. S0(t) supervivencia para el grupo x1 = 0. Se muestra S(t) = S0(ϕt),
para ϕ = 0,5 y ϕ = 2. En el primer caso, la probabilidad de supervivencia del grupo x1
= 0 en cualquier tiempo t, es la misma que la del grupo x1 = 1 en el tiempo t1 = 0,5t y
en el segundo, la probabilidad de supervivencia del grupo x1 = 0 en cualquier tiempo
t, es la misma que la del grupo x1 = 1 en el tiempo t2 = 2t.
Cap 04 4/10/04 12:48 Página 88
Al cociente h(t)/h0(t) entre el riesgo para cualquier valor de las variables y el riesgo basal,
se le denomina riesgo relativo y se suele representar por HR, sus siglas en inglés (hazard
ratio), es decir, el modelo plantea el logaritmo del riesgo relativo como una función lineal
de las variables independientes. Se supone, por lo tanto, que el riesgo relativo, a diferen-
cia del riesgo propiamente dicho, no depende del tiempo, o dicho de otra manera, que es
constante a lo largo del tiempo (de ahí el nombre de modelo de riesgo proporcional).
Esta última expresión del modelo hace explícita la interpretación de los coeficientes: βi
es el logaritmo del riesgo relativo cuando Xi aumenta una unidad, manteniéndose cons-
tantes las demás variables, y por tanto, exp(βi) es el riesgo relativo cuando Xi aumenta
una unidad, manteniéndose constantes las demás.
Nótese que el modelo no depende de cómo sea h0(t), y la única asunción es que el ries-
go relativo al aumentar una unidad cada variable es constante (exp(βi)) en todo tiempo.
Hay que destacar que esta asunción no siempre es razonable y conviene evaluarla en ca-
da caso con los procedimientos que se examinarán más adelante (apartado Diagnóstico
de regresión).
La Tabla III muestra los coeficientes del modelo, los riesgos relativos y sus intervalos de
confianza al 95% y la significación estadística de las variables edad, sexo y tratamiento
para el evento pérdida del injerto en la cohorte de los trasplantados del Ramón y Cajal,
estimados con modelos de Cox. Se muestran las estimaciones realizadas en los mode-
los univariados y en el modelo multivariante a efectos de comentar las diferencias.
Como el objetivo, en general, es estudiar el efecto conjunto de todas las variables, los re-
sultados que se suelen mostrar son sólo los del análisis multivariante. Como la edad está
89
CURVAS DE VIDA Y SUPERVIVENCIA
Modelos univariados Modelo multivariante
Variable βi HR IC 95% p βi HR IC 95% p
exp(βI) exp(βI)
Edad 0,008 1,008 1,000-1,016 0,054 0,006 1,006 0,998-1,015 0,136
Sexo -0,238 0,789 0,633-0,982 0,034 -0,219 0,804 0,645-1,001 0,051
Tratamiento 0,000 0,001
Tacro -0,953 0,386 0,239-0,621 0,000 -0,905 0,404 0,251-0,653 0,000
CSA -0,194 0,823 0,654-1,037 0,099 -0,158 0,854 0,677-1,077 0,183
Tabla III. Riesgos relativos (HR) y sus intervalos de confianza (IC), estimados
mediante modelos de Cox univariados y multivariantes para el evento pérdida del
injerto en la cohorte de trasplantados del Ramón y Cajal.
Cap 04 4/10/04 12:48 Página 89
codificada en años, el riesgo relativo que aparece en la tabla, es por aumento de un año en
la edad del trasplante, es decir, fijándose en el análisis multivariante, por cada año de edad
de más en el momento del trasplante, el riesgo de fallo del injerto se multiplica por 1,006
o lo que es lo mismo, por cada año es un 0,6% mayor, si bien, este riesgo relativo no es
significativamente distinto de 1 (ya que p = 0,136, o equivalentemente el intervalo de con-
fianza [0,998-1,015] incluye el valor 1). En el caso del sexo, codificado como 0 para varón y
1 para mujer, el riesgo relativo de 0,804 quiere decir que el riesgo de las mujeres es el
80,4% del de los hombres, aunque tampoco es significativamente distinto de 1; es decir,
el valor 0,804 calculado en la muestra es compatible con un valor “real” de 1. Se llama la
atención sobre que, si se hubiera codificado al revés, es decir, 1 para varón y 0 para mujer,
se estaría considerando el riesgo de las mujeres como riesgo basal o de referencia, y en
consecuencia, el riesgo relativo obtenido sería el inverso, HR = 1/0,804 = 1,244.
Es importante detenerse sobre dos aspectos muy relevantes de los modelos de regre-
sión, en particular del de Cox. En la Tabla III se observa que en el análisis, realizado con el
modelo univariado, se encontró un efecto significativo del sexo, (HR = 0,789; p = 0,034),
coincidente con el análisis realizado con la prueba del log-rank en el apartado Error están-
dar e intervalo de confianza de la supervivencia (allí era p = 0,032). En general, el modelo
de Cox univariado, para variables categóricas, es equivalente a la prueba del log-rank y se
obtiene un valor p tanto más parecido, cuanto mayor sea el tamaño muestral, aunque,
primera ventaja, el modelo de Cox produce también una estimación del tamaño del efec-
to, el HR, que no se obtiene con el log-rank.
El otro aspecto a destacar es que en el análisis multivariante, es decir, cuando se ha te-
nido en cuenta también la edad y el tratamiento, el efecto del sexo ha dejado de ser sig-
nificativo. La interpretación de esta diferencia es que la distinta supervivencia del injerto
entre sexos, observada en el apartado Error estándar e intervalo de confianza de la su-
pervivencia, es un resultado que está confundido por el hecho de que ambos grupos di-
fieren en la edad y/o en el tratamiento recibido y que, cuando se controla por estas va-
riables, el efecto desaparece.
En cuanto al tratamiento, al ser una variable categórica con tres categorías, el modelo
ofrece el valor p, que corresponde al contraste de hipótesis en el que se comparan glo-
balmente los tratamientos (p = 0,001 en el modelo multivariante) y, además, los valores
p y los HR, con sus intervalos de confianza, de las comparaciones de cada tratamiento
con el que se haya tomado como referencia.
En el análisis mostrado en la Tabla III, se tomó el tratamiento del grupo AZA como re-
ferencia y se comparó con el tratamiento realizado en el grupo TACRO (HR = 0,404;
p = 0,000) y en el grupo CSA (HR = 0,854; p = 0,183). Es decir, la supervivencia del
injerto es diferente según el tratamiento recibido (p = 0,001), el riesgo en el grupo
TACRO es 40,4% inferior que en el grupo AZA (p = 0,000), mientras que los pacien-
90
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 90
tes del grupo CSA no tienen un riesgo significativamente menor (p = 0,183). Hay que
recordar, no obstante, que los tratamientos no se asignaron al azar y que estos resul-
tados están, muy probablemente, sesgados por el efecto cohorte (apartado
Comparación de las curvas de supervivencia).
Supervivencia estimada con el modelo de Cox
Dadas las relaciones entre h(t) y S(t), mencionadas en el apartado Funciones de supervi-
vencia y riesgo, el modelo de Cox también se puede escribir como:
S(t) = S0(t)
exp(β1
X
1
+...+βK
X
K
)
Una vez que se han estimado los coeficientes del modelo y, aunque es poco usado en la
literatura médica (11), es posible también estimar la función de supervivencia basal S0(t) y,
a partir de ella y de la expresión anterior, la función de supervivencia predicha por el mo-
delo para un paciente con una serie especificada de valores xi. Aunque S0(t) es la función
de supervivencia cuando todas las variables son 0, la estimación realizada con el modelo
91
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 7. Funciones de supervivencia para las mujeres y los hombres para el evento
pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal,
estimadas con el modelo de Cox (línea gruesa) y el método de Kaplan-Meier (línea fi-
na), en ambos casos la curva superior corresponde a las mujeres. Se observa que la
coincidencia no es buena como era de esperar en este caso.
Supervivenciadelinjerto
Años
Cap 04 4/10/04 12:48 Página 91
de Cox se hace dado el modelo, es decir, asumiendo que el riesgo es proporcional, a par-
tir de todos los pacientes de la muestra, no sólo de los que toman el valor 0 en todas las
variables.
La Figura 7 muestra la estimación realizada con el modelo de Cox de las funciones de su-
pervivencia del injerto en la cohorte del Ramón y Cajal para hombres y mujeres, super-
puestas a las funciones mostradas en la Figura 4, estimadas por el método de Kaplan-
Meier, la comparación visual de ambas estimaciones o, dicho en otros términos, de la su-
pervivencia observada (Kaplan-Meier) con la supervivencia predicha por el modelo, es una
de las maneras de evaluar lo apropiado de la asunción de proporcionalidad del riesgo (12).
En este caso, las curvas no muestran una buena coincidencia; en el apartado Error están-
dar e intervalo de confianza de la supervivencia, ya se había señalado que las curvas de
Kaplan-Meieir de ambos sexos eran iguales en los primeros tres años, para irse separando
después. Por lo tanto, es claro que no se cumple la asunción de riesgo proporcional.
Modelo de Cox estratificado
Una característica única que presenta el modelo de Cox con respecto a otros modelos
de regresión, es la capacidad para ajustar, a través de la estratificación, por factores que
no están incluidos en el modelo. Ello es útil para incluir variables categóricas con mu-
chas categorías, que sería difícil incluir de otra manera, por ejemplo para ajustar por cen-
tro en los ensayos clínicos multicéntricos (12) o para incluir variables que no satisfagan
la asunción de riesgo proporcional.
La idea es permitir que la función de riesgo basal varíe entre los estratos. Si hay b estra-
tos, indexados por el subíndice j, el modelo queda en cada uno:
hj (t) = h0,j (t)eβ1X1+...+ βk Xk
El modelo no asume ninguna relación entre las formas de las curvas de los diferentes
estratos, pero sí obliga a compartir los mismos coeficientes. Por ejemplo, un modelo
para la pérdida del injerto, que incluya la edad en el modelo y esté estratificado por se-
xo, producirá un coeficiente para la edad ajustado por sexo (un coeficiente “promedia-
do” para ambos sexos), sin necesitar la asunción de riesgo proporcional para sexo, aun-
que no produciría un coeficiente para el sexo. La estratificación también se puede hacer
combinando varias variables, por ejemplo, se podría ajustar un modelo para el trata-
miento, creando estratos combinados para la edad y el sexo.
Objetivos de la utilización de los modelos de Cox
Los modelos de regresión se pueden usar con tres objetivos diferentes:
1. Objetivo estimativo: si el interés del investigador se centra en estimar la relación de
92
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 92
una variable con la supervivencia. Ejemplos de estudios con este objetivo son los
ensayos clínicos en los que se pretende estudiar el efecto del tratamiento sobre la
supervivencia, o los estudios observacionales para evaluar el valor pronóstico de un
cierto marcador. En ambos casos, las demás variables están en el modelo para evi-
tar su posible efecto perturbador (6,13).
2. Objetivo predictivo: si el objetivo es predecir lo mejor posible la supervivencia usan-
do un conjunto de variables independientes. Se desea seleccionar una serie de fac-
tores que permitan predecir la supervivencia de los pacientes. El resultado de un
modelo predictivo es el modelo mismo, mientras que en un modelo estimativo el
resultado es la estimación del efecto de la variable de interés, es decir el HR. El ob-
jetivo estimativo es el más frecuente en la investigación etiológica, en la que se tra-
ta de encontrar factores determinantes de una enfermedad o un proceso.
3. Hay un tercer objetivo mixto, de naturaleza más exploratoria, en el que se pretende
identificar factores de potencial importancia pronóstica para posteriores investiga-
ciones (13).
Confusión e interacción
Son los dos efectos perturbadores que, en los modelos estimativos, pueden tener unas
variables en la asociación entre otras. Existe confusión cuando la relación entre la varia-
ble en estudio y la supervivencia difiere según se considere o no otra variable. A esta úl-
tima variable se le denomina variable de confusión para la asociación. Existe interacción
cuando la relación entre la variable y la supervivencia varía según los diferentes niveles
de otra variable. Aunque en una primera lectura pueden parecer similares, conviene dis-
tinguir claramente entre ambos fenómenos, siendo los modelos de gran ayuda para ello.
El modelo más sencillo para estudiar la asociación entre la supervivencia y otra variable
X1 es:
In [
h(t)
]= β1 X1
h0(t)
X2 es una variable de confusión para esta asociación, si el modelo:
In [
h(t)
]= β1 X1+ β2 X2
h0(t)
produce una estimación diferente de β1. Obviamente, esta definición se puede ampliar
a un conjunto de variables.
Contrastar la existencia de confusión requiere, por lo tanto, comparar los coeficientes
de regresión de modelos diferentes y, si hay diferencia, existe la confusión, en cuyo ca-
so la mejor estimación es la ajustada. Para dicha comparación no se precisa realizar un
contraste de hipótesis estadístico. Será el investigador quien establezca el criterio para
93
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 93
decidir cuándo hay diferencia, siendo lo habitual considerar que existe confusión cuan-
do la exponencial del coeficiente (el HR) cambia en más del 10%. Por ejemplo, si el aná-
lisis mostrado en la Tabla III tuviera como objetivo estimar el efecto de los tratamientos,
se encontraría que la edad y el sexo conjuntamente no son variables de confusión,
puesto que los HR estimados en el modelo simple, 0,386 y 0,823 para tacrolimus y
CSA, respectivamente, no son muy diferentes de 0,404 y 0,854, estimados en el mode-
lo que contiene también las variables edad y sexo.
El modelo más sencillo que hace explícita la interacción entre dos variables X1 y X2 es:
In [
h(t)
]= β1 X1+ β2 X2 + β3 X1 X2
h0(t)
Es fácil ver (6) que en este modelo, el cambio en In [h(t)/h0(t)] por una unidad de cambio
en X1 manteniendo fijo X2 es β1+β3X2 o, dicho de otro modo, el HR por una unidad de
cambio en X1 manteniendo fijo X2 es:
eβ1+β3x2
= eβ1
(eβ3
)x2
Es decir, el HR es diferente para cada valor de X2.
Contrastar la existencia de interacción entre X1 y X2 es contrastar si el coeficiente β3 es cero
(no hay interacción), o distinto de cero (existe interacción). En caso de que exista interacción,
los exponenciales de los coeficientes β1 y β2 por sí solos no significan nada y la asociación
de las variables X1 y X2 con la supervivencia está cuantificada por la expresión anterior.
Obviamente, primero debe contrastarse la interacción y después, en caso de que no exista,
la confusión.
Estrategias de modelización
Debido a los objetivos distintos de los modelos de regresión es difícil establecer una es-
trategia general para encontrar el mejor modelo, es más, el mejor modelo significa co-
sas distintas con cada objetivo.
En un análisis predictivo el mejor modelo es el que produce predicciones más fiables,
es decir, más parecidas a la realidad, para una nueva observación, mientras que en un
análisis estimativo el mejor modelo es el que produce estimaciones más precisas, es
decir, con un intervalo de confianza más estrecho, del efecto de la variable de interés.
En ambos casos, se prefiere el modelo más sencillo posible (a este modo de seleccio-
nar modelos se le denomina parsimonia), de modo que, en un análisis estimativo, se
puede excluir del modelo una variable que tenga un coeficiente significativamente dis-
94
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 94
tinto de cero y que su contribución a la predicción de la variable dependiente sea impor-
tante porque no sea variable de confusión para la variable de interés (el coeficiente de
dicha variable no cambia); en un análisis predictivo esa variable no se excluiría.
Sin embargo, hay una serie de pasos que deben realizarse siempre (6):
1. Especificación del modelo máximo: establecer todas las variables que van a ser con-
sideradas. El número máximo que se puede considerar (modelo saturado) son n -1
variables, siendo n el número de observaciones, pero en general, el modelo máximo
deber tener menos variables que el modelo saturado para evitar sesgos e inestabili-
dades en la estimación de los coeficientes. Un criterio habitual es incluir, como má-
ximo, una variable cada diez eventos (14). El criterio para decidir qué variables for-
man el modelo máximo lo establece el investigador.
2. Especificación de un criterio de comparación de modelos y definición de una estra-
tegia para realizarla. Debe establecerse cómo y con qué se comparan los modelos.
El estadístico más frecuentemente usado para comparar modelos es el logaritmo
del cociente de verosimilitudes (6) (log-likelihood ratio) y, aunque los paquetes esta-
dísticos suelen implementar estrategias automáticas, como la paso a paso (stepwi-
se), es altamente recomendado realizar estrategias dirigidas por los objetivos del
estudio y los conocimientos previos (6, 13, 15).
3. Evaluación de la idoneidad del modelo. Un modelo es adecuado si representa la su-
pervivencia de los pacientes en los datos de un modo aceptable. Si por ejemplo, un
grupo de pacientes tiene mal pronóstico, un modelo idóneo debería predecir que
este grupo tenga ese resultado (13). Básicamente hay tres aspectos a evaluar en lo
que se conoce como diagnósticos de la regresión y que son: bondad del ajuste,
evaluación de las asunciones y evaluación de la validez del modelo.
Diagnósticos de la regresión
Se conocen como diagnósticos de la regresión una serie de técnicas para verificar el
comportamiento de los modelos y que incluyen la evaluación de las asunciones, de la
bondad del ajuste y de la validez del modelo.
Evaluación de las asunciones
La única asunción del modelo es la del riesgo proporcional, que se puede evaluar gráfica
o estadísticamente. En el apartado Supervivencia estimada con el modelo de Cox, ya se
vio una manera gráfica de evaluarla válida para variables categóricas, consistente en
comparar visualmente las funciones de supervivencia predichas por el modelo con las
observadas (estimadas por el método de Kaplan-Meier).
Otra forma usada más frecuentemente, es la representación, contra el tiempo, de los
logaritmos de las funciones de riesgo, h(t) o H(t) (generalmente, se prefiere H(t) debido
95
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 95
a las inestabilidades que presenta la estimación de h(t) (13)) para los distintos valores de
la variable. Si los riesgos son proporcionales, estas gráficas son paralelas. Con frecuen-
cia, las gráficas del logaritmo del riesgo suelen ser de tipo exponencial, y no es fácil
comprobar visualmente el paralelismo. En este caso, se puede presentar el logaritmo
del riesgo contra el logaritmo del tiempo, que también deben ser paralelas si se cumple
la asunción de riesgo proporcional.
En la Figura 8 se muestran estas gráficas para la pérdida del injerto en relación con la va-
riable sexo. En ambas, se observa la falta de paralelismo que indica la falta de propor-
cionalidad del riesgo. Un problema con estas evaluaciones gráficas es decidir cuándo
las líneas dejan de ser paralelas, decisión que siempre tiene un componente subjetivo.
Hay una recomendación general (7), debido a la robustez del método, de usar una estra-
tegia conservadora y de asumir la proporcionalidad, a menos que haya una fuerte impre-
sión de falta de paralelismo.
Otras pruebas gráficas son las incluidas en el denominado análisis de residuos. Los resi-
duos son diferencias entre “cantidades” observadas y predichas por el modelo. Hay varios
residuos propuestos, aunque algunos de ellos son difíciles de interpretar debido a las cen-
suras (13). En general, si se cumple la asunción, las gráficas de los residuos presentan una
distribución dentro de una banda horizontal. Entre los varios descritos, el SPSS calcula tres:
1. Residuos parciales, o de Schoenfeld: se calculan uno por variable en el modelo, só-
lo se usan los eventos y su representación gráfica es contra el tiempo en el eje X.
96
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 8. Gráficas del logaritmo de la función de riesgo acumulada para hombres (arri-
ba) y mujeres, para el evento pérdida del injerto. A la izquierda, contra el tiempo en
años y a la derecha, contra el logaritmo del tiempo. En ambas, se observa la falta de
paralelismo que indica que no se cumple la asunción de riesgo proporcional.
H(t)(escalalogarítmica)
Años Años (escala logarítmica)
H(t)(escalalogarítmica)
Cap 04 4/10/04 12:48 Página 96
2. Residuos de Cox-Snell: consiste en representar H(t) contra cada variable o contra el
predictor lineal.
3. Martingala (corrección del anterior: 1-H(t) para eventos y –H(t) para pérdidas). En
SPSS, se puede construir sólo mediante el uso de sintaxis.
En la Figura 9 se presentan los residuos parciales y martingala para la variable edad en el
modelo multivariante de la Tabla III. Se observa una distribución razonablemente horizontal.
Una evaluación estadística, que puede usarse tanto para variables categóricas como
continuas, consiste en incluir en el modelo una variable de interacción con el tiempo. Si
esta variable fuera significativa, indicaría que el riesgo varía con el tiempo y, por lo tanto,
no se cumple la asunción. Si así fuera, podría dejarse esta variable en el modelo, aun-
que se complica su interpretación: los HR son distintos para cada tiempo. Hay que re-
cordar también que, en caso de que no se cumpla la asunción de riesgo proporcional,
puede usarse la variable como criterio de estratificación.
Tanto esta prueba estadística como las gráficas permiten evaluar cada variable por sepa-
rado, o cada variable dadas las otras.
Bondad del ajuste
Hay varios métodos que evalúan globalmente lo bien que ajustan los datos al modelo.
Uno muy general de todos los modelos de regresión que, como el de Cox, estiman
97
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 9. Residuos parciales para la edad, representados en función del tiempo (iz-
quierda) y martingala, representados en función de la edad (derecha) para el modelo
multivariante de la tabla 2.3. Si la asunción de riesgo proporcional se cumpliera, debe-
rían distribuirse en una banda horizontal, que razonablemente se cumple.
ResiduosparcialesparaEDAD
Residuosmartingala
Años Edad
Cap 04 4/10/04 12:48 Página 97
los coeficientes por el método de máxima verosimilitud (6), consiste en calcular un
estadístico, el logaritmo del cociente de la verosimilitud del modelo estimado y de los
datos sin modelo, y que en la hipótesis nula de que los datos no se ajusten al modelo,
se distribuye como una χ2
con k grados de libertad (siendo k el número de variables
en el modelo).
Otra prueba, sugerida por Hosmer y Lemeshow (3), consiste en crear un índice pronós-
tico a partir del modelo: IP = β1X1+...+ βkXk, calcularlo para cada paciente y, después,
dividir la muestra en n-ciles. Los grupos así creados se introducen en el modelo como
variable categórica. Si el modelo mejorara significativamente, en términos del logaritmo
del cociente de la verosimilitud, indicaría que la bondad de ajuste es mala.
Validez del modelo
El último aspecto a evaluar en un modelo es su validez o fiabilidad, es decir, ¿se com-
porta igual en otras muestras extraídas de la misma población (reproducibilidad) y/o de
otras similares (transportabilidad)? (16).
El modo más completo de evaluarlo será repetir el estudio con otra muestra y com-
parar los resultados (validación externa). Otra aproximación similar es partir aleato-
riamente la muestra inicial en dos grupos: un grupo de trabajo con el que se desa-
rrolla el modelo y un grupo de validación, con el que se hace la validación o, usado
cada vez con más frecuencia, con técnicas de re-muestreo como jackknife y boots-
trap (12).
La evaluación se hace de modo distinto en modelos estimativos que en los predicti-
vos. En modelos estimativos, simplemente se ajusta el modelo en el grupo de traba-
jo, luego se hace la estimación del efecto en el de validación y se comparan.
En los modelos predictivos la validación es un poco más compleja (16, 17). Tiene dos
componentes, calibración que es el grado en que la supervivencia predicha coincide
con la observada, y puede evaluarse comparando la supervivencia predicha por el
modelo en el grupo de validación con la estimada en el mismo grupo por Kaplan-
Meieir, y discriminación, grado en que el modelo distingue entre individuos de alto y
bajo riesgo. La calibración puede cuantificarse también con el coeficiente de reduc-
ción (shrinkage) (18), que es el coeficiente β del modelo ajustado en el grupo de vali-
dación, usando como única variable el índice pronóstico IP = β1X1+...+ βkXk, calcula-
do con los coeficientes estimados en el grupo de trabajo, y la discriminación con el
coeficiente de correlación de Nagelkerke (R
2
N), que es un número entre 0,para un
modelo sin capacidad predictiva, y 1 para un modelo con predicción perfecta, cons-
truido a partir del logaritmo del cociente de la verosimilitud del modelo estimado y
de los datos sin modelo (12).
98
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 98
ANÁLISIS DE SUPERVIVENCIA CON EL SPSS
El SPSS ofrece en la opción Supervivencia del menú Analizar las subopciones de: Kaplan-
Meier, Tablas de mortalidad (método actuarial) y Regresión de Cox.
Método de Kaplan-Meier
La ventana de diálogo se muestra en la Figura 10. Tras seleccionar la variable que repre-
senta el tiempo y la variable que representa si el paciente ha presentado o no el evento
(casilla Estado), debemos definir los códigos para esta variable mediante el botón
Definir evento. El cuadro de diálogo que aparece, tras pulsar este botón, es el que se re-
presenta en la Figura 11. Supongamos, por ejemplo, un análisis de supervivencia en el
que se distinguen distintas causas de muerte, la variable muerte podría tomar los valo-
res 0 = pérdida, 1 = muerte por la enfermedad, 2 = muerte por otras causas. Si desea-
mos analizar sólo la mortalidad debida a la enfermedad, en la definición de evento se
utilizaría la opción de Valor único con el valor 1. Si el análisis se orientase hacia la morta-
lidad total, en el cuadro de diálogo definiríamos una Lista de valores con los valores 1 y
2 o, equivalentemente, el rango comprendido entre 1 y 2.
En las opciones que se muestran en la parte derecha de la Figura 10, se observa que se
pueden seleccionar distintos estadísticos y gráficos. Lo habitual es seleccionar Tablas de
supervivencia, que producen una tabla similar a la que aparece en la Tabla II, y Mediana.
Hay que tener en cuenta que, cuando existen eventos en muchos tiempos distintos, las
tablas de supervivencia son demasiado largas y no se muestran completamente en los
resultados. Debemos actuar en el visor de resultados con el ratón para ampliar la zona de
visualización. Es útil también activar la casilla de Supervivencia en Gráficos. La función
denominada Impacto en este cuadro es H(t), es decir, la función de riesgo acumulada.
Para contrastar si la supervivencia es distinta, según alguna variable cualitativa (por
ejemplo, según la presencia o no de un factor pronóstico), se debe introducir en la casi-
lla Factor dicha variable (Figura 10) y después seleccionar el estadístico para el contras-
te (el más habitual es la prueba log-rank), y decidir la estrategia con la que se compara-
rán los distintos niveles de la variable introducida en la casilla Factor. A estas opciones
(Figura 12) se accede mediante el botón Comparar factor.
Intervalos de confianza para la función
de supervivencia
El SPSS no presenta directamente los intervalos de confianza para la función de super-
vivencia. Sin embargo, se puede obtener siguiendo los siguientes pasos:
1. Mediante el botón Guardar se pueden guardar, en dos nuevas columnas del archivo
de datos, los valores de la función de supervivencia para los distintos tiempos don-
99
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 99
100
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 10. Pantalla inicial (izquierda) y de selección de opciones (derecha) para el aná-
lisis de supervivencia por el método de Kaplan-Meier.
Figura 11. Pantalla de diálogo del botón Definir evento del método de Kaplan-Meier.
Cap 04 4/10/04 12:48 Página 100
de se producen eventos, junto a su error estándar (Figura 13). Con esta operación,
en el archivo de datos, se han creado dos variables nuevas: sur_1 y se_1, que se
refieren a la función de supervivencia y a su error estándar, respectivamente. Si es-
ta operación se repitiera de nuevo, los subíndices para las nuevas variables se irían
incrementando (sur_2 y se_2).
2. Se construyen los límites superior e inferior de los intervalos de confianza para la
supervivencia mediante la fórmula mostrada en el apartado Método de Kaplan
Meier, es decir, para el 95% de confianza: sur_1 ± 1,96 x se_1. Esta operación se
realiza en dos pasos, uno para el límite superior (sur_1 + 1,96 x se_1) y otra para el
límite inferior (sur_1 – 1,96 x se_1) mediante la opción Calcular variable del menú
Transformar (Figura 14).
3. Para crear la gráfica de supervivencia, incluyendo los intervalos de confianza recién
calculados, lo primero que se debe realizar es una ordenación de los casos en el ar-
chivo de datos de acuerdo a la variable tiempo. Hay que recordar que, para esta
operación, se debe acceder al menú Datos y, posteriormente, seleccionar la opción
Ordenar casos.
4. Tras esta ordenación se crea la gráfica utilizando la opción Dispersión del menú
principal de Gráficos. De entre las opciones posibles para estos diagramas de dis-
persión hay que seleccionar la opción Superpuestos, pues se va a representar, en
los mismos ejes, la función de supervivencia y los dos límites del intervalo de con-
fianza.
101
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 12. Pantalla de diálogo del botón Comparar factor del método de Kaplan-Meier.
Cap 04 4/10/04 12:48 Página 101
102
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 13. Pantalla de diálogo del botón Guardar del método de Kaplan-Meier.
Figura 14. Pantalla de diálogo de la opción Calcular variable dentro del menú
Transformar. Con ella se crean los límites superior e inferior del intervalo de confianza de
la función de supervivencia.
Cap 04 4/10/04 12:48 Página 102
5. Hay que tener presente que todas las variables se representarán en función del
tiempo, de forma que se seleccionarán parejas de la lista de variables, pulsando
ambas con el ratón y, cuando la pareja esté seleccionada, se pasarán a la lista de
pares Y-X, pulsando la flecha correspondiente. Comprobar que el orden de las varia-
bles es Y-X. De no ser así, se puede intercambiar el par con el botón correspon-
diente (Figura 15).
6. Para darle el aspecto final deseado se debe acceder al editor de gráficos (doble clic
del ratón) y en él, seleccionar la opción Formato y configurar dicha ventana tal co-
mo se muestra en la Figura 16. Es decir, activar las opciones Interpolación y
Escalón a la derecha y desactivar la opción Mostrar marcadores.
Método actuarial
Una situación especial ocurre cuando los datos están recogidos de forma que se refie-
ren a observaciones agrupadas en intervalos temporales o cuando el número de obser-
vaciones es elevado y se nos presenta la necesidad de dividir el tiempo de observación
en intervalos. Para esta situación, el método estadístico adecuado es el denominado
método actuarial. El SPSS incluye este método de análisis bajo la opción Tablas de mor-
talidad del menú Supervivencia. El cuadro de diálogo es similar al de Kaplan-Meier, ex-
cepto que se debe introducir la anchura de los intervalos en los que se va a dividir el
tiempo (Figura 17).
103
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 15. Pantalla de diálogo de la opción Diagrama de dispersión superpuesto.
Cap 04 4/10/04 12:48 Página 103
104
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 16. Pantalla para dar el formato final al intervalo de confianza de la función de
supervivencia.
Figura 17. Pantalla de diálogo para el método actuarial.
Cap 04 4/10/04 12:48 Página 104
Regresión de Cox
El cuadro de diálogo para la realización de este análisis (Figura 18) es similar al del análi-
sis de Kaplan-Meier. La diferencia fundamental estriba en que ahora se pueden introdu-
cir varios factores (cualitativos o no) en el apartado de covariables, cuando en Kaplan-
Meier sólo era posible introducir un factor cualitativo. Se pueden crear términos de
interacción entre factores, utilizando el botón Producto (con la etiqueta >a*b>), tras
marcar un conjunto con dos o más variables de la lista correspondiente.
Los resultados de este análisis se muestran en la Figura 19. En la parte superior se ob-
servan las pruebas de bondad de ajuste y en la inferior los resultados de las estimacio-
nes de los coeficientes del modelo, la última columna muestra el HR para cada variable
independiente bajo la denominación Exp(B). De forma sencilla, se puede completar este
último resultado, solicitando en las Opciones que muestre los intervalos de confianza
para esos HR (IC para Exp(B)).
Para analizar una variable categórica de más de dos niveles se debe utilizar el botón
Categórica, y aparecerá el cuadro de diálogo de la Figura 20. La opción más fácilmente
interpretable es utilizar el esquema de contraste denominado Indicador, seleccionando
qué nivel de esa variable es el que actuará como referencia. Se puede elegir entre el pri-
105
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 18. Pantalla de diálogo para la regresión de Cox.
Cap 04 4/10/04 12:48 Página 105
mer y el último nivel. Es importante notar que se debe pulsar siempre el botón Cambiar
para que la selección realizada tenga efecto.
Para obtener los gráficos de la Figura 8, para evaluar la asunción de riesgos proporciona-
les de una variable categórica, se introduce la variable elegida en la casilla Estrato, y se
pide el gráfico Log menos log, desde el cuadro de diálogo correspondiente, al botón
Gráficos (Figura 21).
Para realizar el análisis de residuos, se pulsa el botón Guardar y se seleccionan las op-
ciones marcadas en la Figura 22. Las nuevas variables guardadas en el archivo se utili-
zarán para realizar las representaciones gráficas. La función de impacto (residuos de
Cox-Snell), guardada con el nombre de haz_1, debe representarse frente a cada varia-
ble, o al resultado del predictor lineal, guardado con el nombre de xbe_1. Los residuos
parciales se representan frente a la variable tiempo. Se pueden construir los residuos
martingala, ejecutando la siguiente lista de comandos en el Editor de sintaxis (funciona
en los supuestos de que en la variable haz_1 estén guardados los residuos de Cox-
Snell, la variable injerto sea la variable de Estado, y que el valor 0 corresponda al evento.
Los residuos martingala se guardan en la variable martinga):
106
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 19. Resultados de la regresión de Cox. Arriba prueba del logaritmo de cocientes
de verosimilitudes para contrastar la bondad del ajuste y abajo, coeficientes, con sus
errores estándar, pruebas de significación para el contraste de que sean son cero y
riesgo relativo (Exp(B)).
Cap 04 4/10/04 12:48 Página 106
107
CURVAS DE VIDA Y SUPERVIVENCIA
Figura 20. Cuadro de diálogo para analizar variables categóricas en el modelo de Cox.
Figura 21. Cuadro de diálogo para construir los gráficos del logaritmo de la función de
riesgo acumulada (recuérdese que H(t) = -Ln (S(t)), por eso en el cuadro hay que mar-
car Log menos log).
Cap 04 4/10/04 12:48 Página 107
DO IF (injerto = 0).
COMPUTE martinga = 1 -haz_1.
ELSE.
COMPUTE martinga = -haz_1.
END IF.
EXECUTE.
FACTORES QUE INFLUYEN EN LOS RESULTADOS
DE LAS CURVAS DE SUPERVIVENCIA:
CONSIDERACIÓN ESPECÍFICA PARA LAS
POBLACIONES EN TRATAMIENTO SUSTITUTIVO
DE LA INSUFICIENCIA RENAL CRÓNICA
(DIÁLISIS Y TRASPLANTE RENAL)
Selección de la muestra a estudiar. Influencia
de la cohorte sobre los estudios de supervivencia
Uno de los elementos básicos para interpretar los estudios de supervivencia es el análi-
sis de los criterios utilizados para la selección de la cohorte, dependiendo estos de los
objetivos que se quieran obtener.
108
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 22. Cuadro de diálogo para guardar los residuos y el predictor lineal.
Cap 04 4/10/04 12:48 Página 108
Hemos visto previamente que un estudio ideal de cohorte, consta de una muestra bien
definida de individuos representativos de la población en estudio. Sin embargo, las po-
blaciones de enfermos son heterogéneas, es decir, están compuestas por individuos de
distintas edades, sexo, raza y grados de comorbilidad, factores diversos que condicio-
nan el pronóstico. Por tanto, existe una cierta contradicción entre que una cohorte sea
homogénea y, al tiempo, que sea representativa de la población de enfermos de la que
procede (19).
Esta complejidad es especialmente cierta en las poblaciones que se encuentran en
tratamiento substitutivo por insuficiencia renal terminal, compuestas por individuos
portadores de variados factores pronósticos (edad, etiología, presencia de nefropatía
diabética, comorbilidad, etc.), tratados secuencialmente con distintas formas de trata-
miento (hemodiálisis, diálisis peritoneal, trasplante renal, etc.), durante tiempos dife-
rentes (20-24).
La forma de enfrentar este problema de la heterogeneidad constitutiva de las poblacio-
nes, depende de los objetivos que pretendamos con el estudio de supervivencia:
• Si lo que queremos es analizar causalidad, por ejemplo si un determinado fármaco
mejora la supervivencia, debemos seleccionar desde la población general, indivi-
duos que constituyan grupos homogéneos y muy semejantes entre sí, aunque la
cohorte resultante tenga diferencias notables con la población diana.
Este tipo homogéneo de cohorte sólo puede conseguirse en estudios prospectivos
en los que el inicio del estudio, la selección de la población en riesgo y la clasifica-
ción de los individuos, según su nivel de exposición al factor pronóstico, se hace
previamente a que se produzca el resultado de interés, que aparecerá en el futuro.
Es la estrategia que se utiliza cuando se diseña un ensayo clínico con el que quere-
mos estudiar la influencia de una terapéutica sobre la producción de los eventos de
interés (muerte, complicaciones, rechazo etc.) comparándola con otra(s) y/o con un
placebo.
Para minimizar la presencia de sesgos es fundamental que el diseño consiga, en
los distintos grupos, muestras de población muy parecidas entre sí, lo que se reali-
za extremando los criterios de inclusión-exclusión y utilizando las técnicas de alea-
torización. Por otra parte, debe asegurarse que, salvo el tratamiento en evaluación,
los grupos sean tratados de igual modo, para lo que se usan las técnicas de enmas-
caramiento o de ciego. Cuanto más estrictos y mejor definidos sean estos proce-
sos, más homogéneas serán las cohortes estudiadas y menor la probabilidad de
que ocurran sesgos.
Sin embargo, aunque la aleatorización rigurosa hace muy probable la semejanza
de los grupos, con relación a las variables de confusión, ésta no la garantiza. Un
ejemplo de esta situación se produjo en el estudio internacional del tratamiento de
las glomerulonefritis en la infancia, que investigaba el tratamiento con prednisona
109
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 109
en la glomerulonefritis membranoproliferativa, utilizando técnicas impecables de
aleatorización y de ciego. Sin embargo, y a pesar del rigor utilizado, los grupos di-
ferían en una variable tan importante como era el tiempo entre el diagnóstico y el
comienzo del tratamiento, haciendo dudoso el significado de los resultados ulte-
riores (25).
Por tanto, en todo estudio que investigue causalidad mediante la comparación de
supervivencias, la asunción de la igualdad entre grupos debe ser comprobada y, si
es necesario, ajustada por distintas variables para un análisis riguroso. Por tanto,
éste debe ser uno de los puntos de interés crítico cuando nos enfrentemos a la lec-
tura de un artículo de este tipo.
• Si el objetivo del análisis es, precisamente, el estudio de esa población, por ejemplo,
cuando pretendemos establecer el pronóstico de un enfermo concreto o analizar la
influencia de factores pronósticos en la aparición del evento de interés o estudiar
una o varias series para realizar controles de calidad, o para determinar la influencia
de determinados factores sobre los resultados.
En estos casos, no nos sirve la estrategia de comparar cohortes muy homogéne-
as (y muy distintas a la población diana), que han sido obtenidas aplicando estric-
tos criterios de selección, sino que tendremos que diseñar estudios (prospecti-
vos o retrospectivos), utilizando series de enfermos o analizando la información
obtenida por medio de registros de enfermedades.
A pesar de sus muchos inconvenientes, la utilización de estos procedimien-
tos (series y registros) representa, con frecuencia, la única forma de analizar
aspectos de las enfermedades crónicas que se dan en poblaciones comple-
jas y que requieren mucho tiempo desde el comienzo de la enfermedad has-
ta la producción de los eventos. En estos estudios, lo que interesa es objeti-
var las variables que, de una forma independiente, inciden en la producción
del evento.
En ambos casos, cuando lo que se pretende es comparar los resultados de dos es-
tudios distintos, se debe comprobar que el tipo de pacientes incluidos sean compa-
rables (al presentar un similar espectro de factores pronósticos), o comparar sub-
grupos portadores de una determinada variable pronóstica o utilizar técnicas de es-
tandarización de los grupos que los homogenicen por estas variables.
Cuando analicemos una curva de supervivencia, debemos tener en cuenta estos
elementos para desentrañar su significado. Por ejemplo, la gráfica de supervivencia
de enfermos trasplantados renales, que se muestra en las Figuras 2 y 3, no tiene en
sí misma mucho sentido, al representar el resultado de una cohorte histórica que ha
experimentado diversos cambios en la estrategia terapéutica y en el criterio de in-
clusión de enfermos para trasplante a largo plazo. Esta curva es difícil de comparar
con la obtenida en otra cohorte en la que no se hayan seguido exactamente los
mismos criterios.
110
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 110
Para mejorar su comparabilidad, debería segmentarse en periodos temporales, por gru-
pos terapéuticos, estratificada por los factores pronósticos más significativos, etc., y
mostrarse después de realizar ajustes por los principales factores pronósticos.
Por otra parte, es necesario analizar, simultáneamente, la supervivencia del enfermo y
del injerto tanto a corto como a largo plazo. Hay centros con muy buena supervivencia
del injerto y mala del enfermo, y viceversa, por ejemplo, en relación con la estrategia in-
munosupresora (26-29).
Por tanto, interesa mejorar la comparabilidad de las cohortes en estudio y detectar la
producción de sesgos. A continuación, resumimos algunas de las fuentes más impor-
tantes en la producción de estos sesgos y algunas de las soluciones metodológicas que
han sido propuestas.
Fuentes en la producción de sesgos
y soluciones metodológicas
Recogida de datos en estudios retrospectivos y en los registros
Una fuente de sesgos en los estudios de investigación clínica se refiere a los problemas
originados por la recogida de datos.
Las cohortes retrospectivas o históricas están especialmente expuestas a este proble-
ma. En ellas, la presencia del factor pronóstico y el resultado de interés se han produci-
do en el pasado, limitándose el momento actual al análisis del mismo. Están sujetas a
numerosos sesgos por la recogida retrospectiva de los datos y por la dificultad que pre-
sentan al estudiar las variables de confusión.
Los registros están también sujetos a numerosos problemas en la recogida y transmi-
sión de datos que pueden producir sesgos. Por ejemplo, sesgos por predominio de co-
municación de la información por centros con “buenos resultados” (los que obtienen
malos resultados tienen menos interés en hacerlo), retraso en comunicar el evento
muerte, predominio en el registro de casos de un centro con un determinado perfil que
sesga los resultados de toda la cohorte, duplicidades, etc.
Por tanto, los estudios efectuados por estos procedimientos deberían objetivar siem-
pre, la metodología seguida para tratar de minimizar este tipo de sesgos (protocolo de
recogida de datos, índice de no respuestas, características de los centros, realización o
no de controles externos, etc.) y sus resultados serán tanto más fiables (robustos) cuan-
to mejor demuestren el rigor y la fiabilidad en el proceso de recogida de datos y su vali-
dación y la ausencia de efecto centro que produzca sesgos sobre los resultados de la
cohorte en su conjunto.
111
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 111
Efecto cohorte
Ya ha sido comentado que el análisis de supervivencia presupone que el pronóstico de
los individuos que componen la cohorte, permanece inalterado con el tiempo y que la
falta de cumplimiento de esta premisa es una fuente de sesgos que se conoce como
efecto cohorte.
Esto sucede, por ejemplo, por cambio de la terapéutica utilizada a lo largo del tiempo,
como sucede en la serie histórica de trasplantados renales que ilustra este trabajo. Por
tanto, no es correcto informar a un paciente que se trasplante en el año 2004 del pro-
nóstico de esta intervención terapéutica, utilizando una serie histórica que se inició 20
años antes.
Se ha demostrado que existe una clara mejoría de la supervivencia del injerto renal con
el tiempo (26), que se relaciona con el progreso de la terapéutica inmunosupresora,
aunque posiblemente influyen otros factores que pueden agruparse como efecto
aprendizaje: la mejoría con el tiempo de los resultados producidos, en un mismo cen-
tro, o recogidos en archivos multicéntricos no pueden explicarse solamente sobre la ba-
se de cambios técnicos, sino por una mejor utilización de los mismos a nivel local.
Por otra parte, la explotación de datos de registros de enfermos renales, muestra una
importante heterogeneidad de resultados de supervivencia entre centros tanto para diá-
lisis, como para trasplante renal (27-29). Estas diferencias se deben, no sólo a una dis-
tinta composición de las cohortes (edad, comorbilidad), variada utilización de la terapéu-
tica o a alternativas técnicas, sino también, a la presencia de una serie sutil de circuns-
tancias que pueden diferenciar a un centro de otro (efecto centro), sin que necesaria-
mente afecten a las variables brutas que definen a la población en riesgo (por ejemplo,
la selección cuidadosa de la pareja donante-receptor en los trasplantes, la situación clíni-
ca basal en variables no medidas como las nutricionales, factores individuales de tipo
cultural que influyan en la adhesión al tratamiento, etc.).
Guttmann (30) afirma que esto es especialmente cierto en los trasplantes renales, en
los que puede ser difícil objetivar los criterios que han sido utilizados para que los pa-
cientes atraviesen la puerta de la elegibilidad y se incluyan en la lista de espera para
trasplante. Estas poblaciones pueden ser comparables en las variables básicas (edad,
sexo, comorbilidad, etc.) pero pueden diferir en otros con influencia potencial en la su-
pervivencia (por ejemplo, el tiempo de permanencia previa en hemodiálisis), con fre-
cuencia no incluidos en el análisis y, a veces, simplemente no medibles.
Por tanto, la cohorte incluida en un estudio de supervivencia, debe incluir una descrip-
ción de la misma en relación a los factores pronósticos que determinan la superviven-
cia. Si se quieren comparar las cohortes de dos estudios diferentes, ambas deben ser
112
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 112
suficientemente homogéneas en su constitución o presentar los resultados de forma
que la comparación sea posible.
Control de la confusión en estudios no experimentales
Debido a las diferentes características en cuanto a factores pronósticos de las cohortes
de los diferentes estudios, en general, las comparaciones directas entre sus superviven-
cias, en mayor o menor grado, estarán afectadas por el sesgo de confusión. Para contro-
lar este sesgo, básicamente hay dos procedimientos, que tienen en común el que sólo
permiten controlar la confusión provocada por características observadas, a diferencia de
la aleatorización que controla por las observadas y también por las no observadas.
Estratificación
La estratificación consiste en hacer las comparaciones en estratos homogéneos con
respecto al factor cuyo efecto de confusión se quiera eliminar. Si por ejemplo, se quisie-
ra comparar la supervivencia de dos cohortes de trasplantados, que presentarán distinta
proporción de diabéticos, un modo de eliminar la confusión provocada por la diabetes,
consiste en dividir ambas cohortes en dos estratos: pacientes diabéticos y pacientes no
diabéticos, y comparar las curvas de supervivencia en cada estrato.
Obviamente, para que se corrija el sesgo, se necesita que en ambas cohortes haya sufi-
ciente número de pacientes en todos los estratos. Si en una cohorte la inmensa mayoría
de los pacientes fueran diabéticos y en la otra la inmensa mayoría no lo fueran, no habría
manera de separar el efecto de la diabetes de cualquier otra causa de diferencia en la su-
pervivencia entre las cohortes. Esta limitación se comparte con los otros métodos, pero
una ventaja de la estratificación es que, si ocurre, el investigador lo observa inmediata-
mente. El principal inconveniente de la estratificación es que resulta difícil de realizar
cuando se necesita ajustar por muchas variables de confusión, como suele ser el caso.
Hay que tener en cuenta también, que pequeñas diferencias en muchas variables, que
individualmente no necesitarían ser ajustadas, pueden tener un efecto acumulativo im-
portante. Por ejemplo, si en una cohorte los pacientes tuvieran ligeramente mayor edad
que en la otra, hubiera una ligera mayor proporción de diabéticos y un nivel de creatinina
ligeramente superior, ese grupo puede tener substancialmente peor pronóstico.
Si el factor que se quiere controlar, fuera una variable continua (edad, tensión arterial,
nivel de creatinina, colesterol, etc.), previamente habría que categorizarla. Sin embar-
go, este proceder puede originar sesgos según sea el criterio utilizado y pérdida de in-
formación de la variable, haciendo disminuir su significación (30-32). Para evitarlos, la
categorización debe realizarse con sensatez, eligiendo los puntos de corte sobre la ba-
se de criterios clínicos y procurando que exista un número suficiente de individuos en
cada categoría.
113
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 113
Este modo de comparar, estratificando la población según su situación con relación a dis-
tintas variables, es muy utilizada en la literatura, ya que constituye una técnica de gran im-
pacto para transmitir de forma visual la diferencia evolutiva entre dos tipos de opciones.
Se han descrito distintas categorías de riesgo o índices de comorbilidad para realizar
una aproximación pronóstica individualizada de los pacientes en tratamiento sustitutivo
de la insuficiencia renal. Aunque en todos los índices propuestos se muestra una clara
relación inversa entre morbilidad y supervivencia, también existe una importante super-
posición entre los grupos, lo que disminuye su interés práctico, de tal forma que ningu-
no de ellos haya sido unánimemente aceptado (20-24, 33-35).
Estandarización
Con el objetivo de mejorar la comparabilidad de los datos de supervivencia, la mayor
parte de los registros de enfermos renales incluyen en su análisis técnicas de estandari-
zación de los resultados, que consisten en estimar la supervivencia para una hipotética
población que sea una “mezcla” predeterminada de los diferentes estratos. Se puede
hacer directamente, calculando el promedio ponderado de la supervivencia en los dife-
rentes estratos o usando el modelo de regresión de Cox en la forma apartado
Supervivencia estimada con el modelo de Cox y aplicándola para unos valores predeter-
minados de las variables especificadas para la variable seleccionada.
Por ejemplo, en el registro de la EDTA-ERA, los resultados de supervivencia se presen-
tan sin ajustar, o bien, ajustados por edad, sexo y etiología (diabetes o no) de la enfer-
medad causante de la insuficiencia renal.
114
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Tipo supervivencia Edad Sexo Enfermedad renal
TRS (pacientes) 60 años 60% varón DM-noDM 20/80
Diálisis (pacientes) 60 años 60% varón DM-noDM 20/80
TR cadáver (1º) (pacientes) 45 años 60% varón DM-noDM 20/80
TR vivo (1º) (pacientes) 45 años 60% varón DM-noDM 20/80
TR cadáver (1º) (injerto) 45 años 60% varón DM-noDM 20/80
TR vivo (1º) (injerto) 45 años 60% varón DM-noDM 20/80
TRS = tratamiento renal substitutivo (cualquier modalidad).
En análisis de supervivencia ajustado y no ajustado, no se consideraron cuando en las celdas había menos
de 30 casos.
Tabla IV. Estudio de supervivencia. Registro EDTA-ERA. Variables de ajuste
(modificada de ERA-EDTA Registry. www.era-edta-reg.org).
Cap 04 4/10/04 12:48 Página 114
Los criterios de este ajuste del registro europeo, se muestran en la Tabla IV. Puede ob-
servarse cómo el cálculo de supervivencia, para todos los pacientes en tratamiento re-
nal substitutivo (cualquier modalidad), se hace ajustando los resultados crudos, asu-
miendo que la cohorte estuviera formada por individuos con una edad de 60 años, com-
puesta por un 60% de varones y un 40% de mujeres y una proporción de pacientes dia-
béticos/no diabéticos del 20/80%. Por el contrario, vemos en la misma tabla que los cri-
terios para realizar el ajuste son diferentes en trasplante renal (27,36,37).
En el registro americano (USRDS = United States Renal Data System), los datos se pre-
sentan sin ajustar y ajustados por edad, sexo, raza (blanco, negro, otro), etnia (hispano,
no-hispano) y diagnóstico primario (diabetes, hipertensión, glomerulonefritis, riñón quís-
tico, otras enfermedades de Urología, otras causas, causas desconocidas, todos) (38).
En el registro australiano (39,40) se analiza la mortalidad cruda para los enfermos en tra-
tamiento substitutivo, diálisis o trasplante (muertes con trasplante funcionante) referida
a enfermos/año (1.000 enfermos/año) con resultados crudos, y también, se estudia la
mortalidad por enfermo/año estandarizada por población. Para ello, se realiza un ajuste
de los valores de supervivencia en la población en tratamiento substitutivo de la IRC (de
mayor edad media que la población australiana), refiriéndolos a la edad de la población
nacional. De esta forma, ambas tasas de mortalidad son comparables.
Elementos clave a tener en cuenta en el análisis
de supervivencia
Como hemos visto ya, el modelo de Cox es una técnica estadística de gran utilidad en el
análisis de supervivencia, porque permite que la variable dependiente sea evaluada con
respecto a varios factores o covariables simultáneamente y, además, ofrece estimacio-
nes sobre el tamaño del efecto de cada una de la covariables en la producción del even-
to. Por otra parte, permite utilizar todo tipo de variables: continuas (edad), binarias (se-
xo), categóricas no ordenadas (histología), categóricas ordenadas (estadios tumorales).
En general, los métodos del análisis de supervivencia asumen que:1) los tiempos de su-
pervivencia de los sujetos en estudio son independientes unos de otros; 2) el censura-
do de casos se realiza aleatoriamente y no es informativo con relación a la producción
del evento; 3) además, en el modelo de Cox, los riesgos entre los grupos son proporcio-
nales.
A continuación, se discuten algunas de las causas potenciales que pueden generar pro-
blemas en la aplicación de esta metodología:
1. Desgraciadamente, la asunción de proporcionalidad de los riesgos que define al
modelo de Cox no siempre se cumple, y por tanto, conviene estudiarlo antes de
aplicarlo, con los métodos vistos en el apartado Diagnósticos de regresión.
115
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 115
2. Utilización de variables tiempo-dependientes. El método descrito en el apartado
Modelo de riesgo proporcional o de Cox asume que las variables independientes
no cambian durante el tiempo (edad al trasplante, sexo, etc.) o están medidas en el
comienzo del seguimiento. Existe una extensión del método que permite incluir
también variables tiempo-dependientes, es decir, variables que cambian a lo largo
de la evolución, aunque deben utilizarse con cuidado, pues pueden dar lugar a erro-
res en relación con su ubicación en la cadena causal. Los más frecuentes son:
A) Confundir una consecuencia con la causa: por ejemplo, si en una cohorte de
enfermos con insuficiencia renal avanzada, queremos analizar las relaciones
entre la función renal residual y la supervivencia. Es posible que la superviven-
cia sea menor en los pacientes que presentan, al comienzo del seguimiento,
una función renal menor. Pero si lo que pretendemos es analizar la relación en-
tre la evolución de la función renal y la supervivencia, el resultado puede ser
paradójico. Por ejemplo, si consideráramos la media de función renal en los
distintos momentos evolutivos y, dado que ésta tiende a 0, los supervivientes
tendrán una función renal más baja que los que han fallecido previamente, lo
que llevaría a la falsa conclusión de que, a menor función residual, mayor su-
pervivencia.
B) Utilización de información futura en el modelo de regresión: en síntesis, el fu-
turo no debe predecirse utilizando información futura. Pueden utilizarse las va-
riables tiempo-dependientes siempre que no formen parte del evento que
pretendemos analizar y se produzcan en un momento anterior a éste, es decir,
que sean información anterior a la producción del evento (31,41).
Un ejemplo ilustrativo del error, que puede cometerse por utilizar en el mode-
lo de regresión información futura, lo constituye el análisis de las relaciones
entre edad y mortalidad. Típicamente, la mortalidad aumenta con la edad y es,
por tanto, correcto incluir la edad de un sujeto, a su entrada en el estudio, co-
mo una covariable del análisis de supervivencia, que puede identificar a la
edad en situación basal como un factor de riesgo de mortalidad.
Sin embargo, si lo que se considera es la edad media durante el estudio (por
ejemplo, la media entre la edad basal y en los distintos momentos en los que
se analiza el evento de interés (1, 2, 5 años, etc.), esto es incorrecto, ya que
se utiliza información futura. Suponer que esto se hiciera para una población
cuyo estudio se inicia al nacer, haciendo estas cuentas, los sujetos con mayor
edad media serían obviamente los que tienen, también, mayor supervivencia.
3. Colinealidad: existen problemas de colinealidad, que dan lugar a imprecisiones e in-
estabilidades de los modelos (6,31), cuando algunas variables independientes es-
tán muy correlacionadas entre sí. Es el caso que sucede cuando una variable englo-
ba a otras varias. Por ejemplo, si queremos analizar a los enfermos, en tratamiento
sustitutivo de la insuficiencia renal, del valor pronóstico de las siguientes variables:
cardiopatía isquémica, claudicación intermitente, accidente cerebrovascular y arte-
riosclerosis. Al realizar el modelo de regresión, pueden producirse problemas de
116
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 116
colinealidad, ya que la variable arteriosclerosis engloba a las demás. La solución
consiste en retirar la variable que engloba a las demás (en este caso, la arterioscle-
rosis). Con ello, el modelo no pierde información (que se encuentra contenida en
las otras variables), pero éste se hace viable.
En la Tabla V se resumen algunas de las reglas que debemos seguir para la utilización de
covariables en los estudios de regresión.
Definición del comienzo del estudio y su influencia
sobre los estudios de supervivencia
Uno de los requisitos de diseño de un estudio de supervivencia es la delimitación del
comienzo del mismo (origen o tiempo 0). Esta propiedad que a primera vista parece ob-
via o baladí, tiene sin embargo, una gran importancia en la producción de sesgos o, al
menos, de resultados no comparables entre unos y otros estudios.
Veamos, por ejemplo, la diferencias en el establecimiento del punto de origen para el cál-
culo de supervivencia en distintos registros internacionales de enfermos en tratamiento
substitutivo por insuficiencia renal (TRS) (27, 36-40), que se describen en la Tabla VI.
117
CURVAS DE VIDA Y SUPERVIVENCIA
1. Seleccionar las covariables cuya relación con el evento tenga sentido clínico.
2. En un modelo estimativo deben considerarse también las variables de confusión o
interacción.
3. El número máximo de covariables, en el modelo, es la décima parte del número de
eventos.
4. Evitar que unas variables engloben a otras para que no se produzca colinealidad. Su
principal manifestación es la inestabilidad e imprecisión de los modelos. En el caso
de que esto se produzca, eliminar del modelo la variable globalizadora o todas las
parciales.
5. Comprobar que las variables introducidas en el modelo satisfagan la asunción de
riesgo proporcional. Para ello, son muy útiles las gráficas que presenten el
logaritmo del riesgo en función del tiempo, o del logaritmo del tiempo para distintos
valores de cada una de las variables: si permanecen paralelas, o al menos si no se
cruzan, podemos asumir esta proporcionalidad. Para variables continuas, mejor las
gráficas de residuos.
6. En caso de usar variables tiempo-dependientes, se debe estar seguro de que no
sean consecuencias en lugar de causas del evento en estudio.
Tabla V. Reglas para la utilización de covariables predictoras en modelos de
regresión.
Cap 04 4/10/04 12:48 Página 117
Puede observarse una diferencia clave en el cálculo de la supervivencia de los pacientes
que inician tratamiento en cualquier procedimiento de TRS. El registro americano
(USRDS) sitúa el origen en el día 90, para aquellos que sobreviven en esta fecha. Por el
contrario, el registro europeo (EDTA-ERA) y el australiano (ANZDATA) fijan el origen en
el día 1 de entrada en la TRS.
EDTA-ERA analiza cohortes constituidas por enfermos que iniciaron el tratamiento
en un periodo de cinco años e incluye un primer punto de evaluación de la supervi-
vencia, al tercer mes, para evaluar las pérdidas precoces y, a continuación, a 1, 2 y 5
años. En el USRDS, la cohorte se constituye por años de inicio en el tratamiento,
analizando supervivencia a 1, 2, 5 y 10 años. El registro australiano, al igual que el de
la EDTA, considera el origen el día 1, aunque para poder realizar análisis comparati-
vos con el USRDS, realiza otro análisis de supervivencia para aquellos enfermos que
permanezcan vivos el día 91 con origen del estudio en este mismo día (tiempo 0). En
todos los registros, el punto de origen para trasplante renal es el día en el que se im-
planta el injerto.
A la vista de estos datos, podemos concluir que los resultados globales en TRS del re-
gistro americano son difíciles de comparar con los europeos, aunque todo indica que
118
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Registros TRS HD / DP TR Enfermo/
Injerto
Europeo 1) día 1 en TRS. Modalidad (HD o DP) = 1) día 1 en TR.
(EDTA-ERA) 2) día 91 en TRS En la que se encuentre
para los supervivientes. el día 90 en TRS (al
menos durante 60 días).
Americano 1) día 90 en TRS. Modalidad (HD o DP) = 1) día 1 en TR.
(USRDS) En la que se encuentre
el día 90 en TRS (al
menos durante 60 días).
Australiano 1) día 1 en TRS. Modalidad (HD o DP) = 1) día 1 en TR.
(ANZDATA) Intención de tratar. En la que se encuentre Intencion de tratar.
2) día 91 en TRS el día 90 en TRS (al
para los supervivientes. menos durante 60 días).
TRS = tratamiento renal substitutivo (cualquier modalidad).
HD = hemodiálisis.
DP = cualquier modalidad de Diálisis Peritoneal.
TR = trasplante renal.
Intención de tratar = la evolución del enfermo es considerada simplemente por haber iniciado el
procedimiento.
Tabla VI. Determinación del punto de origen para el cálculo de supervivencia.
Cap 04 4/10/04 12:48 Página 118
inferiores a estos en supervivencia de los pacientes en TRS. Por ejemplo, la mortalidad
global a los 90 días (ajustada por sexo, edad y diagnóstico) reflejada en el registro eu-
ropeo para la cohorte, que comienza tratamiento substitutivo de la insuficiencia renal
entre los años 1992 y 1996, es ligeramente inferior al 5%. Y en el análisis que toma co-
mo origen el día 91 (y que por tanto, sería comparable a la del USRDS), la superviven-
cia es del 87,1% al año (IC 95%: 86,8-87,5); del 76,1% a los dos años (75,7-76,6) y del
50% a los cinco años (49,4-50,6). En el registro americano, la supervivencia oscila en el
primer año entre el 79%, en los que comienzan en 1992, y el 80,6% en los que co-
menzaron en 1996; la supervivencia a los dos años oscila entre el 64,6% y el 66,9%; y
a los cinco años entre el 37,6% y el 39,7%. Estas importantes diferencias, probable-
mente se deben más a la existencia de diferentes criterios de inclusión de enfermos
en programa de diálisis, es decir, a la constitución de la cohorte, que a diferencias en la
calidad del tratamiento.
En cualquier caso y, sea cual sea la causa, lo que quiero destacar es que analizar el cri-
terio, con el que se fija el punto 0 de un estudio de supervivencia, es fundamental para
comprender los resultados del mismo.
Un matiz de mucho interés es el que refleja, de una forma expresa, el registro australia-
no: que la inclusión de los pacientes en el punto 0 se haga por intención de tratar.
En el mundo nefrológico es, en el trasplante renal, donde es más evidente la impor-
tancia de considerar o no este punto en el estudio de supervivencia. Esto sucede
porque hay grupos que no incluyen, en el análisis, aquellos casos en los que el injer-
to es retirado durante el acto quirúrgico, por cualquier circunstancia (problema técni-
co) e incluso, aquellos que han superado el acto quirúrgico, pero en los que el injerto
nunca llega a funcionar. El argumento es que “estos enfermos, en realidad, no han
sido trasplantados, el tejido renal nuevo no ha sido implantado o éste no ha llegado a
funcionar”.
Probablemente, esta práctica sea válida si se quieren analizar determinados aspectos,
por ejemplo, la influencia de variables inmunológicas sobre la supervivencia del injerto,
pero es incorrecta si lo que estudiamos es la supervivencia global del injerto en una se-
rie en la que también deben incluirse las pérdidas durante la cirugía.
Hoy, la mayoría de los metodólogos piensan que, para la correcta evaluación de cual-
quier alternativa terapéutica, es importante considerar a los pacientes en el procedi-
miento donde “había intención de tratarlos”, aunque luego sigan una línea terapéutica
alternativa o salgan del programa por cualquier circunstancia.
La definición del origen debe, por tanto, ser clara (sin equívocos) y precisa en relación al
objetivo que se pretenda.
119
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 119
Definición del evento de interés a estudiar
Hemos visto que los estudios de supervivencia consisten en analizar la probabilidad, en
el tiempo, en la que se produce un suceso o evento de interés. Por tanto, una de las
principales consideraciones en el diseño del estudio, es la definición de esta variable.
La definición debe ser rigurosa, es decir, acorde con los criterios científicos sobre el te-
ma. Debe ser sencilla y no sujeta a interpretaciones o equívocos. Las distintas circuns-
tancias posibles deben ser consideradas y hacerse explícitas en la metodología.
Por ejemplo, si analizamos la supervivencia del enfermo después del trasplante renal, el
evento de interés es la muerte. Aparentemente, este acontecimiento es muy claro y no
induce a problemas de ningún tipo. No es sin embargo así para interpretar correctamen-
te los resultados, ya que la variable muerte debe ser definida con mayor precisión.
Debemos dejar claro que hemos incluido (o no) todos los casos de muerte, incluyendo
la que sucede durante el acto quirúrgico del trasplante y la accidental o el suicidio.
También hemos comprobado el exitus, incluyendo como tal, aquel caso trasladado a
otro centro o a su domicilio como terminal.
Por otra parte, hay que objetivar cómo hemos considerado a los pacientes una vez per-
dido el injerto y producida su vuelta al programa de hemodiálisis.
El criterio más extendido como correcto es el que incluye la supervivencia en diálisis
después del trasplante, como periodo de análisis para la misma. Es decir, la muerte de
un paciente trasplantado renal, que sucede un tiempo después de su vuelta al programa
de diálisis por fallo del injerto, se computa como muerte en el estudio de supervivencia
del enfermo trasplantado. Sin embargo, en algunos estudios, una vez que el paciente
vuelve a diálisis, se le considera perdido a la evolución y censurado. Puede entenderse,
por tanto, que los resultados serán muy diferentes según se adopte un criterio u otro.
Asimismo, debe explicitarse qué procedimiento se ha seguido para constatar el evento
muerte en la población que se ha trasladado a unidades de diálisis distintas del centro
trasplantador. En su editorial, Guttman (30) refiere que cuando se pierde el injerto, mu-
chos pacientes se pierden a la evolución, incluso sin que exista constancia de la pérdida
del injerto en el centro trasplantador. Esto sucede en algunos centros de trasplante, es-
pecialmente americanos, donde los enfermos son seguidos en lugares muy distantes al
hospital donde se realizó el trasplante.
En el trasplante renal se ha mostrado la influencia de la definición del evento muerte en la
producción de diferentes resultados de supervivencia del injerto. En la mayoría de los es-
tudios, cuando se produce la muerte del paciente con riñón funcionante, el injerto es con-
120
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 120
siderado, también, como perdido. Sin embargo, esto puede enmascarar a los verdaderos
factores de riesgo que inducen a la pérdida del injerto al enmascararlos con otros que con-
dicionan la muerte del enfermo trasplantado por causas no relacionadas con el trasplante.
Matas y cols., de la Universidad de Minnesota (42), analizaron los factores de riesgo pa-
ra la supervivencia del injerto renal en 2.230 enfermos, utilizando cuatro estrategias di-
ferentes, según la forma de considerar el evento pérdida del injerto cuando se produ-
ce la muerte del enfermo con riñón funcionante. Los resultados muestran que, obvia-
mente, el tiempo medio de supervivencia del injerto es diferente según se adopte una u
otra estrategia, pero también lo son los factores de riesgo que determinan su pérdida.
En el supuesto de que la muerte equivale a pérdida del injerto, son factores de riesgo,
entre otros, la edad (>50 años), la presencia de diabetes y el retrasplante. Sin embargo,
estos tres desaparecen en las otras estrategias de estudio que censura la variable pér-
dida del injerto cuando la muerte (en distintos grados de matiz) se produce con riñón
funcionante. Probablemente, estas tres variables predicen el riesgo de muerte del en-
fermo más que de pérdida del injerto.
Otros autores encuentran que no censurar la muerte con riñón funcionante (28), al estu-
diar la supervivencia del injerto, da lugar a resultados particularmente negativos en los
centros que trasplantan muchos ancianos y enfermos con comorbilidad.
Por eso, en la mayoría de los estudios, los resultados “crudos” obtenidos son ajustados
por los principales factores pronósticos (edad, sexo, etiología, etc.) o las curvas presen-
tadas de ambas formas, es decir, con los casos de exitus con riñón funcionante censu-
rados y no censurados (36-41).
Análisis del proceso de censurado
Previamente, hemos visto que el censurado constituye una de las peculiaridades más
interesantes del análisis de supervivencia, ya que permite utilizar para el estudio, el
tiempo de evolución conocido de los individuos, de los que luego perdemos su evolu-
ción o no sabemos si, en ellos, se produce el evento por cualquier motivo.
La estrategia, seguida en el proceso censurado, constituye un elemento clave en el di-
seño y la interpretación de los estudios de supervivencia. A continuación, resumimos al-
gunos elementos clave a tener en cuenta.
La estrategia de censura debe ser adecuada a los objetivos
Observemos en la Tabla VII la estrategia que se sigue en el registro de la EDTA-ERA (36,
37) con relación al proceso de censurado de las variables que definen los eventos de in-
terés más importantes. Vemos que, cuando se analiza la supervivencia del enfermo en
121
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 121
el tratamiento substitutivo (en su globalidad, independientemente de los procedimien-
tos con los que sea tratado a lo largo de su evolución), el tiempo de observación hasta
el evento muerte, se prolonga a través de todo cambio de procedimiento terapéutico
(hemodiálisis, diálisis peritoneal, trasplante). Además del final del periodo de estudio, la
única situación censurada es la recuperación de la función y la salida del enfermo de diá-
lisis, pues la evolución, en este supuesto, no depende del tratamiento substitutivo.
Por el contrario, en el estudio de supervivencia de los enfermos en tratamiento con al-
guna modalidad de diálisis, además de las situaciones previamente descritas, los enfer-
mos son censurados en la fecha en la que se produce el trasplante pues, evidentemen-
te, se trata de una opción terapéutica diferente. Por tanto, en la población en diálisis só-
lo permanecen, a efectos de supervivencia, los enfermos que nunca son trasplantados.
Es decir, una población sesgada en la que persisten, generalmente, los enfermos de
más edad y comorbilidad. Por eso, las curvas de supervivencia en diálisis muestran
siempre un peor perfil y es difícil saber cuál sería la expectativa de supervivencia si los
enfermos fueran tratados, únicamente, con diálisis. Por tanto, la utilidad de este tipo de
curvas del registro de la EDTA-ERA es realmente muy limitada.
Por el contrario, en su análisis de supervivencia del enfermo, después de un trasplante
renal, los únicos supuestos de censurado son la pérdida en el seguimiento y al final del
122
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Tipo de supervivencia Evento Censurado
TRS (pacientes) Muerte del Recuperación de Función.
enfermo. Pérdida a seguimiento.
Final periodo de estudio.
Diálisis (pacientes) Muerte del Trasplante renal.
enfermo. Recuperación de función.
Pérdida de seguimiento.
Final periodo de estudio.
Primer TR (pacientes) Muerte del Pérdida de seguimiento.
(cadáver o vivo) enfermo. Final periodo de estudio.
Primer TR (injerto) Pérdida del Pérdida de seguimiento.
(cadáver o vivo) injerto.Muerte Final periodo de estudio.
con injerto
funcionante.
TRS = tratamiento renal substitutivo (cualquier modalidad).
TR = trasplante renal.
Tabla VII. Estudio de supervivencia. Registro EDTA-ERA. Evento y censurado
(modificada de ERA-EDTA Registry. www.era-edta-reg.org).
Cap 04 4/10/04 12:48 Página 122
periodo de estudio (los casos que vuelven a diálisis por pérdida de función del injerto no
son censurados). Este tipo de análisis sí es representativo de las probabilidades de su-
pervivencia de estos casos.
En cuanto a la supervivencia del injerto, sólo son censurados en los casos de fin del es-
tudio (con riñón funcionante) o pérdida en la evolución. La muerte con riñón funcionante
es considerada, por el registro de la EDTA-ERA, como pérdida del injerto, es decir, que
no es motivo de censurado.
La práctica actual por la que los enfermos, después de comenzar tratamiento dialítico, en-
tran en lista de espera y reciben un trasplante renal, excepto aquellos en los que se desa-
conseja la realización del mismo por la edad o la morbilidad asociadas, hace muy difícil co-
nocer cuál sería el pronóstico de un enfermo si se tratara de forma aislada con uno sólo de
los procedimientos terapéuticos (hemodiálisis, diálisis peritoneal o trasplante renal).
Las cohortes de enfermos, tratados exclusivamente con sólo uno de los procedimien-
tos, o son muy poco numerosas (enfermos sólo tratados con trasplante) o están sesga-
das con los enfermos de peor pronóstico (enfermos sólo tratados con diálisis) (43, 44).
No obstante, WOLFE y cols. (45), encuentran menor supervivencia de los enfermos tra-
tados sólo con diálisis, cuando la cohorte en estudio la constituían enfermos que ya ha-
bían sido incluidos en lista de espera para trasplante. Sin embargo, a mi juicio, el trabajo
no demuestra la igualdad entre los dos grupos, que no garantiza el hecho de que ambos
estén constituidos por enfermos incluidos en lista de espera.
El proceso de censurado no puede ser informativo
El censurado, en los casos perdidos en la evolución, es una fuente potencial de sesgos si la
pérdida del caso se produce por causas que predeterminen o condicionen el evento de interés.
Por ejemplo, en una determinada unidad que realiza trasplantes en enfermos que viven en
zonas lejanas al hospital, y en el caso de mala evolución, son dados de alta en situación pre-
terminal. Si luego, al desconocer la situación exacta de estos enfermos, se incluyeran co-
mo perdidos en la evolución, se produciría un sesgo, que tendría mayor o menor importan-
cia según el número de casos. Naturalmente, este tipo de problema es difícil que se pro-
duzca en los Centros de Trasplante que mantienen un estrecho contacto con las unidades
de hemodiálisis y con los pacientes.
El número de casos perdidos a la evolución es importante
Si a partir de un momento determinado, el número de enfermos, que no completan el
estudio, es grande, es decir, hay muchos casos perdidos en la evolución, la cohorte pue-
de no ser útil para determinar la probabilidad de que se produzca el evento de interés.
123
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 123
Una pregunta clásica por parte de los médicos, en relación a los análisis de superviven-
cia, es ésta: ¿qué porcentaje de casos perdidos en la evolución podemos permitirnos
para que un estudio sea válido? Aunque para responder a esta cuestión se han referido
algunas aproximaciones para su utilización en la práctica –por ejemplo, la cifra del
30%– ninguna respuesta basada en porcentajes es rigurosa, pues no tiene en cuenta
otros factores, como el número total de enfermos en riesgo o la homogeneidad de la
población.
Como hemos referido en otras ocasiones, el procedimiento matemático para evaluar si
la información producida por el análisis de supervivencia es válida, viene dada por la va-
loración del intervalo de confianza. Al disminuir los enfermos en riesgo, disminuye el
denominador de la ecuación por la que se calcula el error estándar, y por tanto, éste au-
menta y también lo hace el intervalo de confianza. Por ejemplo, la supervivencia del in-
jerto del 65%, en un determinado tiempo de evolución, con un intervalo de confianza
entre el 60% y el 70%, puede constituir una información útil desde el punto de vista clí-
nico, pero no si el intervalo oscila entre el 35% y el 85%.
Por otra parte, como hemos indicado previamente, la desigualdad en el número de ca-
sos, que han completado el estudio entre dos cohortes en comparación, es una fuente
potencial de sesgos. Aunque se han propuesto otras medidas (46), un indicador muy
sencillo para detectarlos es comparar la proporción de individuos perdidos en el segui-
miento. En general, diferencias entre grupos en este indicador señalan una posible
fuente de sesgos.
Por tanto, respecto a este parámetro, la proporción de casos perdidos en cada grupo
debería ser analizado y reflejado, expresamente, en los estudios comparativos de su-
pervivencia.
Pérdidas en la evolución porque el sujeto experimenta un evento
competitivo con el principal de interés
Más complejo es el censurado en aquellos casos en los que el sujeto experimenta un
evento distinto del principal de interés. Por ejemplo, la muerte con injerto funcionante,
¿deben ser considerados estos órganos trasplantados como perdidos o censurados y
como perdidos en la evolución? Como hemos visto anteriormente en el primer su-
puesto, los resultados de supervivencia del injerto serían peores, cuando en realidad la
pérdida del mismo no se ha producido por fracaso inmunológico u otro de los factores
que inciden en la supervivencia del injerto. Si adoptamos la segunda alternativa, la su-
pervivencia del injerto sería mejor, pero estaríamos olvidando una causa de pérdida del
injerto (el que se deriva del exitus aparentemente no relacionado con el trasplante),
que incide en todas las poblaciones y que, sin duda, no puede ser despreciada en un
estudio pronóstico.
124
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 124
La consideración o no de estos casos, como censurados, afectará los resultados del es-
tudio y debe realizarse en base a criterios objetivos, explicitando claramente en la meto-
dología, la opción elegida y su justificación.
No es correcto comparar dos poblaciones de enfermos trasplantados en las que se hu-
bieran seguido criterios diferentes para el censurado, tanto en relación a este punto, co-
mo para cualquier otro.
Tiempo de seguimiento de los individuos
El tiempo de seguimiento debe ser suficiente para que se puedan capturar bastantes
eventos, y por tanto, disponer de un poder adecuado para los test estadísticos. Esto de-
pende, naturalmente, de la enfermedad en estudio. Por ejemplo, un periodo de segui-
miento de cinco años puede ser apropiado para el estudio de supervivencia en muchas
variedades de cáncer. Sin embargo, es una estimación inadecuada para valorar la super-
vivencia de enfermos en el tratamiento substitutivo por IRC.
Como indicador de la longitud del seguimiento se suele usar la mediana del seguimiento
(se llama la atención sobre que la mediana de seguimiento es la mediana de todos los
tiempos, sean hasta el evento o hasta la censura, y que es diferente de la mediana de su-
pervivencia, estimada como se explicó en el apartado Funciones de supervivencia y ries-
go), aunque otros autores prefieren usar la mediana sólo de los tiempos censurados.
Sin embargo, ambos métodos tienden a infraestimar el seguimiento y una medida más ro-
busta es la obtenida a partir del método de Kaplan-Meier inverso (4); es decir, se calcula la
mediana, como se explica en el apartado Funciones de supervivencia y riesgo, a partir de
una curva de Kaplan-Meier en la que el evento es la censura. En la cohorte de enfermos
trasplantados del Ramón y Cajal, para el evento pérdida del injerto, la mediana de segui-
miento fue cinco años y tres meses, la mediana de los tiempos censurados ocho años y un
mes, y la mediana estimada por el método de Kaplan-Meier inverso diez años y dos meses.
Para supervivencia del enfermo en tratamiento sustitutivo de la insuficiencia renal, es
necesario analizar puntos de mortalidad precoz (90 días, un año), y a partir de entonces
es interesante constatar la supervivencia anual y tardía (diez años). Esto es especial-
mente importante para la cohorte de enfermos que han recibido un trasplante renal con
largos periodos de supervivencia del enfermo. No obstante, podemos obtener una in-
formación clínicamente valiosa si se objetivan diferencias significativas entre dos gru-
pos, en la mortalidad precoz (<1 año) o en tiempos intermedios (3 ó 5 años), especial-
mente en las cohortes con factores pronósticos desfavorables. Para la supervivencia
del injerto conviene, igualmente, analizar tiempos precoces (90 días, un año) y, a partir
de entonces, supervivencia anual, siendo aconsejable reclutar una población suficiente
para objetivarla durante un mínimo de cinco años.
125
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 125
126
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
A. ¿ Son válidos los resultados del trabajo?
Preguntas de eliminación
Estudios de pronóstico Estudios de tratamiento
¿Se orienta el estudio a una pregunta claramente definida?
(Una pregunta debe definirse por: a) la población en estudio, b) la intervención realizada y c) los resultados)
¿La metodología de selección de la ¿Fue aleatoria la asignación de los pacientes
cohorte garantiza que es representativa a los tratamientos?
de la población objetivo del estudio? ¿Se mantuvo oculta la secuencia de
aleatorización?
¿Fue el seguimiento del paciente ¿Fueron adecuadamente considerados
suficientemente prolongado hasta el fin del estudio todos
y exhaustivo? los pacientes que entraron en él?
¿El seguimiento fue completo?
(si contesta afirmativamente a estas preguntas merece la pena que continúe con el análisis del artículo
respondiendo a las siguientes cuestiones).
Preguntas de detalle
Variables pronósticas
Estudios de pronóstico Estudios de tratamiento
¿Se han estudiado las variables de ¿Se mantuvieron ciegos al tratamiento
interés clínico con potencial influencia los pacientes, clínicos y personal del
en el pronóstico? estudio?
¿Se objetiva (texto, tablas, etc.) cuál es ¿Se objetiva (texto, tablas etc), la igualdad
la estructura de la cohorte en relación de los grupos terapéuticos en relación a las
a las variables pronósticas más variables demográficas y pronósticas
importantes? más importantes?
Si se estratifica por variables ¿Al margen de la intervención en estudio
pronósticas, ¿se objetiva (texto, tablas, los grupos fueron tratados de igual modo?
etc.) que los subgrupos pronósticos
son iguales en relación al resto de las
variables pronósticas?
¿Se ha estudiado mediante análisis ¿El análisis de los resultados se hace por
multivariante los factores pronósticos? intención de tratar?
Se analiza la evolución del paciente en el
grupo donde fue originariamente asignado
Siga la columna de pronóstico o tratamiento según proceda. Contestar cada pregunta con
SÍ/NO/indeterminado. Realizar un breve comentario, en cada caso, basado en su interpretación del texto.
Tabla VIII. Cuestionario para la lectura crítica de un artículo basado en el
análisis de supervivencia (este material ha sido desarrollado adaptando y
modificando los desarrollados por el grupo CASPe, www.redcaspe.org).
Cap 04 4/10/04 12:48 Página 126
127
CURVAS DE VIDA Y SUPERVIVENCIA
¿Se ha verificado la asunción de riesgo
proporcional de las variables incluidas
en el modelo de Cox?
¿Si se define un modelo con variables
tiempo-dependientes se ha descartado
su dependencia de las fijas o que sean
un epifenómeno del evento?
Preguntas de detalle
Definición del origen, evento de interés y censurado
Estudios de pronóstico Estudios de tratamiento
¿La definición del origen, evento de interés (resultado) y los criterios de censurado
son objetivas y precisas, y se adaptan a los objetivos del estudio?
(No deja fuera a pacientes que podrían tener interés en los resultados objetivo del estudio).
¿Se aplicaron criterios objetivos para la constatación del evento (resultado)?
(Incluyendo las circunstancias en los que se produce fuera de la observación directa de los responsables
del estudio).
Los criterios de censura, ¿hacen improbable que ésta sea informativa?
(Impide que se den casos frecuentes de casos censurados por circunstancias que anuncien o hagan
probable que se produzca el evento (resultado).
El punto de origen, ¿se sitúa en una ¿Los criterios de origen, evento y censurado
fase precoz del comienzo de la son idénticos en todos los grupos
enfermedad o fase de la enfermedad terapéuticos en estudio y en el grupo
que se quiera estudiar? control?
Definición del final del estudio, periodo de observación
Estudios de pronóstico Estudios de tratamiento
¿Cuál es la mediana de seguimiento de la cohorte o los distintos subgrupos?
¿El tiempo de seguimiento es suficiente para reclutar un número de casos adecuado
en los que se produzca el evento (resultado)?
¿Cuál es el porcentaje de casos perdidos a la evolución?, ¿se especifican las causas?
¿Se cuida que no se hayan producido ¿Los tiempos de seguimiento y
en el tiempo cambios en los criterios el porcentaje de casos perdidos a la
de selección, tratamiento, etc. que evolución son similares en los
cambien el pronóstico (efecto cohorte)? distintos grupos en estudio?
Cap 04 4/10/04 12:48 Página 127
128
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
¿Existe un número suficiente de casos
en riesgo en todas las categorías de
pronóstico y en todos los tiempos
considerados?
B. ¿Cuáles son los resultados?
Análisis de supervivencia
Estudios de pronóstico Estudios de tratamiento
¿Cuál es la precisión de la estimación en la probabilidad de supervivencia?
¿Hay constancia de los intervalos de confianza en los puntos más significativos de las curvas de
supervivencia?
¿La disminución de los enfermos y aumento del intervalo de confianza hacen poco
informativa la curva de supervivencia a partir de algún momento informativo?
¿Cuáles son las variables pronósticas ¿Cuál fue el efecto del tratamiento?
que influyen sobre el resultado?
¿Cuál es el peso de estas variables ¿Cuál es la importancia clínica de la
en la determinación del pronóstico? diferencia entre los grupos en estudio?
¿Hubo una validación en un grupo ¿Existe un análisis riguroso de los
independiente de pacientes del efectos secundarios de la medicación
“grupo de derivación”? en estudio?
C. ¿Pueden ayudarnos estos resultados?
Estudios de pronóstico Estudios de tratamiento
¿Los resultados de este estudio de ¿Pueden aplicarse estos resultados
pronóstico pueden ser aplicados en en tu medio?
tu medio? ¿Crees que los pacientes del ensayo son
¿Crees que la cohorte estudiada es semejantes a los tuyos?
semejante a tus pacientes? ¿En qué circunstancias y en qué casos sí
¿En qué circunstancias y en qué serían aplicables a tu medio los resultados
casos sí serían aplicables? del ensayo?
¿Cambia este trabajo en algo tu criterio ¿Se tuvieron en cuenta todos los
acerca de lo que se debe contar a tus resultados de importancia clínica?
pacientes en relación al pronóstico ¿En caso negativo, cómo influye esto
de su enfermedad? en la decisión a tomar?
Los beneficios terapéuticos obtenidos,
¿compensan los riesgos y los costes?
Cap 04 4/10/04 12:48 Página 128
El registro de la EDTA analiza las cohortes agrupadas por quinquenios, teniendo en
cuenta la fecha de inicio del programa terapéutico. En su informe del 2001, se incluye la
cohorte 1992-96, analizando supervivencias a los 90 días, 1, 2 y 5 años, y la 1995-99, en
la que sólo se analiza a los 90 días, 1 y 2 años, tanto para el estudio global de los enfer-
mos, en cualquier modalidad de tratamiento, como para diálisis o trasplante renal. El re-
gistro americano incluye análisis de supervivencia de enfermo e injerto de hasta diez
años.
Otro problema es el que plantea la desigualdad en los periodos de observación entre los
individuos que se incluyen en la cohorte. Es habitual que, en los análisis de superviven-
cia, los sujetos en estudio presenten un distinto tiempo de seguimiento. Por una parte,
habitualmente la observación no comienza en el mismo tiempo para todos los sujetos y,
si el estudio se ha diseñado para que acabe en un tiempo determinado, los casos que
entraron más tarde tienen menos tiempo de observación, y por tanto, menos probabili-
dad de desarrollar el evento. En estos pacientes, con menor tiempo de seguimiento, no
estamos seguros de que el hecho de que no se haya presentado el evento de interés,
se debe a que existe poca probabilidad de que suceda o que el corto tiempo de evolu-
ción impide el que éste sea observado.
Una posible solución al problema planteado, por el desigual tiempo de observación en-
tre los pacientes de la cohorte, es diseñar la fecha de fin del estudio para que acabe
después de que todos los participantes hayan alcanzado un mismo periodo de observa-
ción. Es decir, que acabe para todos en distintas fechas del calendario.
Desgraciadamente, en los estudios a largo plazo esto tampoco suele ser posible. Por
ejemplo, esperar que todos los enfermos trasplantados alcancen cinco años de evolu-
ción puede demorar su análisis hasta hacerlo ineficiente. Por eso, en los análisis de su-
pervivencia, generalmente el número de enfermos expuestos al riesgo casi siempre
disminuye conforme más avanzado está el tiempo. Esto no invalida los resultados, pero
disminuye su precisión.
Por eso, como hemos reiterado a lo largo de este trabajo, para interpretar correctamen-
te la información que proporciona una curva de supervivencia, hay que valorar el núme-
ro de enfermos en riesgo y, sobre todo, el error estándar (y de ahí el intervalo de con-
fianza) de la función de supervivencia del momento temporal que interese considerar.
PROPUESTA DE SISTEMÁTICA PARA LA LECTURA
CRÍTICA DE UN ARTÍCULO BASADO
EN EL ANÁLISIS DE SUPERVIVENCIA
Este trabajo ha pretendido aportar información para una mejor comprensión de los pro-
blemas que tenemos los médicos cuando nos enfrentamos a los problemas metodoló-
129
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 129
gicos del análisis de supervivencia, de tanta importancia para la toma de decisiones en
nuestra profesión y, desde luego, en el mundo de los trasplantes.
Sin embargo, en nuestra experiencia, el procedimiento idóneo para mejorar nuestra des-
treza en estos temas, lo constituye la lectura crítica de trabajos originales que, a nuestro
juicio, debería formar parte de cualquier programa serio de formación continuada.
La práctica de la lectura crítica puede realizarse individualmente. Pero adquiere todo su po-
tencial formativo cuando se realiza en pequeños grupos de profesionales que coinciden
por el interés en una determinada materia, y con la presencia, como facilitador-moderador,
de un profesional experto en metodología. En estos seminarios, la lectura crítica se facilita
por medio de un cuestionario que nos ayude a leer de forma sistemática, el artículo o tra-
bajo de que se trate y a crear las destrezas y los hábitos de hacerlo.
Ésta es la propuesta que hacemos como colofón de nuestro trabajo (Tabla VIII). Para es-
to, hemos diseñado un cuestionario, adaptando y modificando los desarrollados por
CASPe (47, 48). Algunas de las preguntas están tomadas, literalmente, de estos cues-
tionarios, así como la estructura de agrupamiento de las mismas, para responder a tres
cuestiones básicas: ¿son válidos los resultados del trabajo?, ¿cuáles son los resulta-
dos?, ¿pueden aplicarse estos resultados en mi medio?
El cuestionario propuesto puede verse en la Tabla VIII. Las preguntas que se incluyen,
están diseñadas para ayudar a realizar, de forma sistemática, la lectura crítica de un artí-
culo científico que estudie el pronóstico o el tratamiento basados en el análisis de su-
pervivencia.
Sin duda, pueden existir puntos de interés en el artículo concreto que no estén contem-
plados aquí, y así será frecuentemente. Este cuestionario sólo pretende ser una ayuda.
El resto debe ponerlo el lector, mediante el trabajo individual y de grupo. Esto es lo que
hace que el cuestionario mejore con el tiempo, hasta ser realmente útil. Ese sería nues-
tro deseo.
BIBLIOGRAFÍA
1. Pozo F, Ricoy JR, Lázaro P. Una estrategia de investigación en el Sistema Nacional
de Salud: I. La epidemiología clínica. Med Clin (Barc) 1994; 102: 664-9.
2. Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic Research. Principles and
Cuantitative Methods. New York: Van Nostrand Reinhold; 1982.
3. Hosmer DW, Lemeshow S. Applied Survival Analysis: Regression Modeling of Time
to Event Data. New York: John Wiley & Sons; 1999.
4. Clark TG, Bradburn MJ, Love SB, Altman DG. Survival analysis part I: basic concepts
and first analyses. Br J Cancer 2003; 89: 232-8.
130
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 130
5. Pérez de Vargas A, Abraira Santos V. Bioestadística. Madrid: Centro de Estudios
Ramón Areces; 1996.
6. Abraira Santos V, Pérez de Vargas A. Métodos multivariantes en Bioestadística.
Madrid: Centro de Estudios Ramón Areces; 1996.
7. Kleinbaum DG. Survival Analysis: a self-learning text. New York: Splinger-Verlag;
1996.
8. Casariego E, Abraira V, Corredoira JC, Alonso García MP, Rodríguez Feijoo A, López
Álvarez MJ, Varela Otero J, Coira Nieto A, Rabuñal R, Rigueiro MT. A predictive mo-
del for mortality of bloodstream infections. Bedside analysis with the Weibull func-
tion. J Clin Epidemiol 2002; 55: 563-72.
9. Abraira V. Estimación: intervalos de confianza. SEMERGEN 2002; 28: 84-5.
10. Pocock SJ, Clayton TC, Altman DG. Survival plots of time-to-event outcomes in clini-
cal trials: good practice and pitfalls. Lancet 2002; 359: 1686-9.
11. Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part II: multivariate da-
ta analysis—an introduction to concepts and methods. Br J Cancer 2003; 89: 431-6.
12. Harrell FE. Regression Modeling Strategies with Applications to Linear Models,
Logistics Regression, and Survival Analysis. New-York: Springer; 2001.
13. Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part III: multivariate
data analysis — choosing a model and assessing its adequacy and fit. Br J Cancer
2003; 89: 605-11.
14. Peduzzi P, Concato J, Feinstein AR, Holford TR. Importance of events per indepen-
dent variable in proportional hazards regression analysis. II. Accuracy and precision
of regression estimates. J Clin Epidemiol 1995; 48: 1503-10.
15. Silva Ayçaguer LC, Barroso Utra I. Selección algorítmica de modelos en las aplicacio-
nes biomédicas de la regresión múltiple. Med Clin (Barc) 2001; 116: 741-5.
16. Justice AC, Covinsky KE, Berlin JA. Assessing the generalizability of prognostic in-
formation. Ann Intern Med 1999; 130: 515-24.
17. Altman DG, Royston P. What do we mean by validating a prognostic model? Stat
Med 2000; 19: 453-73.
18. Verweij PJM, van Houwelingen HC. Cross-validation in survival analysis. Stat Med
1993; 12: 2305-14.
19. Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Clinical Epidemiology. Boston: Little,
Brown and Co. (2 ed) 1991.
20. Khan IH, Catto GR, Edward N, Fleming LW, Henderson IS, McLeod AM.
Influence of coexisting disease on survival on renal-replacement therapy. Lancet
1993; 341: 415-8.
21. Miskulin DC, Athienites NV, Yan G, Martin A, Ornt DB, Kusek JW, Meyer KB, Levey
AS. Comorbidity assesment using the index of coexistent diseases in a multicenter
clinical trial. Kidney Int 2001; 60: 1498-510.
22. Wolfe RA, Ashby VB, Milford EL, Ojo AO, Ettenger RE, Agodoa LYC, Held PJ, Port
FK. Comparison of mortality in all patients on dialysis awaiting transplantation and
recipients of a first cadaveric transplant. New Eng J Med 1999; 341: 1725-30.
131
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 131
23. Gill JS, Abichandani R, Kausz AT, Pereira BJ. Mortality after kidney transplant fai-
lure: the impact of non-immunologic factors. Kidney International 2002; 62(5):
1875-83.
24. Matas AJ, Gillingham KJ, Sutherland DER. Half-life and risk factors for kidney trans-
plant outcome. Importance of death with function. Transplantation 1993; 55: 757-
61.
25. Tarshish P, Bernstein J, Tobin JN, Edelmann CM. Treatment of mesangiocapillary
glomerulonephritis with alternate-day prednisone, A report of International Study of
Kidney Diseases in Chlidren. Pediatr Nephrol 1992; 6: 120-3.
26. Hariharan S, Jonson CP, Bersnahan BA, Taranto SE, McIntosh MJ, Stablein D.
Improved Graft Survival after Renal Transplantation in the United States 1988 to
1996. New Eng J Med 2000; 342: 605-12.
27. Wing AJ, D’Amaro J, Lamm LU, Selwood N. Evolving methodologies in computeri-
zed European Registries. Kidney International 1983; 24: 507- 15.
28. Gjertson DW, Terasaki PI. The large center variation in half-life of kidney transplanta-
tion. Transplantation 1992; 53: 357-62.
29. Thorogoog J, Houwelingen JC, Persijn GG, Zantvoort FA, Schreuder GM, Van Rood
JJ. Prognostic indices to predict survival of first and second renal allografts.
Transplantation 1991; 831-6.
30. Guttmann RD. The Graft Survival Curve: Ideology and rhetoric. Trasnsplant. Proc
1992; 24: 2407-10.
31. Fernández M, Abraira V, Quereda C, Ortuño J. Curvas de supervivencia y modelos
de regresión: errores y aciertos en la metodología de aplicación. Nefrología 1996;
26: 383-90.
32. Clark TG, Bradburn MJ, Love SB, Altman DG. Survival Analysis. Basic concepts and
first analyses. Br J Cancer 2003; 89: 232-8.
33. Van Manen JG, Korevaar JC, Dekker FW, Boeschoten EW, Bossuyt PM, Krediet RT.
How to adjust for comorbidity in survival studies in ESRD patients: a comparison of
different indices. Am J Kidney Dis. 40(1): 82-8.
34. Charlson M, Szatrowski TP, Petreson P, Gold J. Validation of a Combined
Comorbidity Index. J Clin Epidemiol 1994; 47: 1245-51.
35. Hammelgan BR, Manns BJ, Quan H, Ghali WA. Adapting the Charlson Comorbidity
index for use in patients with ESRD. Am J Kidney Dis 2003; 42: 125-32.
36. Van Dick PCW, Jager KJ, de Charro F, Collart R, Cornet FW, Dekker W, Grönhagen-
Riska, Kramar R, Leivestad T, Simpson K, Briggs JD. Renal replacement therapy in
Europe: the results of a colaborative effort by the ERA-EDTA registry and six natio-
nal or regional registries. Nephrol Dial Trasplant 2001; 16: 1120-30.
37. ERA-EDTA Registry. www.era-edta-reg.org
38. Researcher´s Guide. www//usrds.org/research.htm
39. Mc Donald SP, Russ GR, Kerr PG, Collins JF. ESRD in Australia and New Zealand at
the end of Milenium: a report from ANZDATA registry. Am J Kidney Dis 2002; 40:
1122-31.
132
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 04 4/10/04 12:48 Página 132
40. Anzdata Annual Reports. www.anzdata.org.au/anzdata/AnzdataReport
41. Wolfe RA, Strawderman RL. Logical and Statistical Fallacies in the Use of Cox
Regression Models. Am J Kidney Dis 1996; 27: 124-9.
42. Matas AJ, Gillingham KJ, Sutherland DER. Half-life and risk factors for kidney trans-
plant outcome. Importance of death with function. Transplantation 1993; 55: 757-60.
43. Hutchinson TA, Thomas DC, Lemieux JC, Harvey CE. Prognostically controlled com-
parison of dialysis and renal transplantation. Kidney International 1984; 26: 44-51.
44. Port FK, Wolfe RA, Mauger EA, Berling DP, Jiang K. Comparison of survival probabi-
lities for dialysis patients vs. cadaveric transplantation. JAMA 1993; 270: 1339-43.
45. Wolfe RA, Ashby VB, Milford EL, Ojo AO, Ettenger RE, Aggoda LYC, Held PJ, Port
FK. Comparison of mortality in all patients on dialysis awaiting transplantation and
recipients of a first cadaveric trasplant. New E J Med 1999; 341: 1725-30.
46. Clark TG, Altman DG, De Stavola BL. Quantification of the completeness of follow-
up. Lancet 2002; 359: 1309-10.
47. CASP España (CASPe). www.redcaspe.org
48. Lupacis A, Wells G, Richardson WS, Tugwell P. User´s Guides to the medical litera-
ture; how to use an article about prognosis. JAMA 1994; 272: 234-7.
133
CURVAS DE VIDA Y SUPERVIVENCIA
Cap 04 4/10/04 12:48 Página 133
149
DE LAS BASES DE DATOS
A LOS PROGRAMAS
ESTADÍSTICOS
J. C. Ruiz San Millán
INTRODUCCIÓN
La realización de un trabajo de investigación de cualquier tipo consiste en la resolución
de una cuestión, planteada a priori (hipótesis nula), en base al análisis exhaustivo de la
información pertinente, información que deberá ser recogida, estructurada y analizada
de manera correcta.
Esto significa que uno de los primeros pasos necesarios en el proceso de investigación,
será la definición de cuál es la información necesaria que se debe recoger para la resolu-
ción, de forma fiable, de la cuestión o cuestiones que se pretendan resolver. Un diseño
incorrecto de esta fase puede hacer que se planteen problemas difíciles de resolver a
posteriori, que retrasen o incluso invaliden todo el proceso. El tiempo invertido en las fa-
ses iniciales del diseño de un estudio es, por tanto, crucial para el éxito del mismo.
Hoy en día, es habitual que cualquier Unidad de Trasplante tenga un cierto nivel de infor-
matización en su actividad asistencial diaria, nivel que raramente llega al 100% pero que,
en algunas unidades, cubre ya una parte considerable de la actividad. Esto supone que ya
existe una base de datos, a veces con gran cantidad de información, que será la fuente
inicial para la obtención de los datos que vamos a utilizar en el proceso de investigación.
Es decir, cuando nos planteamos un trabajo de investigación, tendremos que partir de ce-
ro (es decir, diseñar una base de datos específica para el trabajo e introducir los datos a
mano desde el principio) si no existe una aplicación que funcione rutinariamente y en la
que se vayan introduciendo datos día a día, y en cambio, en este último caso podremos
exportar datos de esta aplicación a nuestra base de datos específica, para nuestro tra-
bajo, lo que nos ahorrará probablemente una considerable cantidad de tiempo.
Cap 06 4/10/04 12:50 Página 149
150
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Es de considerable importancia tener en cuenta esta posibilidad, la de realizar trabajos
de investigación, cuando se diseña la informatización de una unidad de trasplantes
(o de cualquier otra) para que, en el futuro, sea posible un análisis óptimo de la informa-
ción almacenada. Es decir, al diseñar una aplicación para la gestión de una unidad de
trasplantes, se debe pensar tanto en su utilidad para la actividad asistencial diaria (crea-
ción de informes, listados de pacientes, etc.), como en su utilidad para la realización de
trabajos de investigación, es decir, para el análisis de los datos. Así, un buen diseño evi-
tará quebraderos de cabeza en el futuro.
Para hacer una mejor descripción del manejo de una base de datos y del proceso de
transferencia de datos a un paquete estadístico, utilizaremos un gestor de bases de da-
tos concreto, el MS Access en su versión 2000 y un paquete estadístico, el SPSS en su
versión 8.0. Estas dos aplicaciones son probablemente las más utilizadas en su campo
en el entorno médico, y por ello, son las más adecuadas para utilizar de ejemplo. En mu-
chas ocasiones los métodos descritos con ellas serán fácilmente extrapolables a otras
aplicaciones semejantes, dado que la mayoría utilizan herramientas y sistemas de trans-
ferencia de información entre aplicaciones semejantes.
GESTORES DE BASES DE DATOS
Un gestor de bases de datos es un programa informático que permite crear y manejar
bases de datos. Una base de datos es una aplicación creada por un gestor de bases de
datos que permite almacenar dichos datos. En nuestro caso, un gestor de bases de da-
tos es MS Access y una base de datos es una aplicación que nosotros creamos con MS
Access, a la que daremos un nombre, por ejemplo “TrasplantesRenales”. En el caso de
MS Access, las bases de datos son archivos con la extensión *.mdb, por tanto, nuestra
base de datos se llamaría “TrasplantesRenales.mdb” (Figura 1). Existen otros gestores
de bases de datos de uso personal, como FoxPro (de Microsoft también), Paradox (de
Borland), dBase (de Borland también) o Filemaker (de Apple), aunque el más utilizado en
la actualidad es MS Access.
Para poder trabajar con una base de datos deberemos primero instalar el gestor de ba-
ses de datos (MS Access), que habitualmente viene incluido en el paquete de ofimática
MS Office. Posteriormente, ejecutando MS Access, podremos crear una base de datos
(el contenedor de los datos) y, dentro de ella, la estructura de tablas en las que irán alo-
jándose los datos. Es importante tener en cuenta la versión de MS Access con la que ha
sido creada una base de datos, porque ésta no podrá ser abierta por una versión anterior
de MS Access. Sin embargo, MS Access 2000 permite guardar una base de datos, crea-
da con esta versión, en el formato de una versión anterior, para que pueda ser ejecutada
con ella (en la ventana de Base de Datos en Access 2000 hacer clic en el menú superior
en Herramientas – Utilidades de la base de datos – Convertir base de datos – A una ver-
sión anterior de la base de datos de Access...).
Cap 06 4/10/04 12:50 Página 150
En ocasiones podremos trabajar con una aplicación desarrollada con MS Access por ter-
ceros, pero que funciona sin, aparentemente, haber instalado previamente el gestor MS
Access en el ordenador. Esto es posible porque existe una versión de MS Access para
distribución de aplicaciones ya desarrolladas que se denomina MS Access Run-Time. En
estos casos, recibiríamos una serie de disquetes o un CD en los que estarían incluidos la
base de datos y todos los archivos necesarios para su ejecución (el Access Run-Time)
que, con un programa de instalación creado al efecto, nos instalaría todo en el ordena-
dor. Esto permite abrir la base de datos, visualizar y modificar los datos, pero no nos per-
mitiría modificar la estructura de la base de datos, ni por supuesto crear una nueva. Para
esto, debemos tener instalada la versión completa de MS Access.
Gestores de bases de datos relacionales
Las bases de datos relacionales se llaman así porque los datos no se almacenan en una
única tabla o lista de casos (registros), como es el caso de las hojas de cálculo (que se
151
DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS
Figura 1. En esta figura se muestra el gestor de bases de datos Microsoft Access (la
ventana principal) y, en su interior, la base de datos creada que se llama Tras-
plantesRenales, aún sin tablas en su interior. Una vez creada la base de datos, será
necesario ir creando las diferentes tablas para almacenar los datos en su interior.
Cap 06 4/10/04 12:50 Página 151
podrían considerar como una base de datos plana), sino que se guardan en múltiples ta-
blas en función de los datos que queremos guardar y, después, se unen unas tablas con
otras por medio de uno o varios campos. Esto tiene la ventaja de que no se repiten los
datos, lo que supone que se trabaja menos, se ocupa menos espacio en la base de da-
tos y existe menos riesgo de inconsistencia de los datos (es decir, que el mismo dato,
por ejemplo el nombre de un paciente, introducido en dos sitios diferentes, es distinto,
con la dificultad que esto implica a la hora de localizar todos los datos de ese paciente)
(Figura 2). Esto se entiende bien con el siguiente ejemplo: si tenemos que guardar las
determinaciones analíticas de los pacientes, lo correcto es crear una tabla llamada
Pacientes (con aquellos datos del paciente que son siempre los mismos, como el nom-
bre, la fecha de nacimiento, el número de historia, la dirección, etc.) y una segunda tabla
con las determinaciones analíticas (llamada, por ejemplo, Bioquímica y que incluya los
campos Glucosa, Urea, Creatinina, etc.). En esta segunda tabla tendremos que crear un
campo que sirva de enlace con la tabla Pacientes para identificar a qué paciente corres-
ponden esos análisis. Este campo puede ser el número de historia, el DNI, el número
de tarjeta sanitaria u otro que identifique unívocamente al paciente (no es correcto utili-
zar el nombre y/o los apellidos porque estos pueden tener más variabilidad). De esta for-
ma, introduciremos una sola vez los datos del paciente en esta tabla y, después, creare-
mos tantos registros como necesitemos en la otra tabla (Bioquímica) de forma que el
campo de enlace sirva para localizar el resto de los datos del paciente en la tabla
Pacientes y mostrarlos sin tener que volver a introducirlos (Figura 3).
152
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 2. En este caso se ha creado una tabla para introducir los datos de los pa-
cientes y la bioquímica juntos. El nombre del mismo paciente ha tenido que ser te-
cleado cuatro veces y no siempre de la misma forma (aunque todas sean correc-
tas) con la dificultad que esto implica al intentar localizar todos los registros de ese
paciente.
Cap 06 4/10/04 12:50 Página 152
Gestores de bases de datos profesionales
Cuando se ha llevado a cabo un proceso de informatización en la Unidad de Trasplantes
o en el Servicio de Nefrología o a nivel hospitalario, es frecuente que los datos estén al-
macenados en una aplicación soportada por unos gestores de bases de datos a los que
llamamos profesionales, como pueden ser SQL Server, Oracle, Informix, etc., de admi-
nistración más compleja. En estos casos, el acceso a los datos “en bruto” suele estar
más restringido y, en general, administrado por el Servicio de Informática del hospital o,
al menos, por personal más especializado.
153
DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS
Figura 3. En esta imagen se aprecia cómo hemos creado dos tablas, una para guar-
dar los datos de los pacientes y otra para las bioquímicas. Posteriormente, hemos
creado una relación entre ambas tablas, utilizando el DNI como campo de enlace
(es el único dato que hay que introducir de forma repetida). Esta relación nos per-
mite, además, garantizar la integridad de los datos entre ambas tablas (integridad
referencial). Esto supone que no se puede crear un registro en la tabla Bioquímica
si no hay uno relacionado en la tabla Pacientes, y que no se puede borrar un regis-
tro en la tabla Pacientes si tiene registros relacionados en la tabla Bioquímica (ya
que quedarían huérfanos).
Cap 06 4/10/04 12:50 Página 153
En estos casos, deberíamos solicitar que nos exportaran los datos que necesitamos en
un formato más manejable, como por ejemplo, en una hoja de cálculo de Excel (si son
datos sencillos) o en una base de datos de Access (si son datos procedentes de varias
tablas), a partir de la que nosotros ya podremos trabajar. Deberíamos hacer un listado
de los datos que queremos recuperar, para que la persona responsable de la base de
datos realice la exportación de la o las tablas (o de los campos de las tablas) que necesi-
temos. Una vez que tengamos esto, trabajaremos ya con nuestra propia base de datos,
sobre la que añadiremos más datos y, finalmente, realizaremos la exportación al paque-
te estadístico para el análisis final.
TRABAJAR CON ACCESS
Como hemos dicho, MS Access es una base de datos relacional convencional de uso
personal (o de usuario final), similar a la mayoría de los gestores de bases de datos de
uso personal que existen hoy en día, aunque hay que reconocer que las últimas versio-
nes, aparecidas en los últimos años, incluyen tal cantidad de funcionalidades y tal nivel
de potencia que, realmente, las convierten en gestores muy sofisticados, capaces de
soportar bases de datos de gran volumen, hasta con cientos de miles e incluso millones
de registros en una tabla.
El objetivo, como ya hemos dicho, a la hora de realizar un trabajo de investigación, será
la estructuración de todos los datos que vayamos a necesitar para solucionar el proble-
ma que nos plantea nuestro proyecto. Lo habitual es que hayamos conseguido capturar
una parte de los datos de la aplicación de trabajo habitual de la Unidad o del hospital, pe-
ro muy raramente conseguiremos el 100% de los datos necesarios. En un segundo pa-
so, tendremos que evaluar qué datos nos faltan y añadir a nuestra base de datos los
campos o las tablas que hagan falta para añadir estos datos, en general, a mano.
Nuestra base de datos puede ser de pequeño tamaño, quizás con una única tabla conte-
niendo unas cuantas decenas de registros, o puede tener un tamaño considerable, con
gran número de tablas de gran tamaño, con miles de registros. En el primer caso, será
sencillo transferir estos datos a SPSS para el análisis estadístico pero, en el segundo,
tendremos que trabajar algo más una vez introducidos todos los datos, antes de transfe-
rirlos al programa de análisis estadístico. En este segundo caso, es probable que nos in-
terese hacer selecciones parciales de los datos contenidos en nuestra base de datos, pa-
ra ir exportándolos en partes al SPSS e ir haciendo los análisis que consideremos.
Para este proceso utilizaremos las consultas de MS Access. Esta es una herramienta
de gran potencia que permite, de forma extremadamente sencilla, seleccionar datos
(consultar) de entre los contenidos en una o varias de las tablas de la base de datos y
obtener una vista de los mismos que podremos guardar, imprimir, exportar, copiar, etc.
Permite aplicar multitud de condiciones del tipo “entre esta fecha y esta otra”, “los ca-
154
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 06 4/10/04 12:50 Página 154
sos con este campo mayor que este valor”, etc., bien de forma sumatoria (y) o de forma
excluyente (o). Para realizar una consulta hay que ir al menú principal de la base de da-
tos que está a la izquierda en la ventana y hacer clic en Consultas, debajo de Tablas, y
después hacer clic en Crear una consulta en vista diseño, a la derecha. Nos aparecerá
una ventana con todas las tablas de la base de datos para que seleccionemos las tablas
que queremos incluir en la consulta, las cuales se irán colocando en la parte superior de
la consulta. Posteriormente, podremos ir construyendo la consulta, seleccionando los
campos de cada tabla que queremos que aparezcan en la misma (haciendo doble clic en
cada campo se irán colocando en la parte inferior de la consulta). Finalmente, podremos
añadir los criterios (condiciones) en cada campo, si es que queremos introducir alguno,
y el orden de aparición de los registros (Figura 4). De esta forma, obtenemos vistas par-
ciales sobre la totalidad de nuestros datos que nos pueden ayudar considerablemente
en la evaluación y el manejo de los mismos.
155
DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS
Figura 4. Hemos creado una consulta de selección utilizando datos de las tablas
Pacientes y Bioquímica. De la primera tabla hemos seleccionado los campos
Nombre, PrimerApe y SegundoApe y de la segunda tabla el campo Creatinina, y
hemos puesto la condición de que nos muestre únicamente los registros en los
que ésta sea mayor de 1,5 mg/dL. Al ejecutar la consulta, obtendremos un listado
con los casos seleccionados, que aparecerán seleccionados por orden alfabético
del primer apellido y después del segundo.
Cap 06 4/10/04 12:50 Página 155
156
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Análisis de datos con MS Access
En muchas ocasiones se pueden realizar estudios estadísticos básicos con MS Access
sin necesidad de exportar los datos a un paquete estadístico, lo cual simplifica el proce-
so. Esto es posible utilizando las consultas de Access. Esto tiene la ventaja adicional de
que, una vez realizada una consulta en MS Access (y guardada) que nos devuelva un re-
sultado con parámetros estadísticos, siempre que se ejecute dicha consulta, estará ana-
lizando los datos directamente de la base de datos y, por tanto, cuando añadamos o mo-
difiquemos datos, los resultados estarán siempre actualizados.
Para realizar este tipo de análisis se utilizan un tipo especial de consultas, que se deno-
minan consultas de agrupamiento. En estas consultas se realiza un análisis de los datos
seleccionados agrupándolos según una serie de órdenes sencillas. Una vez creada una
consulta de selección, como explicábamos en el apartado anterior, podemos convertirla
en una consulta de agrupamiento, seleccionando la opción adecuada en el menú supe-
rior (Ver – Totales) o bien, haciendo clic en el botón Totales en la barra de botones, re-
presentado por el símbolo Σ (sigma). Esto añade una nueva opción en la parte inferior
de la vista de diseño de la consulta, denominada Total, y que nos permite realizar una
serie de funciones nuevas entre las que están el cálculo de promedios, la desviación es-
tándar, el máximo y el mínimo, la cuenta de registros y otros que añaden una funcionali-
dad considerable a Access, sin tener que transferir los datos a SPSS.
Transferencia de datos de MS Access a SPSS
Existen varias formas de transferir los datos que queremos analizar a la aplicación de
análisis estadístico que vamos a utilizar. La más sencilla consiste en copiar todos los da-
tos, desde una vista de los mismos, en la base de datos, y pegarlos en la hoja de datos
de SPSS. Este es el sistema más sencillo y quizás el adecuado para una pequeña canti-
dad de datos. Consiste en abrir una hoja de datos de Access, ya sea una tabla o una
consulta, y seleccionar los registros (filas) que queremos copiar. Si queremos copiar to-
dos los registros iremos al menú Edición y haremos clic en la opción Seleccionar todos
los registros para, posteriormente, en el mismo menú (Edición) hacer clic en Copiar
(Figura 5). Ya tendremos los datos copiados para después ir a SPSS y pegarlos. Para es-
ta segunda parte ejecutaremos SPSS, con lo que nos aparecerá la ventana de edición
de datos (SPSS Data Editor) con una hoja de datos vacía. Colocando el ratón sobre la pri-
mera celda (superior izquierda) y haciendo clic en el botón derecho del mismo, seleccio-
naremos la opción Pegar con lo que nos pegará todos los datos que habíamos copiado
en el mismo orden en el que estaban en la hoja de datos de Access. Sin embargo, este
sencillo método tiene algunos problemas que hay que conocer:
• Los nombres de los campos no son los originales, sino que SPSS llama a los mis-
mos de forma estándar como var00001, var00002, var00003, y así sucesivamente.
Cap 06 4/10/04 12:50 Página 156
Estos nombres se pueden cambiar por los originales, pero habrá que hacerlo a ma-
no, uno a uno (colocando el ratón sobre el nombre de un campo y haciendo clic en
el botón derecho y seleccionando la opción Define Variable).
• La primera fila de las copiadas aparecerá vacía y, realmente, los datos de nuestro pri-
mer registro en Access aparecerán en la segunda fila en SPSS. La primera fila se
deberá eliminar (seleccionando la primera fila, haciendo clic con el botón derecho
del ratón en el botón de la izquierda donde pone 1 y seleccionando Cut).
• Finalmente, los campos de texto (no numéricos) de Access aparecerán vacíos pues,
por defecto, SPSS crea campos numéricos. Para evitar esto, antes de proceder a pe-
gar los datos, habría que redefinir, en SPSS, las variables que vayan a recibir datos de
tipo texto. Para ello, haciendo clic en el título de una variable con el botón derecho
del ratón y seleccionando Define Variable, procederíamos a cambiar el tipo de varia-
ble (Change Settings – Type), cambiando la opción Numeric por String (Figuras 6 y 7).
Una segunda forma de transferir los datos es su exportación a un formato de datos fá-
cilmente reconocible por SPSS, como puede ser Excel (*.xls) o dBase (*.dbf). En este
caso, en Access procederemos a abrir la hoja de datos y, posteriormente, haremos clic
en el menú superior Archivo y Exportar. Aparecerá un cuadro de diálogo en el que espe-
157
DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS
Figura 5. Para copiar los datos de una tabla o consulta en Access abra la hoja de
datos correspondiente, haga clic en el menú Edición y después en Seleccionar to-
dos los registros. Aparecerán todos seleccionados (en negro) y después, de nuevo
en Edición, haga clic en Copiar.
Cap 06 4/10/04 12:50 Página 157
cificaremos el nombre del archivo en el que se exportarán los datos, el formato de ex-
portación (dBase, Excel, etc.) y el directorio en el que queremos guardar el archivo (es
importante fijarse en este directorio para después recuperar el archivo desde SPSS). De
esta forma, una vez exportados los datos, se creará un archivo en el disco duro con la
extensión correspondiente. Finalmente, desde SPSS será sencillo abrir dicho archivo,
cuyo contenido con todos los datos aparecerá en la ventana de datos de SPSS. Para es-
to, una vez abierta la aplicación y en la ventana de edición de datos de SPSS, iremos al
menú Archivo (File) – Abrir (Open). Aparece de nuevo una ventana de diálogo en la que
seleccionaremos el directorio en el que está el archivo y, haciendo doble clic en éste, se
procederá a la importación de los datos. En este caso, aparecerán los nombres de los
campos como en Access y no será preciso redefinir ninguna de las variables.
Por último, existe una tercera forma de transferir datos desde Access a SPSS de forma
directa, que es utilizando el controlador ODBC adecuado (acrónimo de Object Data Base
Conectivity), que ahora explicaremos. Este es un sistema que permite la transferencia
de datos entre diferentes entornos. Es una especie de subprograma que actúa de “tra-
ductor de datos” y que permite la comunicación entre dos entornos diferentes, en nues-
158
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 6. Aquí se aprecia cómo aparecen los datos pegados desde SPSS. Las varia-
bles no tienen los nombres originales, deberemos cambiarlos para reconocerlas
mejor. La primera fila deberá ser eliminada, las tres primeras variables deberían
ser redefinidas como variables de texto (String) para que acepten datos de este ti-
po y la cuarta como variable de fecha (Date), y después volver a copiar todos los
datos de nuevo. Ver instrucciones en el texto. El resultado de estos cambios se
aprecia en la Figura 7.
Cap 06 4/10/04 12:50 Página 158
tro caso entre Access y SPSS. El ODBC es una función que se instala en Windows con
múltiples aplicaciones, entre ellas SPSS, y una vez instalado, tiene la funcionalidad que
estamos describiendo, manteniéndose aunque se desinstale la aplicación con la que se
instaló. En este caso, no tendremos que exportar los datos de Access, ni copiarlos, sino
que directamente, desde SPSS, procederemos a capturarlos de Access directamente.
Para realizar este proceso, abriremos SPSS y, una vez en la pantalla del editor de datos,
haremos clic en File – Database capture – New Query. Nos aparecerá un asistente que
nos guiará en el proceso de la captura de los datos (Figura 8).
En esta ventana, mostrada en la Figura 8, tendremos que crear un origen de datos (ha-
ciendo clic en el botón Add Data Source), que son las especificaciones que le indicarán
a SPSS cuál es la base de datos a la que vamos a acceder para capturar los mismos, en
qué formato está (Access o de otro tipo) y el directorio en el que reside. También podre-
mos especificar una contraseña, en caso de que sea necesaria, para acceder a la base
de datos. Una vez creado este origen de datos (Data Source), quedará grabado en el or-
denador indefinidamente, de forma que, si hay que volver a capturar datos de esa base
de datos, no será preciso definir el origen de los mismos. Es más, esta definición nos
podrá servir igual si pretendemos acceder a esa base de datos desde otra aplicación di-
ferente de SPSS, que utilice también ODBC (un estándar hoy en día).
159
DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS
Figura 7. Resultado de copiar los datos tras las transformaciones especificadas en
el texto (Figura 6). Los nombres de algunos campos ha sido preciso reducirlos da-
do que SPSS acepta un máximo de ocho caracteres en el nombre de estos, aunque
aún se reconocen sin problemas.
Cap 06 4/10/04 12:50 Página 159
160
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Figura 8. Este es el asistente que nos guiará en el proceso de captura de los datos
de Access para su inclusión en la hoja de edición de datos de SPSS.
Figura 9. En esta ventana aparecen los datos de configuración del origen de datos
que estamos definiendo para capturar los datos de la base de datos de Access de-
nominada TrasplantesRenales.mdb, que creamos previamente como ejemplo.
Cap 06 4/10/04 12:50 Página 160
Por tanto, para crear el origen de datos haremos clic en el botón Add Data Source. Nos
aparecerá una ventada denominada ODBC Data Source Administrador. Seleccio-
naremos la opción User DSN y después haremos clic en el botón Add..., para añadir el
nuevo origen de datos. En la siguiente ventana nos pide que elijamos el driver adecua-
do, en nuestro caso el Driver de Microsoft Access (puede aparecer en diferentes idio-
mas, en principio esto no es importante), aunque podríamos elegir otro para acceder a
161
DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS
1. Si participa en el diseño de una base de datos, para informatizar el trasplante,
piense siempre en el análisis de los datos a la hora de estructurar la información.
2. A la hora de plantear un trabajo de investigación haga un análisis lo más detallado
posible de la información que necesitará. Si lo hace bien le ahorrará mucho trabajo
posteriormente.
3. Cree una base de datos e importe todos los datos que ya estén almacenados en
otras bases de datos de la unidad que le puedan ser de utilidad.
4. Estructure la base de datos en tablas y cree relaciones entre ellas.
5. No introduzca espacios en los nombres de los campos y, a ser posible, no pase de
8 caracteres. Al exportar a SPSS esta aplicación sólo reconoce los 8 primeros
caracteres del nombre del campo y, si es más largo, lo truncará.
6. Intente evitar los campos de texto libre, estos serán muy difícilmente analizables al
final. Tendrá que hacer el esfuerzo de crear categorías y encajar los casos en un
número limitado de éstas para poder analizarlas estadísticamente.
7. Introduzca todos los datos que necesite. Puede definir listas desplegables en los
campos de las tablas para elegir directamente las opciones y no tener que
teclearlas. Esto le ahorrará trabajo y reducirá el riesgo de errores.
8. Depure los datos. Busque los valores extremos de cada campo, realizando
consultas y ordenando de forma ascendente o descendente. En muchas ocasiones
se pueden detectar errores en la introducción de los datos que pueden dar
resultados estadísticos erróneos.
9. Puede utilizar reglas de validación en Access para intentar evitar introducir datos
erróneos que se alejen mucho de lo habitual (por ejemplo, la creatinina en sangre
debería estar entre 0,5 y 20 mg/dL; un valor de 200 es un error seguro).
10. Cuando haya finalizado la introducción de los datos, haga la exportación al paquete
estadístico para el análisis final de los datos.
11. Si hay que añadir o modificar datos, después de la exportación a SPSS, siempre es
preferible hacerlo sobre la base de datos de Access y repetir la exportación tantas
veces como haga falta. Es más seguro mantener los datos fuente actualizados en
Access.
Tabla I. Recuerde las normas básicas que le servirán para evitar problemas
posteriores y facilitar el trabajo.
Cap 06 4/10/04 12:50 Página 161
una base de datos en otro formato de la misma manera (dBase, etc.). Después, hare-
mos clic en Finalizar y nos aparecerá una ventana nueva en la que tendremos que espe-
cificar Data Source Name (un nombre elegido por nosotros) y, oprimiendo el botón
Select, aparecerá un cuadro de diálogo en el que elegiremos la base de datos en cues-
tión en su directorio (Figura 9). Una vez seleccionada la base de datos, haremos clic en
OK dos veces y volveremos a la ventana del asistente de captura de datos (Database
Capture Wizard), donde ya nos aparecerá el origen de datos que hemos creado con el
nombre que le dimos.
Posteriormente, haremos clic en Siguiente y nos aparecerán, en una ventana, las tablas
y consultas de la base de datos con la que queremos trabajar y podremos elegir la tabla
o tablas (o consultas) que queremos abrir en SPSS, para lo que arrastraremos la tabla a
la casilla del lado derecho con el ratón. Al soltar, nos aparecerán los campos de dicha ta-
bla y, haciendo clic en Finalizar, se traspasarán a la hoja de edición de datos del SPSS,
pasando a estar disponibles para comenzar el análisis estadístico.
A modo de compendio, a continuación exponemos en la Tabla I una relación de normas
básicas que hemos podido ver en amplitud a lo largo del capítulo.
162
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 06 4/10/04 12:50 Página 162
163
RESULTADOS DEL TRASPLANTE
RENAL: ENSAYOS CLÍNICOS
Y REGISTROS
J. Pascual, D. Hernández
ENSAYOS CLÍNICOS
Concepto general y objetivos de un ensayo clínico.
Nivel de evidencia
El ensayo clínico (EC) es un estudio experimental planificado y prospectivo en el que se
realiza una intervención que modifica el curso normal de los acontecimientos. A pesar
de que la metodología de los EC es aplicable a diferentes intervenciones, es la realiza-
ción de EC con medicamentos la que se encuentra más desarrollada y sometida a me-
canismos de regulación más establecidos. El EC con medicamentos se realiza tanto en
sujetos sanos como en pacientes para evaluar la eficacia y la seguridad de uno o varios
procedimientos terapéuticos, profilácticos o diagnósticos. La definición legal de EC con
medicamentos está reflejada en el artículo 59 de la Ley 25/1990 del Medicamento y en
el artículo 2 del Real Decreto 56/1993 sobre EC con medicamentos (Tabla I).
Es imprescindible definir, inicialmente, el objetivo u objetivos del EC que se plantea por-
que ellos determinarán, en gran medida, el diseño más adecuado para alcanzar conclu-
siones válidas. Los objetivos principal y secundarios del EC definen la razón que justifica
su realización. El objetivo principal debería ser único y responder a la pregunta más rele-
vante, y condicionará la elección de la variable principal y el cálculo del tamaño de la
muestra. Una vez definido el objetivo u objetivos del EC, éste se desarrolla siguiendo un
esquema básico que incluye, entre otros, la identificación de una muestra de sujetos a
partir de una población, la asignación de los sujetos a uno u otro grupo de intervención,
Cap 07 4/10/04 12:51 Página 163
164
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
la aplicación de las intervenciones objeto de estudio y la medida de los resultados. En
cualquiera de estos niveles existe la posibilidad de introducir sesgos o errores sistemáti-
cos que pueden dificultar la interpretación del investigador sobre la eficacia de las dife-
rentes intervenciones. De todos estos aspectos nos ocuparemos posteriormente.
La medicina basada en la evidencia (MBE) nos permite analizar las mejores aportaciones
científicas procedentes de estudios contrastados y relevantes, con el fin de obtener los
mejores resultados en el diagnóstico y tratamiento de las enfermedades. La MBE nos per-
mite optimizar la práctica clínica mediante la aplicación de argumentos científicos consoli-
dados. A partir de la calidad científica de los distintos estudios científicos, se han estableci-
do escalas de jerarquía lideradas por los meta-análisis y los EC (Tabla II). Con esta referen-
cia, se han elaborado Guías de Práctica Clínica que contemplan niveles decrecientes de
evidencia en función de la relevancia científica de dichos trabajos (Tabla III). Simplificando,
un nivel de evidencia A, B o C tendría como sustrato un meta-análisis (o en su defecto un
EC controlado), un EC no controlado o un estudio observacional, respectivamente.
Artículo 2. Definición de ensayo clínico con medicamentos
1. De acuerdo con el artículo 59 de la Ley 25/1990 del Medicamento, se considera
ensayo clínico toda evaluación experimental de una sustancia o medicamento, a
través de su aplicación a seres humanos, orientada hacia alguno de los siguientes
fines:
a. Poner de manifiesto sus efectos farmacodinámicos o recoger datos referentes a
su absorción, distribución, metabolismo y excreción en el organismo humano.
b. Establecer su eficacia para una indicación terapéutica, profiláctica o diagnóstica
determinada.
c. Conocer el perfil de sus reacciones adversas y establecer su seguridad.
2. Se considerará siempre evaluación experimental aquel estudio en el que los sujetos
sean asignados a uno u otro grupo de intervención terapéutica de forma aleatoria, o
bien se condicione, directa o indirectamente, el proceso de prescripción médica
habitual.
3. Se considerará siempre evaluación experimental aquel estudio en que se utilice una
sustancia no autorizada como especialidad farmacéutica o bien se utilice una
especialidad farmacéutica en condiciones de uso distinto de las autorizadas.
4. No se considera ensayo clínico la administración de la sustancia o medicamento a
un solo paciente en el ámbito de la práctica médica habitual con el único propósito
de conseguir un beneficio para el mismo, de acuerdo con lo previsto en el artículo
23 de este Real Decreto referente al uso compasivo de medicamentos. La práctica
médica y la libertad profesional de prescripción del médico no ampararán, en ningún
caso, ensayos clínicos no autorizados, ni la utilización de remedios secretos o no
declarados a la autoridad sanitaria.
Tabla I. Definición legal de ensayo clínico con medicamentos (Real Decreto 561/1993).
Cap 07 4/10/04 12:51 Página 164
Clasificación de los EC.
Población del estudio y asignación
Conceptualmente, sólo las tecnologías eficaces pueden ser efectivas, pero la eficacia en
sí misma no es suficiente para alcanzar la efectividad. A título de ejemplo, disponemos
de inmunosupresores muy eficaces en el arsenal terapéutico del trasplante renal. Sin
embargo, si no se administran adecuadamente o el diagnóstico de rechazo no es pre-
coz, estos fármacos no tendrán efectividad. Con estas premisas, Schwartz y Lellouch
propusieron, en 1967, una clasificación de los EC de acuerdo a sus objetivos: 1) EC ex-
plicativos, que son los que intentan demostrar la eficacia en el ser humano, partiendo de
experimentos previos en animales y corresponden a los EC en fase I y II; y 2) EC prag-
máticos, que intentan demostrar la efectividad y constituyen los EC en fase III y IV. En la
Tabla IV se muestran las diferencias más importantes entre estos dos tipos de EC.
En base a los objetivos planteados, los EC se pueden clasificar según la fase de desarro-
llo del fármaco que se investiga (Tabla V). El ensayo en fase I constituye el primer paso
en la investigación de un fármaco en humanos, principalmente orientados a proporcio-
165
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
1. Meta-análisis de ensayos clínicos controlados aleatorizados.
2. Ensayos clínicos controlados aleatorizados de muestras grandes.
3. Ensayos clínicos controlados aleatorizados de muestras pequeñas.
4. Ensayos prospectivos controlados no aleatorizados.
5. Estudios de cohortes.
6. Estudios de casos y controles.
7. Series clínicas no controladas.
8. Estudios de vigilancia epidemiológica (registros y bases de datos).
9. Estudios descriptivos.
10. Casos clínicos.
Tabla II. Nivel de evidencia científica en orden decreciente.
Nivel Evidencia Tipo de estudio
A Existe adecuada evidencia Meta-análisis
para recomendar Ensayo controlado aleatorizado
(uno grande o varios pequeños)
B Existe cierta evidencia Ensayo controlado no aleatorizado
para recomendar
C Existe insuficiente evidencia Estudio observacional
para recomendar
Tabla III. Guías de práctica clínica en función de la calidad científica de los
estudios.
Cap 07 4/10/04 12:51 Página 165
nar información sobre los efectos y seguridad del fármaco que se evalúa. Se realizan ge-
neralmente en voluntarios sanos y, con menos frecuencia, en pacientes. Los ensayos
de fase II se realizan en pacientes con el objetivo de obtener información preliminar so-
bre la eficacia de un fármaco, establecer la relación dosis-respuesta, y ampliar los datos
de seguridad obtenidos en la fase I. El ensayo en fase III responde al modelo de ensayo
clínico controlado, cuyo objetivo principal es la confirmación de la eficacia de un nuevo
166
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Explicativos Pragmáticos
Intervención Standarizada Individualizado
(dosis y periodos fijos). (dosis y periodos flexibles).
Tratamiento concomitante Tratamiento concomitante
controlado. según práctica habitual.
Criterios inclusión Homogéneos. Todos los pacientes
Muchos criterios exclusión. susceptibles.
Diseño Énfasis en igualar los Énfasis en buscar beneficio
predictores de la variable máximo.
resultado.
Variables estudio Con significado fisiológico. Con significado clínico.
Medida variable Enmascaramiento. Con o sin enmascaramiento.
Análisis datos Exclusión complicados. Analiza según intención
de tratar.
Tabla IV. Diferencias más significativas entre los EC explicativos y pragmáticos.
Objetivos Sujetos Diseño Duración
Fase I Farmacocinética. Voluntarios sanos Abierto o ciego. Breve
Farmacodinamia. (n = 30-100) Controlado o 9-18 meses
Seguridad. no controlado.
Fase II FC, FD, seguridad. Pacientes Abierto o ciego. 1-3 años
Búsqueda de dosis. (n = 100-400) Controlado o
Eficacia preliminar. no controlado.
Fase III Eficacia. Pacientes Ensayo clínico 1-4 años
Indicaciones. (n>1.000) controlado.
Fase IV Nuevas indicaciones, Pacientes Aleatorizado. Producto en el
condiciones, etc. (n = 5000) Observacional. mercado.
Tabla V. Ensayos clínicos según la fase de desarrollo del fármaco que se
investiga.
Cap 07 4/10/04 12:51 Página 166
tratamiento en comparación a un tratamiento utilizado habitualmente en la indicación
evaluada. El desarrollo de esta fase es necesario para conseguir el registro y la comer-
cialización de un medicamento. Los ensayos en fase IV son los que se realizan después
de la comercialización del fármaco y pueden estar dirigidos a evaluar diversos objetivos:
eficacia en nuevas indicaciones, nuevas condiciones de uso además de las autorizadas
(pauta o vía de administración), efectividad y seguridad en la práctica habitual, etc.
En la identificación de los sujetos candidatos a participar en el ensayo, la fuente de re-
clutamiento (población general, pacientes ambulatorios u hospitalizados, etc.) y la espe-
cificación de los criterios de inclusión y exclusión pueden ser determinantes de la repre-
sentatividad y homogeneidad de la muestra. Cuando se establecen unos criterios de se-
lección muy restrictivos, la muestra de sujetos es muy homogénea, pero será represen-
tativa únicamente de un determinado subgrupo de la población, y los resultados o con-
clusiones obtenidos a partir de estos ensayos pueden tener limitaciones en su aplica-
ción en la población de referencia u otras poblaciones (validez externa).
La selección de las variables que serán utilizadas para evaluar los fenómenos observa-
dos en el ensayo, condicionan también la posibilidad de generalizar a la población las
conclusiones del estudio. Además, si se utilizan medidas que representen adecuada-
mente a las variables seleccionadas, se aumentará la probabilidad de que las conclusio-
nes del estudio describan realmente los hallazgos derivados de la intervención realizada
(validez interna). De lo comentado anteriormente se deduce que los EC deben aportar
dos premisas inexcusables para respaldar con firmeza sus propias conclusiones: calidad
y validez (interna y externa). De no ser así, incurriremos en lo que conocemos como los
sesgos de los estudios controlados, que distorsionarán sistemáticamente los resulta-
dos reales. Obviamente, la validez de un EC constituye la piedra angular de la calidad y,
de una manera práctica, los criterios de validez interna se basan en un diseño correcto y
en un óptimo manejo de los resultados mediante el análisis según “la intención de tra-
tar”. Este planteamiento minimizará los sesgos y las diferencias observadas serán, sin
duda, reflejo inequívoco de la intervención terapéutica realizada. Con estas condiciones,
los EC deben ser potencialmente reproducibles y generalizables (validez externa). En
otras palabras, deben aplicarse en otras circunstancias y en otras poblaciones, que
constituye en definitiva el fin primordial de los EC.
La evaluación de una variable está sometida a la influencia de la variabilidad debida al
observador, al sujeto sometido a la intervención y al instrumento de medida. Las varia-
bles objetivas o “duras” (como la mortalidad, la tensión arterial, la diuresis, etc.) son re-
producibles de un sujeto a otro y de un observador a otro. Las variables subjetivas o
“blandas” (como la sensación dolorosa, el estado de ánimo, etc.) son más difícilmente
reproducibles y están sometidas a variabilidad de percepción. La objetividad puede ser
optimizada reduciendo el grado de vinculación del observador a la medida y mejorando
la estructura del instrumento de medida.
167
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 167
Es frecuente que se utilicen variables intermedias o indirectas (surrogate end points) en
sustitución de una variable clínicamente relevante, ya que son, en general, más fácil-
mente medibles o identificables. Deben ser de fácil medida, plausibles biológicamente,
predictivas de la evolución de la enfermedad y que su modificación, como respuesta a
la intervención, se traduzca en un efecto sobre la variable clínica de interés (ejemplos en
Tabla VI).
El número de sujetos o el tamaño de la muestra que se ha de incluir, será definido en
función de la variable de medida que se haya seleccionado, como la principal, para eva-
luar el objetivo propuesto. Este número depende de diversos factores:
• Magnitud de las diferencias que se quieren poner de manifiesto en la comparación.
• Homogeneidad de la muestra, que confiere mayor probabilidad de detectar pequeñas
diferencias, ya que existe menos variabilidad o desigualdad entre los grupos.
• Probabilidad de afirmar, después de la evaluación de los resultados, que existen dife-
rencias entre los grupos de tratamiento cuando en realidad éstas no existen (error tipo I
o α).
• Probabilidad de afirmar que no existen diferencias entre los grupos, cuando en reali-
dad éstas existen (error tipo II o β).
El EC controlado es el mejor método para demostrar la eficacia de un nuevo fármaco en
el tratamiento de una determinada enfermedad y, salvo en situaciones excepcionales,
debe demostrarse por comparación con un grupo de referencia o control que sea con-
currente en el tiempo y en el espacio. La comparación de cualquier tratamiento con un
grupo control contribuye a reducir o a eliminar la influencia de los factores que se rela-
cionan con la propia enfermedad, como su evolución temporal o el manejo habitual de la
enfermedad. El grupo control o de referencia puede estar sometido o no a una interven-
ción, y dicha intervención puede ser un tratamiento farmacológico activo o inactivo (pla-
cebo) o un tratamiento o intervención no farmacológica. Es posible que, en casos con-
cretos, se utilicen controles históricos o retrospectivos, comparando los resultados del
tratamiento evaluado con la experiencia de pacientes similares en el pasado, pero en
168
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Enfermedad Variable intermedia Variable primaria de interés
Glaucoma Presión intraocular Pérdida de visión
Diabetes Glucemia Morbilidad y mortalidad por
complicaciones
Cardiopatía isquémica Colesterol Riesgo cardiovascular
Hipertensión arterial Presión arterial Riesgo cardiovascular
Tabla VI. Ejemplos de variables intermedias o indirectas.
Cap 07 4/10/04 12:51 Página 168
general se considera imprescindible la existencia de un grupo control concurrente para
realizar una verdadera comparación.
Para poder evaluar una comparación de dos tratamientos o intervenciones, no sólo es
necesaria la concurrencia en el tiempo, sino que se deben utilizar las medidas necesa-
rias para asegurar que los grupos son comparables o lo más parecidos posibles respec-
to a los factores de importancia pronóstica, con la excepción evidente de la intervención
a la que son sometidos. Existen múltiples factores (curso imprevisible de las enferme-
dades, variabilidad en la respuesta, poder del efecto placebo, sesgo del observador o
del observado) que condicionan una gran dificultad en la obtención de grupos iguales.
Sin embargo, la asignación o distribución aleatoria, con el propósito de evitar o reducir al
máximo los posibles sesgos derivados del proceso de selección de los participantes,
permite reducir las diferencias entre los grupos comparados. La asignación aleatoria tie-
ne como objetivo la obtención de una distribución homogénea de las características ba-
sales de los sujetos, requiere un tamaño de muestra suficiente, así como la utilización
de un buen método de aleatorización que no permita prever la secuencia de los trata-
mientos.
La selección del diseño del EC se ha de realizar en base a los objetivos. El ensayo con
grupos paralelos es el más común y puede ser aplicable en la mayoría de situaciones.
En ellos, los sujetos son asignados aleatoriamente a una u otra intervención durante el
mismo periodo de tiempo. En los ensayos cruzados, los sujetos reciben de forma con-
secutiva cada una de las intervenciones (experimental y control), y el sujeto se convier-
te en su propio control. Este diseño se debería limitar a ensayos que evalúan enferme-
dades crónicas y estables, y requiere frecuentemente la inclusión de un periodo de la-
vado para evitar los efectos residuales.
Instrumentos de medida y desarrollo
El enmascaramiento o carácter ciego de un ensayo clínico es una medida o precaución
fundamental para evitar los sesgos de valoración por parte de los implicados en el ensa-
yo (sesgo del observador o del observado), que resulta en el desconocimiento del trata-
miento asignado. El enmascaramiento se considera casi indispensable cuando las varia-
bles de medida tienen un carácter subjetivo o cuando el conocimiento del paciente del
tratamiento asignado puede condicionar el incumplimiento o abandono del estudio.
Cuando no es posible enmascarar al investigador y al paciente (diseño doble ciego) pue-
de realizarse una valoración de los resultados por un evaluador que desconoce el trata-
miento que ha recibido cada paciente (evaluación ciega por terceros). El carácter ciego
del ensayo no está indicado si implica riesgos innecesarios para el paciente, si puede
perjudicar la relación entre médico y paciente, si no es posible disponer de una formula-
ción galénica adecuada, y si los efectos farmacológicos permiten identificar fácilmente,
como mínimo, uno de los fármacos estudiados.
169
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 169
170
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Algunos aspectos destacables sobre el desarrollo del ensayo son los referentes al se-
guimiento de los pacientes e interpretación de los resultados. Para un seguimiento ade-
cuado de los sujetos del ensayo, se debe evitar la sobrevaloración o infraestimación de
los beneficios de una intervención y la invalidación de los resultados. Por ello es nece-
sario, además de realizar una planificación de visitas y pruebas complementarias, definir
y evaluar las pérdidas que se producen durante el mismo. Es importante especificar la
circunstancia que conlleva la pérdida de un paciente durante el seguimiento.
Generalmente, se distingue entre las pérdidas que se producen por la propia voluntad
del sujeto a continuar en el ensayo (abandono o drop-outs) y las que se deben a circuns-
tancias no relacionadas tan directamente con la voluntad del paciente (retiradas o with-
drawal), como la aparición de acontecimientos adversos, la falta de eficacia y el incum-
plimiento del tratamiento, entre otros. En algunos ensayos clínicos se define específica-
mente la falta de eficacia o la aparición de acontecimientos adversos como criterios de
retirada de los sujetos. Entre las posibles actuaciones a seguir, con posterioridad a es-
tos acontecimientos, se incluyen la elección de recibir la otra intervención del ensayo, o
bien, otros tratamientos de rescate.
El análisis de los resultados se puede realizar con todos los sujetos incluidos según la
intervención a la que fueron asignados de manera aleatoria al inicio del ensayo (es lo
que se denomina análisis por intención de tratar) o realizarlo sólo con los sujetos que ha-
yan recibido realmente la intervención (análisis por protocolo o de casos válidos).
Generalmente, se considera más válida la realización de un análisis por intención de tra-
tar, debido a que generalmente las pérdidas que se producen durante el desarrollo de
un ensayo, no suelen producirse al azar, y si no son excluidas del análisis, se mide real-
mente la efectividad de la intervención evaluada. Pero se debe tener en cuenta que, en
casos justificados, se acepta la utilización de un análisis por protocolo.
Posteriormente al análisis, en la interpretación de los resultados, es fundamental la dis-
tinción entre una diferencia estadísticamente significativa y clínicamente significativa.
Una diferencia puede ser significativa desde el punto de vista estadístico, pero tener es-
caso valor clínico.
La extrapolación y la aplicación de los resultados de los ensayos clínicos a la práctica clí-
nica habitual, para la toma de decisiones relativas a la prescripción o aplicación de una
intervención en pacientes determinados, es compleja. La dificultad de la aplicación prác-
tica de los resultados se debe, en gran medida, a las diferencias que existen entre las
condiciones, en las que se realizan los ensayos clínicos, y las de la práctica habitual.
Entre ellas, se incluye el número limitado de sujetos expuestos a la intervención evalua-
da antes de que ésta esté disponible en el mercado, la corta duración de los tratamien-
tos, la escasa validez externa de los resultados, la falta de información en determinadas
poblaciones (como sujetos de edad avanzada, población pediátrica, mujeres, pacientes
con enfermedades en estadios menos evolucionados o comorbilidad, tratamientos múl-
Cap 07 4/10/04 12:51 Página 170
tiples), etc. Por este motivo, se debe distinguir entre eficacia (grado en que una deter-
minada intervención produce un resultado beneficioso en el contexto de un ensayo clí-
nico controlado) y efectividad (grado en que una intervención origina un resultado bene-
ficioso en las condiciones de la práctica habitual) de una intervención, conceptos ya co-
mentados con anterioridad.
Zonas “oscuras” de los EC
Principios éticos de la investigación clínica
Los EC son poderosas herramientas clínicas que tienen una gran influencia en las deci-
siones clínico-terapéuticas de la práctica médica habitual. Al mismo tiempo, conllevan
un importante despliegue de recursos económicos que induce a pensar que pudieran
desarrollarse con fines básicamente comerciales. Todo ello implica que los EC deben
llevarse a cabo bajo estrictas normas éticas de práctica clínica, y que organismos e insti-
tuciones sanitarias competentes velen por la integridad de estos estudios.
Los códigos éticos, considerados históricos (Código de Nuremberg y Declaración de
Helsinki), fueron elaborados a partir de la Segunda Guerra Mundial a consecuencia de
diferentes episodios desgraciados de experimentación en humanos, que pusieron de
manifiesto la necesidad de regular la investigación clínica. El Código de Nuremberg
(1947) es un documento centrado, principalmente, en los derechos de los sujetos que
participan en una investigación, y establece el consentimiento del sujeto como un ele-
mento esencial en la investigación en humanos. La Declaración de Helsinki fue aproba-
da en 1964 por la Asamblea Médica Mundial con el propósito de autorregular la ética de
la investigación en humanos, basándose en la integridad moral y las responsabilidades
del médico. En Edimburgo, en el año 2000, se realizó el cambio más relevante de este
documento a lo largo de su historia, con el objetivo de aproximar los postulados éticos a
la nueva situación de la medicina y la investigación clínica.
El Informe Belmont fue elaborado en 1978 por la Comisión Nacional para la Protección
de las Personas Objeto de Experimentación Biomédica y de la Conducta, en el seno del
Congreso de los Estados Unidos, para crear un documento que sirviera de base para la
elaboración de una regulación federal sobre la investigación clínica. Se considera que el
Informe Belmont incorpora el concepto más moderno de la investigación clínica, esto
es, que la práctica médica debe ser evaluada a partir de datos objetivos y evaluados con
un método científico y lógico, y no a partir de un método empírico basado en la expe-
riencia personal. En este documento se definen los principios básicos de la bioética, a
partir de los cuales se puede “formular, criticar e interpretar reglas o normas específicas
de aplicación práctica de investigación clínica en seres humanos”: el principio de respe-
to por las personas o de autonomía, la beneficiencia (posteriormente relacionado con el
principio de no maleficiencia) y la justicia.
171
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 171
El consentimiento informado es la aplicación práctica de uno de los principios básicos
de la bioética, el principio de autonomía, por el cual el sujeto debe ser capaz de tomar
sus propias decisiones. Además, es un requisito legal que, en España, se encuentra de-
finido en el Real Decreto 561/1993 sobre EC con medicamentos. Se considera que, pa-
ra que el consentimiento informado sea válido, debe ser comprendido, competente (le-
galmente) y voluntario. La información se debe dar al sujeto de manera que se ajuste a
su capacidad de comprensión en cuanto a cantidad, contenido y forma de presentación.
A este respecto, la última revisión de la Declaración de Helsinki (Edimburgo, 2000) in-
corpora la necesidad de que el investigador se asegure de la comprensión de la infor-
mación por parte del paciente. Actualmente existe la duda, documentada por múltiples
estudios, de si los pacientes llegan a entender la información que reciben acerca del es-
tudio en el que participan. Por otro lado, el carácter voluntario del consentimiento puede
ser vulnerado por una presión externa, más o menos intencionada, pero que tiene, co-
mo resultado final, la limitación de la libertad y, en definitiva, la autonomía del sujeto: la
persuasión (inducción a aceptar libremente, por parte del sujeto, una opinión determina-
da), la manipulación (modificación de manera intencionada de la percepción de las alter-
nativas posibles para el sujeto) y la coerción (presión al sujeto con amenazas para lograr
un objetivo). Estos elementos pueden surgir de la propia relación desigual que se esta-
blece, habitualmente, entre el médico y el paciente, así como de otros factores, como
por ejemplo, la limitación del tiempo para la toma de decisiones.
Los Comités Éticos de Investigación Clínica (CEIC) son los encargados de ponderar los
aspectos metodológicos, éticos y legales de los protocolos de EC propuestos, así co-
mo de hacer una valoración de los beneficios y riesgos. En nuestro país, la autoridad
sanitaria competente de cada Comunidad Autónoma es la que acredita a los CEIC. Su
composición es multidisciplinar y debe de incluir un mínimo de siete personas, de las
cuales dos deben ser ajenas a la profesión sanitaria. Según el Real Decreto 561/1993,
los CEIC deben evaluar la idoneidad de los protocolos de EC y del equipo investigador,
así como la información escrita que se entrega a los pacientes, comprobar la previsión
de la compensación y tratamiento que se ofrecerá a los sujetos en caso de lesión o
muerte, atribuibles al ensayo, conocer y evaluar el alcance de las compensaciones que
se ofrecerán a los investigadores y a los sujetos de la investigación por su participación
y, finalmente, realizar el seguimiento del EC desde su inicio hasta la recepción del in-
forme final.
Una de las premisas, que deben de cumplir los EC aleatorizados, es que exista una
duda razonable sobre la relación beneficio/riesgo que se puede obtener con cada una
de las opciones comparadas. La aplicación de esta premisa no es una tarea fácil y la
selección del control más adecuado puede ser un dilema ético y científico. Por razo-
nes éticas, el grupo control debe recibir el mejor tratamiento disponible y el ensayo
debe comparar tratamientos que a priori no difieran aparentemente en su efectividad
global.
172
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 172
Está enormemente extendido y es bien conocido el uso de placebo en la investigación
clínica. El placebo es una sustancia desprovista de acción farmacológica que se prescri-
be o administra para complacer a un paciente. En determinadas circunstancias y, princi-
palmente, por razones científicas (por ejemplo, evitar posibles sesgos en la valoración
de la eficacia de una estrategia terapéutica) es recomendable incluir un grupo tratado
con placebo en un EC. Por otro lado, la necesidad de los EC, con un grupo tratado con
placebo, viene condicionada en muchas ocasiones por los requerimientos de los orga-
nismos reguladores que exigen este tipo de estudios para la autorización de un medica-
mento en una determinada indicación.
La utilización del placebo ha sido objeto de mucho debate en la comunidad científica:
los códigos éticos establecen que el médico debe tratar al paciente con el mejor trata-
miento disponible. Así, la Declaración de Helsinki refiere que “los posibles beneficios,
riesgos, costes y eficacia de todo procedimiento nuevo deben ser evaluados mediante
su comparación con los mejores métodos preventivos, diagnósticos y terapéuticos exis-
tentes. Ello no excluye que pueda usarse un placebo, o ningún tratamiento, en estudios
para los que no hay procedimientos preventivos, diagnósticos o terapéuticos proba-
dos“. Una lectura más o menos estricta de este punto es el eje de las controversias que
ha habido con relación con el uso del placebo, como grupo control en ensayos clínicos.
No hay dudas cuando el ensayo evalúa un tratamiento para una enfermedad en la que
no hay una estrategia probada. Sin embargo, incluso en las ocasiones en las que sí exis-
te un tratamiento de referencia, puede haber dudas en lo que significa que un trata-
miento se considere que está probado o que sea de referencia.
Para superar estas situaciones, en las que se plantea la duda sobre la utilización del place-
bo, es decir, cuando se disponga de un tratamiento activo para la enfermedad estudiada, se
han propuesto estrategias en cuanto al diseño del ensayo clínico que permitan evitar caer
en la violación de los principios éticos de la investigación clínica: limitar la duración del en-
sayo clínico a un periodo de tiempo inferior al considerado en que la enfermedad evaluada
pueda ocasionar un daño irreversible, establecer unos criterios de retirada del paciente por
falta de eficacia, definir un tratamiento de rescate adecuado o utilizar el placebo en la eva-
luación de un tratamiento añadido al tratamiento de referencia. En definitiva, se trata de es-
trategias para evitar que la participación del sujeto en el ensayo no le suponga un incre-
mento del riesgo de daño irreversible para él. Al mismo tiempo, es imprescindible informar
de manera adecuada al sujeto de las posibles consecuencias del tratamiento con placebo
durante el periodo de tiempo que dure el estudio, así como respetar el derecho a retirarse
del estudio en cualquier momento y recibir posteriormente el tratamiento estándar.
Aspectos legales de los ensayos clínicos
La realización de EC con medicamentos está regulada por diferentes organismos nacio-
nales e internacionales. A nivel europeo, el organismo responsable de la regulación de
173
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 173
los medicamentos es la Agencia Europea de Evaluación de Medicamentos (European
Medicines Evaluation Agency, EMEA), que depende de la Dirección General de
Industria de la Unión Europea y de la Comisión Europea, pero son los Estados
Miembros los que retienen las competencias de la regulación de ensayos clínicos.
Las normas de buena práctica clínica son un conjunto de condiciones que debe cumplir
un ensayo clínico para asegurar que se ha efectuado siguiendo un protocolo científica-
mente adecuado, respetando los derechos de los sujetos incluidos en el mismo y ga-
rantizando la validez de los datos y resultados obtenidos. La tendencia actual se acerca
cada vez más a una mayor uniformidad de estas normas y de las legislaciones naciona-
les en el área de los medicamentos. La Conferencia Internacional de Armonización (ICH)
es un organismo que fue creado en 1989 por la industria farmacéutica y las autoridades
reguladoras de los Estados Unidos, Europa, Japón y Canadá. El objetivo de este orga-
nismo es elaborar documentos de carácter técnico que sirvan como directrices para la
investigación y el desarrollo de nuevos fármacos, y que dichas directrices sean acepta-
das por las autoridades reguladoras, como guía para la industria farmacéutica en la ela-
boración de la solicitud de registro de un nuevo fármaco. Las agencias reguladoras de
los medicamentos en los Estados Unidos y Europa, Food and Drug Administration
(FDA) y EMEA han aceptado las normas ICH como base para la elaboración de los ensa-
yos clínicos con medicamentos. También es importante destacar la existencia de un co-
mité científico asesor de la EMEA, que entre otras, tiene como funciones la elaboración
de documentos guía para la investigación clínica de medicamentos en distintas situacio-
nes o patologías (Committee of Proprietary Medicinal Products, CPMP).
A pesar de lo anteriormente expuesto, las normas que regulan los ensayos clínicos en
los distintos países europeos tienen particularidades que dificultan la utilización de crite-
rios comunes para la realización de los estudios multicéntricos en Europa. Por ello, re-
cientemente ha sido desarrollada y publicada la Directiva 2001/20/CE que trata, entre
otros aspectos, de simplificar y armonizar las disposiciones administrativas relativas a
los ensayos clínicos multicéntricos. Con esta directiva se pretende dar un impulso a la
investigación clínica europea, reduciendo el plazo necesario para iniciar los ensayos clí-
nicos multicéntricos. Las disposiciones recogidas en la directiva deberían haberse publi-
cado en los Estados Miembros, antes del 1 de mayo de 2003, y estar en funcionamien-
to no más tarde del 1 de mayo de 2004.
En España, actualmente, la investigación clínica con medicamentos está regulada por el
título III de la Ley 25/1990 de 20 de diciembre del Medicamento, desarrollada por el
Real Decreto 566/1993 de 16 de abril, por el que se establecen los requisitos para la re-
alización de ensayos clínicos. Más recientemente, después de la constitución de la
Agencia Española del Medicamento (organismo autónomo adscrito al Ministerio de
Sanidad y Consumo, que tiene, entre las múltiples funciones atribuidas por la legislación
vigente, la de evaluar, autorizar o limitar los ensayos clínicos y estudios y ensayos com-
174
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 174
plementarios), ha sido desarrollada la circular número 15/2001, que contiene la aplica-
ción del Real Decreto 561/1993 de 16 de abril.
Esta circular tiene por objetivo unificar, en un sólo documento, las instrucciones existen-
tes sobre investigación clínica con medicamentos y aclarar aspectos que son motivo fre-
cuente de consultas a la Agencia Española del Medicamento. Las principales disposicio-
nes, contenidas en el Real Decreto y la posterior circular, hacen referencia, entre otras, a
consideraciones generales y a principios básicos de los ensayos clínicos con medicamen-
tos, así como las responsabilidades del promotor del ensayo, del investigador y del moni-
tor, las atribuciones de los CEIC, las Comunidades Autónomas y la Agencia Española del
Medicamento (algunas de ellas ya han sido comentadas previamente en este texto).
Es importante mencionar, específicamente, algunos de los aspectos prácticos que define
el Real Decreto, y que hay que tener en cuenta durante la planificación y la realización de
un ensayo clínico: protocolización, aseguramiento y autorización de un ensayo clínico.
• Las características de un ensayo clínico se deben definir íntegramente en un protoco-
lo al cual se ajustará la realización del ensayo (Título I, Artículo 8). Se define como proto-
colo el documento que establece la justificación del estudio, objetivos, diseño, metodo-
logía, análisis previsto de los resultados, así como las condiciones bajo las cuales se
desarrollará el ensayo (Tabla VII).
175
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Artículo 8. Protocolización de un ensayo clínico
1. Resumen.
2. Índice.
3. Información general.
4. Justificación y objetivos.
5. Tipo de ensayo clínico y diseño del mismo.
6. Selección de los sujetos.
7. Descripción del tratamiento.
8. Desarrollo del ensayo y evaluación de la respuesta.
9. Acontecimientos adversos.
10. Aspectos éticos.
11. Consideraciones prácticas.
12. Análisis estadístico.
Anexo I. Cuaderno de recogida de datos.
Anexo II. Manual del investigador.
Anexo III. Procedimientos normalizados de trabajo.
Anexo IV. Memoria analítica de las muestras a realizar.
Tabla VII. Apartados básicos de un protocolo de ensayo clínico (Real Decreto
561/1993).
Cap 07 4/10/04 12:51 Página 175
• De acuerdo con el Real Decreto 561/1993, los ensayos clínicos, que evalúan productos
en fase de investigación clínica (no comercializados) o nuevas indicaciones de medica-
mentos ya autorizados, o cuando se realizan en situaciones en las que no existe interés
terapéutico para el sujeto del ensayo (como los ensayos realizados en voluntarios sanos),
sólo podrán realizarse si previamente se ha concertado un seguro que cubra los daños y
perjuicios que pudieran derivarse de la participación del sujeto en el ensayo. Dicho segu-
ro debe ser contratado por el promotor del ensayo.
• Antes de iniciar un ensayo clínico, éste debe haber sido autorizado por el CEIC co-
rrespondiente y por la Dirección General de Farmacia y Productos Sanitarios (actual-
mente, Agencia Española del Medicamento). La solicitud de autorización debe ser
realizada por el promotor del ensayo y el investigador principal y será acompañada
del protocolo del ensayo, el compromiso del investigador, el correspondiente infor-
me del CEIC y la conformidad del director del centro donde vaya a realizarse dicho
ensayo.
Papel de la industria farmacéutica
Los EC pudieron desarrollarse, con fines esencialmente comerciales, debido al gran
impacto económico que conllevan. En efecto, la empresa que desarrolla un medica-
mento, puede tener importantes intereses económicos en la promoción del mismo.
Pero, ¿este apoyo económico inclina la balanza hacia unos resultados del EC más fa-
vorables para la compañía farmacéutica? Una revisión sistemática de 30 trabajos, pa-
trocinados por la industria entre 1996 y 2002, reveló que hubo una tendencia a que
los resultados de los EC fuesen publicados en revistas científicas con menor factor
de impacto o en algunos simposium sin control de calidad. Asimismo, los resultados
finales eran mayoritariamente favorables a la industria farmacéutica en cuestión. En
esta misma línea, otro estudio investigó el sesgo de las múltiples publicaciones o pu-
blicaciones selectivas. El resultado fue que los EC con efectos significativos y rele-
vantes fueron publicados en una sola revista con gran factor de impacto, lo que no
ocurrió en los EC con resultados más débiles, que fueron publicados parcialmente en
diferentes revistas de menor calidad científica. Más aún, muchos de los EC con re-
sultados negativos no son publicados y se quedan en el camino tras un gasto innece-
sario de recursos humanos y económicos. La explicación a todo ello no es sencilla,
pero la realidad es que enciende una luz sobre la existencia de posibles sesgos siste-
máticos en la interpretación de resultados de los EC promovidos por la industria far-
macéutica.
Análisis fármaco-económicos
Clásicamente, la utilización de un medicamento se ha basado en los datos de eficacia y
seguridad que aportaban los resultados de un EC sobre dicho medicamento. En la ac-
176
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 176
tualidad, además de los datos de eficacia, hay que tener en cuenta parámetros de efi-
ciencia, esto es, la relación entre los recursos consumidos y los resultados clínicos ob-
tenidos. En otras palabras, la incorporación de los análisis fármaco-económicos en los
protocolos de los EC, va a permitir disponer de los datos de eficiencia para racionalizar
la política de precios de un fármaco y su inclusión en los petitorios de los centros sani-
tarios. Sin menoscabo de intentar una práctica médica de excelencia, esta política nos
ayudará, sin duda, a tomar las decisiones clínicas más adecuadas.
Dado que la inclusión de estudios fármaco-económicos en los EC supone una carga de
trabajo adicional, derivado de la recogida de información extra del EC, se debe racionali-
zar la incorporación de estos estudios fármaco-económicos en dichos EC. A efectos
prácticos, es recomendable la inclusión de análisis fármaco-económicos en aquellos EC
que cumplan los siguientes requisitos: 1) EC pragmáticos con un diseño correcto; 2) EC
con datos fiables y con potenciales beneficios clínicos; 3) EC con cálculo del tamaño
muestral; 4) EC con empleo sistemático de un fármaco control; 5) cuando se quiera mi-
nimizar costes o realizar un estudio de coste-beneficio; y 6) cuando se requiera explici-
tar los autores del EC, la fuente de financiación y la relación contractual entre ambos.
Todo ello supondrá, también, una valiosa ayuda para las autoridades sanitarias a la hora
de financiar un medicamento y decidir su incorporación en los formularios y guías de
práctica clínica.
Publicación de resultados de ensayos clínicos:
Declaración CONSORT
Para comprender los resultados de un EC controlado, aleatorizado, los lectores deben
entender su diseño, desarrollo, análisis e interpretación. El objetivo sólo puede alcan-
zarse a través de la absoluta transparencia de los autores. A mediados de los años 90,
dos iniciativas independientes para mejorar la calidad de la publicación de los resulta-
dos de los EC controlados, condujeron a la publicación de la Declaración CONSORT
(Consolidated Standards of Reporting Trials), desarrollada por un grupo de investiga-
dores clínicos, estadísticos, epidemiólogos y editores y apoyada por multitud de revis-
tas biomédicas y grupos editoriales, incluido el Comité Internacional de Editores de
Revistas Médicas (en inglés ICMJE), que es el más conocido como Grupo de
Vancouver. En 2001, se publicó la edición revisada y actualizada. CONSORT se basa
en el seguimiento de una lista (check list) de 22 cuestiones (ítem) y un diagrama de
flujo que debe seguirse para publicar, revisar y evaluar un EC aleatorizado. La declara-
ción, la lista, el diagrama y una explicación muy detallada son accesibles en
www.consort-statement.org.
La lista incluye cuestiones sobre el título, el resumen, la introducción, los métodos, los
resultados y los comentarios, seleccionadas en base a que la ausencia de publicación
de aspectos esenciales de información se asocia con sesgos en la estimación del efec-
177
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 177
to del tratamiento, su fiabilidad o la relevancia de los hallazgos. El diagrama de flujo de-
talla los pasos que sigue cada participante incluido en un EC en cuatro estadios: inclu-
sión, asignación de intervención, seguimiento y análisis. El diagrama incluye, de modo
explícito, el número de participantes distribuidos según su grupo de intervención asig-
nado, de modo que resulta sencillo comprobar que los autores publican un análisis por
intención de tratar.
Lectura crítica de un ensayo clínico
Los problemas inherentes al diseño, desarrollo y publicación de los resultados de los
EC, esbozados previamente, justifican la importancia que, para el clínico que desea es-
tar bien informado, tiene una buena lectura crítica del ensayo clínico publicado. La sim-
ple lectura o la revisión superficial de los resultados de un EC no permiten asimilarlos
adecuadamente y pueden convertirse en fuente incesante de falsas evidencias.
Una adecuada lectura crítica de un EC implica atender a seis cuestiones principales: 1)
si el EC es controlado o no; 2) si es aleatorio; 3) si es enmascarado; 4) si detalla de mo-
do consistente las variables clínicas de resultado; 5) el análisis estadístico; y, por fin, 6)
las medidas del efecto. Aunque la MBE se sustenta en los hallazgos de las revisiones
sistemáticas y el meta-análisis de ensayos clínicos controlados, aleatorizados, no debe
olvidarse que la base del progreso del conocimiento, según la propia MBE, es el estu-
dio de la mejor evidencia disponible que, en innumerables ocasiones, como se verá
más adelante, no proviene de EC aleatorizados. Por tanto, el primer paso a la hora de
valorar críticamente un EC, es observar si se trata de un EC controlado, aleatorizado
(primer rasgo de calidad en la consideración de las evidencias de más alta calidad). Los
EC controlados con controles históricos, no aleatorizados, contienen profundos sesgos
potenciales y, en este sentido, se asimilan con los EC no controlados. La aleatorización
elimina los inconvenientes de los estudios con controles históricos o no controlados,
evita los sesgos de selección, equilibra los grupos con respecto a las variables deter-
minantes del pronóstico y garantiza la validez de las pruebas estadísticas de significa-
ción. Otro aspecto relevante es el enmascaramiento, que influye sobremanera en la
naturaleza de los resultados. El EC doble ciego es mucho más fiable, al evitar el efecto
placebo.
El análisis de los resultados debe hacerse con todos los pacientes aleatorizados, con in-
dependencia de si completaron el tratamiento –el ya referido análisis por intención de
tratar. No hacerlo así implica violar el proceso de aleatorización e impedir sus efectos de
reducir el sesgo de selección. Por otro lado, este análisis se acerca más a las condicio-
nes de aplicación de los tratamientos estudiados a la vida real. Los pacientes, incluidos
en las comparaciones terapéuticas, deben contabilizarse en el grupo al que fueron asig-
nados.
178
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 178
En la Tabla VIII se resumen las preguntas básicas a las que debe responderse durante
una lectura crítica adecuada de un EC, modificadas de Guyatt, Sackett y Cook.
Revisiones sistemáticas y meta-análisis.
La Declaración QUORUM
Cualquier clínico sufre una auténtica inundación de información que, con demasiada fre-
cuencia, no es manejable por cuestiones de tiempo y método si tenemos en cuenta
que, cada año, se publican más de dos millones de artículos en más de 20.000 revistas
biomédicas. Se necesitan resúmenes sistemáticos, sintetizados y, a la vez, completos
con el fin de dar respuesta a las preguntas que los pacientes plantean y conocer el esta-
do del conocimiento en la materia de que se trate, además de establecer la consistencia
de las conclusiones de cada estudio por separado.
Una revisión sistemática implica la elaboración previa de un diseño de investigación ob-
servacional y retrospectivo para obtener evidencia válida sobre un tema concreto. Su
marco de referencia es toda la investigación accesible sobre un tema, y la unidad de
análisis los estudios primarios (originales) de investigación. En contraposición a la revi-
sión tradicional, que acumula la información disponible sobre un tema habitualmente
179
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
¿Son válidos los resultados del ensayo? (1)
• ¿Se orienta el ensayo a una pregunta claramente definida?
• ¿Fue aleatoria la asignación de los pacientes a los tratamientos?
• ¿Fueron adecuadamente considerados hasta el final del estudio todos los
pacientes que entraron en él?
• ¿Se mantuvieron ciegos al tratamiento los pacientes, los clínicos y el personal del
estudio?
• ¿Fueron similares los grupos al comienzo del ensayo?
• ¿Al margen de la intervención en estudio, los grupos fueron tratados de igual
modo?
¿Cuáles son los resultados?
• ¿Cómo fue el efecto del tratamiento?
• ¿Fue precisa la estimación del efecto del tratamiento?
¿Pueden ayudarnos estos resultados?
• ¿Pueden aplicarse estos resultados en tu medio local?
• ¿Se tuvieron en cuenta todos los resultados de importancia clínica?
• ¿Los beneficios a obtener justifican los riesgos y los costes?
(1) Si la respuesta a las tres primeras es SÍ, merece la pena seguir contestando las siguientes.
Tabla VIII. Preguntas para una adecuada lectura crítica de un ensayo clínico
(modificadas de Guyatt, Sackett y Cook).
Cap 07 4/10/04 12:51 Página 179
amplio de modo subjetivo, y la interpreta, la revisión sistemática utiliza metodología ex-
plícita y rigurosa para identificar, seleccionar críticamente y sintetizar los estudios rele-
vantes que tratan de responder a una pregunta concreta.
En la Tabla IX se resumen las diez preguntas básicas que pueden responderse en la lec-
tura crítica de una revisión sistemática, y que constituyen el análisis fundamental de su
fiabilidad. El valor de las revisiones sistemáticas es cada vez más reconocido y su publi-
cación más frecuente.
El meta-análisis es un tipo de revisión sistemática que utiliza metodología estadística
para combinar y resumir los resultados de diversos estudios primarios o individuales. Es
una revisión sistemática en cuyo resumen de resultados se detalla una síntesis estadís-
tica. Su cuantificación constituye el resultado, que puede determinarse como riesgo re-
lativo (RR), odds ratio (OR) o número de pacientes que será necesario tratar para obte-
ner el efecto (NNT). La precisión de este resultado vendrá determinado por los interva-
los de confianza (IC). Este tipo de análisis es útil en la toma de decisiones y puede servir
de base para la elaboración de guías de práctica clínica, evaluaciones económicas o fu-
turos planes de investigación.
Una iniciativa internacional, denominada Colaboración Cochrane (www.cochrane.org),
se ha desarrollado con el objetivo básico de preparar, mantener y diseminar resultados
180
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
¿Son válidos los resultados de la revisión? (1)
• ¿Se hizo la revisión sobre un tema claramente definido (población, intervención,
control o comparación y resultados considerados)?
• ¿Buscaron los autores el tipo de artículos adecuado?
• ¿Crees que estaban incluidos los estudios importantes y relevantes?
• ¿Crees que los autores de la revisión han hecho suficiente esfuerzo para valorar la
calidad de los estudios incluidos?
• Si los resultados de los diferentes estudios han sido mezclados para obtener un
resultado “combinado”, ¿era razonable hacer eso?
¿Cuáles son los resultados?
• ¿Cuál es el resultado global de la revisión?
• ¿Fueron precisos los resultados?
¿Pueden ayudarnos estos resultados?
• ¿Pueden aplicarse estos resultados en tu medio local?
• ¿Se tuvieron en cuenta todos los resultados de importancia clínica?
• ¿Los beneficios a obtener justifican los riesgos y los costes?
(1) Si la respuesta a las dos primeras es SÍ, merece la pena seguir contestando las siguientes.
Tabla IX. Preguntas para una adecuada lectura crítica de una revisión sistemática
(modificadas de Oxman et al.).
Cap 07 4/10/04 12:51 Página 180
de revisiones sistemáticas sobre los efectos de la atención sanitaria, con el fin de ayu-
dar a tomar decisiones clínicas y sanitarias bien fundamentadas. La biblioteca Cochrane
y sus bases de datos constituyen ya fuentes básicas de investigación clínica.
Como en cualquier trabajo de investigación, particularmente debido a su naturaleza ob-
servacional, el meta-análisis y su publicación puede presentar importantes sesgos.
Después de la iniciativa de la Declaración CONSORT, se ha desarrollado la Declaración
QUORUM (Quality of Reporting of Meta-Analysis), con el fin de mejorar la calidad de las
publicaciones de los meta-análisis de ensayos clínicos controlados aleatorizados. El gru-
po QUORUM está formado por 30 epidemiólogos, clínicos, estadísticos y editores, que
en 1999 elaboraron: 1) su Declaración; 2) una lista (checklist) para guiar la mejor manera
de presentar el resumen, la introducción, los métodos, los resultados y la discusión dis-
tribuida en 21 apartados y sub-apartados sobre las búsquedas, selección, análisis de va-
lidez, extracción de datos, características de los estudios y síntesis cuantitativa; y 3) un
diagrama de flujo con el que aportar la información de los números de ensayos identifi-
cados, incluidos y excluidos, y las razones para excluirlos. La lista y el diagrama son ac-
cesibles en www.thelancet.com.
El ensayo clínico en el trasplante renal
Introducción
La mayor parte de ensayos clínicos, realizados en los últimos años en el área de tras-
plante de órganos, han tratado de profundizar en nuevas pautas de inmunosupresión.
Han sido, por tanto, ensayos clínicos de intervención terapéutica con medicamentos,
habitualmente inmunosupresores. Después de más de una década de protagonismo ca-
si exclusivo de la ciclosporina como fármaco útil en la prevención del rechazo agudo del
injerto, se han desarrollado nuevos fármacos que han requerido la demostración de efi-
cacia y seguridad comparadas con las pautas clásicas.
El desarrollo de estos nuevos fármacos se ha llevado a cabo con EC de alta calidad; la
inmensa mayoría han sido ensayos controlados y, aunque rara vez se han controlado
con placebo, la asignación a las nuevas pautas y a las pautas control se ha hecho de
modo realmente aleatorio, con lo que se ha asegurado la distribución homogénea de
las características basales de los sujetos. Las características de los fármacos ensaya-
dos, que habitualmente se monitorizan según los niveles sanguíneos, ha impedido, en
la mayor parte de los casos, un diseño doble ciego que hubiera descartado buena par-
te de los sesgos que se aprecian en estos ensayos. Problemas de diagnóstico de la va-
riable principal de eficacia –habitualmente rechazo agudo– y sesgos subjetivos de tra-
tamiento más intenso y vigilancia más estrecha en los grupos de intervención con fár-
macos nuevos son aspectos bien conocidos en estos ensayos que les han restado par-
te de su fiabilidad.
181
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 181
Otro de los problemas evidentes que se derivan del análisis de los ensayos de los últi-
mos años, en este área terapéutica, es que la población estudiada suele estar seleccio-
nada de forma que se aplican de modo controlado las nuevas terapias a sujetos con es-
casa morbilidad asociada y bajo riesgo de desarrollar rechazo agudo, representativos de
un determinado subgrupo de población con los problemas de validación externa que
ello acarrea.
Pero el problema más importante que subyace en la mayoría de estos ensayos, es que
el promotor de casi todos ellos ha sido la empresa farmacéutica encargada de la comer-
cialización del producto ensayado. La ingente cantidad de recursos necesarios para la
realización de ensayos clínicos, en gran número de enfermos, ha conducido a que sean
muy escasos los ensayos clínicos promovidos por los propios médicos o por la adminis-
tración. Esta situación ha conducido a que las bases de datos clínicos de los ensayos se
encuentren en manos de esas empresas, los análisis de los resultados, las comunica-
ciones a los congresos y las publicaciones de estos resultados estén dirigidas por sus
departamentos médicos y el control de lo que se publica o no –y cómo– se decida en
reuniones internas de las empresas, sin intervención definitiva de los investigadores.
Por todo ello, resulta imprescindible el diseño y la ejecución de ensayos clínicos de alta
calidad en trasplante de órganos, no sólo en inmunosupresión, sino en todo tipo de inter-
venciones terapéuticas, promovidos por investigadores y por la propia administración,
con autonomía respecto de la industria farmacéutica. Ensayos en los que, además de la
eficacia y la seguridad de nuevos fármacos, se analice la efectividad y el coste-efectivi-
dad de nuevas pautas de tratamiento, en contextos generales y en poblaciones no ses-
gadas, con análisis de calidad de vida. Esta autonomía conducirá al análisis objetivo de
los resultados y permitirá su divulgación científica fiable, superando las deficiencias ac-
tuales.
Evolución de las variables finales (end points) en trasplante renal
El objetivo primario habitual de los ensayos de trasplante recientes, de fase II y III, pre-
vios al registro de nuevos fármacos inmunosupresores, ha sido la incidencia de rechazo
agudo del órgano durante un periodo de tiempo relativamente corto post-trasplante (de
3 a 12 meses según los casos), en el que el riesgo de esos episodios de rechazo es má-
ximo. El propio diseño de los ensayos no ha permitido, en general, la consecución de
objetivos primarios de eficacia más contundentes, como la supervivencia del injerto o
del propio enfermo. La demostración de diferencias de supervivencia de injerto o enfer-
mo, entre los fármacos nuevos en desarrollo y los clásicos, hubiera requerido muestras
de estudio mucho más numerosas y periodos de seguimiento más prolongados.
Paradójicamente, la continua mejoría en la supervivencia del injerto y el descenso pro-
gresivo de la incidencia de rechazo agudo, dificultan el análisis adecuado de la eficacia
182
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 182
de los nuevos inmunosupresores con estas variables finales convencionales. Los inves-
tigadores responden ante esta nueva realidad con el diseño de nuevas variables finales,
denominadas variables subrogadas, tales como función renal o marcadores histológi-
cos. Sus ventajas e inconvenientes más relevantes se muestran en la Tabla X. Hariharan
et al., en una reciente revisión, postulan superar la debilidad progresiva de las variables
finales convencionales aisladas con la utilización de variables finales compuestas (com-
posite end points), que pueden integrar variables convencionales, como rechazo agudo,
pérdida del injerto o muerte, con nuevas variables predictivas, como función renal du-
rante el primer año o marcadores histológicos de cronicidad.
183
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Variable final Ventajas Inconvenientes
Variables convencionales
Rechazo agudo Bien definible. Cada vez menos frecuente.
Se correlaciona con Para ser fiable requiere biopsia.
función posterior.
Pérdida del injerto Es la variable más Muy poco frecuente a corto
contundente. y medio plazo.
Supervivencia del Gran contundencia. Se requiere largo seguimiento y
injerto a 5 años volumen importante de enfermos.
Variables a corto plazo que predicen supervivencia a largo plazo
Creatinina sérica Simplicidad. Depende de múltiples factores:
Reproducibilidad. edad, sexo, peso, talla,
Predictor de función masa muscular, etc.
posterior.
Aclaramiento de Algo más exacto que El calculado depende de
creatinina calculado la creatinina sérica fórmulas con validación.
o medido aislada limitada. El medido depende demasiado
de una adecuada recogida
de orina.
Filtrado glomerular Bastante exacta medida Costoso y dependiente
medido con isótopos de función renal. del técnico.
Histología: fibrosis, Gran correlación con Invasivo, costoso
índice de cronicidad función a largo plazo. y poco reproducible.
Variabilidad intra
e inter-observador.
Tabla X. Ventajas e inconvenientes de diversas variables finales empleadas en
ensayos clínicos de trasplante renal.
Cap 07 4/10/04 12:51 Página 183
Áreas de investigación clínica en trasplante renal
Posiblemente, la ausencia de consenso y la gran variabilidad en el manejo clínico del en-
fermo trasplantado renal se deben al desequilibrio entre un elevado nivel de evidencia,
en áreas como las estrategias encaminadas a la prevención del rechazo agudo, y otras
como la nefropatía crónica del injerto o la enfermedad cardiovascular, que carecen de tal
nivel de prueba.
Tres de las áreas más relevantes, sobre las que es probable que deba profundizarse en la
búsqueda de más evidencias, son: 1) el perfil de riesgo pre-trasplante del enfermo con in-
suficiencia renal y las estrategias para su detección y manejo precoces; 2) la individualiza-
ción y la optimización de la inmunosupresión inicial y de mantenimiento; y 3) la prevención
y el manejo de las complicaciones a largo plazo del enfermo trasplantado, principalmente
la nefropatía crónica y la enfermedad cardiovascular. Se han hecho diversos intentos de
sistematizar las evidencias disponibles en las diversas áreas relacionadas con el trasplante
renal, y un análisis profundo de las mismas excede los límites de este capítulo (ver
Orofino y Pascual 1998, García López y Amenábar 2000, Hernández y García López 2003).
REGISTROS
Registros y estudios observacionales (EO)
en el trasplante renal. Su necesidad
Tradicionalmente, los EC constituyen el “patrón oro” de la evidencia en cuanto a las de-
cisiones clínicas en la práctica médica habitual. Sin embargo, algunas razones justifican
la necesidad de llevar a cabo grandes EO y complementarlos con los EC en el campo
del trasplante renal.
En general, la tasa de supervivencia de los injertos renales, tras el primer año del implante
con las actuales terapias inmunosupresoras, ronda el 90%. Esto apunta a que los EC pue-
den carecer del poder estadístico suficiente para detectar pequeñas diferencias en las ta-
sas de supervivencia entre las distintas intervenciones terapéuticas. Por dicha razón y co-
mo ya se ha comentado en la sección anterior, en muchos EC se emplean variables fina-
les intermedias como la tasa de rechazos agudos o la función renal, obviando como objeti-
vo primario la supervivencia del injerto a corto y medio plazo. Asimismo, los EC se realizan
en pacientes muy seleccionados y en condiciones muy rigurosas, lo que puede alejarnos
de la práctica clínica habitual. A título de ejemplo, los EC con los modernos inmunosupre-
sores (anticuerpos monoclonales antiCD-25 o el sirolimus) en pacientes trasplantados
muy seleccionados demuestran con un alto nivel de evidencia que disminuyen significati-
vamente la tasa de rechazos agudos frente al grupo control. Sin embargo, no se ha obser-
vado aún que estos fármacos sean capaces de prolongar, significativamente, la supervi-
vencia del injerto, posiblemente por la falta de poder estadístico de los mismos.
184
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 184
Por otra parte, existe una gran variabilidad en el manejo de muchos aspectos clínicos
del trasplante renal. Ya se ha sugerido más arriba que esta falta de consenso en las de-
cisiones diagnósticas y terapéuticas de estos pacientes se debe, en buena parte, a un
importante cuerpo de evidencia en algunas áreas del trasplante renal (inmunosupresión
inicial o la de mantenimiento), frente a otras como la nefropatía crónica del injerto o la
enfermedad cardiovascular, que obviamente carecen de este respaldo científico. Con
estas premisas se infiere que los EC y los EO (registros, bases de datos, etc.) deben
complementarse en el campo del trasplante renal para el óptimo manejo clínico de es-
tos pacientes.
Los EO analizan el pronóstico de miles de pacientes, proporcionando una visión real de
todos los factores comórbidos que pudieran afectar el pronóstico. La comorbilidad de
cualquier entidad clínica, incluida el trasplante renal, puede modificar el curso de la pro-
pia enfermedad y predecir el riesgo de muerte. En la actualidad, los EO y los grandes re-
gistros constituyen los pilares en la elaboración de los diferentes índices de comorbili-
dad. El importante número de pacientes que incluyen durante un largo seguimiento, re-
presentan las bases de tal afirmación.
Finalmente, la información que aportan los EO y los grandes registros es, en general, más
fácilmente accesible para su posterior aplicación en el campo del trasplante renal. Por el
contrario, la disponibilidad de toda la información de los EC queda restringida, en general,
a los propios líderes del EC, las instituciones sanitarias o la industria farmacéutica.
Análisis de datos de registros de trasplante:
beneficios y limitaciones
La utilidad de los registros y EO en el campo de los trasplantes debe ser entendida en el
contexto de otros tipos de estudios clínicos y de las condiciones inherentes al propio
proceso del trasplante. Por su carácter prospectivo, los EC constituyen un instrumento
esencial para poner a prueba determinadas hipótesis en la investigación médica. Sin
embargo, los EC tiene también sus propias limitaciones, derivadas principalmente de
sus condiciones de estudio y de su incapacidad para detectar pequeñas, pero importan-
tes, diferencias entre los grupos que se analizan.
En la Tabla XI se muestran las diferencias más notables entre los EC y los EO que nos
facilitarán el análisis crítico de cada uno de estos tipos de estudios, a la vez que nos ayu-
darán a comprender las ventajas y limitaciones de los mismos.
En general, los EC miden la eficacia de las intervenciones terapéuticas bajo condiciones
muy controladas y en pacientes muy seleccionados. Sin embargo, la eficacia de un de-
terminado tratamiento pudiera debilitarse en circunstancias donde el paciente no recibe
la misma atención del EC durante un largo seguimiento. Por el contrario, los EO y los
185
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 185
grandes registros analizan la efectividad en condiciones habituales de la vida real. De
ahí, que los estudios retrospectivos pueden llegar a confirmar si los efectos testados
previamente en EC, son aplicables a otras poblaciones y en otras circunstancias.
Alternativamente, algunas hipótesis de estudio pueden haber nacido inicialmente de los
EO, y han justificado la realización de un EC para su posterior confirmación. No obstan-
te, algunos datos conflictivos, que nacieron de EO, no han sido confirmados posterior-
mente por EC. De esto se deduce que los EO son muy vulnerables a factores de confu-
sión (confounding factors), principalmente por la visión retrospectiva inherente al propio
EO. Afortunadamente, existen rigurosas herramientas estadísticas (análisis de Cox, es-
tudios de propensión, regresión logística, entre otros) que minimizan esta situación y
proyectan a los EO y los grandes registros a los niveles más altos de la evidencia.
186
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Ensayos clínicos Estudios observacionales/registros
Objetivo Medir la eficacia. Medir la efectividad.
Condiciones controladas. Condiciones de vida real.
Población Muy seleccionados. Población habitual con todas las
de pacientes condiciones de la vida real.
Criterios de Previos a la obtención Posteriores a la obtención de
inclusión. de los datos. los datos.
Randomización
Tamaño de 75-200 por grupo Miles de pacientes en cada grupo.
la muestra de tratamiento.
Duración Generalmente 6-12 En general, más de 10 años.
meses. A veces,
con estudio extensión.
Obtención Riguroso y global. Menos datos por paciente.
de datos Enviados por otros centros.
Datos de costes En general, puede Sólo disponible en algunos casos.
ser recogido.
Tipo de análisis Análisis de variables Análisis de regresión que miden
finales (end points) el efecto independiente de
pre-definidas en variables pronósticas.
tiempos concretos.
Accesibilidad Generalmente, disponible Mas fácilmente disponibles.
para los líderes de los EC.
Tabla XI. Diferencias más representativas entre los EC y los EO.
Cap 07 4/10/04 12:51 Página 186
Los criterios de inclusión y la aleatorización en los EC se aplican previamente a la obten-
ción de los datos. Por el contrario, esto se realiza con posterioridad en los EO. El tama-
ño de la muestra y la duración de los EC es notoriamente menor que en los EO, los cua-
les analizan miles de pacientes durante diez o más años de seguimiento.
Adicionalmente, una potencial ventaja de los EO es el efecto drop-out o la pérdida de in-
formación de los pacientes durante los EC. Esto puede dar lugar a sesgos, sobrestima-
ciones o infravaloraciones del efecto del tratamiento en dichos EC. Por último, en los
EC se analizan variables finales predefinidas en tiempos específicamente determina-
dos, mientras que en los EO se emplean potentes análisis de regresión (análisis de Cox
y regresión logística) que detectan el efecto independiente de muchas variables pronós-
ticas que influyen en la supervivencia. En cualquier caso, los investigadores necesitan
conocer qué factores no pueden explicarse.
Con todo, y a modo de parangón, los EO pueden representar “mares muy extensos, pero
poco profundos”. En efecto, los EO recaban información muy valiosa de una ingente can-
tidad de pacientes, pero frecuentemente no especifican ni pormenorizan los detalles de
tal información. En cualquier caso, los EO, lejos de competir con los EC en la escala de
evidencia, deben complementarse y aunar sus conclusiones para lograr el máximo rendi-
miento en la aplicación de sus resultados en los pacientes portadores de un injerto renal.
Tipos de EO. ¿Sabemos distinguirlos?
Desde una visión global, la investigación clínica se divide en dos grandes grupos, de-
pendiendo de si los investigadores asignan o no una determinada intervención: investi-
gación experimental e investigación observacional (Figura 1). Obviamente, en la experi-
mental la primera distinción que se debe plantear, es si el estudio fue aleatorizado o no,
y si se ajustó a la práctica clínica habitual.
En los EO, el primer planteamiento debe ser si utiliza o no un grupo comparativo o con-
trol. Si así fuera, el estudio se denomina analítico. Por el contrario, si carece de grupo
control se define como descriptivo con la particularidad de que estos no permiten es-
tudios de asociación.
El siguiente paso es determinar la dirección de los EO analíticos. Si el estudio propone el
análisis del parámetro a medir y el pronóstico en el mismo tiempo, se denomina estudio
cross-sectional (transversal). La determinación de la creatinina plasmática, en los pacien-
tes ingresados con rechazo frente a los que no tuvieron rechazo, sería el ejemplo de este
tipo de estudios donde el parámetro de medida (creatinina) y el pronóstico (rechazo) se
observan al mismo tiempo. Este tipo de estudios proporciona una visión puntual de la po-
blación enferma y sana en el mismo tiempo. Esto permite detectar la presencia o ausen-
cia de enfermedad y de una determinada exposición, proporcionando datos de prevalen-
cia. Sin embargo, no aclaran la relación temporal entre el pronóstico y la exposición.
187
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 187
Si el estudio comienza con una exposición (por ejemplo, el tratamiento sustitutivo de la
función renal: diálisis o trasplante renal) y se continúa con el seguimiento, durante años,
hasta alcanzar el pronóstico (muerte del paciente o del injerto), se denomina estudio de
cohortes (looking forward en el tiempo). Esta clase de estudio permite el cálculo de las
tasas de incidencia, riesgo relativo y riesgos atribuibles. Sin embargo, para el análisis de
infrecuentes o eventos raros, este tipo de estudios puede durar años, con el consi-
guiente consumo de tiempo y recursos para su ejecución.
Por último, si el estudio analítico en cuestión comienza con el planteamiento de un pro-
nóstico (por ejemplo, la muerte del paciente trasplantado) y mira “hacia detrás” en el
tiempo para una determinada exposición (uso de IECA y otros posibles “protectores”
de función renal, rechazo agudo, un determinado inmunosupresor, etc.), se denomina
estudio de casos y controles. Este tipo de estudio es muy útil para determinar el pro-
nóstico de entidades que tardan muchos años en su desarrollo, como la enfermedad
cardiovascular o el cáncer. Sin embargo, su punto más débil es elegir un adecuado gru-
188
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
¿Asignación de exposición
o intervención?
Estudio experimental Estudio observacional
¿Randomización?
Estudio
cross-sectorial
Exposición y
pronóstico en el
mismo tiempo
Estudio de
cohortes
Exposición →
Pronóstico
Estudio de
casos-controles
Exposición ←
Pronóstico
¿Comparación grupos?
SÍ
SÍ
NO
NO
Estudio
controlado
randomizado
Estudio no
controlado
randomizado
SÍ NO
Estudio
analítico
¿Dirección?
Estudio
descriptivo
Figura 1. Algoritmo para la clasificación de los diferentes tipos de investigación clínica.
Cap 07 4/10/04 12:51 Página 188
po control con similares características a los casos, excepto para el pronóstico en cues-
tión. Asimismo, en estos estudios se emplean las razones de probabilidad (odds ratio)
para investigar la asociación entre el pronóstico y los posibles factores implicados.
Calidad de los registros
Los registros contribuyen, de una forma significativa, al análisis científico del pronóstico
y las complicaciones de los pacientes trasplantados. Obviamente, esto conlleva una op-
timización del cuidado de estos pacientes, a la vez que puede tener un impacto positivo
sobre las políticas de trasplantes de diferentes regiones y países. En esta línea, existen
diferentes registros en el mundo que recogen datos nacionales e internacionales de
uno o más órganos (Tabla XII) con un objetivo común a todos ellos: conseguir la calidad
de los datos recogidos.
En general, la calidad de los registros depende de la inclusión de un grupo de pacientes
representativo y de la propia calidad de los datos recogidos. Esto implica que los datos
sean completos, precisos y fiables. Idealmente, las bases de datos deberían incluir la to-
talidad de la población expuesta, pero en general esto no es factible. Por tanto, sí sería
deseable, al menos, que los pacientes candidatos a ingresar en el registro, fueran en re-
alidad incluidos en la base de datos.
Pero, ¿cómo se puede asegurar la calidad de los registros? El primer paso es definir con
claridad el objetivo para el cual se va a cumplimentar la base de datos. Seguidamente,
es importante la creación de una base de datos, limitada en su tamaño, pero completa
en cuanto a la utilidad de las variables que se quieran analizar. Asimismo, la recogida de
datos debe llevarse a cabo en un entorno informático propicio para reducir los procesos
de codificación y minimizar los errores de trascripción. Finalmente, debe realizarse la
monitorización y el seguimiento estrecho durante la recogida de estos datos.
Básicamente existen dos métodos para asegurar la calidad de los datos. El primero y
más simple es analizar la calidad de los datos dentro de la misma base. Con ello, inicial-
mente detectaremos los valores perdidos (valores missing). Asimismo, mediante la apli-
cación de rangos en las variables categóricas, se pueden detectar valores incongruen-
tes en esas bases de datos, que son más preocupantes que los valores missing. En
efecto, los valores no congruentes pueden afectar más los resultados de un estudio
epidemiológico que los valores perdidos. En otras palabras, en las grandes bases de da-
tos es preferible tener un 5% de valores perdidos que 1,5% de valores incongruentes,
de ahí la importancia de identificarlos. El segundo método, para garantizar y validar la ca-
lidad de los datos, radica en reproducir exactamente la recogida de datos de una parte
de la muestra inicial y compararla con la muestra original. El grado de acuerdo o concor-
dancia entre las variables categóricas de las dos muestras será determinado por el índi-
ce kappa. De esta manera, un índice de kappa que se acerque a la unidad, indicará una
gran similitud entre las muestras y avalará, por tanto, la calidad de los datos.
189
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 189
A pesar de estas medidas, es esperable que aún se cometan errores. Por ello, se hacen
necesarias, en ocasiones, las auditorías de la veracidad de los registros, que comparan
los datos contenidos en las propias bases de datos con los datos de las historias clínicas
de los pacientes. En este sentido, un estudio reciente sobre el control de calidad del re-
gistro europeo de trasplante hepático, en el que se auditó de modo aleatorio las bases
de datos de 21 centros europeos (12 países), comprobó que los datos, en su gran ma-
yoría, eran fiables, así como los resultados científicos derivados de los mismos. Los au-
190
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Registro/base Información Contenido y Dirección
de datos de órganos recogida de datos electrónica
UNOS Scientific Riñón, hígado Basal, 6 meses www.unos.org
Registry Transplant páncreas, órganos y cada año hasta la
Database (USA) torácicos y otros muerte o pérdida
órganos sólidos de injerto
USRDS (USA) Información sobre Datos demográficos, www.usrds.org
tratamiento de la clínicos y
insuficiencia renal económicos
crónica terminal
Collaborative Riñón, hígado, Basal, 3, 6 y www.ctstransplant.org
Transplant Study. corazón, pulmón 12 meses
(Coordinado por la y páncreas post-trasplante.
Universidad de Después
Heidelberg) anualmente
Australia and New Insuficiencia renal Basal y cada www.anzdata.org
Zealand Dialysis crónica terminal y 6 meses
and Transplant trasplante de riñón
Registry (ANZDATA)
European Liver Hígado Datos demográficos, www.eltr.org
Transplant Registry clínicos y
epidemiológicos
ISHLT International Órganos torácicos Comparte datos www.ishlt.org/
Registry for Heart con la UNOS, regist.htm
and Lung Eurotransplant y
Transplantation UK Transplant
NAPRTCS Riñón Datos del trasplante http://spitfire.emmes.
The North American y el crecimiento com/study/ped
Pediatric Renal
Transplant Cooperative
Study
Tabla XII. Información sobre algunas de las bases de datos o registros de
trasplantes.
Cap 07 4/10/04 12:51 Página 190
tores concluyeron, en este trabajo, que este método puede servir como modelo para
auditar los registros y garantizar su calidad.
Herramientas estadísticas. Medidas de propensión
Contrariamente a los EC, los EO y los registros son muy vulnerables a factores de con-
fusión que pueden debilitar la contundencia de sus resultados. Independientemente de
especificar una clara hipótesis de trabajo previo al examen de los datos, la elección de
modelos estadísticos apropiados (univariados o multivariados) es otro paso crucial para
el análisis de los registros y las curvas de supervivencia en el trasplante renal.
Concretamente, la aplicación de análisis de regresión multivariados minimizan el efecto
de las variables de confusión en la interpretación de los resultados de los EO.
Antes de realizar modelos de regresión múltiple, la primera aproximación para el análisis
de supervivencia en estos enfermos, debe ser una curva de Kaplan-Meier de cada una de
las variables que, potencialmente, pueden influir en dicha supervivencia. Con ello, se ob-
servará el comportamiento individual de cada una de las variables sobre el pronóstico a
estudiar. No obstante, cuando se comparan las curvas de supervivencia, resulta difícil ob-
tener dos muestras homogéneas en todos los factores que puedan afectar al resultado
del estudio. Asimismo, puede ocurrir que una variable, que condiciona mortalidad, se ana-
lice individualmente y pierda su significación estadística al hacerla interrelacionar o ajus-
tarla con otras variables. Para salvar estos obstáculos se requiere la aplicación de mode-
los de regresión, como el desarrollado por Cox, denominado también modelo proporcio-
nal. Este modelo permite calcular el riesgo relativo del pronóstico en cuestión, en función
de posibles variables explicativas, asumiendo que, a medida que transcurre el tiempo, el
riesgo de los dos grupos, que se están comparando, varía de una forma proporcional el
uno con el otro. Estos aspectos se analizan en profundidad en otro capítulo de esta obra.
Estos modelos de regresión pueden, a su vez, utilizarse con dos objetivos: 1) predicti-
vo, en el que el interés del investigador es predecir la variable dependiente (muerte, fa-
llo del injerto, etc.) en función de un conjunto de variables independientes (rechazos,
función renal, etc.); y 2) estimativo, en el que el interés radica en estimar la relación de
una o más variables independientes con la variable dependiente. El siguiente paso con-
siste en establecer la estrategia de modelización o formas de desarrollar el modelo de
regresión. Brevemente, estas estrategias se deben aplicar en función del tipo de estu-
dios que queramos desarrollar y consisten en:
1. Estrategia Backward o “hacia detrás” (la más recomendada para estudios predicti-
vos). Se aplica introduciendo el máximo número de variables que interese analizar y
se van quitando, de una en una, en función del menor grado de significación esta-
dístico (para objetivo predictivo) o en función de que sean o no “contundentes”
(objetivo estimativo).
191
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 191
2. Estrategia Forward o “hacia delante”. Se parte de una única variable y se van intro-
duciendo todas las demás variables, hasta conseguir el modelo definitivo. La inclu-
sión de variables se hace en función, también, de que queramos un modelo predic-
tivo o estimativo.
3. Estrategia Stepwise o “paso a paso”. Es una modificación de la anterior para evitar
que una estrategia “hacia delante” quede con variables no significativas.
El investigador debe elegir los factores de corrección apropiados (covariables) y conside-
rar posibles interacciones entre las variables más relevantes. Asimismo, puede ser útil
también la transformación de ciertas variables continuas, que no guardan una clara rela-
ción con el modelo proporcional de riesgos, en variables categóricas de más fácil manejo
en el contexto de estos modelos multivariados. En cualquier caso, la inclusión de varia-
bles con alto grado de colinearidad (variables en función de otras o que están relacionadas
entre sí) puede, también, sobrestimar el modelo innecesariamente. Por el contrario, la
omisión de variables relevantes en dicho modelo puede conducir a la aparición de sesgos.
Por otra parte, los valores perdidos (missing) también suponen un obstáculo en el análi-
sis de los resultados de los registros de trasplante. De una manera simplista, pero en-
gañosa, estos valores pueden ser ignorados. Sin embargo, esto puede conducir a la pér-
dida de poder estadístico y, lo que es peor, puede contribuir a introducir sesgos en los
resultados. La categorización de una variable, que incluya estos valores missing o su im-
putación en el análisis estadístico, pueden ser algunas de las medidas correctoras para
estos valores perdidos.
En los EO, los grupos comparados son con frecuencia diferentes entre sí, producto de
la falta de aleatorización de los mismos. Individuos con especiales características bioló-
gicas pudieran tener más posibilidades de una determinada exposición o tratamiento
que los pacientes del grupo comparativo. Estas características son los denominados
factores de confusión, que pueden afectar el pronóstico final y producir sesgos en los
resultados. La regresión logística es un método habitual para paliar esta situación. Su
principal ventaja es su capacidad de controlar múltiples variables simultáneamente, pe-
ro ante escasos eventos pudiera estar limitado el número de variables, que resulta ade-
cuado incluir simultáneamente (en general, una variable por cada 8-10 eventos). Otro
método interesante para solventar esta situación son los índices o medidas de propen-
sión (propensity score). Conceptualmente, es la probabilidad condicional de que un indi-
viduo reciba un determinado tratamiento o se exponga a un específico factor de riesgo,
en función de las variables de confusión. Para el cálculo de un índice de propensión
(IP) se utiliza la regresión logística, en la que se incluyen los factores de confusión como
variables independientes, y como variable dependiente la exposición (el empleo de un
determinado tratamiento, la presencia de rechazo agudo, etc.). Cada paciente tendrá,
por tanto, un IP resultante de la suma de los coeficientes β de los diferentes factores
que influyen sobre la variable dependiente (exposición determinada) en la regresión lo-
192
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 192
gística. En este momento, las probabilidades estimadas (variable con la suma del índice)
se dividen en tertiles o quintiles para estratificar el riesgo. Finalmente, para estimar el
impacto de la exposición sobre el pronóstico, usando el IP, se debe construir un modelo
de regresión logística donde la variable dependiente es, ahora, el pronóstico y las varia-
bles independientes son la exposición determinada y las categorías del IP (estratifica-
ción del índice en tertiles quintiles). El IP es, en definitiva, una eficiente manera de con-
densar la información de muchos factores confundentes en una sola variable.
En conclusión, existen potentes herramientas estadísticas que mitigan los posibles fac-
tores confundentes de los EO. Sin embargo, como toda técnica matemática, su uso ina-
decuado o el desconocimiento de los principios básicos de su aplicación conducen a re-
sultados que, aunque significativos, se alejan de la realidad de la práctica clínica. En el
mejor de los casos, los investigadores deberían también ser conscientes de las limita-
ciones de estos EO y ser cautos a la hora de establecer conclusiones más allá de los lí-
mites del propio modelo de estudio.
Comorbilidad y sus instrumentos de medida
La comorbilidad es el conjunto de condiciones médicas distintas de la enfermedad en
estudio (como por ejemplo, el tratamiento sustitutivo de la función renal) que, conjunta-
mente, conlleva una mayor morbimortalidad. Obviamente, cuanto mayor es la comorbi-
lidad, más se incrementa la mortalidad y el consumo de recursos económicos y sanita-
rios. De ahí, la importancia de profundizar en su conocimiento.
La más simple aproximación al estudio de la comorbilidad es clasificar a los pacientes
en base a la presencia o ausencia de una o varias condiciones, potencialmente comórbi-
das (diabetes, enfermedad cardiovascular, etc.). Otra manera de conocer la comorbili-
dad es sumar las condiciones comórbidas coexistentes en un mismo individuo. Sin em-
bargo, la manera más precisa de expresarla es a través de los índices de comorbilidad
(IC), los cuales agrupan, en diferentes grados o escalas, los factores de riesgo de una
entidad. Con ello, podremos conocer el impacto acumulativo de diferentes condiciones
comórbidas sobre la mortalidad.
El estudio de la comorbilidad puede representar una herramienta muy útil para controlar
factores de confusión en los estudios epidemiológicos que emplean importantes bases
de datos. Por tanto, los EO y los grandes registros representan los pilares de los dife-
rentes IC. Básicamente, esto lo consiguen por el importante número de pacientes que
incluyen durante un largo periodo de seguimiento (en general, más de diez años). De
ello se infiere que los IC son predictores de supervivencia o de estados de salud que
nos pueden ayudar como marcadores pronósticos en estudios longitudinales de dife-
rentes entidades clínicas. Este conocimiento también servirá para diseñar estrategias
terapéuticas específicas, en aras a disminuir la morbimortalidad.
193
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 193
En general, el rendimiento predictivo de los IC, que se apoyan en los registros o gran-
des bases de datos, depende de varios factores, que incluyen: 1) las condiciones clíni-
cas incluidas en el IC y sus pesos estadísticos relativos; 2) la distribución de las condi-
ciones comórbidas en la población de estudio; 3) la variable final primaria (end point) del
estudio; y 4) la precisión de los datos. Existen múltiples IC en diferentes áreas de la me-
dicina que cumplen estos criterios. El índice de Charlson o el índice de enfermedades
coexistentes (ICED), en la población general, el índice de la Sociedad Americana de
Anestesia (ASA Index), o el de la patología mamaria son algunos de los ejemplos más
representativos. En todos, el denominador común es estratificar el riesgo con la finali-
dad de predecir la mortalidad.
Los enfermos renales no podían ser una excepción y la primera aproximación hacia la
búsqueda de un IC sistemático, en estos pacientes, data de 1982: Hutchinson y cols.,
utilizando como factores comórbidos la edad, la diabetes mellitus y el fallo ventricular iz-
quierdo, elaboraron un valioso IC mediante un modelo matemático. Desde entonces se
han aplicado diversos IC en la población urémica con resultados satisfactorios. Algunos
se basan en los IC de la población general como el de Charlson o el ICED, y otros son
de nueva creación, como el índice de Khan, el índice de Davies o el de van Manen, en-
tre otros. Todos predicen el riesgo de muerte con un alto índice de concordancia y todos
han sido validados en diferentes poblaciones, en distintos periodos de tiempo, o se han
aplicado de una forma aleatorizada en la misma población. Más aún, en todos estos IC
se ha incluido la edad y otras condiciones comórbidas categorizadas en diferentes esca-
las de riesgo.
A pesar de que estos IC son buenos predictores de mortalidad en los pacientes en diáli-
sis, poco se sabe sobre su utilidad en la población trasplantada. Aunque estos pacientes
tienen un mejor pronóstico que la población en diálisis, presentan una mortalidad signifi-
cativamente mayor que la población general de edad y sexo similares. Esta peor super-
vivencia se debe, en general, a la suma de una alta prevalencia de factores clásicos de
riesgo y factores inherentes al propio trasplante renal. Y es que, en pocas entidades clí-
nicas se agregan tantos factores de riesgo como en el trasplante renal.
En un estudio preliminar, nosotros elaboramos un IC de fácil manejo y aplicación a partir
de 1.293 pacientes trasplantados renales incluidos en una base de datos. Para minimi-
zar el sesgo de la sobreestimación del IC, se aleatorizó la muestra en dos subpoblacio-
nes (población modelo y estudio), determinándose en la población modelo el peso es-
pecífico (coeficiente ß) de cada factor de riesgo sobre la supervivencia (análisis de Cox).
Estos factores incluían la edad, factores tradicionales de riesgo vascular y otros factores
inherentes al trasplante renal, como necrosis tubular, condición de re-trasplante, recha-
zos, tiempo previo en diálisis, etc.). Con esta información se estratificó la población de
estudio en tres niveles de riesgo (alto, medio y bajo) y se determinaron las curvas de su-
pervivencia de Kaplan-Meier en función de estas escalas de riesgo. Finalmente, los re-
194
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 194
sultados fueron comparados con la aplicación del índice de Charlson, con ligeras modifi-
caciones, en la población de estudio. Sorprendentemente, la concordancia estadística
fue excelente con el nuevo índice y ligeramente superior al índice de Charlson (0,91 versus
0,90). Asimismo, el nuevo IC mostró una mejor capacidad discriminatoria para predecir
la mortalidad, de manera que los enfermos de bajo riesgo presentaron unas tasas de su-
pervivencia de 95 y 93% a los 2 y 5 años, respectivamente, tras la aplicación de este
nuevo IC. Con las reservas de sus limitaciones, la confirmación de estos resultados en
otras poblaciones y con mayor número de pacientes puede representar un método fia-
ble, elaborado a la cabecera del enfermo, para mejorar el pronóstico de los pacientes
con trasplante renal.
BIBLIOGRAFÍA RECOMENDADA
Sección 1. Ensayos clínicos
1. Bakke OM, Carné X, García Alonso F. Ensayos clínicos con medicamentos.
Fundamentos básicos, metodología y práctica. Barcelona: Ediciones Doyma 1994.
2. Real Decreto 561/1993, de 16 de abril, por el que se establecen los requisitos para la
realización de ensayos clínicos con medicamentos. Ministerio de Sanidad y
Consumo. BOE nº 114, 1993.
3. International Conference on Harmonisation of technical requirements for registra-
tion of pharmaceuticals for human use. ICH tripartite guideline for Good Clinical
Practice. Ginebra: ICH Secretariat 1996.
4. Directiva 2001/20/CE del Parlamento Europeo y del Consejo de 4 de abril de 2001
relativa a la aproximación de las disposiciones legales, reglamentarias y administrati-
vas de los Estados miembros sobre la aplicación de buenas prácticas clínicas en la
realización de ensayos clínicos de medicamentos de uso humano. Diario Oficial de
la Comunidades Europeas. 1 de mayo de 2001. L 121/34-44.
5. EMEA/CPMP Position Statement on the use of placebo in clinical trials with regard
to the revised Declaration of Helsinki. London, 28 June 2001. EMEA/17424/01.
6. The Nuremberg Code. JAMA 1996; 276: 1.691.
7. The World Medical Association, Inc. Declaration of Helsinki. Recommendation gui-
ding physicians in biomedical research involiving human subjects. Adopted by the
18th
World Medical Assembly, Helsinki, 1964. Amended by the 29
th
WMA, Tokio,
1975; 35
th
WMA, Venecia, 1983; 41
th
WMA, Hong Kong, 1989; 48
th
WMA, Somerset
West, 1996; 52
th
WMA, Edimburgo, 2000.
8. Moher D, Schulz KF, Altman DG for the CONSORT Group. The CONSORT state-
ment: revised recommendations for improving the quality of reports of parallel-
group randomised trials. Lancet 2001; 357: 1191-4.
9. Guyatt GH. Sachett DL, Cook DJ. User´s guides to the medical literature. II.
How to use an article about therapy or prevention. JAMA 1993; 270: 2598-601 y
271: 59-63.
195
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 195
10. Oxman AD, Cook DJ, Guyatt GH. User´s guides to the medical literature. VI. How to
use an overview. JAMA 1994; 272: 1367-71.
11. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF for the QUORUM
Group. Improving the quality of reports of meta-analysis of randomised controlled
trials: the QUORUM statement. Lancet 1999; 354: 1896-1900.
12. Schwart D, Lellouch J. Explanatory and pragmatic attitudes in therapeutic trials. J
Chron Dis 1967; 20: 637-48.
13. Lexchin J, Bero LA, Djulbegovic B, Clark O. Pharmaceutical industry sponsorship
and research outcome and quality: systematic review. BMJ 2003; 326: 1-10.
14. Mekander H, Ahlqvist-Rastad J, Meijer G, Beermann B. Evidence based medicine-
selective reporting from studies sponsored by pharmaceutical industry: review of
studies in new drug apllications. BMJ 2003; 326: 1-5.
15. Manheimer E, Anderson D. Survey of public information about ongoing clinical trials
funded by industry: evaluation of completeness and accessibility. BMJ 2002; 325:
528-31.
16. Soto Álvarez J. Inclusión de análisis farmacoeconómicos en ensayos clínicos: princi-
pios y prácticas. Med Clin (Barc) 2003; 120: 227-35.
17. Hariharan S, MCbride MA, Cohen EP. Evolution of endpoints for renal transplant out-
come. Am J Transplant 2003; 3: 933-41.
18. Orofino L, Pascual J (eds). Nefrología basada en la evidencia. Nefrología 1998 (su-
plemento).
19. García López F, Amenábar Iríbar JJ. The intrincate relationship between evidence
and clinical practice in kidney transplantation. J Nephrol 2000; 13: 405-14.
20. Hernández D, García López F. Ensayos clínicos en trasplante renal: muchos y pocos.
Un análisis de la evidencia. Nefrología 2003; 23: 211-8.
Sección 2. Registros y estudios observacionales
21. Grimes DA, Schulz KF. An overview of clinical research: the lay of the land. Lancet
2002; 359: 57-61.
22. Hornberger J, Wrone E. When to base clinical policies on observational versus ran-
domized trial data. Ann Intern Med 1997; 127 (8 Pt 2): 697-703.
23. Michels KB, Braunwald E. Estimating treatment effects from observational data.
JAMA 2002; 287: 3130-2.
24. Hanto DW. Reliability of voluntary and compulsory databases and registries in the
United States. Transplantation 2003; 75: 2162-4.
25. Van der Meulen JHP, Jaco M, Copley L. Assessing the quality of the data in a trans-
plant registry: the European liver transplant registry. Transplantation 2003; 75: 2164-7.
26. Karam V, Gunson B, Roggen F, Grande L, Wannoff W, Janssen M, Guckelberger O,
Delvart V, Bismuth H, Höckerstedt K, Rogiers X, Adam R. Quality control of the
European liver transplant registry: results of audit visits to the contributing centers.
Transplantation 2003; 75: 2167-3.
196
MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL
Cap 07 4/10/04 12:51 Página 196
27. Kaplan B, Schold J, Meier-Kriesche H-U. Overview of large database analysis in re-
nal transplantation. Am J Transplant 2003; 3: 1052-6.
28. Fernández M, Abraira V, Quereda C, Ortuño J. Curvas de supervivencia y modelos
de regresión: errores y aciertos en la metodología de aplicación. Nefrología 1996;
16: 383-90.
29. Klabunde CN, Warren JL, Legler JM. Assesing comorbidity using claims data. Med
Care 2002; 40 (Suppl.): IV26-IV35.
30. Schneeweiss S, Seeger JD, Maclure M, Wang PS, Avorn J, Glynn RL. Performance
of comorbidity scores to control for confounding in epidemiologic studies using
claims data. Am J Epidemiol 2001; 154: 854-64.
31. Schneeweiss S, Maclure M. Use of comorbidity scores for control of confounding in
studies using administrative databases. Int J Epidemiol 2000; 29: 891-8.
32. Hutchinson TA, Thomas DC, MacGibbon B. Predicting survival in adults with end-sta-
ge renal disease: an age equivalence index. Ann Intern Med 1982; 96: 417-23.
33. Charlson ME, Pompei P, Ales KL, MacKenzie CR. A new method of classifying prog-
nostic comorbidity in longitudinal studies: development and validation J Chron Dis
1987; 40: 373-83.
34. Khan IH, Catto GRD, Edward N, Fleming LW, Henderson IS, MacLeod AM.
Influence of coexisting disease on survival on renal-replacement therapy. Lancet
1993; 341: 415-8.
35. Beddhu S, Zeidel ML, Saul M, Seddon P, Samore MH, Stoddard GJ, Bruns FJ. The
effects of comorbid conditions on the outcomes of patients undergoing peritoneal
dialysis. Am J Med 2002; 112: 696-701.
36. Van Manen JG, Korevaar JC, Dekker FW, Boeschoten EW, Bossuyt PMM, Krediet
RT. How to adjust for comorbidity in survival studies in ESRD patients: a comparison
of different indices. Am J Kidney Dis 2002; 40: 82-9.
37. Lash TL, Thwin SS, Horton NJ, Guadagnoli E, Silliman RA. Multiple informants: a
new method to assess breast cancer patient´s comorbidity. Am J Epidemiol 2003;
157: 249-57.
197
RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS
Cap 07 4/10/04 12:51 Página 197

METODOS ESTADISTICOS EN EL TRANSPLANTE

  • 1.
    T R AS P L A N T E S S I G L O X X I MÉTODOSESTADÍSTICOSENELTRASPLANTERENAL 1 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL B i b l i o t e c a d e TRASPLANTESSIGLOXXI Bibliotecade 1 07.04-CEL-L05 Roche Farma, S. A. C/ Eucalipto, 33. 28016 Madrid Tel. 91 324 81 00 - Fax 91 324 83 50 www.roche.es www.roche-trasplantes.com
  • 2.
    T R AS P L A N T E S S I G L O X X I MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL B i b l i o t e c a d e 1 Paginas iniciales 4/10/04 12:37 Página 1
  • 3.
    Edificio Vértice AntonioLópez, 249 - 1º 28041 - MADRID ISBN Obra completa: 84-96305-20-1 ISBN Primer volumen: 84-96305-21-X D.L.: ©2004 DRUG FARMA S.L. Reservados todos los derechos. Ninguna parte de esta publicación puede ser reproducida sin el permiso escrito del titular del Copyright. Esta publicación se ha realizado con la colaboración de Roche Farma. DRUG Paginas iniciales 4/10/04 12:37 Página 2
  • 4.
    3 ÍNDICE Presentación 7 M. Arias Introducción9 M. Arias Estadística en Biomedicina: una herramienta peligrosa 11 M. Delgado, J. Llorca Esquema general de análisis estadístico de una población trasplantada 31 R. Escallada, M. Arias Curvas de vida y supervivencia en el tratamiento sustitutivo de la insuficiencia renal: diálisis y trasplante renal 67 V. Abraira, C. Quereda El concepto de semivida como predictor de la supervivencia a largo plazo 135 R. Escallada De las bases de datos a los programas estadísticos 149 J. C. Ruiz San Millán Resultados del trasplante renal: ensayos clínicos y registros 163 J. Pascual, D. Hernández Paginas iniciales 4/10/04 12:37 Página 3
  • 5.
  • 6.
    ÍNDICE DE AUTORES COORDINADOR ManuelArias Jefe de Servicio y Catedrático de Nefrología Hospital Universitario Marqués de Valdecilla (Santander) AUTORES Victor Abraira Unidad de Bioestadística Clínica Hospital Ramón y Cajal (Madrid) Miguel Delgado Rodríguez Catedrático de Medicina Preventiva y Salud Pública Universidad de Jaén Rafael Escallada Cotero Nefrólogo Director Centro de Diálisis DIALSAN (Santander) Domingo Hernández Miembro del Grupo de Medicina Basada en la Evidencia en Trasplante Renal de la Sociedad Española de Nefrología. Médico Adjunto Servicio de Nefrología. Hospital Universitario de Canarias (Tenerife) Javier Llorca Díaz Profesor Titular de Medicina Preventiva y Salud Pública Universidad de Cantabria Julio Pascual Santos Miembro del Grupo de Medicina Basada en la Evidencia en Trasplante Renal de la Sociedad Española de Nefrología. Médico Adjunto Servicio de Nefrología. Hospital Ramón y Cajal (Madrid) Carlos Quereda Servicio de Nefrología Hospital Ramón y Cajal (Madrid) Juan Carlos Ruiz San Millán Médico Adjunto Servicio de Nefrología Hospital Universitario Marqués de Valdecilla (Santander) 5 Paginas iniciales 4/10/04 12:37 Página 5
  • 7.
    7 PRESENTACIÓN TRASPLANTES SIGLO XXI “Laimposibilidad de una obra no es siempre motivo para no emprenderla, siempre que el autor no se haga, con respecto a ella, demasiadas ilusiones“ (Ortega y Gasset). Una serie monográfica y continuada sobre trasplantes plantea una serie de dificultades que la acercan a la utopía, pero el reto está en aproximar lo más posible esta utopía a la re- alidad. Ya en sí, es difícil definir claramente el objetivo y los fines de una serie de monogra- fías sobre trasplante renal en estos días de avalancha de información fácilmente accesible. Hemos valorado la conveniencia y necesidad de abordar tópicos de actualidad junto con otros básicos que convenga poner al día. Esta biblioteca estará integrada por monografías que tendrán principio y fin en sí mismas, desarrolladas por expertos en cada materia, y editadas en un formato cómodo y coleccionable. Esta idea de Roche Trasplantes se pone en marcha hoy con esta primera entrega sobre Métodos estadísticos en trasplante renal. La continuidad de la serie depende de todos nosotros. Manuel Arias Cap 01 4/10/04 12:45 Página 7
  • 8.
    Cap 01 4/10/0412:45 Página 8
  • 9.
    9 INTRODUCCIÓN MÉTODOS ESTADÍSTICOS EN ELTRASPLANTE RENAL ¿Es mejor ciclosporina que tacrolimus en el trasplante renal de cadáver? ¿Tiene valor la compatibilidad HLA en el emparejamiento actual donante-receptor en trasplante de riñón de cadáver en pacientes hipersensibilizados? ¿La supervivencia de los injertos a largo plazo es diferente en los pacientes a los que se les retiran los esteroides? ¿Es mejor la diálisis o el trasplante en pacientes diabéticos tipo 2? Hablar de trasplante es hablar de estadística y de comparaciones. Nos movemos entre decisiones que intentan equilibrar los buenos resultados con la ausencia de efectos secundarios en un contexto de múltiples factores que intervienen sobre un paciente concreto en el que el aislamiento de una variable no es posible como suele suceder en el laboratorio o en los modelos animales experimentales. Del análisis correcto de la propia experiencia se pueden deducir pautas de comporta- miento en nuestro círculo asistencial que son exportables en el caso de suponer una mejoría o cambio positivo sobre lo existente. La exposición de estas experiencias propias tienen que hacerse a través de revistas científicas y sometidas a revisión por expertos, en la que, lógicamente, el análisis esta- dístico va a ser fundamental. Las posibilidades de error y manipulación de la estadística en biomedicina han dado lugar a una leyenda negativa que arrastra un cierto escepticis- mo que perjudica el rigor científico. Frases como “la estadística es la herramienta que permite torturar los datos hasta que canten” expresan ese desencanto que muchas veces está basado en la ignorancia o el conocimiento incompleto de las técnicas y fun- damentos de la estadística. La falta de formación durante generaciones, ahora en vías de mejora, ha llevado a la adquisición desordenada de conocimientos y al autodidactismo con la consiguiente inseguridad y falta de dominio en esta materia. Cap 01 4/10/04 12:45 Página 9
  • 10.
    10 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL La disciplina y el rigor en la recogida de datos es el primer paso ineludible que obliga, muchas veces, a una autocrítica sobre nuestros documentos clínicos y bases de datos y a una permanente renovación. Sobre la base de unos datos rigurosos y bien seleccionados, la herramienta que es la estadística hará “cantar” a los datos sin necesidad de torturarlos sino orientados a con- testarnos a las preguntas que nos preocupen y a proporcionarnos ayuda en la toma de decisiones complejas en las que nada es blanco o negro. Seguiremos necesitando el consejo de expertos, como los que he tenido la suerte de coordinar en esta monografía, pero una puesta al día teórica, con el mayor correlato práctico que puede permitir el formato libro, parecía necesario en el ámbito que es el trasplante renal. Con esta idea diseñamos el contenido de este primer volumen de la serie de monogra- fías Trasplantes Siglo XXI en el que hemos podido contar con una serie de personas que reúnen la condición de expertos en el tema y de ser amigos. Esta segunda cualidad es la que ha hecho posible que acepten esta tarea, buscando un hueco entre sus muchas ocupaciones, lo que les agradezco profundamente. Si en algún momento este libro ayuda a alguien a solucionar o, por lo menos, a plante- ar correctamente el análisis de una población de trasplantados renales y a analizar correctamente los métodos empleados en trabajos y propuestas de ensayos clínicos, nos daremos por satisfechos. Manuel Arias Cap 01 4/10/04 12:45 Página 10
  • 11.
    ESTADÍSTICA EN BIOMEDICINA: UNAHERRAMIENTA PELIGROSA M. Delgado, J. Llorca INTRODUCCIÓN En este apartado se expondrán una serie de errores frecuentes en el análisis de datos en la literatura médica. En lo posible, se utilizarán ejemplos sobre trasplantes, pero ello no significa que los artículos sobre trasplantes cometan estos errores con más frecuen- cia; ocurren también en otros campos de la investigación médica. Claro está que para la valoración de estos errores, es imprescindible que, dentro de la sección de métodos de un artículo, se aborde la metodología estadística empleada, y sorprende que aún haya estudios en los que no se describen estas técnicas (Verran et al. 2001, Antonopoulos et al. 2001). En la primera sección, se establecen las diferencias entre asociación estadística y cau- salidad, para lo que es necesario definir el sesgo de confusión. La segunda sección se centra en separar los modelos predictivos de los explicativos; son dos tipos de modelos que se obtienen como resultado de las mismas técnicas de análisis multiva- riable, pero que deben interpretarse de forma diferente. La sección 3 aborda un pro- blema habitual en el análisis de supervivencia: la existencia de seguimientos incom- pletos, que obliga a introducir el concepto de “censura”; se discuten las “censuras” informativa y no informativa y, como consecuencia, el problema de riesgos competi- tivos de muerte, una situación en la que el análisis de supervivencia requiere técnicas distintas de las utilizadas habitualmente. En la sección 4, se discute la asunción de proporcionalidad que permite emplear la regresión de Cox, una técnica de uso habi- tual para estimar supervivencia. En la sección 5, se abordan algunos errores menos típicos que se han encontrado al revisar la literatura sobre trasplantes (uso de técni- cas estadísticas inadecuadas, errores en la comunicación de resultados,etc.). 11 Cap 02 4/10/04 12:46 Página 11
  • 12.
    12 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Finalmente, en la sección 6 se aborda el recordatorio de otras consideraciones meto- dológicas aparte del análisis de datos. ASOCIACIÓN Y CAUSALIDAD Uno de los objetivos más frecuentes en un estudio sobre trasplantes es medir la aso- ciación entre dos variables. Por ejemplo, los investigadores pueden estar interesados en comprobar si un injerto renal, procedente de un donante vivo, está más o menos aso- ciado a la supervivencia inmediata del injerto que si procediera de un donante cadáver. Igualmente, podría investigarse si un trasplante cardíaco tiene mejor pronóstico a largo plazo, cuando hay compatibilidad HLA, que cuando sólo hay compatibilidad ABO. Esta fuerza de asociación se suele medir empleando el riesgo relativo (RR) en cualquie- ra de sus formas. En el ejemplo del injerto renal, probablemente se presentaría la razón de odds (odds ratio, OR) obtenida por regresión logística; y en el ejemplo del pronóstico a largo plazo, probablemente se mediría la razón de tasas (hazards ratio) mediante la regresión de Cox. En ambos casos, la interpretación que se hace es la misma: si el RR es mayor de 1, el factor estudiado está asociado a una menor supervivencia. Sin embar- go, es frecuente que en la literatura médica se cometa el error de interpretar un riesgo relativo mayor de 1 como si el factor (injerto de donante vivo o compatibilidad ABO) fuera la causa de mayor supervivencia. Para mostrar la diferencia es necesario aclarar el con- cepto de causa. La existencia de asociación estadística es el punto de partida para establecer, entre dos variables, una relación de causalidad (Rothman y Greenland, 2000). Se han enumerado muchos criterios de causalidad pero, en definitiva, se reducen a comprobar que la causa presumible preceda, en el tiempo, al efecto, y que la asociación observada no se deba a la existencia de sesgos en la selección de la muestra, en la recogida de datos, en su análisis o a que no se considere la interferencia que producen otras causas (el sesgo de confusión). En el supuesto de que un estudio haya sido correctamente realizado (sin ses- gos de selección, información o análisis incorrecto), el motivo fundamental, para que exista asociación pero no causalidad, es la presencia de factores de confusión. Factores de confusión Para comprender qué es un factor de confusión, considérese el siguiente ejemplo hipo- tético: se quiere comparar la mortalidad intrahospitalaria de los trasplantes cardíacos en dos hospitales (A y B). Los resultados iniciales se presentan en la Tabla I. Se observa que un RR = 2, lo que sugiere que la mortalidad en el hospital A es el doble que en el hos- pital B. Sin embargo, los investigadores se dieron cuenta de que en el hospital A se rea- lizaban más trasplantes de emergencia, los cuales tienen una mayor mortalidad quirúr- gica. Entonces, surge la pregunta: ¿la mayor mortalidad en el hospital A se debe a que Cap 02 4/10/04 12:46 Página 12
  • 13.
    en el mismose hacen peor los trasplantes (relación causal)?, ¿o se debe a que los tras- plantes se realizan en situación de emergencia (factor de confusión)? Para comprobarlo, analizaron por separado la mortalidad en el trasplante de emergencia y en el trasplante sin emergencia. Los resultados se muestran en la Tabla II. En los pacientes que reciben un trasplante de emergencia, la mortalidad en el hospital A es la misma que en el B (RR = 1,0); en cuanto a los que reciben el trasplante de forma programada, la mortalidad en ambos hospitales es también casi la misma (RR = 1,1). Este resultado muestra que las diferencias entre ambos hospitales no se deben al hospital mismo (relación causal), sino que hay otra variable –la emergencia quirúrgica– que “con- funde” la relación entre hospital y mortalidad. En este caso, se dice que la emergencia quirúrgica es un “factor de confusión”. 13 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Análisis crudo Muerte Supervivencia Total Riesgo relativo intrahospitalaria Hospital A 40 360 400 Hospital B 25 475 500 40/400 = 2,0 25/500 Tabla II. Mortalidad intrahospitalaria en el trasplante cardíaco en dos hospitales. Análisis estratificado en función de la emergencia. Cirugía de emergencia Muerte Supervivencia Total Riesgo relativo intrahospitalaria Hospital A 35 65 100 Hospital B 17 33 50 Cirugía programada (sin emergencia) Muerte Supervivencia Total Riesgo relativo intrahospitalaria Hospital A 5 295 300 Hospital B 8 442 450 Tabla I. Mortalidad intrahospitalaria en el trasplante cardíaco en dos hospitales. 35/100 = 1,0 17/50 5/300 = 1,1 8/450 Cap 02 4/10/04 12:46 Página 13
  • 14.
    La relación entrelas tres variables (hospital, mortalidad y emergencia) se muestra en la Figura 1. Para saber si una variable es un factor de confusión es necesario comprobar tres criterios: • Criterio 1: el factor de confusión es un factor de riesgo del efecto independiente de la exposición o variable que se estudia. En nuestro ejemplo, la cirugía de emergen- cia es un factor de riesgo de la mortalidad en cualquier hospital. • Criterio 2: el factor de confusión está asociado al factor que se estudia. En el ejem- plo, la cirugía de emergencia es más frecuente en el hospital A. • Criterio 3: el factor de confusión no es una consecuencia del factor que se estudia (ni tampoco consecuencia del efecto). En el ejemplo, este criterio se cumple si el hospital A no demora el trasplante hasta que se produce la emergencia. Control de factores de confusión en el análisis ¿Qué debe hacer el investigador en el análisis cuando encuentra un factor de confusión? Hay básicamente dos alternativas: análisis estratificado (como el que se ha realizado en este ejemplo) y análisis multivariable. El análisis estratificado, que debe realizarse siem- pre antes del multivariable para tener un mejor conocimiento de los datos, sólo es útil cuando hay uno o dos factores de confusión, porque puede ser inmanejable, con un número mayor, el número de estratos. El análisis multivariable consiste en introducir dentro del modelo (por ejemplo, de regresión logística o de regresión de Cox), la varia- 14 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Censura: Vivos con función del injerto Fallo: Muertos con fun- ción del injerto Fallo: Vivos con fracaso del injerto Censura: Vivos con función del injerto Censura: Muertos con fun- ción del injerto Fallo: Vivos con fracaso del injerto (a) (b) Figura 1. Dos formas de analizar la supervivencia del injerto. En (a), la muerte con fun- ción se considera fallo; en (b), la muerte con función se considera dato censurado. En (b), la muerte actúa como un riesgo competitivo: si aumenta la mortalidad, disminuye el riesgo de fracaso del injerto. Cap 02 4/10/04 12:46 Página 14
  • 15.
    ble de interésy los factores de confusión. En el ejemplo que se está presentando, se utilizaría la regresión logística en la que se relacionaría la probabilidad de muerte con el hospital y con la cirugía de emergencia. Un problema añadido se presenta cuando hay un gran número de variables candidatas a ser incluidas en el modelo de regresión. ¿Cuáles de ellas deben seleccionarse? ¿Existe alguna regla de selección? Un procedimiento que frecuentemente se utiliza de forma errónea es la regresión paso a paso (stepwise regression). En la regresión paso a paso es el ordenador quien decide –con la ayuda de un algoritmo estadístico– las variables que se incluyen en el modelo; esto puede hacer que se seleccionen variables irrelevan- tes o que no sean factores de confusión (con lo que los intervalos de confianza serán mayores y descenderá la significación estadística), o que algunos factores de confusión no sean seleccionados (con lo que las OR obtenidas no serán correctas: estarán sesga- das). Es la aproximación que utilizaron Shahinian et al. (2003) en un análisis de factores de riesgo de enfermedad linfoproliferativa tras el trasplante, con un estudio de casos y controles, emparejados, en una relación 1:2 (20 casos y 40 controles). La regresión paso a paso sólo debería utilizarse en tres situaciones (Katz, 1999): a) cuando se pretende obtener un modelo predictivo con el menor número posi- ble de variables (ver más adelante Modelos predictivos y explicativos), b) cuando se intenta minimizar el impacto de los datos que no constan (missing data), o c) cuando la muestra es escasa. Si se pretende obtener una estimación ajustada de la OR o del RR, un procedimien- to más adecuado es el sugerido por Delgado-Rodríguez y Llorca (2001): 1. Revisar la bibliografía para identificar los factores de riesgo o los protectores cono- cidos y su posible asociación con la exposición. Cualquier variable que haya sido identificada previamente como factor de riesgo o protector del efecto en estudio deberá ser considerada como posible factor de confusión. 2. Eliminar los factores de riesgo o protectores que se consideren variables interme- dias entre la exposición y el efecto. 3. Realizar un análisis estratificado: la relación entre la exposición y el efecto debe estudiarse estratificando por cada una de las variables que han quedado después del paso 2. Esto permite identificar los factores de confusión y las interacciones. 4. Realizar un modelo multivariable, paso a paso (exploratorio), con todas las variables identificadas en el paso 3. Para ello, se parte de un modelo en el que el efecto es la variable dependiente y la exposición de interés es el regresor. A continuación, se permite la introducción progresiva de las variables que tengan una p <0,2. Cada fac- tor de confusión debe ser introducido como una sola variable (es decir, si se pre- tende ajustar por edad, ésta debe introducirse como variable continua, no categori- zándola). Este procedimiento tiene el inconveniente de que trabaja solamente con los sujetos de los que existe información completa de todas las variables. 15 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 15
  • 16.
    5. Realizar unmodelo multivariable saturado con las variables que han sido seleccio- nadas en el paso anterior. Aunque tenga las mismas variables, este modelo puede ser distinto del obtenido en el paso 4: suponga que en el paso 4 se intentan valo- rar, como posibles factores de confusión, la edad, el sexo, la clase social, el consu- mo del alcohol y el de tabaco. Aunque el modelo seleccione sólo la edad y el sexo, los cálculos se realizarán solamente con los sujetos de los que se dispone de la información relativa a las cinco variables. En el modelo saturado del paso 5, en cam- bio, intervienen todos los sujetos de los que se conocen la edad y el género, aun- que no se conozcan la clase social y el consumo de alcohol y tabaco. 6. Aproximación heurística: realizar nuevos modelos, sacando e introduciendo las varia- bles del modelo saturado, para retener aquellas que cambian el coeficiente de la exposición en más del 10% respecto del modelo saturado. MODELOS PREDICTIVOS Y EXPLICATIVOS Los modelos multivariables pueden tener básicamente dos finalidades: identificar las cau- sas que explican un resultado (se habla entonces de modelos explicativos) o predecir el resultado –haya o no una relación causal– (es el caso de los modelos predictivos). En ambos casos, se utilizan las mismas técnicas multivariables (regresión logística, de Poisson, de Cox, etc.), pero la forma de construir el modelo y de interpretarlo cambia completamente. Modelos explicativos Los modelos explicativos son del tipo de los presentados en la sección anterior: se desea medir la asociación de una variable con un resultado y se introducen otras varia- bles, en el modelo, con la finalidad de obtener estimaciones correctas (ajustadas) del riesgo relativo. Observe que estos modelos tienen finalidad causal, por ello es necesa- rio tener presente los factores de confusión y las interacciones e introducirlos en el modelo siguiendo el procedimiento que se ha descrito en la sección Control de factores de confusión en el análisis. En los modelos explicativos es incorrecto dejar en manos del ordenador la selección automática de las variables (por ejemplo, mediante la regre- sión paso a paso). Se trata de los modelos más utilizados. Modelos predictivos En ocasiones, el investigador desea elaborar un modelo que prediga cuándo se va a producir el resultado, aunque no exista una relación causal entre las variables del mode- lo y el resultado. Por ejemplo, los criterios de Ramson para la pancreatitis no provocan la muerte, pero la predicen. En la elaboración de un modelo predictivo, las variables no se seleccionan por la asociación que tengan con el resultado (la muerte, el fracaso del injerto,etc.) sino por su capacidad para clasificar a los pacientes en dos grupos: los que tendrán un trasplante exitoso o los que tendrán un fracaso. En el modelo predictivo, por 16 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 02 4/10/04 12:46 Página 16
  • 17.
    lo tanto, noes de interés calcular el riesgo relativo, ni tener en cuenta los factores de confusión o las interacciones. En este caso, sí puede ser correcto dejar al ordenador la selección de las variables paso a paso. Por ejemplo, Smits et al. (2003), en un excelente artículo, elaboraron un modelo predic- tivo sobre la supervivencia en la lista de espera para trasplante cardíaco en Alemania, para ello realizaron una regresión de Cox múltiple paso a paso, utilizando los 889 pacien- tes que entraron en la lista de espera en 1997. Hay que señalar dos datos del artículo: 1) en todo momento mantienen la interpretación del modelo como predictivo (no cau- sal); 2) el modelo obtenido fue validado con los 897 pacientes que entraron en lista de espera en 1998. Debe destacarse especialmente este segundo punto; cualquier modelo funciona bien (y mejor que otros modelos) en la muestra que se ha utilizado para elaborarlo; por ello, los modelos predictivos deben ser validados siempre. Para la validación puede utilizarse una muestra independiente de la que se empleó en la generación del modelo (como en Smits et al.) o puede dividirse al azar la muestra inicial en dos grupos: un grupo se utili- za para generar el modelo y el otro para validarlo. Es frecuente el error de interpretar como causal un modelo predictivo. Loucaidou et al. (2003) utilizaron un modelo de Cox para predecir la muerte en 83 trasplantes renales con rechazo. La variable más fuertemente asociada fue la existencia de rechazo vascular; los autores concluyeron que eran necesarios mejores medios para prevenir y tratar el recha- zo vascular. Lo que se desea destacar en esta sección es que el modelo elegido (pre- dictivo) no era adecuado para llegar a esa conclusión (al margen de que sea o no cierta), era necesario un modelo explicativo en el que el riesgo relativo de cada tipo de rechazo se ajustara por sus factores de confusión. En el trabajo mencionado de factores de riesgo de enfermedad linfoproliferativa post- trasplante (Shahinian et al. 2003), no queda claro a priori cuál es la actitud de los auto- res. Da la impresión de que buscan una explicación causal, ya que la hipótesis de parti- da es que el virus de Epstein-Barr se relaciona con la enfermedad linfoproliferativa. Sin embargo, aclara la cuestión la forma en que construyen el modelo, mediante regresión escalonada y permitiendo la inclusión de variables con p <0,1 (hubiera sido mejor el cri- terio de p <0,2, tanto más cuanto la muestra es reducida). Esto indica una finalidad pre- dictiva y no explicativa. Los autores afirman que “este estudio es el primero en demos- trar que, tras el control de otros factores de riesgo potenciales, los pacientes que son negativos al virus de Epstein-Barr se enfrentan a un riesgo duradero de una enfermedad linfoproliferativa en un periodo más allá de un año”. En el modelo escalonado entraron tan sólo dos variables: la seronegatividad al virus y el sexo (la única variable por la que se ajustó). En realidad, no hicieron una aproximación correcta para hacer la afirmación, ya que no trataron al sesgo de confusión de manera adecuada. 17 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 17
  • 18.
    18 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL TIPOS DE CENSURA Y RIESGOS COMPETITIVOS DE MUERTE En el seguimiento de trasplantados, el tipo de análisis más utilizado es el de supervi- vencia (por ejemplo, curvas de Kaplan-Meier, test log-rank, regresión de Cox). En este tipo de análisis -que será desarrollado en detalle por un capítulo posterior en este libro- se estudia el tiempo transcurrido entre dos fenómenos: el que marca la incorporación del paciente al estudio (por ejemplo, la recepción del injerto) y el que determina el fallo o la variable de finalización –end point– (por ejemplo, la muerte del receptor). Una de las características, que hacen especial el análisis de supervivencia, es que el seguimiento de algunos pacientes no está completo: hay pacientes que continúan vivos en el momento de finalizar el estudio o hay otros pacientes cuyo seguimiento se ha perdido. Se dice que estos pacientes están censurados por la derecha. La primera condición para que un análisis de supervivencia sea correcto es que la com- pleción del seguimiento sea similar en los grupos que se comparan, esto es, que un grupo no sea seguido durante más tiempo que otro. Por ejemplo, en un estudio sobre trasplantes de donantes vivos de riñones, con evidencia arteriográfica de enfermedad renovascular leve, se emparejaron este grupo de pacientes (n = 28) por edad del donan- te y del receptor (sin especificar el intervalo de emparejamiento), con un grupo de tras- plantados con riñones normales. No se dan datos de seguimiento, pero éste fue clara- mente diferencial en los dos grupos: hubo diez censuras en el primer grupo, antes de los cuatro años de seguimiento, frente a tres en el grupo de comparación (Hiramoto et al. 2002), probablemente debido a que fueron posteriores en el tiempo los trasplantes con riñones afectados. Esto puede sesgar completamente la comparación. Falta de descripción del mecanismo de censura Un error frecuente es realizar el análisis de supervivencia sin aclarar en qué consiste la censura. Por ejemplo, en el seguimiento de trasplantados es frecuente que se analice como variable de finalización el fracaso del injerto. El problema es: ¿los pacientes que han muerto, se consideran fallos o se consideran datos censurados? Otero et al. (2003) com- pararon las curvas de supervivencia (obtenidas por Kaplan-Meier) de dos grupos de tras- plantados: 40 de donantes con latido cardíaco y 20 de donantes sin latido cardíaco. Las curvas de supervivencia se realizaron con dos variables de finalización alternativas: la muerte del paciente o el fracaso del injerto. No constan detalles sobre cómo se hicieron las censuras. Obsérvese en la Figura 1 que, en este ejemplo, la supervivencia hasta el fracaso del injerto puede estudiarse de dos formas distintas: en la primera (a la izquierda de la figura), el efecto es el fracaso del injerto; la muerte y continuar vivo con injerto fun- cionante se consideran como datos censurados. En la segunda (a la derecha de la Figura 1), el end point es el fracaso del injerto o la muerte del paciente; los únicos datos cen- surados son los de los pacientes que continúan vivos y con función del injerto. Con los Cap 02 4/10/04 12:46 Página 18
  • 19.
    datos del artículono se puede conocer cuál de las dos opciones se ha utilizado. En cam- bio, Loucaidou et al. (2003) y Sánchez-Fructuoso et al. (2003) sí especifican que la super- vivencia del injerto se hizo censurando la muerte con función del injerto. Riesgos competitivos En este apartado se trata de un problema muy frecuente en los estudios clínicos (Llorca y Delgado-Rodríguez, 2000), y especialmente, en los trasplantes: los riesgos competiti- vos de muerte. Los riesgos competitivos ocurren cuando dos o más efectos “compiten” por el mismo paciente. Por ejemplo, en el hospital A se sigue a 200 pacientes en los que se ha realizado un trasplante de médula ósea como tratamiento de una leucemia. La fina- lidad del estudio es conocer la tasa de recidiva. Si en este grupo se presentara un núme- ro anormalmente alto de muertes por sepsis, el número de recidivas sería menor (se dice entonces que la sepsis compite con la recidiva). Si estas cifras se comparan con las del hospital B –en el que se evitan las sepsis– se tendrá la falsa impresión de que en B hay mayor tasa de recidivas. El problema fundamental es que el análisis de supervivencia debe realizarse por métodos diferentes cuando existen riesgos competitivos. Las técnicas habituales de análisis de supervivencia asumen que las censuras no son informativas, es decir, que si los sujetos pudieran seguirse más allá del momento en que se han censurado, tendrían la misma tasa de mortalidad que los pacientes no censura- dos (Lee et al. 1997). Otra forma de expresar lo mismo es diciendo que la censura ocu- rre al azar, con independencia de la variable de finalización. Esta no es una asunción insignificante. El ejemplo de la Figura 1b, muestra una situación especialmente frecuente en el estu- dio de trasplantes. Al estudiar como variable de finalización el fracaso del injerto, hay dos tipos de censura: pacientes que continúan vivos con función y pacientes que han muerto con función del injerto. Realmente, estos dos tipos de censura: ¿se comportan igual? ¿Se cumple en ambas situaciones la asunción de independencia? Probablemente, sea fácil admitir que los pacientes vivos con función, si el estudio continuara, tendrían fracaso del injerto con la misma tasa que los pacientes que ya lo han sufrido. Sería, por lo tanto, una censura no informativa y se podrían utilizar los métodos habituales de aná- lisis de supervivencia. En cambio, es difícil creer que los pacientes fallecidos, si hubie- ran continuado vivos, habrían tenido la misma tasa de fracaso. Si se suponen, por ejemplo, dos causas de muerte que ocurren mientras el injerto sigue funcionando: un paciente muere atropellado por un coche y otro paciente muere por una sepsis secundaria a una infección del órgano trasplantado. Claramente, la primera muer- te sería independiente del fracaso del injerto, pero la segunda no. Los pacientes con infección del injerto tendrán otros factores asociados que se relacionan con el fracaso del órgano (mayor tiempo de isquemia, mayor tiempo quirúrgico, mayor edad, etc.). 19 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 19
  • 20.
    Este ejemplo muestraque algunos tipos de censura son informativos, es decir, si los pacientes con esa censura (muerte con función, en este caso) hubieran continuado en el estudio, habrían tenido una tasa de fracaso distinta de los pacientes que se han podi- do seguir completamente (Prentice et al. 1978). En este caso, los métodos habituales de análisis de supervivencia (Kaplan-Meier, por ejemplo) son inadecuados porque tratan ambos tipos de censura como si fueran iguales (Leung et al. 1997). La Figura 2 muestra los resultados de una simulación con 1.000 pacientes, utilizando tasas de fracaso del injerto de 10/1.000 pacientes-año y de mortalidad con función de 5/1.000 pacientes-año. Con el análisis de Kaplan-Meier (que trata la mortalidad con fun- ción como censura no informativa), la probabilidad de padecer un fracaso del injerto antes de los diez años es del 66%; en cambio, con el método de decrementos múlti- ples (que analiza la mortalidad como riesgo competitivo), este riesgo desciende hasta el 54%. Esta es la regla general: no tener en cuenta los riesgos competitivos de muerte aumenta la proporción de fracasos (Yan et al. 2000). Las alternativas para el análisis de supervivencia en presencia de riesgos competitivos son varias: método de decrementos múltiples (Nelson 1969, Aalen 1978), el uso de cadenas 20 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 2. Probabilidad de fracaso de un injerto. Con la estimación de Kaplan-Meier (curva superior) se acumula el 66% de fracasos en diez años. Con el método de decre- mentos múltiples, que tiene en cuenta la muerte como riesgo competitivo (curva infe- rior) se acumula sólo el 54% de fracasos. Probabilidad Tiempo (en años) tras el trasplante 54,1% 65,8% Cap 02 4/10/04 12:46 Página 20
  • 21.
    de Markov (Llorcay Delgado-Rodríguez 2001) o el método de Lin que, además, aporta una forma de comparar curvas de supervivencia en lugar del –inadecuado en esta situación– test de log-rank (Lin 1997). Los artículos científicos de metodología sobre riesgos compe- titivos han derivado, en gran medida, del campo de los trasplantes (Pepe et al. 1993). REGRESIÓN DE COX Y ASUNCIÓN DE PROPORCIONALIDAD La regresión de Cox (Cox 1972) es el método más usado para medir los riesgos relati- vos en el análisis de supervivencia. El punto más problemático de la regresión de Cox es que es necesario que las funciones de riesgo sean proporcionales, en otras palabras, si durante el primer año los pacientes mayores de 65 años tienen tres veces mayor ries- go de morir que los menores de 65 años, en el segundo año también deberían tener tres veces más riesgo (obsérvese que esto no significa que la mortalidad en el primer año sea igual que en el segundo). Un ejemplo clásico es la comparación entre el trasplante de médula ósea y la quimioterapia en el tratamiento de la leucemia aguda no linfoblás- tica (Appelbaum et al. 1984); durante el primer año la supervivencia de los pacientes con quimioterapia era mayor pero, a partir del año y medio, esta tendencia se invertía: no se cumplía la asunción de proporcionalidad, y por tanto, la regresión de Cox habría sido inadecuada.Una de las formas de comprobar la asunción de proporcionalidad, se pre- 21 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Figura 3. Comprobación gráfica de la asunción de proporcionalidad mediante transfor- maciones logarítmicas. Las curvas son paralelas, lo que sugiere que la asunción de proporcionalidad se cumple y se puede utilizar la regresión de Cox. -In(-In(Probabilidaddesupervivencia)) In (tiempo de seguimiento) Cap 02 4/10/04 12:46 Página 21
  • 22.
    senta en lasFiguras 3 y 4. Se representan las curvas de supervivencia y el tiempo de seguimiento transformados logarítmicamente. En la Figura 3, las curvas son paralelas, lo que indica que se cumple la proporcionalidad y se puede utilizar la regresión de Cox. En la Figura 4, las curvas se cortan, esto es, no se cumple la asunción de proporciona- lidad y la regresión de Cox no debería utilizarse. La asunción de proporcionalidad puede comprobarse tanto por métodos gráficos (Hess 1995) como por métodos numéricos (Grambsch y Therneau 1994). La mayoría de los artí- culos revisados elaboran modelos de Cox sin justificar la asunción de proporcionalidad (Loicaidou et al. 2003, Meier-Kriesche et al. 2003, Smits et al. 2003). Sánchez-Frutuoso et al. (2003) sí señalan explícitamente que la comprueban, aunque no indican por qué méto- do. En el uso de la regresión de Cox se pueden encontrar otros errores. Loicaidou et al. (2003) estimaron un modelo de Cox multivariable, introduciendo doce variables sin selec- cionar por ningún procedimiento. Siete de ellas tenían valores de p mayores de 0,4 (y cua- tro, mayores de 0,7). Sólo dos variables tenían p <0,05. La muestra estaba formada por 83 trasplantes renales con rechazo; no consta cuántos murieron en el seguimiento. Esto plantea un problema importante de tamaño de muestra. Clásicamente se recomienda que, en el estudio, haya al menos diez muertes (fallos) por cada variable que se desee introducir en el análisis multivariable; en este estudio de Loicaidou et al., para introducir doce variables habrían sido necesarias, al menos, 120 muertes. Además, una variable con 22 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 4. Comprobación gráfica de la asunción de proporcionalidad mediante transfor- maciones logarítmicas. Las dos curvas se cruzan, con esto se descarta la asunción de proporcionalidad y no se debe utilizar la regresión de Cox. -In(-In(Probabilidaddesupervivencia)) In (tiempo de seguimiento) Cap 02 4/10/04 12:46 Página 22
  • 23.
    tres categorías mutuamenteexcluyentes (rechazo: borderline, celular y vascular) tiene las tres categorías en el modelo; esto no es ni siquiera un error. Es completamente imposi- ble, lo que hace pensar que los autores realmente no han llevado a cabo una regresión multivariable, sino doce regresiones simples. Por último, en la presentación de resultados se utiliza, equivocadamente, el término hazard, cuando se debería emplear hazards ratio. MISCELÁNEA DE ERRORES ESTADÍSTICOS A continuación, se presentan algunos ejemplos de errores u omisiones metodológicas típicas, extraídos de la literatura científica sobre trasplantes. La lista no es exhaustiva y puede presentarse, igualmente, en otros campos de la investigación médica. Significación estadística e importancia clínica Es frecuente que la presentación de resultados estadísticos se limite a determinar si hay o no significación estadística sin considerar la importancia que pueda tener para la clíni- ca el resultado. Por ejemplo, en un estudio en el que se comparara la fracción de eyec- ción ventricular (FEV), tras el trasplante en pacientes mayores y menores de 65 años, la significación estadística dependería de: a) el tamaño de muestra, b) la variabilidad de la FEV en esa muestra (medida por su varianza), y c) la diferencia de la FEV media en los dos grupos estudiados. Si el número de sujetos en el estudio fuera muy grande y la varianza de la FEV fuera pequeña, una diferencia de 3% en la FEV podría llegar a ser estadísticamente significativa (valor p <0,05), aunque esta diferencia tuviera muy poca importancia clínica. En cambio, un estudio con pocos pacientes podría encontrar una diferencia del 20% en la FEV (mucho más importante clínicamente), pero que no fuera significativa estadísticamente. En la mayoría de los estudios, el objetivo debería ser obtener una medida del efecto (diferencia de medias, RR, etc.). El valor de p no es un objetivo en sí mismo, sino que complementa la medida del efecto indicando la probabi- lidad de que el efecto se deba al azar. La presentación del valor de p es llamativa, en muchos artículos se presenta el valor numérico sólo si está por debajo de 0,05, y si está por encima se presenta como “no significativo”(Jose et al. 2003, Omoto et al. 2003, Liu et al. 2003, Sadeghi et al. 2003, Bartosh et al. 2003). El valor 0,05 es completamente arbitrario y se continúa utilizando sólo por tradición; realmente hay poca diferencia entre p = 0,04 y p = 0,06. Una prácti- ca más adecuada es informar del valor de p (cualquiera que sea) y dejar que el lector juz- gue si es relevante o no para interpretar el estudio. Errores en la selección de la prueba estadística En un estudio, 21 ratas Lewis recibieron un trasplante renal. A continuación, fueron ale- atorizadas en tres grupos y cada uno recibió un tratamiento (clodronato encapsulado en 23 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 23
  • 24.
    liposomas, liposomas consuero salino fosfatado y suero salino). Se midieron los nive- les de varios anticuerpos. Mediante un análisis de la varianza (ANOVA) se compararon las medias y los porcentajes entre los dos primeros grupos; no se hizo comparación con el tercer grupo (Jose et al. 2003). En este estudio hay varios errores: en primer lugar, el ANOVA no se puede utilizar para comparar porcentajes; en segundo, el tamaño de la muestra (siete en cada grupo) es muy pequeño para emplearlo; por último, en el estu- dio hay tres grupos y se ha excluido uno de ellos de la comparación. Más adecuados fueron los análisis de Sánchez-Fructuoso et al. (2003) y Thervet et al. (2003) que utilizaron el método de Kruskal-Wallis. Thervet et al. compararon la dosis dia- ria de tacrolimus en 80 pacientes con trasplante renal, dividiéndolos en tres grupos según el genotipo CYP3A5. El test de Kruskal-Wallis permitió comparar simultánea- mente los tres genotipos. Woeste et al. (2003) siguieron a un grupo de receptores de trasplantes renal y pancreá- tico simultáneos, y compararon la supervivencia entre los que desarrollaban una infección abdominal y los que no. Aplicaron una prueba estadística para comparar las medias de supervivencia (68,4 meses con infección abdominal y 87,6 meses sin ella). Esta compa- ración carece de sentido ya que es característico de los análisis de supervivencia que existan datos censurados, es decir, hay pacientes para los que el seguimiento no se ha completado porque continúan vivos al finalizar el estudio. En cambio, para calcular la media es necesario disponer del tiempo hasta la muerte de todos los pacientes: la media no puede calcularse con datos censurados (salvo que se haya utilizado un modelo para- métrico, la regresión de Weibull, por ejemplo). Lo que realmente parece haberse calcu- lado en este estudio es la media de seguimiento, pero el seguimiento no sólo depende de la fecha de la muerte, sino también de la fecha del trasplante. Los pacientes tras- plantados en el último periodo han tenido menor seguimiento, aunque continúen con vida; si en ese periodo se produce un aumento de las infecciones abdominales, se encon- trará que el seguimiento de los infectados es menor que el de los no infectados. Los estudios de casos y controles no son frecuentes en el literatura científica sobre tras- plantes, aunque también se realizan. Con frecuencia, estos diseños son emparejados (ver por ejemplo, Shahinian et al. 2003, Marcén et al. 2002). En estos diseños el análi- sis multivariable adecuado es la regresión logística condicional y no la convencional. Omisión de información Es bastante frecuente que no se dé información suficiente en la sección de métodos sobre el tipo y condiciones de uso de las pruebas estadísticas. Oscila desde la ausencia absoluta (con ejemplos dados al comienzo de este capítulo), pasando por problemas de índole menor, como no especificar el tipo de análisis multivariable realizado (Humar et al. 2001), o incluso, ser críptico en lo que se realiza, por ejemplo, en un artículo se men- 24 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 02 4/10/04 12:46 Página 24
  • 25.
    ciona que “seutilizaron ecuaciones de estimación generalizadas para evaluar la signifi- cación de las variables independientes y se usaron técnicas de modelación mixta para el examen de los datos longitudinales, incluyendo medidas repetidas” (Chueh y Kahan 2003). Uno de los problemas que más frecuentemente se encuentra, es la no mención de la predeterminación del tamaño de la muestra. Es recomendable en general, pero pre- ceptiva en los ensayos clínicos por razones éticas; hay que utilizar tan sólo los pacien- tes necesarios para dirimir una duda razonable entre dos tratamientos. Es llamativa la frecuencia con la que no se hace referencia a este aspecto (Goggins et al. 2003, Dresske et al. 2003, Van Gelder et al. 2003, Matl et al. 2003) o no se da información sufi- ciente para comprobar si la estimación es correcta (Charpentier et al. 2003). En los ensayos clínicos se realizan con frecuencia análisis antes de finalizar el ensayo (análisis intermedios). Se realizan para ver si se ha alcanzado el beneficio esperado o si, por el contrario, es poco probable que se observen diferencias al final. Estos ensayos deben realizarse siguiendo una regla estadística preespecificada (análisis secuencial, regla de O’Brien-Fleming, etc.), que debe figurar en los métodos y que, sin embargo, no se aprecia (Stratta et al. 2003). Conviene dar los números y no sólo ofrecer porcentajes. Por ejemplo, en una encuesta sobre profilaxis infecciosa renal en centros trasplantadores estadounidenses, Batiuk et al. (2002) indican que respondieron claramente menos los centros que realizaban menos de 25 trasplantes, pero no se menciona en ningún momento su número, por lo que no se puede cuantificar la repercusión de esta falta de respuesta. OTRAS CONSIDERACIONES METODOLÓGICAS Los errores estadísticos son fácilmente solucionables pero lo que no tiene solución en un estudio son los problemas en la selección de la muestra y los problemas de recogi- da de información. La imposición de la llamada medicina basada en la “evidencia” (mejor traducida por “pruebas”) ha dado lugar a listados de verificación para publicar y evaluar lo publicado, pero que en definitiva contribuyen a la formación en metodología de investigación. En estos listados se incluyen aspectos estadísticos y de diseño gene- ral de un estudio. La primera de estas listas ha sido la declaración CONSORT (Altman et al. 2001) para ensayos clínicos aleatorizados, un tipo de estudio especialmente frecuente en el campo del trasplante. Se comprueba que es escaso el grado de aproximación entre lo publica- do en el campo del trasplante renal y las recomendaciones CONSORT. Aspectos esen- ciales como la aleatorización (cómo se ha hecho, no sólo decir que se aleatorizó), si es ocultada su secuencia, etc., no se mencionan con mucha frecuencia. 25 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 25
  • 26.
    Los estudios sobrepruebas diagnósticas son menos frecuentes en el campo del tras- plante. En este campo también se ha elaborado un listado de aspectos claves, las nor- mas STARD, para la realización y publicación de estudios en este ámbito (Bossuyt et al. 2003). Se pueden aplicar, por ejemplo, al estudio de Lobo et al. (2002), en el que se valo- ró si los linfocitos digeridos con pronasa mejoran la sensibilidad y la especificidad en la detección de antígenos de histocompatibilidad. Los métodos de laboratorio están per- fectamente descritos, pero los estadísticos están ausentes. Tampoco se describe la pro- cedencia de las muestras, aspecto clave para juzgar un estudio de este tipo. Un diseño frecuente en el campo de la clínica es la cohorte retrospectiva, para aprove- char la información contenida en la historia clínica. Aquí no se ha emitido por ninguna organización ninguna lista de verificación. No obstante, hay una serie de limitaciones que se expondrán brevemente. Se emplean con frecuencia, en los trasplantes, las cohortes retrospectivas del tipo pre-post; por ejemplo, antes de 1994 se actuaba de una manera y, a partir de esta fecha, de otra. Con posterioridad, se compara la superviven- cia en esas dos situaciones, para concluir, con frecuencia, que en el segundo periodo la supervivencia ha mejorado (ver por ejemplo, Kimball et al. 2002, Jungraithmayr et al. 2003). Este tipo de comparaciones son siempre problemáticas, ya que el efecto perio- do (los cambios seculares en pacientes, donantes, habilidades terapéuticas) es difícil de evitar. Siempre en estos casos hay que comparar las características basales de los pacientes y hay que eliminar el sesgo de confusión mediante técnicas de análisis mul- tivariable. El problema es menor, pero sigue existiendo, cuando las cohortes retrospec- tivas se solapan en su seguimiento, hasta que la segunda opción terapéutica triunfa sobre la primera (ver por ejemplo, Langer y Kahan 2003). Las cohortes retrospectivas también se utilizan para ver el resultado de opciones tera- péuticas simultáneas en el tiempo. Por ejemplo, para comprobar cómo funcionan los pacientes urémicos diabéticos trasplantados, se compararon 42 pacientes trasplantados sólo de riñón, con 162 con doble trasplante de riñón-páncreas y 37 trasplantados con riñón más islotes pancreáticos (Fiorina et al. 2003). Aquí es obligado, al igual que lo afir- mado en el párrafo anterior, realizar una comparación de las características basales de los pacientes de los diferentes grupos que influyan en el pronóstico, y ajustar mediante técnicas de análisis multivariable para eliminar la interferencia de las diferencias. No obs- tante, conviene que el investigador se plantee cuáles son las razones que motivaron en el pasado una acción concreta, porque ello puede sesgar completamente el resultado. Un aspecto común a muchos diseños es que no se dan datos de procedencia de los pacientes. Se asume así el carácter universal que tienen los pacientes, lo que en reali- dad no es así. Los centros y los profesionales difieren en muchas características y pue- den motivar que los resultados de la muestra de un hospital no sean generalizables a los pacientes tratados en otros. Es fundamental, para juzgar un estudio, conocer de dónde y cómo vienen los pacientes. Por ejemplo, Szládek et al. (2003) valoraron el virus 26 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 02 4/10/04 12:46 Página 26
  • 27.
    TT en 92trasplantados y 66 individuos sanos, sin aclarar en ningún momento la proce- dencia, especialmente de los llamados “sanos”. Igualmente, siguieron a 31 pacientes, pero no se indica quiénes ni las razones que motivaron el seguimiento. CONCLUSIÓN El desarrollo informático ha puesto una gran cantidad de herramientas estadísticas a dis- posición de los investigadores. Existe el peligro de que el investigador aprenda una serie de recetas sobre cómo usar la estadística (al estilo de los manuales de preparación para el MIR) en lugar de buscar un conocimiento estadístico específico, o que se confíe a la ayuda del ordenador la elección del método estadístico a emplear en cada caso. De la misma forma que un matemático armado con un bisturí no se convierte en neurociruja- no, un médico armado con el manual del SPSS no se convierte en estadístico. Aunque a veces se cometen errores realmente elementales, es más frecuente que el error se deba a la aplicación rutinaria de pruebas estadísticas, sin conocer si realmente están indicadas en esa situación. Tres ejemplos típicos son el uso de procedimientos de regresión, paso a paso, para ajustar por factores de confusión, la utilización del método de Kaplan-Meier en presencia de riesgos competitivos, o el empleo de la regresión de Cox sin que se dé la proporcionalidad de riesgos. BIBLIOGRAFÍA RECOMENDADA 1. Aalen OO. Nonparametric estimation of partial transition probabilities in multiple decrement models. Annals Statistics 1978; 6: 534-45. 2. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The Revised CONSORT Statement for Reporting Randomized Trials: Explanation and Elaboration. Ann Intern Med 2001; 134: 663-94. 3. Antonopoulos IM, Nahas WC, Mazzucchi E, Ianhez LE, Saldanha LB, Arap S. Comparison of palpation-guided and ultrasound-guided biopsies in transplanted kid- neys. Clin Transplant 2001; 15: 393-6. 4. Appelbaum FR, Dahlberg S, Thomas ED, et al. Bone marrow transplatation or che- motherapy after remission induction for adults with acute nonlymbphoblastic leuke- mia. Ann Intern Med 1984; 101: 581-8. 5. Bartosh SM, Leverson G, Robillard D, Sollinger HW. Long-term outcomes in pedia- tric renal transplant recipients who survive into adulthood. Transplantation 2003; 76: 1195-2000. 6. Batiuk TD, Bodziak KA, Goldman M. Infectious disease prophylaxis in renal transplant patients: a survey of US transplant centers. Clin Transplant 2002; 16: 1-8. 7. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. BMJ 2003; 326: 41-4. 27 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 27
  • 28.
    8. Cox DR.Regression models and life-tables. J Royal Stat Soc (B) 1972; 39: 187-220. 9. Charpentier B, Rostaing L, Berthoux F, Lang P, Civati G, Touraine JL, et al. A three- arm study comparing immediate tacrolimus therapy with antithymocyte globulin induction therapy followed by tacrolimus or cyclosporine A in adult renal transplant recipients. Transplantation 2003; 75: 844-51. 10. Chueh SC, Kahan BD. Dyslipidemia in renal transplant recipients treated with a siro- limus and cyclosporine-based immunosuppressive regimen: incidence, risk factors, progression, and prognosis. Transplantation 2003; 76: 375-82. 11. Delgado-Rodríguez M, Llorca J. Sesgos. En: Piédrola Gil: Medicina Preventiva y Salud Pública. 10ª ed. Barcelona: Masson 2001. 12. Dresske B, Zavazava N, Jenisch S, Exner B, Lenz P, El Mokhtari NE, et al. WOFIE synergizes with calcineurin-inhibitor treatment and early steroid withdrawal in kid- ney transplantation. Transplantation 2003; 75: 1286-91. 13. Fiorina P, Folli F, Maffi P, Placidi C, Venturini M, Finzi G, et al. Islet transplantation improves vascular diabetic complications in patients with diabetes who underwent kidney transplantation: a comparison between kidney-pancreas and kidney-alone transplantation. Transplantation 2003; 75: 1296-301. 14. Goggins WC, Pascual MA, Powelson JA, Magee C, Tolkoff-Rubin N, Farrell ML et al. A prospective, randomized, clinical trial of intraoperative versus postoperative Thymoglobulin in adult cadaveric renal transplant recipients. Transplantation 2003; 76: 798-802. 15. Grambsch PM, Therneau TM. Proportional hazards tests and diagnostics based on weighted residuals. Biometrika 1994; 81: 515-26. 16. Hess KR. Graphical methods for assessing violations of the proportional hazards assumption in Cox regression. Stat Med 1995; 14: 1707-23. 17. Hiramoto JS, LaBerge JM, Neymark E, Hirose R. Live donor renal transplants using kidneys with arteriographic evidence of mild renovascular disease. Clin Transplant 2002; 16: 24-9. 18. Humar A, Kerr SR, Ramcharan T, Gillingham KJ, Matas AJ. Peri-operative cardiac morbidity in kidney transplant recipients: incidence and risk factors. Clin Transplant 2001; 15: 154-8. 19. Jose MD, Ikezumi Y, van Rooijen N, Atkins RC, Chadban SJ. Macrophages act as effectors of tissue damage in acute renal allograft rejection. Transplantation 2003; 76: 1015-22. 20. Jungraithmayr T, Staskewitz A, Kirste G, Boswald M, Bulla M, Burghard R, et al. Pediatric renal transplantation with mycophenolate mofetil-based immunosuppres- sion without induction: results after three years. Transplantation 2003; 75: 454-61. 21. Katz MH. Multivariable analysis: A practical guide for clinicians. Cambridge University Press, Cambridge, 1999. 22. Kimball P, Wagner B, King A, Fisher RA, Dawson S, Cotterell A, et al. Comparison of two drug regimens upon clinical outcome among renal transplant recipients with positive flow cytometric crossmatches. Clin Transplant 2002; 16: 290-4. 28 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 02 4/10/04 12:46 Página 28
  • 29.
    23. Langer RM,Kahan BD. Sirolimus does not increase the risk for postoperative throm- boembolic events among renal transplant recipients. Transplantation 2003; 76: 318-23. 24. Lee ET, Go OT. Survival analysis in Public Health research. Annu Rev Public Health 1997; 18: 105-34. 25. Leung KM, Elshoff RM, Afifi AA. Censoring issues in survival analysis. Ann Rev Public Health 1997; 18: 83-104. 26. Lin DY. Non-parametric inference for cumulative incidence functions in competing risks studies. Stat Med 1997; 16: 901-10. 27. Liu CL, Fan ST, Lo CM, Wei WI, Yong BH, Lai CL, et al. Live-donor liver transplanta- tion for acute-on-chronic hepatitis B liver failure. Transplantation 2003; 76: 1174-9. 28. Lobo PI, Isaacs RB, Spencer CE, Pruett TL, Sanfey HA, Sawyer RG, et al. Improved specificity and sensitivity when using pronase-digested lymphocytes to perform flow- cytometric crossmatch prior to renal transplantation. Transpl Int 2002; 15: 563-9. 29. Loucaidou M, Mclean AG, Cairns TDH, Griffith M, Hakim N, Palmer A, et al. Five- year results of kidney transplantation under tacrolimus-based regimes: the persis- ting significance of vascular rejection. Transplantation 2003; 76: 1120-2. 30. Llorca J, Delgado-Rodríguez M. Competing risks analysis using Markov chains: impact of cerebro-vascular and ischaemic heart disease in cancer mortality. Int J Epidemiol 2001; 30: 99-101. 31. Llorca J, Delgado-Rodríguez M. Competing risks in absence of independence. Impact of AIDS on liver function failure mortality, and lung cancer on ischemic heart disease mortality. J Clin Epidemiol 2000; 53: 1145-9. 32. Marcén R, Morales JM, Fernández-Juárez G, Andrés A, Pascual J, Rodicio JL, et al. Risk factors of ischemic heart disease after renal transplantation. Transplant Proc 2002; 34: 394-5. 33. Matl I, Bachleda P, Lao M, Michalsky R, Navratil P, Treska V, et al. Safety and effi- cacy of an alternative basiliximab (Simulect) regimen after renal transplantation: administration of a single 40-mg dose on the first postoperative day in patients recei- ving triple therapy with azathioprine. Transpl Int 2003; 16: 45-52. 34. Meier-Kriesche HU, Baliga R, Kaplan B. Decreased renal function is a strong risk factor for cardiovascular death after renal transplantation. Transplantation 2003; 75: 1291-5. 35. Nelson W. Hazard plotting for incomplete failure data. J Quality Technology 1969; 1: 27-52. 36. Onoto K, Tanabe K, Tokumoto T, Shimmura H, Ishida H, Toma H. Use of candesar- tan cilexetil decreases proteinuria in renal transplant patients with chronic allograft dysfunction. Transplantation 2003; 76: 1170-4. 37. Otero A, Gómez-Gutiérrez M, Suárez F, Arnal F, Fernández-garcía A, Aguirrezabalaga J, et al. Liver transplantation form Maastricht category 2 non-heart-beating donors. Transplantation 2003; 76: 1068-73. 38. Pepe MS, Longton G, Pettinger M, Mori M, Fisher DL, Storb R. Summarizing data on survival, relapse, and chronic graft-versus-host disease after bone marrow trans- 29 ESTADÍSTICA EN BIOMEDICINA: UNA HERRAMIENTA PELIGROSA Cap 02 4/10/04 12:46 Página 29
  • 30.
    plantation: Motivation anddescription of new methods. Br J Haematol 1993; 83: 602-7. 39. Prentice RL, Kalbfleisch JD, Peterson AV, Flournoy N, Farewell VT, Breslow NE. The analysis of failure times in the presence of competing risks. Biometrics 1978; 34: 541-54. 40. Rothman KJ, Greenland S. Hill’s criteria for causality. En: Gail MH, Benichou J (eds). Encyclopedia of epidemiologic methods. Wiley, Chichester, 2000: 428-31. 41. Sadeghi M, Daniel V, Wiesel M, Hergeseli O, Opelz G. High urine sIL-6R as a predic- tor of late graft failure in renal transplant recipients. Transplantation 2003; 76: 1190-4. 42. Sánchez-Fructuoso AI, Prats D, Pérez-Contín MJ, Marqués M, torrente J, Conesa J, et al. Increasing the donor pool using en bloc pediatric kidneys for transplant. Transplantation 2003; 76: 1180-4. 43. Shahinian VB, Muirhead N, Jevnikar AM, Leckie SH, Khakhar AK, Luke PP, et al. Epstein-Barr virus seronegativity is a risk factor for late-onset posttransplant lympho- roliferative disorder in adult renal allograft recipients. Transplantation 2003; 75: 851-6. 44. Smits JMA, Deng MC, Hummel M, de Meester J, Schoendube F, Scheld HH, et al. A prognostic model for predicting waiting-list mortality for a total national cohort of adult heart-transplant candidates. Transplantation 2003; 76: 1185-90. 45. Stratta RJ, Alloway RR, Lo A, Hodge E. Two-dose daclizumab regimen in simulta- neous kidney-pancreas transplant recipients: primary endpoint analysis of a multi- center, randomized study. Transplantation 2003; 75: 1260-6. 46. Szladek G, Juhasz A, Asztalos L, Szoke K, Murvai M, Szarka K, et al. Persisting TT virus (TTV) genogroup 1 variants in renal transplant recipients. Arch Virol 2003; 148: 841-51. 47. Thervet E, Anglicheau D, King B, Schlageter MH, Cassinat B, Beaune P, et al. Impact of cytochrome p450 3A5 genetic polymorphism on tacrolimus doses and concen- tration-to-dose ratio in renal transplant recipients. Transplantation 2003; 76: 1233-5. 48. Van Gelder T, ter Meulen CG, Hene R, Weimar W, Hoitsma A. Oral ulcers in kidney transplant recipients treated with sirolimus and mycophenolate mofetil. Transplantation 2003; 75: 788-91. 49. Verran DJ, deLeon C, Chui AK, Chapman JR. Factors in older cadaveric organ donors impacting on renal allograft outcome. Clin Transplant 2001; 15: 1-5. 50. Woeste G, Wullstein C, Vogt J, Zapletal C, Bechstein WO. Value of donor swabs for intra-abdominal infection in simultaneous pancreas-kidney transplantation. Transplantation 2003; 76: 1073-8. 51. Yan Y, Moore RD, Hoover DR. Competing risk adjustment reduces overstimation of opportunistic infection rates in AIDS. J Clin Epidemiol 2000; 53: 817-22. 30 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 02 4/10/04 12:46 Página 30
  • 31.
    31 ESQUEMA GENERAL DE ANÁLISISESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA R. Escallada, M. Arias INTRODUCCIÓN En este capítulo, trataremos de definir cómo se debe describir correctamente una po- blación trasplantada, así como las diferentes pruebas estadísticas que, progresiva- mente, es necesario realizar para un análisis estadístico correcto: estadística descripti- va, estadística comparativa básica y estadística comparativa más compleja. Para ello, además de una breve explicación teórica, utilizaremos ejemplos basados en una serie real de pacientes trasplantados, analizada estadísticamente con el programa informáti- co SPSS, uno de los más usados en la actualidad (además, un tanto por ciento muy elevado de las normas que exponemos, son perfectamente aplicables a otros progra- mas). Este programa estadístico es muy complejo y nosotros utilizaremos, muy proba- blemente, menos del 10% de sus utilidades para un análisis completo de una serie de pacientes trasplantados, pero lógicamente no es propósito de este capítulo explicar exhaustivamente el SPSS, sino dar normas básicas y prácticas para poder utilizarlo sin conocerlo a fondo. DESCRIPCIÓN DE UNA POBLACIÓN TRASPLANTADA Como en cualquier otro tipo de población o muestra en la que se estudien hechos bioló- gicos, los datos que manejaremos serán de dos tipos: cuantitativos o variables continuas (por ejemplo: edad, niveles sanguíneos de parámetros biológicos o de fármacos, dosis de Cap 03 4/10/04 12:46 Página 31
  • 32.
    32 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 1 CAUSAMUE Frequency Percent Valid Percent Cumulative Percent Valid ACV 155 53,3 53,3 53,3 ANX 8 2,7 2,7 56,0 OTR 4 1,4 1,4 57,4 TCE 124 42,6 42,6 100,0 Total 291 100,0 100,0 Total 291 100,0 Statistics N Valid Missing CAUSAMUE 291 0 Tabla I Cap 03 4/10/04 12:46 Página 32
  • 33.
    fármacos, cifras detensión arterial, etc.) y cualitativos o variables cualitativas-disconti- nuas (por ejemplo: sexo, estado del paciente o del injerto, tipo de inmunosupresión, gra- do de riesgo cardiovascular, etc.) (Figura 1). En cualquiera de los dos tipos de datos, la presentación más sencilla y comprensible es la distribución de frecuencias, sobre todo cuando el número de pacientes y/o datos es elevado, como suele ocurrir en las poblacio- nes trasplantadas. La distribución de frecuencias en las variables cualitativas-discontinuas es obvia y se limita a describir el número y/o el porcentaje de casos de cada clase. Con el programa SPSS, esta distribución se realiza de la siguiente manera: hemos seleccionado en la barra de herramientas la sección Statistics para, después, ir a las secciones que pueden verse resaltadas en la figura; después, únicamente deberemos seleccionar la o las variables cualitativas que deseemos analizar (en este caso, la causa de muerte del donante) y dar OK. El progra- ma nos responderá en una pantalla SPSS Output de la manera indicada en la Tabla I. En ella podemos observar el número de casos válidos (291), si en alguno no se ha rellenado adecuadamente la respuesta (en este caso ninguno) y el nú- mero, el porcentaje sobre el to- tal de la serie (incluidos en su caso, los pacientes sin res- puesta a esta variable en con- creto), el porcentaje sobre los casos válidos y el porcentaje acumulado. Esta información po- demos trasformarla en un gráfico, simplemente seleccionando en la barra de herramientas (Figura 2) la sección Graphs y eligiendo, después, el tipo de gráfico que deseemos y que sea más adecuado para una buena compresión visual (en este caso concreto, lo más convenien- te sería un gráfico de barras, como vemos en el ejemplo, o uno de sectores) (Figura 3). En el caso de las variables continuas, la distribución de frecuencias consistirá en dividir el conjunto de datos en una serie de grupos o intervalos, cuyos límites máximos y míni- mos deberemos decidir según nuestro criterio, aunque es conveniente tener en cuenta unos principios básicos: • No es aconsejable que el número de intervalos sea demasiado grande (en ningún caso, mayor de 10-15). 33 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 2 Cap 03 4/10/04 12:46 Página 33
  • 34.
    • En general,es conveniente que los intervalos sean de igual magnitud, es decir, homogéneos (por ejem- plo, intervalos de edad de 10 en 10 años), aunque a efectos estadísticos es perfectamente válida la comparación entre grupos no homogéneos (por ejemplo, pacientes meno- res de 15 años vs. pacien- tes entre 15 y 50 años vs. pacientes mayores de 50 años). • Los límites de cada interva- lo deben tener la misma precisión numérica que los datos introducidos: por ejemplo, si utilizamos un decimal para introducir los valores de creatinina plasmáti- ca, la división de los diferentes intervalos también deberá ser un decimal (por ejemplo, menor de 1,5 mg/dL, entre 1,5 y 3,0 mg/dL, mayor de 3,0 mg/dL). • Los intervalos nunca deben solaparse lo que, aunque parece obvio, es uno de los errores más frecuentes. Así, es muy habitual ver tablas o gráficos en los que la dis- 34 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 3 CAUSA MUERTE DONANTE TCEOTRANXACV % 60 50 40 30 20 10 0 Figura 4 Cap 03 4/10/04 12:46 Página 34
  • 35.
    tribución de gruposes, por ejemplo, de este tipo: edad entre 0-20, 20-40, 40-60 y 60-80. Esto conlleva un error primario, ya que no sabremos en qué grupo se han in- cluido los casos con valores límite; por ejemplo, los pacientes que tienen 20 años, ¿en qué grupo están, en el primero o en el segundo? Lo correcto hubiera sido ha- cer la distribución de esta manera: edad entre 0-20, 21-40, 41-60 y 61-80. La forma idónea de presentar estos intervalos es mediante una tabla que debe incluir siempre el número total de casos y el de cada grupo, y el porcentaje (aunque si el nú- mero es pequeño, es preferible indicar las ci- fras absolutas, por ejem- plo, 6/10 en vez de 60%) sobre el total de la muestra. La representación gráfi- ca más útil de la distribu- ción de frecuencias de una variable continua es el histograma, muy fácil de realizar con el progra- ma SPSS: en la barra de herramientas seleccio- namos la sección Sta- tistics y, a continuación, las que se ven en la Figura 4. Automáticamente, el pro- grama nos mostrará el histograma de la variable que hayamos selecciona- do; en este ejemplo, la creatinina plasmática al primer año, con o sin la curva de distribu- ción normal (Figura 5). Una vez descritos de manera genérica los datos de cada variable, el siguiente paso es la definición del conjunto de los mismos, analizando su tendencia y su dispersión. El análisis de la tendencia se realiza, fundamentalmente, mediante la media y la media- na (otra medida es la moda, pero es mucho menos utilizada al tener un interés muy li- mitado). La media tiene como principal ventaja su fácil comprensión y cálculo, y que es con mucho la medida más utilizada para realizar las comparaciones estadísticas, ya que los test más precisos y comunes se basan en ella. Su gran desventaja es que está fuer- 35 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 5 Creatinina 1º año post-trasplante 5,004,504,003,503,002,502,001,501,00 % 100 80 60 40 20 0 Cap 03 4/10/04 12:46 Página 35
  • 36.
    temente influida porlos valores extremos, en especial en las series de datos cortas (se da la circunstancia en muchas ocasiones de que un solo dato, excesivamente alto o ba- jo, hace que un porcentaje muy elevado de los valores estén por encima o por debajo del valor de la media), por esto, es muy interesante complementar la información que nos proporciona con la mediana, que no es más que el valor equidistante entre los ex- tremos de la serie de datos, de tal manera que la mitad de los mismos son inferiores a ella y la otra mitad superiores, por lo cual no está influida por los valores extremos. Sin embargo, no es habitual en la comparación de poblaciones al haber muy pocos test que la utilicen, por lo que está prácticamente limitada a su uso como parámetro descriptivo. Una vez conocida la tendencia de una serie de datos, deberemos analizar su dispersión o variación. Lógicamente, la primera y más obvia medida de variación es el rango de la muestra, es decir, los valores máximo y mínimo y su diferencia, pero carece de valor pa- ra realizar pruebas estadísticas y únicamente tiene valor informativo. Sin duda alguna, la medida de dispersión más frecuentemente usada en estadística médica, es la desvia- ción estándar de la media, cuyo valor in- fluye decisivamente en la existencia real de diferencias entre dos poblaciones. Además, de manera indirecta, nos puede resultar muy útil para depurar valores no reales por errores en la introduc- ción de los datos (lo cual no es raro, sobre todo en series gran- des) y que nos pueden alterar de manera significativa la media, y por tanto, las comparaciones posteriores. Por ejemplo, es fácil confundirse al teclear el valor de cualquier parámetro con decimales, simplemente con olvidar la coma, el valor se multiplica por 10 o por 100 (glucemia: 90,8 ó 908 mg/dL; ácido úrico: 7,26 ó 726 mg/dL). Teniendo en cuenta que, en una serie de datos con una distribución relativamente simétrica (media y mediana con valores muy cercanos), la media ±2 desviaciones estándar supone aproximadamente el 95% de las observaciones, todos los valores que estén por encima o por debajo deberían ser com- probados en la fuente original de los datos. En resumen, la descripción de todas las va- riables cuantitativas de una serie trasplantada debe incluir, necesariamente, el cálculo 36 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 6 Cap 03 4/10/04 12:46 Página 36
  • 37.
    de la media,la mediana y la desviación estándar de la media. Estos cálculos son muy fá- ciles y rápidos con el SPSS ya que, no solamente podemos realizar todas las pruebas a la vez, sino que además nos permite hacerlo con varias variables al mismo tiempo, tal y como puede verse en el ejemplo posterior, en el que vamos a calcular los parámetros ci- tados en la evolución de la función renal: creatinina plasmática y aclaramiento de la cre- atinina al séptimo día, primer, tercer y sexto mes, y primer año. De nuevo y, como en casos anteriores, deberemos ir a la sección Statistics y, a conti- nuación, las que se ven en la Figura 6. A continuación, elegiremos las variables que deseemos analizar, teniendo en cuenta que este programa las ordena por orden alfabético y no por el orden en que nosotros las hemos colocado en la tabla de datos, y seleccionaremos los parámetros estadísticos mencionados, como en la Figura 7. Después de pulsar Continue y OK el programa nos mostrará la siguiente tabla y datos (Tabla II). En ella podemos ver el número de casos válidos y en los que no existen datos, la media y la mediana, y las medidas de dispersión: desviación estándar, rango y valores máximo y mínimo. Como puede verse en este caso, la muestra no es demasiado homogénea, sobre todo en lo que respecta a valores máximos y mínimos, por lo que sería muy con- veniente comprobar si son correctos todos los valores que estén por encima y por de- bajo de la media ±2 DE (por ejemplo, en el caso del aclaramiento de la creatinina a los seis meses, deberíamos asegurarnos de que son ciertos todos los valores >131, aun- 37 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 7 Cap 03 4/10/04 12:46 Página 37
  • 38.
    38 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL que no sería necesario hacerlo con los valores más bajos, ya que la media 2 DE es infe- rior al valor mínimo. De este modo, podemos estar seguros de trabajar con una muestra depurada y de calidad. ESTADÍSTICA BÁSICA A no ser que estemos ante un trabajo epidemiológico meramente descriptivo, lo habi- tual es que queramos hacer comparaciones entre grupos de diversos parámetros, con el fin de saber si existen diferencias reales entre ellos. Dependiendo del tipo de pará- metro que queramos analizar, deberemos utilizar un tipo de test estadístico u otro. Comparación simple de medias Utilizaremos preferentemente el test t de Student al ser la prueba más precisa y usada habitualmente para este fin. Esta prueba, sin embargo, tiene una condición para su uso correcto y es que debe ser aplicada en poblaciones con una distribución normal, lo cual es asumible, en la práctica, cuando el tamaño de la muestra es razonable (más de 30 casos). En los casos de poblaciones pequeñas, deberíamos comprobar si efectivamente la distri- bución es normal o no, lo cual es muy sencillo con el SPSS. Por ejemplo, queremos saber si los valores de creatinina sérica, en el primer mes post-trasplante, suponiendo que no tu- viéramos una muestra superior a 30 pacientes, tiene una distribución normal y, por lo tan- to, se pueden utilizar los test que describimos a continuación. Únicamente debemos se- leccionar los campos que se ven en la Figura 8 y marcar en Test Distribution el campo Normal. El resultado nos indicará si la variable tiene una distribución normal o no (Tabla III). Dependiendo del tipo de poblaciones que queramos comparar, utilizaremos en el pro- grama SPSS distintos tipos. N Valid Missing Mean Median Std. Range Minimum Maximum Deviation CLCR180 249 42 68,65 66,11 32,29 267 6 273 CLCR30 280 11 55,76 54,96 26,04 146 1 147 CLCR360 236 55 73,60 69,44 33,13 257 20 277 CLCR7 291 0 33,95 29,17 27,80 134 0 134 CLCR90 267 24 66,00 64,17 31,32 204 3 208 CR180 249 42 1,702 1,500 0,781 5,6 0,6 6,2 CR30 280 11 2,079 1,700 1,276 9,7 0,7 10,4 CR360 236 55 1,699 1,500 0,679 4,1 0,8 4,9 CR7 291 0 4,237 3,200 2,874 11,9 0,8 12,7 CR90 267 24 1,753 1,500 0,844 7,4 0,8 8,2 Tabla II. Statistics. Cap 03 4/10/04 12:46 Página 38
  • 39.
    Comparación de dospoblaciones independientes En este caso, comparamos los valores medios de uno o más parámetros en dos series de casos, cuyos individuos no son los mismos: por ejemplo, el valor de la creatinina plasmática al primer año post-trasplante de los pacientes que han sufrido rechazo agu- do o no. El proceso de análisis en el SPSS es el que se observa en las pantallas de la Figura 9. Una vez seleccionado el test, como se ve en la figura, se seleccionan la o las variables que queramos comparar (Test Variables) y la variable que define los individuos de cada grupo (Grouping Variable), en este caso, los pacientes con rechazo agudo o no (Figura 10). El resultado nos da la correspondiente información en la Tabla IV. 39 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA CR30 N 280 Normal Parameters Mean 2,079 Std. Deviation 1,276 Most Extreme Absolute 0,218 Differences Positive 0,218 Negative -0,167 Kolmogorov-Smirnov Z 3,654 Asymp. Sig. (2-tailed) 0,000 a. Test distribution is Normal b. Calculated from data Tabla III. One-Sample Kolmogorov-Smirnov Test. Group Statistics RA N Mean Std. Deviation Std. Error Mean CR360 Sí 56 1,964 0,827 0,111 No 127 1,583 0,577 5,116E-02 Independent Samples Test Levene’s t-test for Std. Test for Equality of Sig. Mean Error Equality F Sig. Mean t df (2-tailed) Difference Difference CR360 Equal 8,960 0,003 3,589 181 0,000 0,382 0,106 variances assumed Equal 3,132 79,484 0,002 0,382 0,122 variances not assumed Tabla IV Cap 03 4/10/04 12:46 Página 39
  • 40.
    40 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 8 Figura 9 Figura 10 Cap 03 4/10/04 12:47 Página 40
  • 41.
    Como vemos enla tabla, el programa nos indica el valor de t y su significación esta- dística tanto para el caso en que la varianza de los dos grupos sea igual (en este caso p = 0,000), como distinta (p = 0,002). Usaremos los resultados para varianzas iguales si el tamaño de las muestras es igual; en caso contrario, se debe comprobar si es sig- nificativo el test de igualdad de varianzas (F). En caso afirmativo, se utilizan los valores de varianzas desiguales y, en caso negativo, los de las varianzas iguales. En nuestro ejemplo, al ser las muestras desiguales, debemos ver el resultado de F que, en este caso, es significativo por lo que debemos concluir que la creatinina al primer año es mayor en el grupo de pacientes con rechazo agudo (1,96 ± 0,83 vs. 1,58 ± 0,58) con una significación estadística de p = 0,002). Comparación de dos poblaciones pareadas En este caso, se compara un mismo parámetro en la misma población, pero en dos mo- mentos distintos. Por ejemplo, queremos saber si, en nuestra serie, existen diferencias entre la creatinina del primer mes y la del primer año cuando el paciente ha tenido algún episodio de rechazo agudo. Para ello, lo primero que debemos hacer es seleccionar es- te subgrupo de pacientes (Figura 11). Una vez seleccionados los casos, procederemos de manera semejante al apartado an- terior, pero seleccionando el test para muestras pareadas y la o las parejas de variables que queremos analizar (Figura 12). El resultado se expresa en la Tabla V. 41 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 11 Cap 03 4/10/04 12:47 Página 41
  • 42.
    La conclusión quepodemos ex- traer, es que la creatinina al año es menor que en el primer mes (1,96 ± 0,83 vs. 2,41 ± 1,22), que existe una correlación significativa entre ambas (p = 0,001) y que la diferen- cia es estadísticamente significati- va (p = 0,005). Comparación de tres o más poblaciones independientes El caso típico es la comparación de un parámetro en una serie de pa- cientes que puede dividirse en tres o más grupos. Por ejemplo, en nues- tra serie queremos saber si existe diferencia en la creatinina al primer año, dependiendo del número de episodios de rechazo agudo. Para ello, utilizaremos el análisis de la va- rianza de un sentido (One-way ANO- 42 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 CR30 2,409 56 1,217 163 CR360 1,964 56 0,827 0,111 Paired Samples Correlations N Correlation Sig. Pair 1 CR30 & CR360 56 0,442 0,001 Paired Samples Test Paired Std. Std. 95% t df Sig. Differences Deviation Error Confidence (2-tailed) Mean Mean Interval of the Difference Lower Upper Pair 1 CR30- 0,445 1,129 0,151 0,142 0,747 2,947 55 0,005 CR360 Tabla V Figura 12 Cap 03 4/10/04 12:47 Página 42
  • 43.
    VA), de lamanera indicada en las Figuras 13 y 14. El SPSS nos permite, ade- más, la comparación de los grupos entre sí, para saber entre cuáles exactamente hay diferencias significati- vas y con qué grado de sig- nificación. Para ello, como vemos en las imágenes, debemos seleccionar el bo- tón Post Hoc... y, en la ven- tana que se abre, los test estadísticos que deseamos utilizar. Cada uno de ellos tiene, teóricamente, sus ventajas e inconvenientes y su aplicación más correcta a determinadas poblacio- nes, pero su explicación de- tallada escapa al propósito de este capítulo. Única- mente, indicar que los más usados y que se adaptan mejor a la mayor parte de las poblaciones que vamos a estudiar en series de tras- plantes, son los test de Bonferroni, Tukey, Scheffe y el de Stephen-Newman- Keuls (este último, sólo pa- ra comparaciones aparea- das). Los resultados que nos pro- porciona el programa, tie- nen la estructura mostrada en la Tabla VI. En esta primera tabla, se nos indica el resultado de la 43 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 13 Figura 14 Cap 03 4/10/04 12:47 Página 43
  • 44.
    ANOVA, con elvalor de F y la significación estadística que, en este caso, es p = 0,000. Por tanto, ya podemos afirmar que el número de rechazos agudos influye significativa- mente en la creatinina plasmática al primer año. En la Tabla VII se nos indica el resultado de la comparación múltiple entre los grupos, mediante una tabla en la que podemos ver el test estadístico correspondiente, los di- 44 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL ANOVA CR360 Sum of Squares df Mean Square F Sig. Between Groups 12,371 2 6,186 15,021 0,000 Within Groups 95,949 233 0,412 Total 108,320 235 Tabla VI Multiple Comparisons Dependent Variable: CR360 (I) NºRA (J) NºRA Mean Std. Sig. 95% Difference Error Confidence (I-J) Interval Lower Upper Bound Bound Tukey HSD 0 1 -0,346 0,095 0,001 -0,568 -0,124 2 -1,417 0,325 0,000 -2,178 -0,656 1 0 0,346 0,095 0,001 0,124 0,568 2 -1,071 0,331 0,003 -1,847 -0,296 2 0 1,417 0,325 0,000 0,656 2,178 1 1,071 0,331 0,003 0,296 1,847 Scheffe 0 1 -0,346 0,095 0,002 -0,579 -0,112 2 -1,417 0,325 0,000 -2,217 -0,617 1 0 0,346 0,095 0,002 0,112 0,579 2 -1,071 0,331 0,006 -1,887 -0,256 2 0 1,417 0,325 0,000 0,617 2,217 1 1,071 0,331 0,006 0,256 1,887 Bonferroni 0 1 -0,346 0,095 0,001 -0,574 -0,117 2 -1,417 0,325 0,000 -2,200 -0,634 1 0 0,346 0,095 0,001 0,117 0,574 2 -1,071 0,331 0,004 -1,869 -0,274 2 0 1,417 0,325 0,000 0,634 2,200 1 1,071 0,331 0,004 0,274 1,869 Tabla VII Cap 03 4/10/04 12:47 Página 44
  • 45.
    versos cruces entreellos y el resultado de la significación o no de cada cruce. En nues- tro ejemplo, podemos observar cómo existen diferencias significativas entre todos los grupos y con cualquier test aplicado. Lógicamente, el valor de p puede ser diferente se- gún el test, pero suele haber muy pocas diferencias como observamos en nuestro ejemplo. Comparación de proporciones En muchas ocasiones tenemos la necesidad de comparar, en dos o más poblaciones in- dependientes, el porcentaje de pacientes que tienen una característica determinada con el porcentaje de los que cumplen determinados criterios, por ejemplo, en nuestro ejem- plo nos podría interesar saber si el porcentaje de injertos no funcionantes se ve influido por la causa de la muerte del donante. También existe la posibilidad de que necesite- mos comparar porcentajes en muestras apareadas, es decir, si hay un cambio significa- tivo en el porcentaje de un parámetro en la misma población de pacientes cuando cam- bia una característica de ese mismo grupo, por ejemplo, el porcentaje de pacientes con hipercolesterolemia tras una intervención terapéutica (cam- bio de tratamiento inmunosu- presor, tratamiento con hipoli- pemiantes, etc.). El método estadístico más uti- lizado para este tipo de com- paración es el test CHI cua- drado, que en el SPSS se rea- liza de la manera expuesta en las Figuras 15 y 16. En este ejemplo, queremos comprobar si la causa de muerte del donante influye en la superviencia del injerto de manera global. El resultado del test CHI cuadrado se muestra en la Tabla VIII. Como vemos en la primera tabla, la diferencia más importante existe entre los injertos no funcionantes (N): el 20,2% procedían de donantes por ACVA vs. el 11,5% de donan- tes por TCE. En la segunda tabla, podemos comprobar que esta diferencia es estadísti- camente significativa: p = 0,034. En esta misma tabla observamos que el programa rea- liza, de manera automática, la prueba exacta de Fisher; este test se debe tener en cuenta únicamente si las frecuencias esperadas, no las reales, son pequeñas (<5 en al- 45 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 15 Cap 03 4/10/04 12:47 Página 45
  • 46.
    46 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 16 CAUSAMUE Total ACV TCE SITUACIO F Count 85 87 172 Expected 92,8 79,2 172,0 Count % of Total 33,7% 34,5% 68,3% N Count 51 29 80 Expected 43,2 36,8 80,0 Count % of Total 20,2% 11,5% 31,7% Total Count 136 116 252 Expected 136,0 116,0 252,0 Count % of Total 54,0% 46,0% 100,0% Chi-Square Tests Value df Asymp. Sig. Exact Sig. Exact Sig. (2-sided) (2-sided) (1-sided) Pearson Chi-Square 4,514 1 0,034 – – Continuity Correction 3,956 1 0,047 – – Likelihood Ratio 4,563 1 0,033 – – Fisher’s Exact Test – – – 0,042 0,023 N of Valid Cases 252 – – – – Tabla VIII. SITUACIO * CAUSAMUE Crosstabulation. Cap 03 4/10/04 12:47 Página 46
  • 47.
    guna de lascasillas de la primera tabla), lo cual no ocurre en nuestro ejemplo. En mu- chas ocasiones esta circunstancia se interpreta erróneamente y lleva a pensar, equivo- cadamente, que no puede utilizarse la prueba CHI cuadrado cuando hay un valor real ce- ro o muy pequeño, por lo que debemos insistir en que son los valores esperados los que influyen en el test estadístico. La prueba CHI cuadrado tam- bién puede utilizarse cuando hay más de dos grupos en una o las dos variables compara- das, por ejemplo, analizar si existen diferencias en el por- centaje de injertos funcionan- tes al primer año, dependien- do del régimen inmunosupre- sor, que habitualmente tiene más de dos alternativas. El método que debemos utilizar, es exactamente igual al des- crito para una comparación 2x2 y los resultados, en el SPSS, se presentan de mane- ra muy similar. Desde luego, cuanto mayor sea el número de categorías de las variables, mayor deberá ser el tamaño de la muestra para que se puedan conseguir diferencias significativas: si algunas de las frecuencias son menores de dos o más de la mitad son menores de cinco, deberemos agrupar casos, en caso de que conceptualmente sea posible, o bien, descartar algún grupo por tamaño de muestra insuficiente. Comparación de dos poblaciones con distribución NO normal En el caso de tener un tamaño de muestra pequeño y que no se ajuste a una distribu- ción normal, lo que hemos comprobado de la manera descrita anteriormente, debere- mos utilizar pruebas estadísticas no paramétricas, siendo las más extendidas el test de Mann-Whitney y el test de Wilcoxon, que realizaremos como muestran las Figuras 17 y 18. En este ejemplo, queremos comparar la creatinina sérica al primer año post-trasplante entre los pacientes que tuvieron uno o dos episodios de rechazo agudo, para lo cual 47 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 17 Cap 03 4/10/04 12:47 Página 47
  • 48.
    hemos seleccionado enNoparametric Tests el apartado 2 Independient sam- ples, la variable cr360 y el nºra 1 ó 2, ya que el número de pacientes con dos re- chazos agudos es de cuatro (n muy baja y sin distribución normal). El resultado que nos da el programa (Tabla IX) es que las diferencias no son significativas (p = 0,112). De una manera muy similar deberemos trabajar si la muestra es apareada, es decir, la misma población de pacientes en dos momentos distintos de evolu- ción. Siguiendo con el mismo ejemplo, queremos saber si existen diferencias entre la función renal, al primer mes y al primer año, en aquellos pacientes con dos episodios de rechazo agudo (Fi- guras 19 y 20). En este caso seleccionaremos en Noparametric Tests el apartado 2 Related Samples, el Test de Wilcoxon y las varia- bles cr30–cr360. El resultado, que tam- poco es estadísticamente significativo, se nos presenta en la Tabla X. 48 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 18 Figura 20 Figura 19 Cap 03 4/10/04 12:47 Página 48
  • 49.
    Comparación de treso más poblaciones con distribución NO normal En el caso de que el número de grupos de pacientes sea mayor de dos, deberemos uti- lizar otro tipo de prueba estadística pero con una metodología, en el SPSS, muy similar: 49 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Ranks NºRA N Mean Rank Sum of Ranks CR360 1 63 33,04 2081,50 2 4 49,13 196,50 Total 67 Test Statistics CR360 Mann-Whitney U 65,500 Wilcoxon W 2081,500 Z -1,603 Asymp. Sig. (2-tailed) 0,109 Exact Sig. [2*(1-tailed Sig.)] 0,112 a. Not corrected for ties b. Grouping Variable: NºRA Tabla IX Ranks N Mean Rank Sum of Ranks CR360 - CR30 Negative 3 2,00 6,00 Ranks Positive 1 4,00 4,00 Ranks Ties 0 Total 4 a. CR360 <CR30 b. CR360 >CR30 c. CR30 = CR360 Test Statistics CR360 - CR30 Z -0,365 Asymp. Sig. (2-tailed) 0,715 a. Based on positive ranks b. Wilcoxon Signed Ranks Test Tabla X Cap 03 4/10/04 12:47 Página 49
  • 50.
    en Noparametric Testsseleccionaremos el apartado K Independent Samples... y el Test de Kruskal-Wallis, seleccionando la o las variables a analizar y la que define los subgru- pos. En este ejemplo, queremos saber si existen diferencias en la función renal, al pri- mer año, dependiendo del nú- mero de episodios de rechazo agudo (Figuras 21 y 22). El resultado es que existe di- ferencia estadísticamente sig- nificativa (p = 0,000) a pesar de tener un grupo de pacien- tes bajo (únicamente cuatro casos con dos episodios de rechazo agudo) (Tabla XI). Otra posibilidad es que quera- mos analizar si existen dife- rencias en una población que no se ajusta a una distribución normal en tres o más momen- tos de su evolución, para lo cual deberemos utilizar el test de Friedman que, en el SPSS, se realiza de la siguiente ma- nera: en Noparametric tests seleccionamos K Related Samples y, en la ventana siguiente, las variables que quera- mos comparar y el test de Friedman. En este ejemplo, queremos analizar si hay diferen- cias en la función renal de los pacientes con dos o más rechazos agudos en cuatro mo- mentos de su evolución a lo largo del primer año post-trasplante (Figuras 23 y 24). 50 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 21 Figura 22 Cap 03 4/10/04 12:47 Página 50
  • 51.
    El resultado, eneste caso concreto, es que no hay diferencias significativas (p = 0,417) a lo largo de la evolución de estos cuatro pacientes (Tabla XII). Correlación y regresión Otro de los puntos básicos en el análisis estadístico de una población trasplantada, es estudiar si existe relación significativa entre dos parámetros, para lo cual utilizaremos los test de correlación y regresión que tienen mucho en común, pero con conceptos de análisis distintos. En el caso de la correlación, lo único que buscamos es saber si existe una relación significativa entre dos variables cuantitativas, mientras que con la regresión 51 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Ranks Nº RA N Mean Rank CR360 0 169 107,94 1 63 142,15 2 4 192,00 Total 236 Test Statistics CR360 Chi-Square 16,315 df 2 Asymp. Sig. 0,000 a. Kruskal Wallis Test b. Grouping Variable: NºRA Tabla XI Descriptive Statistics N Mean Std. Deviation Minimum Maximum CR30 4 3,025 1,617 1,8 5,4 CR90 4 2,325 1,147 1,4 4,0 CR180 4 3,375 1,889 1,5 5,5 CR360 4 3,000 1,519 1,5 4,9 Test Statistics N 4 Chi-Square 2,842 df 3 Asymp. Sig. 0,417 a. Friedman Test Tabla XII Cap 03 4/10/04 12:47 Página 51
  • 52.
    estudiamos si unparámetro varía (parámetro que denominamos variable dependiente) a medida que varía otro (variable independiente). Como puede verse, la diferencia con- ceptual es muy sutil, pero queda más clara con dos ejemplos: en una población trasplantada quere- mos saber si existe relación entre las cifras de glucemia y las de co- lesterol plasmático; como, en prin- cipio, ninguno de los dos paráme- tros es dependiente del otro, utili- zaremos el cálculo de la correla- ción para saber si la relación es significativa o no existe relación. Sin embargo, si queremos saber si la relación entre las dosis de ci- closporina y sus niveles plasmáti- cos es estadísticamente significa- tiva, utilizaremos la regresión line- al, ya que debemos suponer, lógi- camente, que los segundos au- mentan a medida que aumenta- mos la dosis. En el SPSS, tanto su cálculo como su representación grá- fica son sencillas de realizar. En nuestra serie, por ejemplo, nos interesa saber si la creatinina del séptimo día tiene relación con el tiem- po de isquemia fría (Figura 25). El coeficiente de co- rrelación más usado es el de Pearson y nos servirá en la gran mayoría de las ocasiones. El resultado se nos presenta de la siguiente manera en la Tabla XIII. Como podemos ver, existe una correlación positiva (coeficiente de Pearson = 0,212) en- tre ambas variables que es estadísticamente significativa p = 0,01, es decir, podemos 52 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 24 Figura 23 Cap 03 4/10/04 12:47 Página 52
  • 53.
    53 ESQUEMA GENERAL DEANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 25 Figura 27 Isquemia fría (horas) 4842363024181260 Creatininasérica7ºdiapost-trasplante(mg/dl) 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Figura 28 Figura 26 Cap 03 4/10/04 12:47 Página 53
  • 54.
    afirmar que enesta serie, a medida que aumenta el tiempo de isquemia fría, mayor es el valor de la creatinina plasmática al séptimo día. La representación gráfica se consigue como indican las Figuras 26 y 27. El gráfico resultante (Figura 28) puede modificarse fácilmente de manera similar a otros tipos de programas gráficos. Debemos recordar que la correlación no significa necesariamente causalidad, como po- dríamos inferir del ejemplo anterior, sino que dos variables tienden a estar relacionadas. Esta relación puede deberse efectivamente a que una de ellas influye en la otra (como muy probablemente ocurra en este caso) o porque alguna otra variable, o más de una, influyan en las dos relacionadas en el mismo sentido. En cuanto al cálculo de la regresión, el método es muy similar, por ejemplo, en nuestra serie queremos saber si efectivamente existe una tendencia a elegir receptores de más edad a medida que el donante es mayor (Figuras 29 y 30). 54 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Correlations CR7 ISQFRI CR7 Pearson Correlation 1,000 0,212 Sig. (2-tailed) 0,0 0,001 N 252 246 ISQFRI Pearson Correlation 0,212 1,000 Sig. (2-tailed) 0,001 0,0 N 246 246 ** Correlation is significant at the 0.01 level (2-tailed) Tabla XIII Figura 29 Figura 30 Cap 03 4/10/04 12:47 Página 54
  • 55.
    El resultado serefleja en la Ta- bla XIV. Como podemos comprobar, la variable dependiente (edad del receptor) aumenta (coeficiente de regresión R positivo = 0,493) a medida que aumenta la edad del donante (variable indepen- diente o predictora) de manera estadísticamente significativa (p = 0,000). La representación gráfica, aun- que puede seleccionarse directa- mente cuando se realiza el test estadístico, en el SPSS es mucho más sencillo realizarla, de la misma manera que hi- cimos con la correlación. El resultado en este caso concreto se muestra en el gráfico de la Figura 31. 55 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Variables Entered/Removed Model Variables Entered Variables Removed Method 1 AGEDON , Enter a. All requested variables entered b. Dependent Variable: AGEREC Model Summary Model R R Square Adjusted R Std. Error Square of the Estimate 1 0,493 0,243 0,240 11,84 a. Predictors: (Constant), AGEDON ANOVA Model Sum of df Mean F Sig. Squares Square 1 Regression 11269,981 1 11269,981 80,421 0,000 Residual 35034,447 250 140,138 Total 46304,429 251 a. Predictors: (Constant), AGEDON b. Dependent Variable: AGEREC Tabla XIV Edad del donante 80706050403020100 Edaddelreceptor 80 70 60 50 40 30 20 10 Figura 31 Cap 03 4/10/04 12:47 Página 55
  • 56.
    ESTADÍSTICA AVANZADA En muchasocasiones, las pruebas estadísticas para comparar o relacionar variables que hemos descrito anteriormente, no nos responden a todas las preguntas que nos plantea un análisis estadístico completo de una población trasplantada, fundamentalmente cuando, sobre uno o varios parámetros, puede influir más de una variable (el ejemplo tí- pico es el análisis de factores de riesgo; sobre la aparición de cardiopatía isquémica pue- den influir la edad, el sexo, la tensión arterial, la hipercolesterolemia, etc.). La cuestión a responder desde el punto de vista estadístico es si todas las variables que influyen tie- nen la misma significación estadística, si unas influyen, a su vez, sobre otras, por lo que estas últimas pierden importancia, y cuáles son las que realmente tienen peso estadísti- co por sí mismas. Para analizar todo lo planteado anteriormente tenemos que recurrir a métodos estadísti- cos para variables múltiples que conocemos genéricamente como análisis multivarian- te. En este capítulo, describiremos la forma de realizar las dos pruebas más usadas en la estadística médica: la regresión múltiple y la regresión logística. Regresión múltiple Este método estadístico se utiliza para investigar si, sobre una varia- ble numérica continua y simple, influyen varias variables indepen- dientes y cuáles de ellas alcanzan significación estadística. Para rea- lizarla seguiremos los pasos si- guientes: en primer lugar, iremos al apartado Regression de estadís- ticas y elegiremos Linear, tal y co- mo vemos en la Figura 32. En la siguiente ventana, elegire- mos la variable que deseamos analizar (dependiente) y después todas aquellas que pensamos que puedan influir en ella (independientes). En nuestro ejemplo, queremos analizar si la edad del donante, el tiempo de isquemia fría, el número de incompatibilidades, el título de anticuerpos, la edad del receptor y el número de rechazos (variables independientes) influyen, y cuáles en la función renal al primer año (variable dependiente). Para ello colo- caremos cr360 en la casilla Dependent, y todas las demás en la casilla Independent(s) (Figura 33). El resultado se refleja en la Tabla XV. 56 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 32 Cap 03 4/10/04 12:47 Página 56
  • 57.
    Se confirma quetodas las varia- bles solicitadas han sido analiza- das y, en caso contrario, cuáles no, y se muestra la significación de cada una de ellas (Tabla XVI). En este ejemplo, podemos ver có- mo únicamente las edades de do- nante y de receptor y el número de rechazos agudos tienen peso esta- dístico por sí mismas (p = 0,000, p = 0,018 y p = 0,000), mientras que las demás no alcanzan signifi- cación. Esto no quiere decir que, si las analizásemos una a una por se- parado, no pudieran ser significati- vas; por ejemplo, un título alto de anticuerpos podría influir negativamente en la función del injerto, pero si lo analizamos con- juntamente con las demás, pierde importancia estadística. 57 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 33 Variables Entered/Removed Model Variables Entered Variables Removed Method 1 NºRA, AGEDON, MISMDR, , Enter ISQFRI, ACACT, AGEREC a. All requested variables entered b. Dependent Variable: CR360 Tabla XV Coefficients Model Unstandardized Std. Error Standardized t Sig. Coefficients B Coefficients Beta 1 (Constant) 1,342 0,232 5,794 0,000 AGEDON 1,437E-02 0,003 0,350 5,181 0,000 ISQFRI 1,438E-03 0,008 0,011 0,182 0,856 MISMDR -1,554E-02 0,063 -0,015 -0,247 0,805 ACACT -4,494E-03 0,004 -0,077 -1,262 0,208 AGEREC -8,116E-03 0,003 -0,161 -2,380 0,018 NºRA 0,422 0,083 0,311 5,103 0,000 a. Dependent Variable: CR360 Tabla XVI Cap 03 4/10/04 12:47 Página 57
  • 58.
    En un análisismás completo pode- mos realizar esta misma prueba, pero en dos o más subgrupos de la población global. Por ejemplo, si queremos realizar exactamente lo mismo que anteriormente, pero solamente en los pacientes que no tuvieron función renal inmediata, únicamente tenemos que indicar la variable correspondiente y su valor; en nuestro ejemplo corresponde a igf = 0 (inmediate graft function = 0), en la casilla Selection Variable, como se ve en la siguiente figura (Figura 34). Cambiando esta condi- ción, podremos realizar cuantos subgrupos queramos. En este caso, el nuevo resultado se aprecia en la Tabla XVII. Como podemos observar, en este subgrupo de pacientes, únicamente se mantiene el número de rechazos agudos, perdiendo significación estadística las edades del donante y del receptor como factores que influyen en la creatinina al primer año post-trasplante. Regresión logística Como hemos visto, la regresión múltiple se utiliza cuando la variable dependiente es nu- mérica o continua. Cuando queremos analizar los factores que pueden influir en una va- 58 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Coefficients Model Unstandardized Std. Error Standardized t Sig. Coefficients B Coefficients Beta 1(Constant) 1,105 0,307 3,593 0,001 AGEDON 4,383E-03 0,004 0,117 1,064 0,291 ISQFRI 1,832E-02 0,011 0,174 1,683 0,097 MISMDR -6,951E-02 0,090 -0,079 -0,776 0,440 ACACT 1,512E-04 0,005 0,003 0,029 0,977 AGEREC -3,400E-03 0,005 -0,082 -0,736 0,464 NºRA 0,505 0,119 0,440 4,236 0,000 a. Dependent Variable: CR360 b. Selecting only cases for which IGF = ,00 Tabla XVII Figura 34 Cap 03 4/10/04 12:47 Página 58
  • 59.
    riable cualitativa odicotómica, deberemos utilizar la regresión logística. Ejemplos muy tí- picos serían analizar los factores que influyen en la situación del injerto, funcionante o no funcionante, o los factores de riesgo de padecer o no cardiopatía isquémica y otros semejantes. Dentro de los parámetros que po- demos incluir como variables inde- pendientes, es decir, como facto- res con posible influencia sobre la circunstancia que estamos anali- zando (variable dependiente), es- tán tanto variables numéricas (edad, creatinina sérica, niveles de inmunosupresores, niveles de co- lesterol, tensión arterial, etc.) co- mo variables cualitativas (sexo, ti- po de inmunosupresión, causa de muerte del donante, etc.). El método a seguir para realizar es- ta prueba con el SPSS, es el si- guiente: en primer lugar, seleccio- namos Logistic en el apartado Regression de estadísticas, co- mo se ve en la Fi- gura 35. En la ventana si- guiente, elegiremos la variable depen- diente que desea- mos analizar (en es- te caso, será la situa- ción del injerto: fun- cionante o no funcio- nante) y, a continua- ción, todas las varia- bles que pensemos que puedan influir (en este caso, por ejemplo, edad del donante y del receptor, causa de la muerte, función renal inicial y a los 30 y 90 días, rechazo agu- do, etc.), como puede verse en la Figura 36. El resultado del test se presenta en la Tabla XVIII. 59 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 35 Figura 36 Cap 03 4/10/04 12:47 Página 59
  • 60.
    Total number ofcases: 291 (Unweighted) Number of selected cases: 291 Number of unselected cases: 0 Number of selected cases: 291 Number rejected because of missing data: 41 Number of cases included in the analysis: 250 Dependent Variable Encoding: Original Internal Value Value F 0 N 1 Parameter Value Freq Coding (1) (2) (3) (4) CAUSAMUE TCE 106 1,000 0,000 0,000 0,000 ANX 6 0,0001 0,000 0,000 0,000 ACV 119 0,000 0,000 1,000 0,000 17 0,000 0,000 0,000 1,000 OTR 2 0,000 0,000 0,000 0,000 RA Sí 67 1,000 0,000 0,000 No 137 0,000 1,000 0,000 0 36 0,000 0,000 1,000 1 10 0,000 0,000 0,000 Dependent Variable. SITUACIO Beginning Block Number 0. Initial Log Likelihood Function -2 Log Likelihood 296,47666 * Constant is included in the model. Beginning Block Number 1. Method: Enter Variable(s) Entered on Step Number 1. AGEDON CAUSAMUE ISQFRI ACACT MISMATC AGEREC RA NºRA CR7 CR30 CR90 60 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Tabla XVIII Cap 03 4/10/04 12:47 Página 60
  • 61.
    Estimation terminated atiteration number 4 because Log Likelihood decreased by less than, 01 percent. -2 Log Likelihood 246,030 Goodness of Fit 248,609 Cox & Snell - R^2 0,183 Nagelkerke - R^2 0,263 Chi-Square df Significance Model 50,447 16 0,0000 Block 50,447 16 0,0000 Step 50,447 16 0,0000 Classification Table for SITUACIO The Cut Value is ,50 Predicted F N Percent Correct F I N Observed F F I 168 I 12 I 93,33% N N I 46 I 24 I 34,29% Overall 76,80% Variables in the Equation Variable B S.E. Wald df Sig R Exp(B) AGEDON 0,0152 0,0137 1,2295 1 0,2675 0,00001 0,0153 CAUSAMUE 3,6108 4 0,4612 0,0000 CAUSAMUE(1) -0,2306 1,7842 0,0167 1 0,8972 0,0000 0,7941 CAUSAMUE(2) -0,7934 1,9613 0,1636 1 0,6858 0,0000 0,4523 CAUSAMUE(3) -0,7355 1,7977 0,1674 1 0,6824 0,0000 0,4793 CAUSAMUE(4) 0,4889 1,9281 0,0643 1 0,7998 0,0000 1,6305 ISQFRI 0,0109 0,0308 0,1261 1 0,7225 0,0000 1,0110 ACACT -0,0051 0,0137 0,1405 1 0,7077 0,0000 0,9949 MISMATC 0,0353 0,1417 0,0621 1 0,8032 0,0000 1,0359 AGEREC 0,0143 0,0143 0,9956 1 0,3184 0,0000 1,0144 RA 2,5866 3 0,4598 0,0000 RA(1) -0,5548 0,9029 0,3776 1 0,5389 0,0000 0,5742 RA(2) 0,8305 1,6655 0,2486 1 0,6180 0,0000 2,2944 RA(3) 1,4923 1,6539 0,8141 1 0,3669 0,0000 4,4472 NºRA 1,8437 1,3927 1,7525 1 0,1856 0,0000 6,3196 CR7 -0,0731 0,0702 1,0848 1 0,2976 0,0000 0,9295 CR30 0,4795 0,2469 3,7724 1 0,0521 0,0773 1,6152 CR90 0,6002 0,3176 3,5703 1 0,0588 0,0728 1,8225 Constant -5,1190 3,1106 2,7082 1 0,0998 61 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Cap 03 4/10/04 12:47 Página 61
  • 62.
    Como podemos observar,la presentación de los resultados es bastante compleja, pero para nuestro propósito, los datos que más nos pueden interesar son: en primer término, se nos describe el número de casos totales, perdidos por falta de datos y los incluidos finalmente en el análisis. El siguiente aspecto que nos interesa, es el listado de los parámetros que se han analizado para que podamos comprobar que están todos los que nos interesan. Al final debe- mos fijarnos en la significación estadística de cada variable. En este ejemplo, vemos que no hay ningún factor que tenga peso, por sí mismo, cuando se analiza conjuntamente con los de- más respecto a la situación del injerto (ninguna p es <0,05). Al igual que en el caso de la re- gresión múltiple, puede ser que en el análisis estadístico básico univariante sí haya significa- ción estadística; una posible explicación es que exista una interacción más o menos intensa entre ellos, que haga que pierdan importancia individual. Otra posibilidad es que el número de parámetros estudiados sea demasiado grande para la muestra que tenemos. Lógicamente, cuantos más factores introducimos en el análisis multivariante, mayor deberá ser la población para que podamos llegar a conclusiones estadísticamente aceptables. Un aspecto práctico importante es que este test nos indica automáticamente el riesgo relativo: se trata del valor Exp(B), y que en nuestro ejemplo se especifica debajo del nombre de cada variable analizada. Al igual que hicimos con la regresión múltiple, podemos dividir la población en subgru- pos. Teniendo en cuenta que disminuiremos la n, debemos intentar que estos subgru- pos tengan un tamaño mínimo y no realizar análisis multivariante en poblaciones de me- nos de 30-50 sujetos. El procedimiento es igual que el anterior, pero especificando una variable y un valor de la misma en el apartado Select: en este caso, vamos a seleccionar el subgrupo de pacientes retrasplantados (txpac = greater than 1). El resultado se pre- senta de idéntica forma (Figura 37). RESUMEN Cuando nos enfrentamos al análisis estadístico de una población trasplantada, existen dos planteamientos básicos: un primer paso, que consiste en un estudio general, y otro más específico, que es el análisis de supervivencia, y que se describe perfectamente en otro de los capítulos. El estudio general estadístico debe realizarse de una forma ordenada y sistemática que incluye varios pasos escalonados, que hemos descrito anteriormente y que intentare- mos sintetizar de la siguiente manera: 1. Descripción de la muestra, tal y como se definió en la primera parte del capítulo. 2. ¿Existen diferencias en los parámetros cuantitativos entre dos grupos de pacientes independientes? 62 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 03 4/10/04 12:47 Página 62
  • 63.
    • Los dosgrupos que queremos comparar, tienen un número de casos mayor de 30: test t de Student. • El tamaño de alguno de los dos grupos es inferior a 30: • Comprobar si la distribución es normal. • En caso afirmativo: test t de Student. • En caso negativo: test de Mann-Whitney y test de Wilcoxon. 3. ¿Existen diferencias en parámetros cuantitativos entre un mismo grupo de pacientes en dos momentos de la evolución? • El grupo que queremos comparar tiene un número de casos mayor de 30: test t de Student para muestras apareadas. • El tamaño del grupo es inferior a 30: • Comprobar si la distribución es normal. • En caso afirmativo: test t de Student para muestras apareadas. • En caso negativo: test de Wilcoxon. 4. ¿Existen diferencias en parámetros cuantitativos entre tres o más grupos de pacien- tes independientes? 63 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Figura 37 Cap 03 4/10/04 12:47 Página 63
  • 64.
    • Todos losgrupos tienen un número de casos mayor de 30 o hemos comprobado que se ajustan todos a una distribución normal: test de ANOVA. • Algún grupo NO tiene una distribución normal: test de Kruskal-Wallis. 5. ¿Existen diferencias en los parámetros cuantitativos entre un grupo de pacientes en tres o más momentos de su evolución? • Todos los grupos tienen un número de casos mayor de 30 o hemos comprobado que se ajustan todos a una distribución normal: test de ANOVA para mediciones repetidas. • Algún grupo NO tiene una distribución normal: test de Friedman. 6. ¿Existen diferencias en parámetros cualitativos entre dos grupos de pacientes inde- pendientes? • Los dos grupos tienen frecuencias esperadas pequeñas: test Chi cuadrado con prueba exacta de Fisher. • No se esperan frecuencias pequeñas en los grupos: test Chi cuadrado. 7. ¿Existen diferencias en parámetros cualitativos en un grupo de pacientes en dos mo- mentos de su evolución? • Test de McNemar o Kappa. 8. ¿Existen diferencias en parámetros cualitativos entre tres o más grupos de pacientes independientes? • Los dos grupos tienen frecuencias esperadas pequeñas: test Chi cuadrado con prueba exacta de Fisher. • No se esperan frecuencias pequeñas en los grupos: test Chi cuadrado. 9. ¿Existe relación entre dos parámetros cuantitativos? • Las dos variables son independientes, en teoría, la una de la otra, pero queremos sa- ber si guardan relación: test de correlación de Pearson. • Suponemos, en teoría, que una variable depende de otra (aumenta o disminuye cuan- do ésta cambia de valor) y queremos saber si guardan relación: test de regresión. 10. ¿Existe algún parámetro que pueda verse influido, teóricamente, por dos o más fac- tores? • La variable a estudiar es numérica continua, así como los factores que puedan in- fluirla: test de regresión múltiple. 64 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 03 4/10/04 12:47 Página 64
  • 65.
    • La variablea estudiar es cualitativa dicotómica y los factores que pueden influir son numéricos o categóricos (es decir, variables cuantitativas o cualitativas): test de re- gresión logística. BIBLIOGRAFÍA RECOMENDADA 1. Pardell H, Cobo E, Canela J. Manual de Bioestadística. Barcelona: Masson; 1986. 2. Leaverton PE. A review of Biostatistics: A program for self-instruction. Boston: little, Brown and Company; 1989. 3. Carrasco JL. El método estadístico en la investigación médica. Madrid: Editorial Ciencia 3; 1989. 4. Schwartz D. Métodos estadísticos para médicos y biólogos. Barcelona: Editorial Herder; 1991. 5. Broughton Pipkin F. Medical statistics made easy. Edimburgo: Churchill Livingstone; 1984. 6. Goldberg M. La Epidemiología sin esfuerzo. Madrid: Ediciones Díaz Santos; 1994. 7. Carrasco JL, López Giménez MR. Ejercicios y problemas de Estadística Biomédica. Madrid: Editorial Ciencia 3; 1985. 8. Dawson-Saunders B, Trapp RG. Bioestadística médica. México D.F.: Editorial El Manual Moderno; 1993. 9. Colton T. Estadística en medicina. Barcelona: Ediciones Científicas y Técnicas (Masson – Salvat Medicina); 1993. 10. Sarriá A, Domenech JM. Análisis multivariante en ciencias de la salud. Laboratori d´Estadística Aplicada i Modelització. Universitat Autónoma de Barcelona. Barcelona: Editorial SIGNO; 1993. 11. Domenech JM. Métodos estadísticos en ciencias de la salud. Laboratori d´Estadística Aplicada i Modelització. Universitat Autónoma de Barcelona. Barcelona: Editorial SIGNO; 1994. 65 ESQUEMA GENERAL DE ANÁLISIS ESTADÍSTICO DE UNA POBLACIÓN TRASPLANTADA Cap 03 4/10/04 12:47 Página 65
  • 66.
    135 EL CONCEPTO DESEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO R. Escallada CONCEPTO DE SEMIVIDA En los anteriores capítulos hemos descrito cómo analizar una población trasplantada, tanto desde el punto de vista general como, más concretamente, desde el punto de vis- ta del análisis de la supervivencia. En todos los casos hemos trabajado con datos reales de evolución. En este capítulo, se va a introducir e intentar definir un aspecto muy rela- cionado con la supervivencia, pero que se basa, fundamentalmente, en una proyección matemático-estadística, es decir, no necesariamente trabajaremos con datos reales de evolución. Este concepto es lo que denominamos semivida. Como su nombre indica, la semivida de supervivencia de una población es el tiempo en el que la mitad de esa población continúa viva o funcionante: por ejemplo, si el 50% de los injertos llegan funcionantes a los 12,5 años, ésta será la semivida. Como podemos dedu- cir de esta definición simple, estamos ante una medida de la supervivencia a largo plazo. Sin embargo, en múltiples ocasiones el tiempo de evolución de una población trasplan- tada concreta es demasiado corto para que se pierdan el 50% de los casos, o bien, la su- pervivencia es muy buena y tardaríamos muchos años en alcanzar el 50% de supervi- vencia. Es por esto por lo que necesitamos algún sistema que nos permita estimar esta cifra sin llegar al 50% real. Otra utilidad de calcular la semivida es que podemos intuir resultados a largo plazo en po- co tiempo de evolución, para que podamos, en su caso, tomar decisiones más precoz- Cap 05 4/10/04 12:49 Página 135
  • 67.
    136 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL mente que si tuviésemos que esperar a la pérdida del 50% de la población. Por ejemplo, ¿cuál es la influencia de un nuevo inmunosupresor en la supervivencia del injerto? A esta pregunta deberemos dar dos respuestas: la primera, su influencia en la supervivencia a corto plazo (inmunosupresión de inducción), que habitualmente se describe durante el primer año, y la segunda, su influencia en la supervivencia a largo plazo, para lo cual cal- cularemos la semivida estimada. Si, en este ejemplo, el nuevo fármaco eleva la supervi- vencia al primer año, pero mantiene constante la semivida, es claramente un inmunosu- presor mejor de inducción e indiferente de mantenimiento, por lo cual, decidiremos su uso con base a otras razones (menor toxicidad, menor coste, etc.) distintas a su eficacia. Al analizar la supervivencia a largo plazo de una población trasplantada, nuestra expe- riencia nos dice que los mayores cambios en la supervivencia del paciente y del injerto, cuando comparamos dos o más curvas de supervivencia, ocurren durante el primer año, produciéndose después una lenta y progresiva pérdida de pacientes e injertos, pero de manera mucho más paralela. Este hecho es claramente evidente cuando comparamos poblaciones trasplanta- das que han llegado fun- cionantes al primer post- trasplante. En el ejemplo siguiente usaremos la base de da- tos real que ya emplea- mos en otro capítulo de este libro; podemos ver la diferencia en la super- vivencia del injerto entre pacientes que han sufri- do rechazo agudo o no (Figura1). Como podemos obser- var, la gran diferencia de supervivencia entre am- bas poblaciones se establece ya desde el primer año, siendo las curvas a partir de ese momento casi paralelas, como puede verse más claramente si, únicamente, analizamos aquellos pacientes que han llegado con injerto funcionante al primer año, para lo cual tendremos que seleccionar, en la hoja de cálculo del SPSS, aquellos casos cuya duración del injerto sea mayor de un año (Figuras 2 y 3). Si repetimos la comparación de las curvas de supervivencia, el resultado es el reflejado en la Figura 4. Figura 1 Cap 05 4/10/04 12:49 Página 136
  • 68.
    Como vemos, lasdos curvas se superponen hasta aproximadamente el cuarto año, año en que los pacientes con antecedentes de rechazo agudo pierden los injertos con más frecuencia (aunque a partir de este año el número de casos empieza a ser bajo y, por lo tanto, con menor valor estadístico). 137 EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO Figura 2 Figura 3 Cap 05 4/10/04 12:49 Página 137
  • 69.
    Lógicamente, la realiza- ciónde un cálculo pre- dicitivo o, dicho de otro modo, de una proyec- ción estadística, debe basarse en el hecho de que los eventos (en es- te caso, la muerte del receptor o la pérdida del injerto) se producen de manera razonable- mente constante a lo largo de la evolución. Es decir, en nuestro ca- so, que la pérdida de in- jertos o el número de fallecimientos anuales esté en un rango estre- cho entre los distintos años. Como hemos vis- to, esto no se produce de ninguna manera durante el primer año post-trasplante, por lo que, cuando calculamos la semivida estimada de una población trasplantada, debere- mos hacerlo siempre en el grupo de pacientes que llegan vivos y con injerto funcionan- te al primer año, ya que es a partir de este momento, cuando se produce lo que podría- mos denominar una fase de riesgo constante que hace que el logaritmo natural de la curva de supervivencia sea prácticamente lineal, permitiéndonos fácilmente realizar la extrapolación necesaria para calcular la semivida. CÁLCULO DE LA SEMIVIDA La fórmula para el cálculo de la semivida es muy sencilla aunque, como veremos, tedio- sa en su realización, por lo que intentaremos describir métodos más rápidos y sencillos y prácticamente con igual exactitud: semivida estimada = T log(2) / n de eventos Donde T es el tiempo de supervivencia acumulado después del primer año y n de eventos el número de pacientes fallecidos o el número de injertos que dejaron de fun- cionar después del primer año. El mayor problema del método es que tenemos que ir sumando, si usamos al pie de la letra esta fórmula, la supervivencia (por encima del año) de todos y cada uno de los ca- 138 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 4 Cap 05 4/10/04 12:49 Página 138
  • 70.
    sos. Por ejemplo,si queremos saber la semivida de las dos poblaciones de las que he- mos calculado las curvas de supervivencia anteriormente, esto es, de los pacientes con y sin antecedentes de rechazo agudo, para ello debemos consultar la tabla que, previa a la curva, nos proporciona el SPSS cuando utilizamos el método Kaplan-Meier, en la que se nos informa de la supervivencia de cada caso (Tablas I y II). Como puede fácilmente adivi- narse, este sistema es laborio- so y tedioso, por lo que utiliza- mos un sistema más simple y que, además, nos permite te- ner al mismo tiempo la repre- sentación gráfica. En el SPSS, seleccionaremos Kaplan-Meier en el apartado Survival de Statistics (Figura 5). En la pantalla siguiente, selec- cionaremos la variable que nos indica la duración del injerto o del paciente, la situación (fun- cionante o no funcionante, o bien, vivo o muerto) y el factor que queramos comparar, en su 139 EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO Figura 6 Figura 5 Cap 05 4/10/04 12:49 Página 139
  • 71.
    140 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Factor RA=NO Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1,0603 F 0 125 1,1507 N 0,9920 0,0080 1 124 1,3068 F 1 123 1,3973 F 1 122 1,4000 F 1 121 1,4603 F 1 120 1,5151 F 1 119 1,5781 N 0,9837 0,0115 2 118 1,6329 N 0,9753 0,0141 3 117 1,6466 F 3 116 1,8630 F 3 115 1,8986 F 3 114 1,8986 F 3 113 2,0164 N 0,9667 0,0164 4 112 2,0329 F 4 111 2,0767 N 0,9580 0,0184 5 110 2,1068 F 5 109 2,1699 N 0,9492 0,0202 6 108 2,3260 F 6 107 2,3425 F 6 106 2,3425 F 6 105 2,4548 F 6 104 2,4904 N 0,9401 0,0220 7 103 2,5123 F 7 102 2,5151 F 7 101 2,6027 F 7 100 2,6027 F 7 99 2,6685 N 0,9306 0,0237 8 98 2,7068 F 8 97 2,7589 F 8 96 2,7863 F 8 95 2,7863 F 8 94 2,8055 F 8 93 2,9808 N 0,9206 0,0255 9 92 2,9863 F 9 91 3,0055 N 0,9105 0,0272 10 90 3,0822 F 10 89 3,1836 F 10 88 3,2740 F 10 87 3,3397 F 10 86 3,3562 F 10 85 3,4466 F 10 84 3,4548 F 10 83 3,4575 F 10 82 3,4959 F 10 81 3,5836 F 10 80 3,6438 F 10 79 3,6438 F 10 78 Tabla I. Survival Analysis for DURACION. Cap 05 4/10/04 12:49 Página 140
  • 72.
    141 EL CONCEPTO SEMIVIDACOMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO 3,6795 F 10 77 3,6849 F 10 76 3,6877 N 0,8985 0,0293 11 75 3,7781 F 11 74 3,9315 F 11 73 3,9863 F 11 72 4,1178 F 11 71 4,1644 F 11 70 4,2959 F 11 69 4,4247 F 11 68 4,4247 F 11 67 4,5014 F 11 66 4,5068 F 11 65 4,5699 F 11 64 4,6356 F 11 63 4,6849 F 11 62 4,7041 F 11 61 4,7233 F 11 60 4,9671 F 11 59 5,0384 F 11 58 5,0466 F 11 57 5,0877 F 11 56 5,0877 F 11 55 5,1041 F 11 54 5,1589 F 11 53 5,2000 F 11 52 5,2137 F 11 51 5,2301 F 11 50 5,4521 F 11 49 5,4849 F 11 48 5,4932 N 0,8798 0,0342 12 47 5,4986 F 12 46 5,5205 N 0,8606 0,0384 13 45 5,5479 F 13 44 5,6575 N 0,8411 0,0422 14 43 5,7370 F 14 42 5,8082 F 14 41 5,8301 F 14 40 5,8438 F 14 39 6,0356 F 14 38 6,0822 F 14 37 6,0822 F 14 36 6,1151 F 14 35 6,2575 F 14 34 6,2575 F 14 33 6,2740 F 14 32 6,5151 F 14 31 6,5452 F 14 30 6,5589 F 14 29 6,7178 F 14 28 6,7178 F 14 27 6,7890 F 14 26 6,8466 F 14 25 6,8466 F 14 24 Cap 05 4/10/04 12:49 Página 141
  • 73.
    caso (en esteejemplo, vamos a analizar la semivida de los injertos con y sin anteceden- tes de rechazo agudo). En el campo Options... deberemos seleccionar Log survival como Plot (curva) que debe dibujar el SPSS (Figura 6). Una vez obtenidas las gráficas correspondientes, en función logarítmica, debemos, des- de el propio SPSS, editar el gráfico y en el apartado Options... de Chart elegiremos Show Subgroups y Fit line Total (para la serie completa), y Subgroups si estamos com- parando poblaciones como es nuestro caso (Figuras 7 y 8). Por último, únicamente nos queda preparar la gráfica para poder determinar el punto de intersección entre el 50% y la línea de supervivencia, viendo a qué valor del eje X corresponde, el cual será la semi- vida (Figura 9). Cuanto más subdividida esté la escala del eje X, más precisa será la medida de la semi- vida estimada, aunque al ser un valor predictivo y con el que no haremos cálculos, no es 7,0137 F 14 23 7,0603 F 14 22 7,2329 N 0,8028 0,0549 15 21 7,2658 F 15 20 7,3096 F 15 19 7,4164 F 15 18 7,5918 F 15 17 7,6000 F 15 16 7,6329 F 15 15 7,6658 F 15 14 7,6959 F 15 13 7,7616 F 15 12 7,7616 F 15 11 7,8411 F 15 10 7,8658 F 15 9 7,9233 F 15 8 7,9342 F 15 7 8,6082 F 15 6 8,6329 F 15 5 8,6822 F 15 4 8,7452 F 15 3 8,8164 F 15 2 8,9205 F 15 1 8,9507 F 15 0 Number of cases: 126 Censored: 111 (88,10%) Events: 15 Survival Time Standard Error 95% Confidence Interval Mean 8,0246 0,2207 (7,5919; 8,4572) (Limited to 8,9507) 142 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 05 4/10/04 12:49 Página 142
  • 74.
    imprescindible una cifraexcesivamente precisa. En nuestro ejemplo, podríamos afirmar, como vemos en el gráfico de la Figura 10, que: • La semivida estimada de nuestra población general es de 12 años. • La semivida estimada de la población con anteceden- tes de rechazo agudo dismi- nuye hasta los 8-8,5 años. • La semivida estimada de la población sin rechazo agu- do alcanza los 18 años. Si quisiéramos más precisión, únicamente deberemos modifi- car el gráfico (como si de un zoom se tratase) hasta conse- 143 EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO Figura 7 Figura 8 Cap 05 4/10/04 12:49 Página 143
  • 75.
    144 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Factor RA=SÍ Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1,0329 N 0,9821 0,0177 1 55 1,4438 F 1 54 1,9068 N 0,9640 0,0250 2 53 2,3041 N 0,9458 0,0305 3 52 2,6301 F 3 51 2,8521 F 3 50 2,9507 N 0,9269 0,0352 4 49 3,0438 F 4 48 3,1315 N 0,9075 0,0394 5 47 3,2356 F 5 46 3,3397 F 5 45 3,5452 F 5 44 3,5836 F 5 43 3,6219 N 0,8864 0,0438 6 42 3,7781 N 0,8653 0,0476 7 41 3,8603 N 0,8442 0,0509 8 40 3,9315 F 8 39 4,0712 N 0,8226 0,0540 9 38 4,1178 F 9 37 4,1616 F 9 36 4,2055 F 9 35 4,2548 F 9 34 4,4411 N 0,7984 0,0576 10 33 4,5041 F 10 32 4,5644 F 10 31 4,6192 F 10 30 4,8493 N 0,7718 0,0615 11 29 5,0603 F 11 28 5,3068 F 11 27 5,4438 N 0,7432 0,0655 12 26 5,4493 F 12 25 5,8000 F 12 24 5,8082 F 12 23 6,0137 N 0,7109 0,0702 13 22 6,0192 F 13 21 6,1151 F 13 20 6,2521 F 13 19 6,2767 F 13 18 6,2904 F 13 17 6,4630 F 13 16 6,5151 F 13 15 6,5836 F 13 14 6,8247 N 0,6601 0,0815 14 13 7,3397 F 14 12 7,6082 F 14 11 7,6438 N 0,6001 0,0936 15 10 7,6685 F 15 9 7,6904 F 15 8 Tabla II. Survival Analysis for DURACION. Cap 05 4/10/04 12:49 Página 144
  • 76.
    145 EL CONCEPTO SEMIVIDACOMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO guir la que nos parezca adecua- da, que no debe ser, a nuestro modo de entender, de más de un decimal de año (Figura 11). Como vemos, los valores antes mencionados podemos concretar- los más y serían exactamente: 12,2 años para la población general; 8,2 años para el grupo de rechazo agu- do y 17,8 para el grupo sin rechazo agudo. Este método, aunque no muy or- todoxo en teoría, es mucho más sencillo y rápido que el uso de la fórmula cuando se coge práctica, y sus valores son bá- sicamente iguales, aunque lógicamente siempre podemos calcular exactamente la se- mivida estimada directamente con la fórmula antes descrita. Lógicamente, la significación estadística de estas diferencias nos vendrán determina- das por los test que comparan curvas de supervivencia y que se explicaron perfecta y detalladamente en otro capítulo de este libro. Figura 9 7,6959 F 15 7 7,7315 F 15 6 7,8438 F 15 5 7,9233 F 15 4 7,9260 F 15 3 8,7397 F 15 2 8,8164 F 15 1 8,9507 F 15 0 Number of cases: 56 Censored: 41 (73,21%) Events: 15 Survival Time Standard Error 95% Confidence Interval Mean 7,3000 0,3567 (6,6009; 7,9991) Limited to 8,9507) Survival Analysis for DURACION Total Number Number Percent Events Censored Censored RA NO 126 15 111 88,10 RA SÍ 56 15 41 73,21 Overall 182 30 152 83,52 Cap 05 4/10/04 12:49 Página 145
  • 77.
    146 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 10 Figura 11 BIBLIOGRAFÍA RECOMENDADA 1. Cook DJ. Long-term survival of kidney allografts. In: Terasaki PL. Ed. Clinical Transplant 1987. Los Angeles: UCLA Tissue Typing Laboratory; 1987. Cap 05 4/10/04 12:49 Página 146
  • 78.
    2. Dawson-Saunders B,Trapp RG. Bioestadística médica. México D.F.: Editorial El Manual Moderno; 1993. 3. Pardell H, Cobo E, Canela J. Manual de Bioestadística. Barcelona: Masson; 1986. 4. Domenech JM. Métodos estadísticos en Ciencias de la Salud. Laboratori d´Es- tadística Aplicada i Modelització. Universitat Autónoma de Barcelona. Barcelona: Editorial SIGNO; 1994. 147 EL CONCEPTO SEMIVIDA COMO PREDICTOR DE LA SUPERVIVENCIA A LARGO PLAZO Cap 05 4/10/04 12:49 Página 147
  • 79.
    67 CURVAS DE VIDA YSUPERVIVENCIA EN EL TRATAMIENTO SUSTITUTIVO DE LA INSUFICIENCIA RENAL: DIÁLISIS Y TRASPLANTE RENAL V. Abraira, C. Quereda EL ANÁLISIS DE SUPERVIVENCIA EN MEDICINA COMO DESCRIPTOR DEL PRONÓSTICO Y EN LOS ESTUDIOS DE TRATAMIENTO Una de las funciones básicas de la medicina y de los médicos es realizar apreciaciones pronósticas que informen al paciente y a su entorno sobre la evolución más probable de la enfermedad y que ayuden a la toma de decisiones sobre la realización de las distintas intervenciones posibles. Estas intervenciones o instrumentos terapéuticos se encami- nan, precisamente, a modificar el pronóstico espontáneo o la historia natural de la enfer- medad, transformándola en un sentido positivo. El estudio de los determinantes que condicionan el pronóstico y el análisis, acerca de si una nueva intervención terapéutica realmente mejora los resultados de una precedente, constituyen objetivos paradigmáti- cos de la investigación clínica. Sin duda, la primera preocupación de una persona enferma es conocer en qué medida la enfermedad puede interferir en su expectativa de vida. El estudio de la mortalidad y el tiempo que transcurre entre el comienzo de la enfermedad y la muerte o el tiempo de supervivencia, constituyen, por tanto, la prioridad para cualquier estudio de pronóstico. Pero, por extensión, forman parte del mismo muchas otras consecuencias de la enfer- medad (remisión, recidiva, complicaciones, secuelas, rechazo agudo, etc.) que interesan Cap 04 4/10/04 12:48 Página 67
  • 80.
    68 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL al paciente y forman parte del proceso de toma de decisiones del médico. Estas varia- bles, que pueden manifestarse o no a lo largo de la enfermedad y a mayor o menor in- tervalo desde su inicio, se denominan resultados de interés, acontecimientos o even- tos (events en la terminología anglosajona). La producción de estos resultados está condicionada, no sólo por la interacción enfer- medad-terapéutica, sino por la presencia en el enfermo de una serie de circunstancias clínicas o epidemiológicas que predicen la probabilidad de que se produzca alguno de los resultados de interés en distintos momentos evolutivos. Estas variables, denominadas factores pronósticos, condicionan la aparición de un determinado resultado de interés o, al menos, se relaciona tan estrechamente con él como para poder ser utilizado como predictor del mismo. Es evidente el impacto que la introducción de los trasplantes ha tenido en la superviven- cia de pacientes que, a consecuencia de distintas enfermedades, sufren un deterioro terminal de órganos vitales (riñones, hígado, corazón, pulmones, páncreas, etc.). Así, la expectativa de vida en los enfermos que han llegado a una fase terminal de la insuficien- cia renal (por ejemplo, con filtrado glomerular inferior a 5 mL/min) se limita a pocos me- ses, pudiendo modificarse esta nefasta evolución con las intervenciones de tratamiento substitutivo de la insuficiencia renal terminal (diálisis y trasplante). Sin embargo, sabe- mos que la supervivencia con estos tratamientos es muy variable, en función de los fac- tores pronósticos que influyen en la misma (edad, raza, comorbilidad, etc.) y de la tera- péutica efectuada (mejoría de las técnicas de diálisis, nuevos inmunosupresores, etc.). Dentro de un concepto amplio, podemos distinguir dos situaciones que implican tam- bién diferencias de diseño y de interpretación: 1. El estudio de la influencia de variables o de factores pronósticos que presentan los enfermos a nivel basal, sobre el curso de la enfermedad, definido por la evolución temporal de uno o varios resultados de interés (estudios de pronóstico en sentido estricto). 2. La influencia de una determinada actuación terapéutica, sobre los resultados de in- terés y, por tanto, su modificación potencial del pronóstico en relación a la evolución natural o a otra u otras alternativas terapéuticas (estudios de tratamiento). Es evidente que ambas circunstancias constituyen el eje fundamental de la investiga- ción clínica. El análisis de la supervivencia en los estudios sobre el pronóstico En el primer supuesto, es decir, el estudio de los factores pronósticos propiamente dichos, el análisis trata de establecer, dentro de unos márgenes de probabilidad, la Cap 04 4/10/04 12:48 Página 68
  • 81.
    predicción del cursofuturo de la enfermedad, individualizando, analizando y cuantifi- cando las circunstancias o variables que condicionan la evolución. Por ejemplo, el es- tudio de factores (edad, tipaje, comorbilidad, etc.) que influyen en la evolución del trasplante renal. Normalmente es imposible, o no ético, asignar pacientes aleatoriamente a distintos factores pronósticos. Por esta razón, el mejor diseño para identificar la presencia y de- terminar el riesgo asociado a un factor pronóstico suele ser un estudio de cohorte. En estos estudios, los investigadores siguen la evolución de uno o más grupos de enfer- mos (cohortes) expuestos a diferentes niveles del factor pronóstico y observan si se produce o no el resultado de interés (supervivencia, recurrencia, complicaciones, etc.) con el fin de averiguar el riesgo atribuible a la presencia de estas variables, comparando los resultados obtenidos en enfermos portadores y no portadores del citado factor. Por tanto, un estudio ideal de cohorte consta de una muestra bien definida de individuos representativos de la población que deseamos estudiar, con un mínimo de dos exáme- nes transversales (inicial y final). Utiliza criterios objetivos para evitar la producción de sesgos, tanto para fijar el inicio del estudio (tiempo 0) en todos los casos, así como para la terminación del mismo (cierre del estudio) y para definir el resultado o acontecimiento de interés. Pueden ser prospectivos, retrospectivos o bidireccionales. La orientación temporal contempla siempre la determinación de la exposición (factores pronósticos o de ries- go) previamente al desarrollo del evento de interés (muerte, complicaciones, etc.). Para que los resultados de un estudio de cohorte sean generalizables, la muestra se- leccionada debe ser representativa de la población diana y sus resultados analizados sobre la base de los factores pronósticos que, de una forma independiente, determi- nen el resultado. El pronóstico puede también estudiarse con el modelo de diseño de casos y contro- les. La utilización de éste, requiere que los investigadores analicen variables de inte- rés de individuos que han experimentado un determinado resultado de la enferme- dad (muerte, complicación, etc.) y compararlos con controles que no lo hayan pre- sentado. La posibilidad de que se produzcan sesgos al seleccionar los casos y los controles, así como la naturaleza retrospectiva de la recogida de datos (que a menudo depende de la precisión de la recogida de datos en los protocolos o historias clínicas o de la memoria del paciente o sus familiares), limita la capacidad probatoria de este diseño. Asimismo, estos estudios no pueden proporcionar información sobre el riesgo absolu- to de un episodio sino sólo, y de un modo indirecto, del riesgo relativo (RR). 69 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 69
  • 82.
    El análisis dela supervivencia en los estudios sobre tratamiento En los estudios que tratan de evaluar la eficacia de un tratamiento, la estrategia de dise- ño es completamente diferente. Ahora la prioridad consiste en asegurar, mediante las técnicas de aleatorización, la comparabilidad entre el grupo experimental y el control. Esta metodología es muy potente para objetivar diferencias en la aparición de los resul- tados de interés entre los distintos grupos, pero no es el procedimiento más adecuado para analizar la influencia sobre estos resultados de las variables pronósticas. No obstante, puesto que los ensayos aleatorizados rigurosos incluyen documentación minuciosa de los criterios de inclusión y protocolos estrictos para el seguimiento, los pacientes de dichos ensayos forman cohortes que también pueden generar información sobre el pronóstico de una enfermedad. El principal inconveniente de los ensayos consiste en que, con frecuencia, los pacientes incluidos no son representativos de la población general con el trastorno, ya que el esta- blecimiento de los criterios de inclusión y exclusión genera, precisamente, una pobla- ción seleccionada. METODOLOGÍA DEL ANÁLISIS DE SUPERVIVENCIA Medidas de frecuencia de la enfermedad y otros eventos La epidemiología, como ciencia que se ocupa de estudiar el proceso de enfermar en las po- blaciones humanas, ha desarrollado instrumentos para medir la frecuencia de la enfermedad y medirla en relación con sus supuestos determinantes. La epidemiología clínica (1) aplica el método epidemiológico para producir conocimiento sobre el proceso de la práctica clínica; aplica por tanto los mismos instrumentos, aunque para medir la frecuencia no sólo de la en- fermedad, sino también de otros eventos que ocurren en la práctica clínica: solicitar una prue- ba diagnóstica, aplicar un tratamiento, etc. Esto provoca, a veces, alguna confusión terminoló- gica de la que probablemente no esté exento este texto, en el que se tratan de repasar las medidas de frecuencia de un evento (en epidemiología suele ser enfermar, usando como re- ferencia la población general, pero en epidemiología clínica también se habla de curación, muerte, pérdida del injerto, etc., usando como referencia una población de enfermos). Prevalencia Es la proporción de individuos de una población que presentan el evento en un momen- to o periodo de tiempo determinado. Por ejemplo, la prevalencia de la pérdida del injer- 70 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 70
  • 83.
    to en lospacientes con trasplante renal en el hospital Ramón y Cajal, en el año 2001, es la proporción de pacientes de este hospital que, en el año 2001, perdieron el injerto con respecto a aquellos que estaban en condiciones de perderlo durante ese año (pacientes en riesgo). Se calcula: Sus características son: es una proporción, es decir, el numerador está incluido en el de- nominador, por lo tanto, no tiene dimensiones y su valor oscila entre 0 y 1, aunque a ve- ces se expresa como porcentaje; es un indicador estático, que se refiere a un momento temporal y que indica la carga del evento que soporta la población. Tiene su mayor utili- dad en los estudios de planificación de servicios sanitarios. En la prevalencia influye la velocidad de aparición del evento y su duración. Es por ello poco útil en la investigación causal y de medidas terapéuticas. Incidencia La incidencia refleja el número de nuevos eventos en una población susceptible de que ocurran, durante un periodo de tiempo. Es un índice dinámico que requiere el seguimiento en el tiempo de la población de interés. Cuando el evento es recurrente se suele referir a la primera aparición. Se puede medir con dos índices: incidencia acumulada y densidad (o tasa) de incidencia. La incidencia acumulada es la propor- ción de individuos que desarrollan el evento durante el periodo de seguimiento. Se calcula: Sus principales características son: es una proporción, por lo tanto, no tiene dimensio- nes y su valor oscila entre 0 y 1, aunque también se suele expresar como porcentaje. Depende del tiempo de seguimiento que se debe hacer explícito. Se calcula sobre una cohorte fija, es decir, no se permiten entradas de nuevos individuos durante el segui- miento. Es un estimador del riesgo, entendido como probabilidad de que un individuo de la po- blación experimente el evento en un periodo determinado de tiempo (condicionado a que pueda ser observado, es decir, a que no muera por otra causa) (2). La principal limi- tación de este índice proviene del efecto de cohorte fija, puesto que a lo largo del se- guimiento generalmente se pierden individuos. Imaginemos que, para evaluar la inci- dencia de la pérdida del injerto, se sigue durante doce meses a un grupo de seis indivi- duos que han recibido un trasplante renal. La situación podría ser: dos de ellos pierden el injerto a los tres y a los seis meses, respectivamente, otros dos acaban el segui- IA(∆t)= Nº eventos nuevos Nº individuos susceptibles al comienzo P= Nº eventos Nº individuos en riesgo 71 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 71
  • 84.
    miento con elinjerto funcionando y otros desaparecen del estudio, también con el in- jerto funcionando a los cuatro y diez meses, respectivamente. En esta situación la IA, en un año, es 2/6 o el 33%. Obsérvese la indeterminación de este índice debido a las pérdidas. En este ejemplo, si se hubiera completado el periodo de observación en to- dos los individuos, los dos perdidos podrían haber sufrido la pérdida del injerto y la IA sería tan distinta como el 66%. Densidad (o tasa) de incidencia Para evitar la limitación de la incidencia acumulada se define este otro índice de inciden- cia, la densidad o tasa de incidencia, que es el cociente entre el número de casos nue- vos ocurridos durante el periodo de seguimiento y la suma de todos los tiempos de ob- servación. Se calcula: Sus características son que tiene dimensión de inversa del tiempo, un rango ilimitado a partir de 0. No depende del tiempo de seguimiento, asumiendo estacionalidad, es decir, ritmo constante, y no necesita cohorte fija. En el ejemplo anterior: meses-1 es una forma de representar que su unidad es la inversa del tiempo y que és- te se ha medido en meses, otra forma de representarlo es persona/mes y, con fre- cuencia, se usa el año como unidad de tiempo. Evidentemente para pasar de perso- na/mes a persona/año hay que multiplicar por 12. El resultado anterior se puede ver como: Esta es una forma común de expresar la mortalidad de los enfermos sometidos a trata- miento sustitutivo por insuficiencia renal (diálisis o trasplante). Como en este caso las densidades de incidencia son bajas, normalmente se expresa como mortalidad por 100 enfermos/año, resultante de multiplicar por 100 la DI expresada como enfermos/año. Es decir, en el ejemplo anterior la mortalidad sería 0,516 x 100 = 51,6 casos de muerte por 100 enfermos/año. DI(1,12) = 0,043 meses-1 = 0,516 años-1 Σ n ∆ti = 3+6+4+10+12+12 = 47 DI(1,12) = 2 = 0,043 meses-1 i=1 47 DI(t1, t2)= Nº eventos nuevos Σ n ∆ti i=1 72 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 72
  • 85.
    Variable tiempo hastaun evento Sin embargo, en muchos estudios clínicos y también en trasplante, el principal resulta- do de interés no es la frecuencia de ocurrencia de los eventos, sino el tiempo hasta que ocurre uno. Este evento puede ser adverso como muerte o fracaso del injerto, o positi- vo como alta hospitalaria o reincorporación a la vida laboral. El análisis de este tipo de variable, “tiempo hasta la ocurrencia de un evento”, suele presentar dos dificultades que impiden realizarlo con las técnicas estadísticas genera- les, tales como la t de Student, el análisis de la varianza o los modelos de regresión li- neal. En primer lugar, en la mayor parte de los estudios, la variable tiempo no tiene la distribución normal que esas técnicas exigen, más bien suele tener una distribución asimétrica, en la que típicamente los eventos ocurren con mayor frecuencia al principio que al final del periodo de seguimiento y, aunque podrían intentarse transformaciones que la normalizaran, existe una segunda dificultad, y es que, en general, al final del pe- riodo de seguimiento siempre hay individuos en los que no se ha podido observar el evento y, por lo tanto, en los que el tiempo hasta su ocurrencia es desconocido, si bien se tiene una información parcial sobre él, es mayor o igual que el tiempo observado. A este fenómeno se le denomina censura y es el que exige un planteamiento específico para estas variables, que permita aprovechar la información contenida en los tiempos censurados. Al conjunto de técnicas que permiten estudiar la variable tiempo hasta que ocurre un evento y su dependencia de otras posibles variables explicativas, se le denomina análi- sis de supervivencia y, aunque este nombre sugiere que el evento es la muerte, se in- siste en que también puede y debe usarse para analizar el tiempo hasta cualquier otro evento, como por ejemplo la curación, la aparición de la enfermedad o el rechazo del in- jerto. En otros ámbitos, como los procesos de control de calidad, se estudia con las mismas técnicas el tiempo hasta que un cierto producto falla (tiempo de fallo) o el tiem- po de espera hasta recibir un servicio (tiempo de espera), etc. Existen tres motivos por los que pueden aparecer las censuras. En primer lugar, por el fin del estudio. Supóngase, por ejemplo, que para evaluar la eficacia de un nuevo trata- miento para una enfermedad mortal, se siguieron en el tiempo, durante un año, dos gru- pos de pacientes. A los pacientes de un grupo se les administró el tratamiento en eva- luación y, a los del otro, el tratamiento estándar, y se registró la duración del intervalo de tiempo entre el inicio del tratamiento y la muerte. Al final del estudio puede haber indivi- duos que no hayan muerto. La segunda causa es la pérdida del seguimiento. En el ejemplo anterior, algunos de los individuos pudieron desaparecer del estudio en algún momento del mismo, por di- versos motivos: cambio de domicilio, falta de interés, etc. 73 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 73
  • 86.
    74 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Una última causa de censura es la ocurrencia de un evento competitivo que impida la observación del evento, por ejemplo, la muerte por alguna otra causa ajena al estudio. Es ésta la causa de censura a la que hay que prestar más atención en el diseño de los estudios, como se comentará más adelante. Todos estos tiempos censurados infraesti- man el tiempo hasta el evento, que siempre ocurrirá, asumiendo que ocurra, en un tiempo posterior. Las situaciones descritas corresponden a lo que se denomina censu- ra por la derecha, pero también puede ocurrir la censura por la izquierda, situación en la que sí se observa el evento, pero en un tiempo posterior al momento en que ocu- rrió. Por ejemplo, en un estudio que investigue el tiempo hasta la recaída en un cáncer (tiempo libre de enfermedad) después de la recesión quirúrgica del tumor, si los pacien- tes fueran examinados seis meses después de la intervención, aquellos que en ese mo- mento ya presentaran una recidiva, estarían censurados por la izquierda, es decir, el tiempo observado sobreestima el tiempo libre de enfermedad, que en este caso sería menor que seis meses. Aunque existen métodos que permiten analizar datos censura- dos por la izquierda (3), en este texto nos limitaremos a los censurados por la derecha, que son los más ampliamente usados en la literatura nefrológica. Hay que tener en cuenta también que la variable es el tiempo hasta que ocurre el evento y viene definida por la duración del intervalo temporal entre los instantes en que empieza la observación y ocurre el evento. En general, la observación no comienza en el mismo instante para todos los individuos, y la manera habitual de registrar los tiempos en la clíni- ca es mediante las fechas de ocurrencia. Por lo tanto, antes del análisis hay que convertir el “tiempo de calendario” a “tiempo hasta el evento”. En el esquema de la Figura 1 se detalla este proceso y los posibles mecanismos de censura para un ejemplo hipotético de supervivencia tras un trasplante renal. Es importante fijarse en el paciente E, que mue- re por accidente de tráfico, y que suele plantear un problema en el diseño de estos estu- dios. Hay autores que prefieren definir el evento de interés como muerte por una causa relacionada con la enfermedad en estudio, y por tanto, censurarían las muertes por cau- sas no relacionadas, argumentando con cierto sentido, que una muerte por accidente de tráfico no debería “contar” si se está evaluando la supervivencia al trasplante renal, mien- tras que otros prefieren definirlo como muerte por todas las causas. A favor de esta últi- ma opción, está la dificultad que suele tener la clasificación de una muerte como relacio- nada o no con la enfermedad en estudio y su tratamiento, y por tanto, la potencial inclu- sión de sesgos por mala clasificación. En general, la muerte por todas las causas se con- sidera un evento más robusto que la muerte por causas específicas (4) y sería por ello el preferido, aunque otras veces se realizan los análisis para las dos definiciones del evento. Sin embargo, si el evento de interés fuera la pérdida del injerto, una muerte por acci- dente de tráfico de un paciente con el injerto funcionando sí podría ser considerada una censura. No obstante, esto no es siempre tan obvio, el accidente puede deberse a in- farto del conductor y éste estar favorecido por hipertensión arterial o hipercolesterole- mia del enfermo en relación a malfunción del injerto o a la medicación recibida. El pro- Cap 04 4/10/04 12:48 Página 74
  • 87.
    blema de cómoactuar (si el injerto debe censurarse o considerarse perdido) en casos de muerte con riñón funcionante, ha sido muy debatido en la literatura sobre trasplan- tes. Se discute ampliamente este tema en apartados siguientes. Estudio ejemplo Consideraremos, como ejemplo para el resto del capítulo, los datos de supervivencia al trasplante renal de todos los enfermos trasplantados en el hospital Ramón y Cajal 75 CURVAS DE VIDA Y SUPERVIVENCIA Figura 1. Esquema temporal de un estudio para observar tiempos de espera para un evento, por ejemplo supervivencia tras un trasplante renal. El estudio empezó el 1 de enero de 1990, fecha del primer trasplante, se incluyeron todos los pacientes trasplan- tados hasta el 1 de enero de 2001 y el periodo de seguimiento acabó el 1 de enero de 2002. En A, el eje temporal representa años de calendario y en B, años desde el tras- plante. Con el círculo en blanco se representan los tiempos censurados y con el cua- drado negro las muertes (ocurrencia del evento). El individuo A que se transplantó en enero de 1990 desaparece del estudio en enero de 1993 (sería una censura a los tres años por pérdida de seguimiento). El B, también trasplantado en enero de 1990, fallece en junio de 1992 (muerte a los 2,5 años). El C sigue vivo al acabar el estudio (sería un dato censurado a los doce años por fin del estudio). El D, al que se le trasplanta en fe- brero de 1991, fallece en marzo de 1999, el tiempo de supervivencia sería ocho años. El E, que recibe el trasplante en noviembre de 1993, fallece en accidente de tráfico en ju- lio de 1997 (sería una muerte, o un dato censurado, a los 3,7 años dependiendo de la definición de evento de interés -véase texto-). El F, al que se le interviene al principio de 1996, sigue vivo al acabar el estudio, sería un dato censurado a los seis años por fin del estudio. Años A B Tiempo desde el trasplante Cap 04 4/10/04 12:48 Página 75
  • 88.
    desde el 10de marzo de 1979 hasta el 31 de diciembre de 2002, el seguimiento aca- bó el 1 de junio de 2003. Son 917 pacientes, en los que se considerarán dos eventos: muerte por todas las causas y pérdida del injerto; para ambas, está recogido el tiempo en meses desde el trasplante. Además, se considerarán la edad al trasplante, el sexo y el tratamiento farmacológico agrupado (sólo a efectos de este ejemplo) en tres ca- tegorías: Grupo AZA (azatioprina + prednisona); Grupo CsA (ciclosporina A + predniso- na o ciclosporina A + prednisona + azatipoprina) y Grupo TACRO (combinaciones de tacrolimus con prednisona y mofetil-micofenolato o rapamicina). Algunos pacientes que no podían ser incluidos estrictamente en estos grupos, han sido excluidos. En la Tabla I se muestra el aspecto de la tabla de datos en SPSS de los diez primeros pa- cientes. 76 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Tabla I. Aspecto de la tabla de datos, recogidos en formato SPSS, para el estudio de la supervivencia (enfermo e injerto) del trasplante renal en el hospital Ramón y Cajal. Además de una variable de identificación (nor), están registrados: la edad al trasplante en años; el sexo, con los códigos 0 para varón y 1 para mujer; el tiempo en meses después del trasplante durante el que el injerto funcionó (meses_ev), con un código (injerto) para indicar si ese tiempo corresponde a una observación (0), es decir, que en ese tiempo el injerto falló, o a una censura (1) por fin del estudio, o (2) por pérdida del seguimiento, es decir, que en ese tiempo se acabó el seguimiento sin que el injerto fallara; el tiempo en meses hasta la muerte (meses_ex), y un código (estatus) para indicar a qué corresponde realmente ese tiempo: 1 para muerte, 0 para censura por fin del seguimiento y 2 para censura por pérdida del seguimiento y una última variable para el tratamiento farmacológico prescrito. Así, el paciente 1, es un varón de 29 años de edad en el momento del trasplante, cuyo injerto falló a los tres meses del trasplante y que falleció a los cuatro meses. La paciente 5 es una mujer de 69 años en el momento del trasplante, cuyo injerto falló a los 32 meses y cuyo seguimiento se perdió a los 219 meses. Mientras que la paciente 9 es una mujer que tenía 64 años en el trasplante y que, al final del estudio, 278 meses después, está viva y con el injerto funcionando. Los pacientes mostrados son los primeros con los que se inició el programa en 1979; todos fueron tratados con azatioprina y prednisona. nor edad sexo injerto meses_ev estatus meses_ex trata 1 29 0 0 3 1 4 AZA PRED 2 36 1 0 7 1 240 AZA PRED 3 68 1 0 160 1 160 AZA PRED 4 55 0 0 4 0 280 AZA PRED 5 69 1 0 32 2 219 AZA PRED 6 49 0 0 280 1 280 AZA PRED 7 61 1 0 2 1 198 AZA PRED 8 58 1 0 83 1 278 AZA PRED 9 64 1 1 278 0 278 AZA PRED 10 66 0 0 1 1 1 AZA PRED Cap 04 4/10/04 12:48 Página 76
  • 89.
    Funciones de supervivenciay riesgo La variable tiempo, hasta que ocurre el evento o tiempo de espera, es una variable alea- toria que puede ser descrita mediante la habitual función densidad de probabilidad f(t) que, para una variable continua, es una función a partir de la cual y mediante cálculo integral o, en la práctica, consultando las tablas correspondientes, se obtiene la probabi- lidad de que la variable tome valores en un intervalo (5). Sin embargo, generalmente, este tipo de variables suele describirse y modelizarse mediante otras dos funciones de probabilidad relacionadas entre sí y con la función densidad: supervivencia y riesgo (6), que resultan especialmente útiles para los datos con observaciones censuradas. La probabilidad de supervivencia, representada por la denominada función de supervi- vencia S(t), es la probabilidad de que, en un individuo de la cohorte, el evento ocurra (sobreviva, si el evento es muerte) en un tiempo igual o mayor que t. En el ejemplo de la cohorte de enfermos trasplantados del hospital Ramón y Cajal, para el evento pérdida del injerto S(2,5), es la probabilidad de que un enfermo mantenga el injerto al menos dos años y medio, S(3) la probabilidad de que lo mantenga al menos tres años, etc. Es, por lo tanto, una manera de resumir la información de forma muy relevante en estos problemas y que, para facilitar su lectura, suele presentarse gráficamente. La Figura 2 muestra la función de supervivencia para el evento pérdida del injerto en la cohorte del Ramón y Cajal, en la que se observa su característica forma monótona no creciente. El riesgo (hazard en inglés), representado por la función de riesgo h(t), es la probabili- dad, por unidad de tiempo, de que un individuo que está en observación en el tiempo t (ha sobrevivido hasta ese tiempo), tenga el evento justo en ese tiempo. Es decir, repre- senta la tasa instantánea de eventos en cada tiempo o, dicho con otras palabras, el po- tencial instantáneo de ocurrencia de eventos por unidad de tiempo, condicionado a que el evento no ocurrió antes (7). En nuestro ejemplo, la función de riesgo a los dos años es la densidad de probabilidad de que el injerto falle a los dos años del trasplante, condi- cionada a que ha funcionado hasta entonces. Obsérvese que la función de supervivencia S(t) se enfoca en la no ocurrencia del evento, mientras que la de riesgo h(t) lo hace en la ocurrencia. Además, S(t) es una probabilidad, mientras que h(t), como f(t), es una densidad de probabilidad por unidad de tiempo; ello hace más intuitivo el manejo de S(t), por ejemplo, el campo de valores para S(t) está entre 0 y 1, mientras que para h(t) y f(t) está entre 0 e infinito. Sin em- bargo, se puede demostrar (6) que estas tres funciones están relacionadas por las ex- presiones: h(t)= f(t) h(t)= – d [InS(t)] S(t) = ∫t ∞ f(x)dx S(t) dt 77 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 77
  • 90.
    Fórmulas que, sinentrar en más detalles, ponen de manifiesto que las tres funciones son representaciones equivalentes y que, si se conoce una cualquiera de ellas, las de- más se pueden obtener automáticamente. A veces, se usa también la función de riesgo acumulada H(t), más difícil de interpre- tar, que se define como la integral desde 0 a t de la función de riesgo y, en consecuen- cia, relacionada con la supervivencia por: Y cuyo uso veremos más adelante (apartado Diagnósticos de la regresión). Como se ha mencionado en el apartado Variable tiempo hasta un evento, los tiempos hasta el evento suelen tener distribuciones asimétricas o sesgadas, en las que los tiem- H(t) = – In S(t) 78 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 2. Función de supervivencia para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal. La gráfica muestra, para cada tiempo t, la probabilidad de que un enfermo mantenga el injerto al menos t años. Por ejemplo, la probabilidad de supervivencia a los 11,25 años (11 años y 3 meses) es 0,5. Una manera gráfica de obtener la mediana de supervivencia es trazando una línea ho- rizontal desde el valor 0,5 del eje vertical hasta que corte a la curva de supervivencia y desde este punto de corte, una línea vertical hasta el eje horizontal. El punto de corte de esta línea con el eje es la mediana, en este ejemplo, 11,25 años. Supervivenciadelinjerto Años Cap 04 4/10/04 12:48 Página 78
  • 91.
    pos mayores quelos típicos son menos frecuentes y están más dispersos que los tiem- pos menores. En esta situación, la media no es una buena medida de centralización de la variable porque la pueden magnificar unos pocos valores atípicamente grandes, y en consecuencia, la medida de centralización aconsejada es la mediana. La mediana, tam- bién denominada tiempo de semivida por analogía con la farmacodinámica o vida-me- dia (half-life en terminología anglosajona), es el tiempo en que la probabilidad de super- vivencia es igual a 0,5 o, dicho en términos de frecuencia, el tiempo al que sobrevivirá la mitad de la población y que, por lo tanto, se obtiene fácilmente a partir de la función de supervivencia: S (mediana) = 0,5 Gráficamente, se obtiene trazando una línea horizontal desde el valor 0,5 del eje vertical hasta que corte a la curva de supervivencia y, desde este punto de corte, una línea ver- tical hasta el eje horizontal, este eje será cortado en la mediana, como se muestra en la Figura 2. Objetivos del análisis de supervivencia En un análisis de supervivencia se pueden establecer tres objetivos, y un estudio puede tener los tres o sólo alguno de ellos: • Estimar e interpretar las curvas de supervivencia y/o riesgo, más frecuentemente la de supervivencia, aunque la de riesgo tiene mayor utilidad para buscar modelos teóricos, por ejemplo, un riesgo constante a lo largo del tiempo indica un modelo exponencial, un riesgo creciente o decreciente puede modelizarse mediante la fun- ción de Weibull, etc.(4, 6, 8). • Comparar curvas de supervivencia, por ejemplo, entre dos tratamientos, o entre dos grupos de pacientes establecidos con respecto a cualquier otro criterio: edad, sexo, historial previo, etc. • Evaluar la relación de la supervivencia con otras, más de una, variables pronósticas. En los próximos apartados, se muestran los métodos para cumplir con estos objetivos. Estimación de la función de supervivencia (método de Kaplan-Meier) El método de Kaplan-Meier es un método no paramétrico, es decir, que no asume nin- guna forma para la función de probabilidad, y por máxima verosimilitud, es decir, que se basa en maximizar la función de verosimilitud de la muestra (6). Una muestra aleatoria de tamaño n, estará formada por k tiempos t1 < t2 …< tk en los que se observan even- tos (en general k ≤ n, es decir, hay menos tiempos que individuos, debido a las censuras y también a que varios eventos pueden ocurrir en el mismo tiempo). En cada tiempo ti 79 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 79
  • 92.
    existen ni “individuosen riesgo” (elementos de la muestra para los que el evento pue- de ocurrir), y se observan di eventos. El método asume que los eventos ocurren independientemente unos de otros y que la información contenida en las censuras es que, para cada una de ellas, el evento ocurre en un tiempo mayor que el tiempo en que se produce la censura. Con estas asuncio- nes, la función de riesgo, en cada tiempo, se estima por: Y la función de supervivencia por: Como ayuda para entender estas fórmulas, considérense los seis pacientes de la Figura 1, considerando al paciente E como evento, es decir, que existen tres eventos en los tiem- pos 2,5, 3,7 y 8, y tres censuras en los tiempos 3, 6 y 12. La manera más cómoda de ha- cer los cálculos es disponer los datos en una tabla como en la Tabla II. Aunque a esta estimación está contribuyendo toda la información disponible (eventos observados y censurados), obsérvese que la función de supervivencia estimada S(t) só- lo cambia en los tiempos en los que se observan eventos, manteniéndose, por lo tanto, constante entre esos tiempos y dando lugar a la característica forma escalonada que se observa en la Figura 2. Si se observaran eventos en todos los individuos, es decir, si no hubiera censuras, la estimación de la supervivencia por el método de Kaplan-Meier se reduciría, en cada tiempo, al cociente entre los individuos que no han experimentado el evento en ese tiempo (supervivientes) y los que empezaron el estudio. En la Tabla II y en la Figura 3 se pone claramente de manifiesto cómo el efecto de la in- formación, contenida en las censuras, aumenta la supervivencia estimada en los tiempos posteriores a ellas. La asunción fundamental del método es que las observaciones cen- suradas tienen la misma mediana de supervivencia que las observaciones que siguen en el estudio. Por ejemplo, para la supervivencia del injerto de los pacientes trasplantados en el hospital Ramón y Cajal, en el tiempo de la mediana de supervivencia (11,25 años, como se muestra en la Figura 2), que corresponde al tiempo estimado en el que sobrevi- virían los injertos de la mitad de los pacientes, hay bastantes menos de la mitad de los in- dividuos iniciales (quedan exactamente 200 individuos de los 917 iniciales). Es decir, a la estimación de la supervivencia en cualquier tiempo, por ejemplo en la mediana o tiempo de semivida, están contribuyendo no sólo los pacientes que se observa que sobreviven hasta ese tiempo, sino también los censurados previamente, en la asunción de que, si no se hubieran censurado, se comportarían como los que sí siguen. i S(ti ) = S(ti-1) (1-h(ti)) = ∏ [1- dj ]njj=1 h(ti) = di ni 80 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 80
  • 93.
    Hay que destacarque la forma escalonada de la función de supervivencia es efecto de la es- timación y que, teóricamente, como el tiempo es una variable continua en la que son posi- bles todos los valores desde 0, la función de supervivencia debería ser una función “suave” que, desde el valor S(t) = 1 en t = 0, iría decreciendo hacía S(t) = 0 en el límite en infinito. Error estándar e intervalo de confianza de la supervivencia Es importante destacar también que las estimaciones de Kaplan-Meier se realizan a par- tir de muestras, y por tanto, presentan una imprecisión cuantificada por el intervalo de confianza (9), que con una confianza del 95% es: S(ti) ± 1,96 x EE(S(ti)) Siendo EE(S(ti)) el error estándar de la función de supervivencia en el tiempo ti. Basta observar que el riesgo está estimado por una proporción para recordar que su error es- tándar es (5): 81 CURVAS DE VIDA Y SUPERVIVENCIA Tiempo Ind. en riesgo Eventos Censuras Fun. Riesgo Func. Supervivencia ti ni di h(ti) S(ti) 2,5 6 1 1/6=0,167 1-0,167=0,833 3 5 1 3,7 4 1 1/4=0,25 0,833x(1-0,25)=0,625 6 3 1 8 2 1 1/2=0,5 0,625x(1-0,5)=0,313 12 1 1 Tabla II. Cálculo de las funciones de riesgo y supervivencia para los datos de la Figura 1. Nótese que ambas funciones sólo se estiman en los tiempos en los que se observan eventos, sin embargo, está contribuyendo a la estimación toda la información disponible (eventos observados y censurados). Cada paciente censurado está contribuyendo a las dos funciones en los tiempos anteriores a su censura (tiempos en los que está en observación) y, a través del producto, a la función de supervivencia en todos los tiempos posteriores. Nótese también que, si no hubiera censuras, la estimación de la supervivencia por este método coincidiría, en cada tiempo, con el cociente entre los individuos, que no han experimentado el evento en ese tiempo (supervivientes) y los que empezaron el estudio. Si por ejemplo, en el estudio sólo estuvieran estos tres pacientes, la función de supervivencia sería 2/3, 1/3 y 0, en los tiempos 2,5, 3,7 y 8, respectivamente. Cap 04 4/10/04 12:48 Página 81
  • 94.
    Y a partirde esta fórmula se puede encontrar una expresión aproximada para el error estándar de la supervivencia, conocida como fórmula de Greenwood (6): Nótese que como el número de individuos en riesgo ni va disminuyendo con el paso del tiempo, debido tanto a los eventos como a las censuras, y en ambas fórmulas ni figura en el denominador con mayor potencia que en el numerador, estos errores estándar van aumentando y, por lo tanto, la precisión de la estimación va disminuyendo a lo largo del eje del tiempo. La Figura 3 muestra la función de supervivencia, con su intervalo de confianza del 95%, para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal, donde se observa el aumento a lo largo del tiempo de la anchura del in- tervalo. En algunos estudios, la anchura al final del tiempo de seguimiento es tan gran- de, aunque la mayor parte de las veces no mostrada, que se hace difícil la interpretación de la curva. Por ello, hay quien recomienda, con poco éxito por ahora, acabar la curva en un tiempo en el que, alrededor del 10-20% de los pacientes iniciales, estén aún en se- guimiento (10). Según esta recomendación, las curvas de las Figuras 2 y 3 deberían cor- tarse en torno a los 15 años. Según nuestra opinión, la recomendación no debería ser tanto dónde cortar, sino incluir los intervalos de confianza. Posteriormente (apartado Análisis del proceso de censurado), insistiremos en la impor- tancia de utilizar estos intervalos de confianza para valorar la precisión de la estimación de la probabilidad de supervivencia en cada momento, y por tanto, para poder valorar la utilidad clínica del dato. Comparación de las curvas de supervivencia Como los estimadores de Kaplan-Meier son estimadores de máxima verosimilitud y la teoría establece que estos estimadores son asintóticamente normales, una primera aproximación para comparar dos curvas de supervivencia, es usar dicha teoría, es decir, se pueden comparar las estimaciones de las funciones de supervivencia en dos grupos de individuos S1(t) y S2(t), usando la variable: S1 (t) – S2 (t) √ EE 2 (S1(t)) + EE 2 (S2(t)) i-1 EE(S(ti)) = S2 (ti) ∑ dj nj(nj-dj)j=1 EE(h(ti))= √ di(ni-di) n3 i 82 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 82
  • 95.
    que se distribuyecomo una normal reducida (6), y por lo tanto se puede usar la tabla de la normal para calcular el valor p correspondiente a la comparación de las dos esti- maciones. De este modo, las comparaciones se tienen que hacer para cada tiempo. Sin embar- go, generalmente, no interesa comparar para un tiempo predeterminado (a veces sí, por ejemplo para tiempos de corte muy establecidos como supervivencia a los cinco años para el cáncer), sino comparar globalmente ambas curvas de supervivencia y, aunque se podrían comparar por este procedimiento, punto a punto, es un modo de proceder poco eficiente, ya que no se usan todos los datos en cada comparación y aparecen los problemas asociados a las comparaciones múltiples (6). En consecuen- cia, se han desarrollado pruebas para realizar una única comparación global. La más usada es la conocida como prueba del log-rank y consiste en calcular, en cada tiempo y para cada grupo, el número de eventos que se esperarían encontrar si no hubiera di- ferencia entre los grupos para construir un estadístico, que se distribuye como una χ2 83 CURVAS DE VIDA Y SUPERVIVENCIA Figura 3. Función de supervivencia con su intervalo de confianza al 95% para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal. Obsérvese cómo la anchura del intervalo va aumentando, es decir, la precisión de la estimación va disminuyendo a medida que pasa el tiempo, como efecto del menor nú- mero de individuos en observación. En la literatura clínica no es tan usual como debie- ra la presentación de estos intervalos. Supervivenciadelinjerto Años Años 0 5 10 15 20 Individuos en riesgo 917 474 249 110 29 Cap 04 4/10/04 12:48 Página 83
  • 96.
    con g -1grados de libertad (siendo g el número de grupos), con la suma de las dife- rencias entre eventos observados y esperados al cuadrado, divididas por los espera- dos. A partir de este estadístico, se calcula el valor p correspondiente a la compara- ción global de las supervivencias de los grupos. Este método, además, se puede usar para comparar más de dos grupos. La Figura 4 muestra las curvas de supervivencia para las mujeres y los hombres, con sus intervalos de confianza al 95%, para el evento pérdida del injerto en la cohorte de pacien- tes trasplantados del hospital Ramón y Cajal. Se observa que a partir de aproximadamen- te tres años, la supervivencia del injerto es mayor en las mujeres que en los hombres. La comparación global, mediante la prueba del log-rank, produce un valor p = 0,032. Es de- cir, con la convención habitual, la diferencia es estadísticamente significativa. En el apartado Factores que influyen en los resultados de las curvas de superviviencia enunciaremos los principales elementos a los que hay que prestar atención cuando 84 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 4. Funciones de supervivencia para las mujeres y los hombres, con sus interva- los de confianza al 95%, para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal. Se observa que aproximadamente hasta los tres años, la probabilidad de supervivencia del injerto es similar en ambos grupos, pe- ro a partir de entonces la supervivencia en las mujeres es más alta, manteniéndose por encima del límite superior del intervalo de confianza de los hombres. El log-rank para la comparación es 4,60 al que corresponde un valor p = 0,032. Supervivenciadelinjerto Años Cap 04 4/10/04 12:48 Página 84
  • 97.
    se diseña ose lee un estudio en el que los datos se analizan con estos métodos. Estos elementos serán ampliamente discutidos, poniéndolos en relación con la pro- blemática específica de las poblaciones con insuficiencia renal crónica tratadas con diálisis o con trasplante renal. Método actuarial Hay ocasiones en que no se dispone de observaciones individuales de los eventos, sino de observaciones agrupadas por intervalos temporales o, incluso, aunque se disponga de las observaciones individuales, se agrupan para compactar su presentación. Por ejemplo, los datos de mortalidad para un país durante una década, se suelen agrupar en intervalos anuales en las denominadas tablas de vida o actuariales, de modo que no se dispone del tiempo de fallecimiento de cada individuo, sino del número de fallecidos en cada intervalo, en este caso anual. Supóngase que hay k intervalos, al principio de cada intervalo i existen ni individuos en riesgo y, durante el mismo, se producen mi censuras y di eventos. Por lo tanto, en el conjunto del intervalo el número de individuos en riesgo es variable. Asumiendo que las censuras se producen homogéneamente a lo largo del intervalo, su número promedio de individuos en riesgo es: ni – mi 2 Y, en consecuencia, el estimador del riesgo para el intervalo será: hi = di ni – mi 2 Sustituyendo este valor en las fórmulas del apartado Modelo de Kaplan Meier. Es decir, cambiando en ellas ni por: ni – mi 2 se obtiene el estimador de la función de supervivencia en esta situación. A este método se le conoce como método actuarial. En la Figura 5 se presenta la curva de superviven- cia para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospi- tal Ramón y Cajal, obtenida por el método actuarial, definiendo intervalos de un año. Se observa que es parecida a la de la Figura 2 con el efecto escalón más acusado. La única ventaja, por lo tanto, sobre el método de Kaplan-Meier es que se puede construir sin da- tos individualizados. 85 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 85
  • 98.
    Análisis multivariante: sunecesidad Hasta aquí se han descrito métodos que cubren los objetivos primero y segundo enunciados en el apartado Objetivo del análisis de supervivencia, es decir, que permi- ten estimar la función de supervivencia para un grupo de pacientes y comparar las fun- ciones de dos o más grupos. Ello es muy útil en la investigación clínica, pero a menu- do insuficiente, porque con mucha frecuencia es necesario realizar las comparaciones teniendo en cuenta el efecto de otras variables distintas a la que se utiliza para definir los grupos. Por ejemplo, en el apartado Error estándar e intervalo de confianza de la supervivencia, se encontró que la supervivencia del injerto era mejor en las mujeres que en los hombres, sin embargo la supervivencia puede depender no sólo del sexo, sino también de otras variables como la edad, el tratamiento o la comorbilidad de cada paciente, y podría ocurrir que hombres y mujeres sean diferentes con respecto a esas variables, lo que dificultaría la interpretación de ese resultado. En la comparación con el método del log-rank se ignora este efecto de otras variables, situación que puede ser adecuada si los grupos se han seleccionado de modo aleatorio, por ejemplo en un ensayo clínico, modo de selección que tiende a hacer que los distintos grupos a com- parar sean homogéneos con respecto a todas las demás variables (quizás no esté de 86 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 5. Función de supervivencia para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal, obtenida por el método actuarial, definiendo intervalos de un año. Supervivenciadelinjerto Años Cap 04 4/10/04 12:48 Página 86
  • 99.
    más recordar quela asignación aleatoria de los grupos no garantiza que sean homogé- neos, sólo garantiza que los grupos homogéneos sean los más probables), pero en los estudios observacionales es claramente insuficiente. Por otro lado, el log-rank ofrece un valor p para la diferencia entre los grupos, pero no estima el tamaño del efecto, es decir, que hace una evaluación estadística, pero no clínica, de la diferencia entre los grupos. El análisis multivariante, en particular los modelos de regresión, permiten hacer ambas cosas, esto es, evaluar el efecto de una variable teniendo en cuenta (controlando por, en la terminología clínico-epidemiológica) otras variables, y estimar el tamaño del efec- to. Además, y a diferencia de los métodos de Kaplan-Meier y log-rank, que requieren que la variable sea categórica, los modelos de regresión permiten estudiar variables continuas (por ejemplo, edad o nivel de creatinina), binarias (por ejemplo, sexo), cate- góricas (por ejemplo, histología o tratamiento) u ordinales (por ejemplo, estadio de un tumor o estatus funcional). Modelo acelerado Hay varios modelos de regresión propuestos (6, 11), como el llamado modelo acelera- do, en el que se asume que la función de supervivencia para un grupo de pacientes, en los que se han medido k variables (X1, X2, ..., Xk), es de la forma: S(t) = S0 (ϕ t) Siendo S0(t) la función de supervivencia basal (supervivencia cuando todas las va- riables son cero) y ϕ un factor de aceleración que depende de las variables de la forma: ϕ = eβ1X1+...+ βk Xk Lo relevante del modelo es que el efecto de cada variable es “estirar” o “encoger” la función de supervivencia a lo largo del tiempo, de acuerdo con la constante ϕ. La Figura 6 ilustra este modelo en el caso de una única variable, con dos valores, por ejemplo, X1 = 0 para hombres y X1 = 1 para mujeres. S0(t) es la función de supervi- vencia para los hombres y S(t) = S0(ϕt) para las mujeres. La proporción de hombres su- pervivientes en cualquier tiempo t es la misma que la de mujeres en el tiempo t1 = ϕt. La figura ilustra los casos ϕ = 0,5, el efecto de ser mujer es “encoger” el tiempo a la mitad y ϕ = 2, el efecto es “alargarlo” al doble. Otros modelos asumen alguna función de supervivencia paramétrica (6), como por ejemplo la exponencial, la de Weibull o la log-normal, y se plantea el modelo de regre- sión para los parámetros de las funciones. 87 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 87
  • 100.
    Modelo de riesgoproporcional o de Cox Sin embargo, el modelo más usado, por su sencillez y facilidad para interpretar los coe- ficientes, es el denominado modelo de riesgo proporcional o modelo de Cox, que es un modelo de la forma: h(t) = h0(t)eβ1X1+...+ βk Xk Siendo h0(t) la función de riesgo basal. Otra manera equivalente de expresarlo es: In [ h(t) ]= β1 X1+...+ βk Xk h0 (t) 88 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 6. Ilustración del modelo acelerado para una única variable X1 con dos nive- les, x1 = 0 y x1 = 1. S0(t) supervivencia para el grupo x1 = 0. Se muestra S(t) = S0(ϕt), para ϕ = 0,5 y ϕ = 2. En el primer caso, la probabilidad de supervivencia del grupo x1 = 0 en cualquier tiempo t, es la misma que la del grupo x1 = 1 en el tiempo t1 = 0,5t y en el segundo, la probabilidad de supervivencia del grupo x1 = 0 en cualquier tiempo t, es la misma que la del grupo x1 = 1 en el tiempo t2 = 2t. Cap 04 4/10/04 12:48 Página 88
  • 101.
    Al cociente h(t)/h0(t)entre el riesgo para cualquier valor de las variables y el riesgo basal, se le denomina riesgo relativo y se suele representar por HR, sus siglas en inglés (hazard ratio), es decir, el modelo plantea el logaritmo del riesgo relativo como una función lineal de las variables independientes. Se supone, por lo tanto, que el riesgo relativo, a diferen- cia del riesgo propiamente dicho, no depende del tiempo, o dicho de otra manera, que es constante a lo largo del tiempo (de ahí el nombre de modelo de riesgo proporcional). Esta última expresión del modelo hace explícita la interpretación de los coeficientes: βi es el logaritmo del riesgo relativo cuando Xi aumenta una unidad, manteniéndose cons- tantes las demás variables, y por tanto, exp(βi) es el riesgo relativo cuando Xi aumenta una unidad, manteniéndose constantes las demás. Nótese que el modelo no depende de cómo sea h0(t), y la única asunción es que el ries- go relativo al aumentar una unidad cada variable es constante (exp(βi)) en todo tiempo. Hay que destacar que esta asunción no siempre es razonable y conviene evaluarla en ca- da caso con los procedimientos que se examinarán más adelante (apartado Diagnóstico de regresión). La Tabla III muestra los coeficientes del modelo, los riesgos relativos y sus intervalos de confianza al 95% y la significación estadística de las variables edad, sexo y tratamiento para el evento pérdida del injerto en la cohorte de los trasplantados del Ramón y Cajal, estimados con modelos de Cox. Se muestran las estimaciones realizadas en los mode- los univariados y en el modelo multivariante a efectos de comentar las diferencias. Como el objetivo, en general, es estudiar el efecto conjunto de todas las variables, los re- sultados que se suelen mostrar son sólo los del análisis multivariante. Como la edad está 89 CURVAS DE VIDA Y SUPERVIVENCIA Modelos univariados Modelo multivariante Variable βi HR IC 95% p βi HR IC 95% p exp(βI) exp(βI) Edad 0,008 1,008 1,000-1,016 0,054 0,006 1,006 0,998-1,015 0,136 Sexo -0,238 0,789 0,633-0,982 0,034 -0,219 0,804 0,645-1,001 0,051 Tratamiento 0,000 0,001 Tacro -0,953 0,386 0,239-0,621 0,000 -0,905 0,404 0,251-0,653 0,000 CSA -0,194 0,823 0,654-1,037 0,099 -0,158 0,854 0,677-1,077 0,183 Tabla III. Riesgos relativos (HR) y sus intervalos de confianza (IC), estimados mediante modelos de Cox univariados y multivariantes para el evento pérdida del injerto en la cohorte de trasplantados del Ramón y Cajal. Cap 04 4/10/04 12:48 Página 89
  • 102.
    codificada en años,el riesgo relativo que aparece en la tabla, es por aumento de un año en la edad del trasplante, es decir, fijándose en el análisis multivariante, por cada año de edad de más en el momento del trasplante, el riesgo de fallo del injerto se multiplica por 1,006 o lo que es lo mismo, por cada año es un 0,6% mayor, si bien, este riesgo relativo no es significativamente distinto de 1 (ya que p = 0,136, o equivalentemente el intervalo de con- fianza [0,998-1,015] incluye el valor 1). En el caso del sexo, codificado como 0 para varón y 1 para mujer, el riesgo relativo de 0,804 quiere decir que el riesgo de las mujeres es el 80,4% del de los hombres, aunque tampoco es significativamente distinto de 1; es decir, el valor 0,804 calculado en la muestra es compatible con un valor “real” de 1. Se llama la atención sobre que, si se hubiera codificado al revés, es decir, 1 para varón y 0 para mujer, se estaría considerando el riesgo de las mujeres como riesgo basal o de referencia, y en consecuencia, el riesgo relativo obtenido sería el inverso, HR = 1/0,804 = 1,244. Es importante detenerse sobre dos aspectos muy relevantes de los modelos de regre- sión, en particular del de Cox. En la Tabla III se observa que en el análisis, realizado con el modelo univariado, se encontró un efecto significativo del sexo, (HR = 0,789; p = 0,034), coincidente con el análisis realizado con la prueba del log-rank en el apartado Error están- dar e intervalo de confianza de la supervivencia (allí era p = 0,032). En general, el modelo de Cox univariado, para variables categóricas, es equivalente a la prueba del log-rank y se obtiene un valor p tanto más parecido, cuanto mayor sea el tamaño muestral, aunque, primera ventaja, el modelo de Cox produce también una estimación del tamaño del efec- to, el HR, que no se obtiene con el log-rank. El otro aspecto a destacar es que en el análisis multivariante, es decir, cuando se ha te- nido en cuenta también la edad y el tratamiento, el efecto del sexo ha dejado de ser sig- nificativo. La interpretación de esta diferencia es que la distinta supervivencia del injerto entre sexos, observada en el apartado Error estándar e intervalo de confianza de la su- pervivencia, es un resultado que está confundido por el hecho de que ambos grupos di- fieren en la edad y/o en el tratamiento recibido y que, cuando se controla por estas va- riables, el efecto desaparece. En cuanto al tratamiento, al ser una variable categórica con tres categorías, el modelo ofrece el valor p, que corresponde al contraste de hipótesis en el que se comparan glo- balmente los tratamientos (p = 0,001 en el modelo multivariante) y, además, los valores p y los HR, con sus intervalos de confianza, de las comparaciones de cada tratamiento con el que se haya tomado como referencia. En el análisis mostrado en la Tabla III, se tomó el tratamiento del grupo AZA como re- ferencia y se comparó con el tratamiento realizado en el grupo TACRO (HR = 0,404; p = 0,000) y en el grupo CSA (HR = 0,854; p = 0,183). Es decir, la supervivencia del injerto es diferente según el tratamiento recibido (p = 0,001), el riesgo en el grupo TACRO es 40,4% inferior que en el grupo AZA (p = 0,000), mientras que los pacien- 90 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 90
  • 103.
    tes del grupoCSA no tienen un riesgo significativamente menor (p = 0,183). Hay que recordar, no obstante, que los tratamientos no se asignaron al azar y que estos resul- tados están, muy probablemente, sesgados por el efecto cohorte (apartado Comparación de las curvas de supervivencia). Supervivencia estimada con el modelo de Cox Dadas las relaciones entre h(t) y S(t), mencionadas en el apartado Funciones de supervi- vencia y riesgo, el modelo de Cox también se puede escribir como: S(t) = S0(t) exp(β1 X 1 +...+βK X K ) Una vez que se han estimado los coeficientes del modelo y, aunque es poco usado en la literatura médica (11), es posible también estimar la función de supervivencia basal S0(t) y, a partir de ella y de la expresión anterior, la función de supervivencia predicha por el mo- delo para un paciente con una serie especificada de valores xi. Aunque S0(t) es la función de supervivencia cuando todas las variables son 0, la estimación realizada con el modelo 91 CURVAS DE VIDA Y SUPERVIVENCIA Figura 7. Funciones de supervivencia para las mujeres y los hombres para el evento pérdida del injerto en la cohorte de pacientes trasplantados del hospital Ramón y Cajal, estimadas con el modelo de Cox (línea gruesa) y el método de Kaplan-Meier (línea fi- na), en ambos casos la curva superior corresponde a las mujeres. Se observa que la coincidencia no es buena como era de esperar en este caso. Supervivenciadelinjerto Años Cap 04 4/10/04 12:48 Página 91
  • 104.
    de Cox sehace dado el modelo, es decir, asumiendo que el riesgo es proporcional, a par- tir de todos los pacientes de la muestra, no sólo de los que toman el valor 0 en todas las variables. La Figura 7 muestra la estimación realizada con el modelo de Cox de las funciones de su- pervivencia del injerto en la cohorte del Ramón y Cajal para hombres y mujeres, super- puestas a las funciones mostradas en la Figura 4, estimadas por el método de Kaplan- Meier, la comparación visual de ambas estimaciones o, dicho en otros términos, de la su- pervivencia observada (Kaplan-Meier) con la supervivencia predicha por el modelo, es una de las maneras de evaluar lo apropiado de la asunción de proporcionalidad del riesgo (12). En este caso, las curvas no muestran una buena coincidencia; en el apartado Error están- dar e intervalo de confianza de la supervivencia, ya se había señalado que las curvas de Kaplan-Meieir de ambos sexos eran iguales en los primeros tres años, para irse separando después. Por lo tanto, es claro que no se cumple la asunción de riesgo proporcional. Modelo de Cox estratificado Una característica única que presenta el modelo de Cox con respecto a otros modelos de regresión, es la capacidad para ajustar, a través de la estratificación, por factores que no están incluidos en el modelo. Ello es útil para incluir variables categóricas con mu- chas categorías, que sería difícil incluir de otra manera, por ejemplo para ajustar por cen- tro en los ensayos clínicos multicéntricos (12) o para incluir variables que no satisfagan la asunción de riesgo proporcional. La idea es permitir que la función de riesgo basal varíe entre los estratos. Si hay b estra- tos, indexados por el subíndice j, el modelo queda en cada uno: hj (t) = h0,j (t)eβ1X1+...+ βk Xk El modelo no asume ninguna relación entre las formas de las curvas de los diferentes estratos, pero sí obliga a compartir los mismos coeficientes. Por ejemplo, un modelo para la pérdida del injerto, que incluya la edad en el modelo y esté estratificado por se- xo, producirá un coeficiente para la edad ajustado por sexo (un coeficiente “promedia- do” para ambos sexos), sin necesitar la asunción de riesgo proporcional para sexo, aun- que no produciría un coeficiente para el sexo. La estratificación también se puede hacer combinando varias variables, por ejemplo, se podría ajustar un modelo para el trata- miento, creando estratos combinados para la edad y el sexo. Objetivos de la utilización de los modelos de Cox Los modelos de regresión se pueden usar con tres objetivos diferentes: 1. Objetivo estimativo: si el interés del investigador se centra en estimar la relación de 92 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 92
  • 105.
    una variable conla supervivencia. Ejemplos de estudios con este objetivo son los ensayos clínicos en los que se pretende estudiar el efecto del tratamiento sobre la supervivencia, o los estudios observacionales para evaluar el valor pronóstico de un cierto marcador. En ambos casos, las demás variables están en el modelo para evi- tar su posible efecto perturbador (6,13). 2. Objetivo predictivo: si el objetivo es predecir lo mejor posible la supervivencia usan- do un conjunto de variables independientes. Se desea seleccionar una serie de fac- tores que permitan predecir la supervivencia de los pacientes. El resultado de un modelo predictivo es el modelo mismo, mientras que en un modelo estimativo el resultado es la estimación del efecto de la variable de interés, es decir el HR. El ob- jetivo estimativo es el más frecuente en la investigación etiológica, en la que se tra- ta de encontrar factores determinantes de una enfermedad o un proceso. 3. Hay un tercer objetivo mixto, de naturaleza más exploratoria, en el que se pretende identificar factores de potencial importancia pronóstica para posteriores investiga- ciones (13). Confusión e interacción Son los dos efectos perturbadores que, en los modelos estimativos, pueden tener unas variables en la asociación entre otras. Existe confusión cuando la relación entre la varia- ble en estudio y la supervivencia difiere según se considere o no otra variable. A esta úl- tima variable se le denomina variable de confusión para la asociación. Existe interacción cuando la relación entre la variable y la supervivencia varía según los diferentes niveles de otra variable. Aunque en una primera lectura pueden parecer similares, conviene dis- tinguir claramente entre ambos fenómenos, siendo los modelos de gran ayuda para ello. El modelo más sencillo para estudiar la asociación entre la supervivencia y otra variable X1 es: In [ h(t) ]= β1 X1 h0(t) X2 es una variable de confusión para esta asociación, si el modelo: In [ h(t) ]= β1 X1+ β2 X2 h0(t) produce una estimación diferente de β1. Obviamente, esta definición se puede ampliar a un conjunto de variables. Contrastar la existencia de confusión requiere, por lo tanto, comparar los coeficientes de regresión de modelos diferentes y, si hay diferencia, existe la confusión, en cuyo ca- so la mejor estimación es la ajustada. Para dicha comparación no se precisa realizar un contraste de hipótesis estadístico. Será el investigador quien establezca el criterio para 93 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 93
  • 106.
    decidir cuándo haydiferencia, siendo lo habitual considerar que existe confusión cuan- do la exponencial del coeficiente (el HR) cambia en más del 10%. Por ejemplo, si el aná- lisis mostrado en la Tabla III tuviera como objetivo estimar el efecto de los tratamientos, se encontraría que la edad y el sexo conjuntamente no son variables de confusión, puesto que los HR estimados en el modelo simple, 0,386 y 0,823 para tacrolimus y CSA, respectivamente, no son muy diferentes de 0,404 y 0,854, estimados en el mode- lo que contiene también las variables edad y sexo. El modelo más sencillo que hace explícita la interacción entre dos variables X1 y X2 es: In [ h(t) ]= β1 X1+ β2 X2 + β3 X1 X2 h0(t) Es fácil ver (6) que en este modelo, el cambio en In [h(t)/h0(t)] por una unidad de cambio en X1 manteniendo fijo X2 es β1+β3X2 o, dicho de otro modo, el HR por una unidad de cambio en X1 manteniendo fijo X2 es: eβ1+β3x2 = eβ1 (eβ3 )x2 Es decir, el HR es diferente para cada valor de X2. Contrastar la existencia de interacción entre X1 y X2 es contrastar si el coeficiente β3 es cero (no hay interacción), o distinto de cero (existe interacción). En caso de que exista interacción, los exponenciales de los coeficientes β1 y β2 por sí solos no significan nada y la asociación de las variables X1 y X2 con la supervivencia está cuantificada por la expresión anterior. Obviamente, primero debe contrastarse la interacción y después, en caso de que no exista, la confusión. Estrategias de modelización Debido a los objetivos distintos de los modelos de regresión es difícil establecer una es- trategia general para encontrar el mejor modelo, es más, el mejor modelo significa co- sas distintas con cada objetivo. En un análisis predictivo el mejor modelo es el que produce predicciones más fiables, es decir, más parecidas a la realidad, para una nueva observación, mientras que en un análisis estimativo el mejor modelo es el que produce estimaciones más precisas, es decir, con un intervalo de confianza más estrecho, del efecto de la variable de interés. En ambos casos, se prefiere el modelo más sencillo posible (a este modo de seleccio- nar modelos se le denomina parsimonia), de modo que, en un análisis estimativo, se puede excluir del modelo una variable que tenga un coeficiente significativamente dis- 94 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 94
  • 107.
    tinto de ceroy que su contribución a la predicción de la variable dependiente sea impor- tante porque no sea variable de confusión para la variable de interés (el coeficiente de dicha variable no cambia); en un análisis predictivo esa variable no se excluiría. Sin embargo, hay una serie de pasos que deben realizarse siempre (6): 1. Especificación del modelo máximo: establecer todas las variables que van a ser con- sideradas. El número máximo que se puede considerar (modelo saturado) son n -1 variables, siendo n el número de observaciones, pero en general, el modelo máximo deber tener menos variables que el modelo saturado para evitar sesgos e inestabili- dades en la estimación de los coeficientes. Un criterio habitual es incluir, como má- ximo, una variable cada diez eventos (14). El criterio para decidir qué variables for- man el modelo máximo lo establece el investigador. 2. Especificación de un criterio de comparación de modelos y definición de una estra- tegia para realizarla. Debe establecerse cómo y con qué se comparan los modelos. El estadístico más frecuentemente usado para comparar modelos es el logaritmo del cociente de verosimilitudes (6) (log-likelihood ratio) y, aunque los paquetes esta- dísticos suelen implementar estrategias automáticas, como la paso a paso (stepwi- se), es altamente recomendado realizar estrategias dirigidas por los objetivos del estudio y los conocimientos previos (6, 13, 15). 3. Evaluación de la idoneidad del modelo. Un modelo es adecuado si representa la su- pervivencia de los pacientes en los datos de un modo aceptable. Si por ejemplo, un grupo de pacientes tiene mal pronóstico, un modelo idóneo debería predecir que este grupo tenga ese resultado (13). Básicamente hay tres aspectos a evaluar en lo que se conoce como diagnósticos de la regresión y que son: bondad del ajuste, evaluación de las asunciones y evaluación de la validez del modelo. Diagnósticos de la regresión Se conocen como diagnósticos de la regresión una serie de técnicas para verificar el comportamiento de los modelos y que incluyen la evaluación de las asunciones, de la bondad del ajuste y de la validez del modelo. Evaluación de las asunciones La única asunción del modelo es la del riesgo proporcional, que se puede evaluar gráfica o estadísticamente. En el apartado Supervivencia estimada con el modelo de Cox, ya se vio una manera gráfica de evaluarla válida para variables categóricas, consistente en comparar visualmente las funciones de supervivencia predichas por el modelo con las observadas (estimadas por el método de Kaplan-Meier). Otra forma usada más frecuentemente, es la representación, contra el tiempo, de los logaritmos de las funciones de riesgo, h(t) o H(t) (generalmente, se prefiere H(t) debido 95 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 95
  • 108.
    a las inestabilidadesque presenta la estimación de h(t) (13)) para los distintos valores de la variable. Si los riesgos son proporcionales, estas gráficas son paralelas. Con frecuen- cia, las gráficas del logaritmo del riesgo suelen ser de tipo exponencial, y no es fácil comprobar visualmente el paralelismo. En este caso, se puede presentar el logaritmo del riesgo contra el logaritmo del tiempo, que también deben ser paralelas si se cumple la asunción de riesgo proporcional. En la Figura 8 se muestran estas gráficas para la pérdida del injerto en relación con la va- riable sexo. En ambas, se observa la falta de paralelismo que indica la falta de propor- cionalidad del riesgo. Un problema con estas evaluaciones gráficas es decidir cuándo las líneas dejan de ser paralelas, decisión que siempre tiene un componente subjetivo. Hay una recomendación general (7), debido a la robustez del método, de usar una estra- tegia conservadora y de asumir la proporcionalidad, a menos que haya una fuerte impre- sión de falta de paralelismo. Otras pruebas gráficas son las incluidas en el denominado análisis de residuos. Los resi- duos son diferencias entre “cantidades” observadas y predichas por el modelo. Hay varios residuos propuestos, aunque algunos de ellos son difíciles de interpretar debido a las cen- suras (13). En general, si se cumple la asunción, las gráficas de los residuos presentan una distribución dentro de una banda horizontal. Entre los varios descritos, el SPSS calcula tres: 1. Residuos parciales, o de Schoenfeld: se calculan uno por variable en el modelo, só- lo se usan los eventos y su representación gráfica es contra el tiempo en el eje X. 96 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 8. Gráficas del logaritmo de la función de riesgo acumulada para hombres (arri- ba) y mujeres, para el evento pérdida del injerto. A la izquierda, contra el tiempo en años y a la derecha, contra el logaritmo del tiempo. En ambas, se observa la falta de paralelismo que indica que no se cumple la asunción de riesgo proporcional. H(t)(escalalogarítmica) Años Años (escala logarítmica) H(t)(escalalogarítmica) Cap 04 4/10/04 12:48 Página 96
  • 109.
    2. Residuos deCox-Snell: consiste en representar H(t) contra cada variable o contra el predictor lineal. 3. Martingala (corrección del anterior: 1-H(t) para eventos y –H(t) para pérdidas). En SPSS, se puede construir sólo mediante el uso de sintaxis. En la Figura 9 se presentan los residuos parciales y martingala para la variable edad en el modelo multivariante de la Tabla III. Se observa una distribución razonablemente horizontal. Una evaluación estadística, que puede usarse tanto para variables categóricas como continuas, consiste en incluir en el modelo una variable de interacción con el tiempo. Si esta variable fuera significativa, indicaría que el riesgo varía con el tiempo y, por lo tanto, no se cumple la asunción. Si así fuera, podría dejarse esta variable en el modelo, aun- que se complica su interpretación: los HR son distintos para cada tiempo. Hay que re- cordar también que, en caso de que no se cumpla la asunción de riesgo proporcional, puede usarse la variable como criterio de estratificación. Tanto esta prueba estadística como las gráficas permiten evaluar cada variable por sepa- rado, o cada variable dadas las otras. Bondad del ajuste Hay varios métodos que evalúan globalmente lo bien que ajustan los datos al modelo. Uno muy general de todos los modelos de regresión que, como el de Cox, estiman 97 CURVAS DE VIDA Y SUPERVIVENCIA Figura 9. Residuos parciales para la edad, representados en función del tiempo (iz- quierda) y martingala, representados en función de la edad (derecha) para el modelo multivariante de la tabla 2.3. Si la asunción de riesgo proporcional se cumpliera, debe- rían distribuirse en una banda horizontal, que razonablemente se cumple. ResiduosparcialesparaEDAD Residuosmartingala Años Edad Cap 04 4/10/04 12:48 Página 97
  • 110.
    los coeficientes porel método de máxima verosimilitud (6), consiste en calcular un estadístico, el logaritmo del cociente de la verosimilitud del modelo estimado y de los datos sin modelo, y que en la hipótesis nula de que los datos no se ajusten al modelo, se distribuye como una χ2 con k grados de libertad (siendo k el número de variables en el modelo). Otra prueba, sugerida por Hosmer y Lemeshow (3), consiste en crear un índice pronós- tico a partir del modelo: IP = β1X1+...+ βkXk, calcularlo para cada paciente y, después, dividir la muestra en n-ciles. Los grupos así creados se introducen en el modelo como variable categórica. Si el modelo mejorara significativamente, en términos del logaritmo del cociente de la verosimilitud, indicaría que la bondad de ajuste es mala. Validez del modelo El último aspecto a evaluar en un modelo es su validez o fiabilidad, es decir, ¿se com- porta igual en otras muestras extraídas de la misma población (reproducibilidad) y/o de otras similares (transportabilidad)? (16). El modo más completo de evaluarlo será repetir el estudio con otra muestra y com- parar los resultados (validación externa). Otra aproximación similar es partir aleato- riamente la muestra inicial en dos grupos: un grupo de trabajo con el que se desa- rrolla el modelo y un grupo de validación, con el que se hace la validación o, usado cada vez con más frecuencia, con técnicas de re-muestreo como jackknife y boots- trap (12). La evaluación se hace de modo distinto en modelos estimativos que en los predicti- vos. En modelos estimativos, simplemente se ajusta el modelo en el grupo de traba- jo, luego se hace la estimación del efecto en el de validación y se comparan. En los modelos predictivos la validación es un poco más compleja (16, 17). Tiene dos componentes, calibración que es el grado en que la supervivencia predicha coincide con la observada, y puede evaluarse comparando la supervivencia predicha por el modelo en el grupo de validación con la estimada en el mismo grupo por Kaplan- Meieir, y discriminación, grado en que el modelo distingue entre individuos de alto y bajo riesgo. La calibración puede cuantificarse también con el coeficiente de reduc- ción (shrinkage) (18), que es el coeficiente β del modelo ajustado en el grupo de vali- dación, usando como única variable el índice pronóstico IP = β1X1+...+ βkXk, calcula- do con los coeficientes estimados en el grupo de trabajo, y la discriminación con el coeficiente de correlación de Nagelkerke (R 2 N), que es un número entre 0,para un modelo sin capacidad predictiva, y 1 para un modelo con predicción perfecta, cons- truido a partir del logaritmo del cociente de la verosimilitud del modelo estimado y de los datos sin modelo (12). 98 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 98
  • 111.
    ANÁLISIS DE SUPERVIVENCIACON EL SPSS El SPSS ofrece en la opción Supervivencia del menú Analizar las subopciones de: Kaplan- Meier, Tablas de mortalidad (método actuarial) y Regresión de Cox. Método de Kaplan-Meier La ventana de diálogo se muestra en la Figura 10. Tras seleccionar la variable que repre- senta el tiempo y la variable que representa si el paciente ha presentado o no el evento (casilla Estado), debemos definir los códigos para esta variable mediante el botón Definir evento. El cuadro de diálogo que aparece, tras pulsar este botón, es el que se re- presenta en la Figura 11. Supongamos, por ejemplo, un análisis de supervivencia en el que se distinguen distintas causas de muerte, la variable muerte podría tomar los valo- res 0 = pérdida, 1 = muerte por la enfermedad, 2 = muerte por otras causas. Si desea- mos analizar sólo la mortalidad debida a la enfermedad, en la definición de evento se utilizaría la opción de Valor único con el valor 1. Si el análisis se orientase hacia la morta- lidad total, en el cuadro de diálogo definiríamos una Lista de valores con los valores 1 y 2 o, equivalentemente, el rango comprendido entre 1 y 2. En las opciones que se muestran en la parte derecha de la Figura 10, se observa que se pueden seleccionar distintos estadísticos y gráficos. Lo habitual es seleccionar Tablas de supervivencia, que producen una tabla similar a la que aparece en la Tabla II, y Mediana. Hay que tener en cuenta que, cuando existen eventos en muchos tiempos distintos, las tablas de supervivencia son demasiado largas y no se muestran completamente en los resultados. Debemos actuar en el visor de resultados con el ratón para ampliar la zona de visualización. Es útil también activar la casilla de Supervivencia en Gráficos. La función denominada Impacto en este cuadro es H(t), es decir, la función de riesgo acumulada. Para contrastar si la supervivencia es distinta, según alguna variable cualitativa (por ejemplo, según la presencia o no de un factor pronóstico), se debe introducir en la casi- lla Factor dicha variable (Figura 10) y después seleccionar el estadístico para el contras- te (el más habitual es la prueba log-rank), y decidir la estrategia con la que se compara- rán los distintos niveles de la variable introducida en la casilla Factor. A estas opciones (Figura 12) se accede mediante el botón Comparar factor. Intervalos de confianza para la función de supervivencia El SPSS no presenta directamente los intervalos de confianza para la función de super- vivencia. Sin embargo, se puede obtener siguiendo los siguientes pasos: 1. Mediante el botón Guardar se pueden guardar, en dos nuevas columnas del archivo de datos, los valores de la función de supervivencia para los distintos tiempos don- 99 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 99
  • 112.
    100 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 10. Pantalla inicial (izquierda) y de selección de opciones (derecha) para el aná- lisis de supervivencia por el método de Kaplan-Meier. Figura 11. Pantalla de diálogo del botón Definir evento del método de Kaplan-Meier. Cap 04 4/10/04 12:48 Página 100
  • 113.
    de se produceneventos, junto a su error estándar (Figura 13). Con esta operación, en el archivo de datos, se han creado dos variables nuevas: sur_1 y se_1, que se refieren a la función de supervivencia y a su error estándar, respectivamente. Si es- ta operación se repitiera de nuevo, los subíndices para las nuevas variables se irían incrementando (sur_2 y se_2). 2. Se construyen los límites superior e inferior de los intervalos de confianza para la supervivencia mediante la fórmula mostrada en el apartado Método de Kaplan Meier, es decir, para el 95% de confianza: sur_1 ± 1,96 x se_1. Esta operación se realiza en dos pasos, uno para el límite superior (sur_1 + 1,96 x se_1) y otra para el límite inferior (sur_1 – 1,96 x se_1) mediante la opción Calcular variable del menú Transformar (Figura 14). 3. Para crear la gráfica de supervivencia, incluyendo los intervalos de confianza recién calculados, lo primero que se debe realizar es una ordenación de los casos en el ar- chivo de datos de acuerdo a la variable tiempo. Hay que recordar que, para esta operación, se debe acceder al menú Datos y, posteriormente, seleccionar la opción Ordenar casos. 4. Tras esta ordenación se crea la gráfica utilizando la opción Dispersión del menú principal de Gráficos. De entre las opciones posibles para estos diagramas de dis- persión hay que seleccionar la opción Superpuestos, pues se va a representar, en los mismos ejes, la función de supervivencia y los dos límites del intervalo de con- fianza. 101 CURVAS DE VIDA Y SUPERVIVENCIA Figura 12. Pantalla de diálogo del botón Comparar factor del método de Kaplan-Meier. Cap 04 4/10/04 12:48 Página 101
  • 114.
    102 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 13. Pantalla de diálogo del botón Guardar del método de Kaplan-Meier. Figura 14. Pantalla de diálogo de la opción Calcular variable dentro del menú Transformar. Con ella se crean los límites superior e inferior del intervalo de confianza de la función de supervivencia. Cap 04 4/10/04 12:48 Página 102
  • 115.
    5. Hay quetener presente que todas las variables se representarán en función del tiempo, de forma que se seleccionarán parejas de la lista de variables, pulsando ambas con el ratón y, cuando la pareja esté seleccionada, se pasarán a la lista de pares Y-X, pulsando la flecha correspondiente. Comprobar que el orden de las varia- bles es Y-X. De no ser así, se puede intercambiar el par con el botón correspon- diente (Figura 15). 6. Para darle el aspecto final deseado se debe acceder al editor de gráficos (doble clic del ratón) y en él, seleccionar la opción Formato y configurar dicha ventana tal co- mo se muestra en la Figura 16. Es decir, activar las opciones Interpolación y Escalón a la derecha y desactivar la opción Mostrar marcadores. Método actuarial Una situación especial ocurre cuando los datos están recogidos de forma que se refie- ren a observaciones agrupadas en intervalos temporales o cuando el número de obser- vaciones es elevado y se nos presenta la necesidad de dividir el tiempo de observación en intervalos. Para esta situación, el método estadístico adecuado es el denominado método actuarial. El SPSS incluye este método de análisis bajo la opción Tablas de mor- talidad del menú Supervivencia. El cuadro de diálogo es similar al de Kaplan-Meier, ex- cepto que se debe introducir la anchura de los intervalos en los que se va a dividir el tiempo (Figura 17). 103 CURVAS DE VIDA Y SUPERVIVENCIA Figura 15. Pantalla de diálogo de la opción Diagrama de dispersión superpuesto. Cap 04 4/10/04 12:48 Página 103
  • 116.
    104 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 16. Pantalla para dar el formato final al intervalo de confianza de la función de supervivencia. Figura 17. Pantalla de diálogo para el método actuarial. Cap 04 4/10/04 12:48 Página 104
  • 117.
    Regresión de Cox Elcuadro de diálogo para la realización de este análisis (Figura 18) es similar al del análi- sis de Kaplan-Meier. La diferencia fundamental estriba en que ahora se pueden introdu- cir varios factores (cualitativos o no) en el apartado de covariables, cuando en Kaplan- Meier sólo era posible introducir un factor cualitativo. Se pueden crear términos de interacción entre factores, utilizando el botón Producto (con la etiqueta >a*b>), tras marcar un conjunto con dos o más variables de la lista correspondiente. Los resultados de este análisis se muestran en la Figura 19. En la parte superior se ob- servan las pruebas de bondad de ajuste y en la inferior los resultados de las estimacio- nes de los coeficientes del modelo, la última columna muestra el HR para cada variable independiente bajo la denominación Exp(B). De forma sencilla, se puede completar este último resultado, solicitando en las Opciones que muestre los intervalos de confianza para esos HR (IC para Exp(B)). Para analizar una variable categórica de más de dos niveles se debe utilizar el botón Categórica, y aparecerá el cuadro de diálogo de la Figura 20. La opción más fácilmente interpretable es utilizar el esquema de contraste denominado Indicador, seleccionando qué nivel de esa variable es el que actuará como referencia. Se puede elegir entre el pri- 105 CURVAS DE VIDA Y SUPERVIVENCIA Figura 18. Pantalla de diálogo para la regresión de Cox. Cap 04 4/10/04 12:48 Página 105
  • 118.
    mer y elúltimo nivel. Es importante notar que se debe pulsar siempre el botón Cambiar para que la selección realizada tenga efecto. Para obtener los gráficos de la Figura 8, para evaluar la asunción de riesgos proporciona- les de una variable categórica, se introduce la variable elegida en la casilla Estrato, y se pide el gráfico Log menos log, desde el cuadro de diálogo correspondiente, al botón Gráficos (Figura 21). Para realizar el análisis de residuos, se pulsa el botón Guardar y se seleccionan las op- ciones marcadas en la Figura 22. Las nuevas variables guardadas en el archivo se utili- zarán para realizar las representaciones gráficas. La función de impacto (residuos de Cox-Snell), guardada con el nombre de haz_1, debe representarse frente a cada varia- ble, o al resultado del predictor lineal, guardado con el nombre de xbe_1. Los residuos parciales se representan frente a la variable tiempo. Se pueden construir los residuos martingala, ejecutando la siguiente lista de comandos en el Editor de sintaxis (funciona en los supuestos de que en la variable haz_1 estén guardados los residuos de Cox- Snell, la variable injerto sea la variable de Estado, y que el valor 0 corresponda al evento. Los residuos martingala se guardan en la variable martinga): 106 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 19. Resultados de la regresión de Cox. Arriba prueba del logaritmo de cocientes de verosimilitudes para contrastar la bondad del ajuste y abajo, coeficientes, con sus errores estándar, pruebas de significación para el contraste de que sean son cero y riesgo relativo (Exp(B)). Cap 04 4/10/04 12:48 Página 106
  • 119.
    107 CURVAS DE VIDAY SUPERVIVENCIA Figura 20. Cuadro de diálogo para analizar variables categóricas en el modelo de Cox. Figura 21. Cuadro de diálogo para construir los gráficos del logaritmo de la función de riesgo acumulada (recuérdese que H(t) = -Ln (S(t)), por eso en el cuadro hay que mar- car Log menos log). Cap 04 4/10/04 12:48 Página 107
  • 120.
    DO IF (injerto= 0). COMPUTE martinga = 1 -haz_1. ELSE. COMPUTE martinga = -haz_1. END IF. EXECUTE. FACTORES QUE INFLUYEN EN LOS RESULTADOS DE LAS CURVAS DE SUPERVIVENCIA: CONSIDERACIÓN ESPECÍFICA PARA LAS POBLACIONES EN TRATAMIENTO SUSTITUTIVO DE LA INSUFICIENCIA RENAL CRÓNICA (DIÁLISIS Y TRASPLANTE RENAL) Selección de la muestra a estudiar. Influencia de la cohorte sobre los estudios de supervivencia Uno de los elementos básicos para interpretar los estudios de supervivencia es el análi- sis de los criterios utilizados para la selección de la cohorte, dependiendo estos de los objetivos que se quieran obtener. 108 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 22. Cuadro de diálogo para guardar los residuos y el predictor lineal. Cap 04 4/10/04 12:48 Página 108
  • 121.
    Hemos visto previamenteque un estudio ideal de cohorte, consta de una muestra bien definida de individuos representativos de la población en estudio. Sin embargo, las po- blaciones de enfermos son heterogéneas, es decir, están compuestas por individuos de distintas edades, sexo, raza y grados de comorbilidad, factores diversos que condicio- nan el pronóstico. Por tanto, existe una cierta contradicción entre que una cohorte sea homogénea y, al tiempo, que sea representativa de la población de enfermos de la que procede (19). Esta complejidad es especialmente cierta en las poblaciones que se encuentran en tratamiento substitutivo por insuficiencia renal terminal, compuestas por individuos portadores de variados factores pronósticos (edad, etiología, presencia de nefropatía diabética, comorbilidad, etc.), tratados secuencialmente con distintas formas de trata- miento (hemodiálisis, diálisis peritoneal, trasplante renal, etc.), durante tiempos dife- rentes (20-24). La forma de enfrentar este problema de la heterogeneidad constitutiva de las poblacio- nes, depende de los objetivos que pretendamos con el estudio de supervivencia: • Si lo que queremos es analizar causalidad, por ejemplo si un determinado fármaco mejora la supervivencia, debemos seleccionar desde la población general, indivi- duos que constituyan grupos homogéneos y muy semejantes entre sí, aunque la cohorte resultante tenga diferencias notables con la población diana. Este tipo homogéneo de cohorte sólo puede conseguirse en estudios prospectivos en los que el inicio del estudio, la selección de la población en riesgo y la clasifica- ción de los individuos, según su nivel de exposición al factor pronóstico, se hace previamente a que se produzca el resultado de interés, que aparecerá en el futuro. Es la estrategia que se utiliza cuando se diseña un ensayo clínico con el que quere- mos estudiar la influencia de una terapéutica sobre la producción de los eventos de interés (muerte, complicaciones, rechazo etc.) comparándola con otra(s) y/o con un placebo. Para minimizar la presencia de sesgos es fundamental que el diseño consiga, en los distintos grupos, muestras de población muy parecidas entre sí, lo que se reali- za extremando los criterios de inclusión-exclusión y utilizando las técnicas de alea- torización. Por otra parte, debe asegurarse que, salvo el tratamiento en evaluación, los grupos sean tratados de igual modo, para lo que se usan las técnicas de enmas- caramiento o de ciego. Cuanto más estrictos y mejor definidos sean estos proce- sos, más homogéneas serán las cohortes estudiadas y menor la probabilidad de que ocurran sesgos. Sin embargo, aunque la aleatorización rigurosa hace muy probable la semejanza de los grupos, con relación a las variables de confusión, ésta no la garantiza. Un ejemplo de esta situación se produjo en el estudio internacional del tratamiento de las glomerulonefritis en la infancia, que investigaba el tratamiento con prednisona 109 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 109
  • 122.
    en la glomerulonefritismembranoproliferativa, utilizando técnicas impecables de aleatorización y de ciego. Sin embargo, y a pesar del rigor utilizado, los grupos di- ferían en una variable tan importante como era el tiempo entre el diagnóstico y el comienzo del tratamiento, haciendo dudoso el significado de los resultados ulte- riores (25). Por tanto, en todo estudio que investigue causalidad mediante la comparación de supervivencias, la asunción de la igualdad entre grupos debe ser comprobada y, si es necesario, ajustada por distintas variables para un análisis riguroso. Por tanto, éste debe ser uno de los puntos de interés crítico cuando nos enfrentemos a la lec- tura de un artículo de este tipo. • Si el objetivo del análisis es, precisamente, el estudio de esa población, por ejemplo, cuando pretendemos establecer el pronóstico de un enfermo concreto o analizar la influencia de factores pronósticos en la aparición del evento de interés o estudiar una o varias series para realizar controles de calidad, o para determinar la influencia de determinados factores sobre los resultados. En estos casos, no nos sirve la estrategia de comparar cohortes muy homogéne- as (y muy distintas a la población diana), que han sido obtenidas aplicando estric- tos criterios de selección, sino que tendremos que diseñar estudios (prospecti- vos o retrospectivos), utilizando series de enfermos o analizando la información obtenida por medio de registros de enfermedades. A pesar de sus muchos inconvenientes, la utilización de estos procedimien- tos (series y registros) representa, con frecuencia, la única forma de analizar aspectos de las enfermedades crónicas que se dan en poblaciones comple- jas y que requieren mucho tiempo desde el comienzo de la enfermedad has- ta la producción de los eventos. En estos estudios, lo que interesa es objeti- var las variables que, de una forma independiente, inciden en la producción del evento. En ambos casos, cuando lo que se pretende es comparar los resultados de dos es- tudios distintos, se debe comprobar que el tipo de pacientes incluidos sean compa- rables (al presentar un similar espectro de factores pronósticos), o comparar sub- grupos portadores de una determinada variable pronóstica o utilizar técnicas de es- tandarización de los grupos que los homogenicen por estas variables. Cuando analicemos una curva de supervivencia, debemos tener en cuenta estos elementos para desentrañar su significado. Por ejemplo, la gráfica de supervivencia de enfermos trasplantados renales, que se muestra en las Figuras 2 y 3, no tiene en sí misma mucho sentido, al representar el resultado de una cohorte histórica que ha experimentado diversos cambios en la estrategia terapéutica y en el criterio de in- clusión de enfermos para trasplante a largo plazo. Esta curva es difícil de comparar con la obtenida en otra cohorte en la que no se hayan seguido exactamente los mismos criterios. 110 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 110
  • 123.
    Para mejorar sucomparabilidad, debería segmentarse en periodos temporales, por gru- pos terapéuticos, estratificada por los factores pronósticos más significativos, etc., y mostrarse después de realizar ajustes por los principales factores pronósticos. Por otra parte, es necesario analizar, simultáneamente, la supervivencia del enfermo y del injerto tanto a corto como a largo plazo. Hay centros con muy buena supervivencia del injerto y mala del enfermo, y viceversa, por ejemplo, en relación con la estrategia in- munosupresora (26-29). Por tanto, interesa mejorar la comparabilidad de las cohortes en estudio y detectar la producción de sesgos. A continuación, resumimos algunas de las fuentes más impor- tantes en la producción de estos sesgos y algunas de las soluciones metodológicas que han sido propuestas. Fuentes en la producción de sesgos y soluciones metodológicas Recogida de datos en estudios retrospectivos y en los registros Una fuente de sesgos en los estudios de investigación clínica se refiere a los problemas originados por la recogida de datos. Las cohortes retrospectivas o históricas están especialmente expuestas a este proble- ma. En ellas, la presencia del factor pronóstico y el resultado de interés se han produci- do en el pasado, limitándose el momento actual al análisis del mismo. Están sujetas a numerosos sesgos por la recogida retrospectiva de los datos y por la dificultad que pre- sentan al estudiar las variables de confusión. Los registros están también sujetos a numerosos problemas en la recogida y transmi- sión de datos que pueden producir sesgos. Por ejemplo, sesgos por predominio de co- municación de la información por centros con “buenos resultados” (los que obtienen malos resultados tienen menos interés en hacerlo), retraso en comunicar el evento muerte, predominio en el registro de casos de un centro con un determinado perfil que sesga los resultados de toda la cohorte, duplicidades, etc. Por tanto, los estudios efectuados por estos procedimientos deberían objetivar siem- pre, la metodología seguida para tratar de minimizar este tipo de sesgos (protocolo de recogida de datos, índice de no respuestas, características de los centros, realización o no de controles externos, etc.) y sus resultados serán tanto más fiables (robustos) cuan- to mejor demuestren el rigor y la fiabilidad en el proceso de recogida de datos y su vali- dación y la ausencia de efecto centro que produzca sesgos sobre los resultados de la cohorte en su conjunto. 111 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 111
  • 124.
    Efecto cohorte Ya hasido comentado que el análisis de supervivencia presupone que el pronóstico de los individuos que componen la cohorte, permanece inalterado con el tiempo y que la falta de cumplimiento de esta premisa es una fuente de sesgos que se conoce como efecto cohorte. Esto sucede, por ejemplo, por cambio de la terapéutica utilizada a lo largo del tiempo, como sucede en la serie histórica de trasplantados renales que ilustra este trabajo. Por tanto, no es correcto informar a un paciente que se trasplante en el año 2004 del pro- nóstico de esta intervención terapéutica, utilizando una serie histórica que se inició 20 años antes. Se ha demostrado que existe una clara mejoría de la supervivencia del injerto renal con el tiempo (26), que se relaciona con el progreso de la terapéutica inmunosupresora, aunque posiblemente influyen otros factores que pueden agruparse como efecto aprendizaje: la mejoría con el tiempo de los resultados producidos, en un mismo cen- tro, o recogidos en archivos multicéntricos no pueden explicarse solamente sobre la ba- se de cambios técnicos, sino por una mejor utilización de los mismos a nivel local. Por otra parte, la explotación de datos de registros de enfermos renales, muestra una importante heterogeneidad de resultados de supervivencia entre centros tanto para diá- lisis, como para trasplante renal (27-29). Estas diferencias se deben, no sólo a una dis- tinta composición de las cohortes (edad, comorbilidad), variada utilización de la terapéu- tica o a alternativas técnicas, sino también, a la presencia de una serie sutil de circuns- tancias que pueden diferenciar a un centro de otro (efecto centro), sin que necesaria- mente afecten a las variables brutas que definen a la población en riesgo (por ejemplo, la selección cuidadosa de la pareja donante-receptor en los trasplantes, la situación clíni- ca basal en variables no medidas como las nutricionales, factores individuales de tipo cultural que influyan en la adhesión al tratamiento, etc.). Guttmann (30) afirma que esto es especialmente cierto en los trasplantes renales, en los que puede ser difícil objetivar los criterios que han sido utilizados para que los pa- cientes atraviesen la puerta de la elegibilidad y se incluyan en la lista de espera para trasplante. Estas poblaciones pueden ser comparables en las variables básicas (edad, sexo, comorbilidad, etc.) pero pueden diferir en otros con influencia potencial en la su- pervivencia (por ejemplo, el tiempo de permanencia previa en hemodiálisis), con fre- cuencia no incluidos en el análisis y, a veces, simplemente no medibles. Por tanto, la cohorte incluida en un estudio de supervivencia, debe incluir una descrip- ción de la misma en relación a los factores pronósticos que determinan la superviven- cia. Si se quieren comparar las cohortes de dos estudios diferentes, ambas deben ser 112 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 112
  • 125.
    suficientemente homogéneas ensu constitución o presentar los resultados de forma que la comparación sea posible. Control de la confusión en estudios no experimentales Debido a las diferentes características en cuanto a factores pronósticos de las cohortes de los diferentes estudios, en general, las comparaciones directas entre sus superviven- cias, en mayor o menor grado, estarán afectadas por el sesgo de confusión. Para contro- lar este sesgo, básicamente hay dos procedimientos, que tienen en común el que sólo permiten controlar la confusión provocada por características observadas, a diferencia de la aleatorización que controla por las observadas y también por las no observadas. Estratificación La estratificación consiste en hacer las comparaciones en estratos homogéneos con respecto al factor cuyo efecto de confusión se quiera eliminar. Si por ejemplo, se quisie- ra comparar la supervivencia de dos cohortes de trasplantados, que presentarán distinta proporción de diabéticos, un modo de eliminar la confusión provocada por la diabetes, consiste en dividir ambas cohortes en dos estratos: pacientes diabéticos y pacientes no diabéticos, y comparar las curvas de supervivencia en cada estrato. Obviamente, para que se corrija el sesgo, se necesita que en ambas cohortes haya sufi- ciente número de pacientes en todos los estratos. Si en una cohorte la inmensa mayoría de los pacientes fueran diabéticos y en la otra la inmensa mayoría no lo fueran, no habría manera de separar el efecto de la diabetes de cualquier otra causa de diferencia en la su- pervivencia entre las cohortes. Esta limitación se comparte con los otros métodos, pero una ventaja de la estratificación es que, si ocurre, el investigador lo observa inmediata- mente. El principal inconveniente de la estratificación es que resulta difícil de realizar cuando se necesita ajustar por muchas variables de confusión, como suele ser el caso. Hay que tener en cuenta también, que pequeñas diferencias en muchas variables, que individualmente no necesitarían ser ajustadas, pueden tener un efecto acumulativo im- portante. Por ejemplo, si en una cohorte los pacientes tuvieran ligeramente mayor edad que en la otra, hubiera una ligera mayor proporción de diabéticos y un nivel de creatinina ligeramente superior, ese grupo puede tener substancialmente peor pronóstico. Si el factor que se quiere controlar, fuera una variable continua (edad, tensión arterial, nivel de creatinina, colesterol, etc.), previamente habría que categorizarla. Sin embar- go, este proceder puede originar sesgos según sea el criterio utilizado y pérdida de in- formación de la variable, haciendo disminuir su significación (30-32). Para evitarlos, la categorización debe realizarse con sensatez, eligiendo los puntos de corte sobre la ba- se de criterios clínicos y procurando que exista un número suficiente de individuos en cada categoría. 113 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 113
  • 126.
    Este modo decomparar, estratificando la población según su situación con relación a dis- tintas variables, es muy utilizada en la literatura, ya que constituye una técnica de gran im- pacto para transmitir de forma visual la diferencia evolutiva entre dos tipos de opciones. Se han descrito distintas categorías de riesgo o índices de comorbilidad para realizar una aproximación pronóstica individualizada de los pacientes en tratamiento sustitutivo de la insuficiencia renal. Aunque en todos los índices propuestos se muestra una clara relación inversa entre morbilidad y supervivencia, también existe una importante super- posición entre los grupos, lo que disminuye su interés práctico, de tal forma que ningu- no de ellos haya sido unánimemente aceptado (20-24, 33-35). Estandarización Con el objetivo de mejorar la comparabilidad de los datos de supervivencia, la mayor parte de los registros de enfermos renales incluyen en su análisis técnicas de estandari- zación de los resultados, que consisten en estimar la supervivencia para una hipotética población que sea una “mezcla” predeterminada de los diferentes estratos. Se puede hacer directamente, calculando el promedio ponderado de la supervivencia en los dife- rentes estratos o usando el modelo de regresión de Cox en la forma apartado Supervivencia estimada con el modelo de Cox y aplicándola para unos valores predeter- minados de las variables especificadas para la variable seleccionada. Por ejemplo, en el registro de la EDTA-ERA, los resultados de supervivencia se presen- tan sin ajustar, o bien, ajustados por edad, sexo y etiología (diabetes o no) de la enfer- medad causante de la insuficiencia renal. 114 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Tipo supervivencia Edad Sexo Enfermedad renal TRS (pacientes) 60 años 60% varón DM-noDM 20/80 Diálisis (pacientes) 60 años 60% varón DM-noDM 20/80 TR cadáver (1º) (pacientes) 45 años 60% varón DM-noDM 20/80 TR vivo (1º) (pacientes) 45 años 60% varón DM-noDM 20/80 TR cadáver (1º) (injerto) 45 años 60% varón DM-noDM 20/80 TR vivo (1º) (injerto) 45 años 60% varón DM-noDM 20/80 TRS = tratamiento renal substitutivo (cualquier modalidad). En análisis de supervivencia ajustado y no ajustado, no se consideraron cuando en las celdas había menos de 30 casos. Tabla IV. Estudio de supervivencia. Registro EDTA-ERA. Variables de ajuste (modificada de ERA-EDTA Registry. www.era-edta-reg.org). Cap 04 4/10/04 12:48 Página 114
  • 127.
    Los criterios deeste ajuste del registro europeo, se muestran en la Tabla IV. Puede ob- servarse cómo el cálculo de supervivencia, para todos los pacientes en tratamiento re- nal substitutivo (cualquier modalidad), se hace ajustando los resultados crudos, asu- miendo que la cohorte estuviera formada por individuos con una edad de 60 años, com- puesta por un 60% de varones y un 40% de mujeres y una proporción de pacientes dia- béticos/no diabéticos del 20/80%. Por el contrario, vemos en la misma tabla que los cri- terios para realizar el ajuste son diferentes en trasplante renal (27,36,37). En el registro americano (USRDS = United States Renal Data System), los datos se pre- sentan sin ajustar y ajustados por edad, sexo, raza (blanco, negro, otro), etnia (hispano, no-hispano) y diagnóstico primario (diabetes, hipertensión, glomerulonefritis, riñón quís- tico, otras enfermedades de Urología, otras causas, causas desconocidas, todos) (38). En el registro australiano (39,40) se analiza la mortalidad cruda para los enfermos en tra- tamiento substitutivo, diálisis o trasplante (muertes con trasplante funcionante) referida a enfermos/año (1.000 enfermos/año) con resultados crudos, y también, se estudia la mortalidad por enfermo/año estandarizada por población. Para ello, se realiza un ajuste de los valores de supervivencia en la población en tratamiento substitutivo de la IRC (de mayor edad media que la población australiana), refiriéndolos a la edad de la población nacional. De esta forma, ambas tasas de mortalidad son comparables. Elementos clave a tener en cuenta en el análisis de supervivencia Como hemos visto ya, el modelo de Cox es una técnica estadística de gran utilidad en el análisis de supervivencia, porque permite que la variable dependiente sea evaluada con respecto a varios factores o covariables simultáneamente y, además, ofrece estimacio- nes sobre el tamaño del efecto de cada una de la covariables en la producción del even- to. Por otra parte, permite utilizar todo tipo de variables: continuas (edad), binarias (se- xo), categóricas no ordenadas (histología), categóricas ordenadas (estadios tumorales). En general, los métodos del análisis de supervivencia asumen que:1) los tiempos de su- pervivencia de los sujetos en estudio son independientes unos de otros; 2) el censura- do de casos se realiza aleatoriamente y no es informativo con relación a la producción del evento; 3) además, en el modelo de Cox, los riesgos entre los grupos son proporcio- nales. A continuación, se discuten algunas de las causas potenciales que pueden generar pro- blemas en la aplicación de esta metodología: 1. Desgraciadamente, la asunción de proporcionalidad de los riesgos que define al modelo de Cox no siempre se cumple, y por tanto, conviene estudiarlo antes de aplicarlo, con los métodos vistos en el apartado Diagnósticos de regresión. 115 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 115
  • 128.
    2. Utilización devariables tiempo-dependientes. El método descrito en el apartado Modelo de riesgo proporcional o de Cox asume que las variables independientes no cambian durante el tiempo (edad al trasplante, sexo, etc.) o están medidas en el comienzo del seguimiento. Existe una extensión del método que permite incluir también variables tiempo-dependientes, es decir, variables que cambian a lo largo de la evolución, aunque deben utilizarse con cuidado, pues pueden dar lugar a erro- res en relación con su ubicación en la cadena causal. Los más frecuentes son: A) Confundir una consecuencia con la causa: por ejemplo, si en una cohorte de enfermos con insuficiencia renal avanzada, queremos analizar las relaciones entre la función renal residual y la supervivencia. Es posible que la superviven- cia sea menor en los pacientes que presentan, al comienzo del seguimiento, una función renal menor. Pero si lo que pretendemos es analizar la relación en- tre la evolución de la función renal y la supervivencia, el resultado puede ser paradójico. Por ejemplo, si consideráramos la media de función renal en los distintos momentos evolutivos y, dado que ésta tiende a 0, los supervivientes tendrán una función renal más baja que los que han fallecido previamente, lo que llevaría a la falsa conclusión de que, a menor función residual, mayor su- pervivencia. B) Utilización de información futura en el modelo de regresión: en síntesis, el fu- turo no debe predecirse utilizando información futura. Pueden utilizarse las va- riables tiempo-dependientes siempre que no formen parte del evento que pretendemos analizar y se produzcan en un momento anterior a éste, es decir, que sean información anterior a la producción del evento (31,41). Un ejemplo ilustrativo del error, que puede cometerse por utilizar en el mode- lo de regresión información futura, lo constituye el análisis de las relaciones entre edad y mortalidad. Típicamente, la mortalidad aumenta con la edad y es, por tanto, correcto incluir la edad de un sujeto, a su entrada en el estudio, co- mo una covariable del análisis de supervivencia, que puede identificar a la edad en situación basal como un factor de riesgo de mortalidad. Sin embargo, si lo que se considera es la edad media durante el estudio (por ejemplo, la media entre la edad basal y en los distintos momentos en los que se analiza el evento de interés (1, 2, 5 años, etc.), esto es incorrecto, ya que se utiliza información futura. Suponer que esto se hiciera para una población cuyo estudio se inicia al nacer, haciendo estas cuentas, los sujetos con mayor edad media serían obviamente los que tienen, también, mayor supervivencia. 3. Colinealidad: existen problemas de colinealidad, que dan lugar a imprecisiones e in- estabilidades de los modelos (6,31), cuando algunas variables independientes es- tán muy correlacionadas entre sí. Es el caso que sucede cuando una variable englo- ba a otras varias. Por ejemplo, si queremos analizar a los enfermos, en tratamiento sustitutivo de la insuficiencia renal, del valor pronóstico de las siguientes variables: cardiopatía isquémica, claudicación intermitente, accidente cerebrovascular y arte- riosclerosis. Al realizar el modelo de regresión, pueden producirse problemas de 116 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 116
  • 129.
    colinealidad, ya quela variable arteriosclerosis engloba a las demás. La solución consiste en retirar la variable que engloba a las demás (en este caso, la arterioscle- rosis). Con ello, el modelo no pierde información (que se encuentra contenida en las otras variables), pero éste se hace viable. En la Tabla V se resumen algunas de las reglas que debemos seguir para la utilización de covariables en los estudios de regresión. Definición del comienzo del estudio y su influencia sobre los estudios de supervivencia Uno de los requisitos de diseño de un estudio de supervivencia es la delimitación del comienzo del mismo (origen o tiempo 0). Esta propiedad que a primera vista parece ob- via o baladí, tiene sin embargo, una gran importancia en la producción de sesgos o, al menos, de resultados no comparables entre unos y otros estudios. Veamos, por ejemplo, la diferencias en el establecimiento del punto de origen para el cál- culo de supervivencia en distintos registros internacionales de enfermos en tratamiento substitutivo por insuficiencia renal (TRS) (27, 36-40), que se describen en la Tabla VI. 117 CURVAS DE VIDA Y SUPERVIVENCIA 1. Seleccionar las covariables cuya relación con el evento tenga sentido clínico. 2. En un modelo estimativo deben considerarse también las variables de confusión o interacción. 3. El número máximo de covariables, en el modelo, es la décima parte del número de eventos. 4. Evitar que unas variables engloben a otras para que no se produzca colinealidad. Su principal manifestación es la inestabilidad e imprecisión de los modelos. En el caso de que esto se produzca, eliminar del modelo la variable globalizadora o todas las parciales. 5. Comprobar que las variables introducidas en el modelo satisfagan la asunción de riesgo proporcional. Para ello, son muy útiles las gráficas que presenten el logaritmo del riesgo en función del tiempo, o del logaritmo del tiempo para distintos valores de cada una de las variables: si permanecen paralelas, o al menos si no se cruzan, podemos asumir esta proporcionalidad. Para variables continuas, mejor las gráficas de residuos. 6. En caso de usar variables tiempo-dependientes, se debe estar seguro de que no sean consecuencias en lugar de causas del evento en estudio. Tabla V. Reglas para la utilización de covariables predictoras en modelos de regresión. Cap 04 4/10/04 12:48 Página 117
  • 130.
    Puede observarse unadiferencia clave en el cálculo de la supervivencia de los pacientes que inician tratamiento en cualquier procedimiento de TRS. El registro americano (USRDS) sitúa el origen en el día 90, para aquellos que sobreviven en esta fecha. Por el contrario, el registro europeo (EDTA-ERA) y el australiano (ANZDATA) fijan el origen en el día 1 de entrada en la TRS. EDTA-ERA analiza cohortes constituidas por enfermos que iniciaron el tratamiento en un periodo de cinco años e incluye un primer punto de evaluación de la supervi- vencia, al tercer mes, para evaluar las pérdidas precoces y, a continuación, a 1, 2 y 5 años. En el USRDS, la cohorte se constituye por años de inicio en el tratamiento, analizando supervivencia a 1, 2, 5 y 10 años. El registro australiano, al igual que el de la EDTA, considera el origen el día 1, aunque para poder realizar análisis comparati- vos con el USRDS, realiza otro análisis de supervivencia para aquellos enfermos que permanezcan vivos el día 91 con origen del estudio en este mismo día (tiempo 0). En todos los registros, el punto de origen para trasplante renal es el día en el que se im- planta el injerto. A la vista de estos datos, podemos concluir que los resultados globales en TRS del re- gistro americano son difíciles de comparar con los europeos, aunque todo indica que 118 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Registros TRS HD / DP TR Enfermo/ Injerto Europeo 1) día 1 en TRS. Modalidad (HD o DP) = 1) día 1 en TR. (EDTA-ERA) 2) día 91 en TRS En la que se encuentre para los supervivientes. el día 90 en TRS (al menos durante 60 días). Americano 1) día 90 en TRS. Modalidad (HD o DP) = 1) día 1 en TR. (USRDS) En la que se encuentre el día 90 en TRS (al menos durante 60 días). Australiano 1) día 1 en TRS. Modalidad (HD o DP) = 1) día 1 en TR. (ANZDATA) Intención de tratar. En la que se encuentre Intencion de tratar. 2) día 91 en TRS el día 90 en TRS (al para los supervivientes. menos durante 60 días). TRS = tratamiento renal substitutivo (cualquier modalidad). HD = hemodiálisis. DP = cualquier modalidad de Diálisis Peritoneal. TR = trasplante renal. Intención de tratar = la evolución del enfermo es considerada simplemente por haber iniciado el procedimiento. Tabla VI. Determinación del punto de origen para el cálculo de supervivencia. Cap 04 4/10/04 12:48 Página 118
  • 131.
    inferiores a estosen supervivencia de los pacientes en TRS. Por ejemplo, la mortalidad global a los 90 días (ajustada por sexo, edad y diagnóstico) reflejada en el registro eu- ropeo para la cohorte, que comienza tratamiento substitutivo de la insuficiencia renal entre los años 1992 y 1996, es ligeramente inferior al 5%. Y en el análisis que toma co- mo origen el día 91 (y que por tanto, sería comparable a la del USRDS), la superviven- cia es del 87,1% al año (IC 95%: 86,8-87,5); del 76,1% a los dos años (75,7-76,6) y del 50% a los cinco años (49,4-50,6). En el registro americano, la supervivencia oscila en el primer año entre el 79%, en los que comienzan en 1992, y el 80,6% en los que co- menzaron en 1996; la supervivencia a los dos años oscila entre el 64,6% y el 66,9%; y a los cinco años entre el 37,6% y el 39,7%. Estas importantes diferencias, probable- mente se deben más a la existencia de diferentes criterios de inclusión de enfermos en programa de diálisis, es decir, a la constitución de la cohorte, que a diferencias en la calidad del tratamiento. En cualquier caso y, sea cual sea la causa, lo que quiero destacar es que analizar el cri- terio, con el que se fija el punto 0 de un estudio de supervivencia, es fundamental para comprender los resultados del mismo. Un matiz de mucho interés es el que refleja, de una forma expresa, el registro australia- no: que la inclusión de los pacientes en el punto 0 se haga por intención de tratar. En el mundo nefrológico es, en el trasplante renal, donde es más evidente la impor- tancia de considerar o no este punto en el estudio de supervivencia. Esto sucede porque hay grupos que no incluyen, en el análisis, aquellos casos en los que el injer- to es retirado durante el acto quirúrgico, por cualquier circunstancia (problema técni- co) e incluso, aquellos que han superado el acto quirúrgico, pero en los que el injerto nunca llega a funcionar. El argumento es que “estos enfermos, en realidad, no han sido trasplantados, el tejido renal nuevo no ha sido implantado o éste no ha llegado a funcionar”. Probablemente, esta práctica sea válida si se quieren analizar determinados aspectos, por ejemplo, la influencia de variables inmunológicas sobre la supervivencia del injerto, pero es incorrecta si lo que estudiamos es la supervivencia global del injerto en una se- rie en la que también deben incluirse las pérdidas durante la cirugía. Hoy, la mayoría de los metodólogos piensan que, para la correcta evaluación de cual- quier alternativa terapéutica, es importante considerar a los pacientes en el procedi- miento donde “había intención de tratarlos”, aunque luego sigan una línea terapéutica alternativa o salgan del programa por cualquier circunstancia. La definición del origen debe, por tanto, ser clara (sin equívocos) y precisa en relación al objetivo que se pretenda. 119 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 119
  • 132.
    Definición del eventode interés a estudiar Hemos visto que los estudios de supervivencia consisten en analizar la probabilidad, en el tiempo, en la que se produce un suceso o evento de interés. Por tanto, una de las principales consideraciones en el diseño del estudio, es la definición de esta variable. La definición debe ser rigurosa, es decir, acorde con los criterios científicos sobre el te- ma. Debe ser sencilla y no sujeta a interpretaciones o equívocos. Las distintas circuns- tancias posibles deben ser consideradas y hacerse explícitas en la metodología. Por ejemplo, si analizamos la supervivencia del enfermo después del trasplante renal, el evento de interés es la muerte. Aparentemente, este acontecimiento es muy claro y no induce a problemas de ningún tipo. No es sin embargo así para interpretar correctamen- te los resultados, ya que la variable muerte debe ser definida con mayor precisión. Debemos dejar claro que hemos incluido (o no) todos los casos de muerte, incluyendo la que sucede durante el acto quirúrgico del trasplante y la accidental o el suicidio. También hemos comprobado el exitus, incluyendo como tal, aquel caso trasladado a otro centro o a su domicilio como terminal. Por otra parte, hay que objetivar cómo hemos considerado a los pacientes una vez per- dido el injerto y producida su vuelta al programa de hemodiálisis. El criterio más extendido como correcto es el que incluye la supervivencia en diálisis después del trasplante, como periodo de análisis para la misma. Es decir, la muerte de un paciente trasplantado renal, que sucede un tiempo después de su vuelta al programa de diálisis por fallo del injerto, se computa como muerte en el estudio de supervivencia del enfermo trasplantado. Sin embargo, en algunos estudios, una vez que el paciente vuelve a diálisis, se le considera perdido a la evolución y censurado. Puede entenderse, por tanto, que los resultados serán muy diferentes según se adopte un criterio u otro. Asimismo, debe explicitarse qué procedimiento se ha seguido para constatar el evento muerte en la población que se ha trasladado a unidades de diálisis distintas del centro trasplantador. En su editorial, Guttman (30) refiere que cuando se pierde el injerto, mu- chos pacientes se pierden a la evolución, incluso sin que exista constancia de la pérdida del injerto en el centro trasplantador. Esto sucede en algunos centros de trasplante, es- pecialmente americanos, donde los enfermos son seguidos en lugares muy distantes al hospital donde se realizó el trasplante. En el trasplante renal se ha mostrado la influencia de la definición del evento muerte en la producción de diferentes resultados de supervivencia del injerto. En la mayoría de los es- tudios, cuando se produce la muerte del paciente con riñón funcionante, el injerto es con- 120 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 120
  • 133.
    siderado, también, comoperdido. Sin embargo, esto puede enmascarar a los verdaderos factores de riesgo que inducen a la pérdida del injerto al enmascararlos con otros que con- dicionan la muerte del enfermo trasplantado por causas no relacionadas con el trasplante. Matas y cols., de la Universidad de Minnesota (42), analizaron los factores de riesgo pa- ra la supervivencia del injerto renal en 2.230 enfermos, utilizando cuatro estrategias di- ferentes, según la forma de considerar el evento pérdida del injerto cuando se produ- ce la muerte del enfermo con riñón funcionante. Los resultados muestran que, obvia- mente, el tiempo medio de supervivencia del injerto es diferente según se adopte una u otra estrategia, pero también lo son los factores de riesgo que determinan su pérdida. En el supuesto de que la muerte equivale a pérdida del injerto, son factores de riesgo, entre otros, la edad (>50 años), la presencia de diabetes y el retrasplante. Sin embargo, estos tres desaparecen en las otras estrategias de estudio que censura la variable pér- dida del injerto cuando la muerte (en distintos grados de matiz) se produce con riñón funcionante. Probablemente, estas tres variables predicen el riesgo de muerte del en- fermo más que de pérdida del injerto. Otros autores encuentran que no censurar la muerte con riñón funcionante (28), al estu- diar la supervivencia del injerto, da lugar a resultados particularmente negativos en los centros que trasplantan muchos ancianos y enfermos con comorbilidad. Por eso, en la mayoría de los estudios, los resultados “crudos” obtenidos son ajustados por los principales factores pronósticos (edad, sexo, etiología, etc.) o las curvas presen- tadas de ambas formas, es decir, con los casos de exitus con riñón funcionante censu- rados y no censurados (36-41). Análisis del proceso de censurado Previamente, hemos visto que el censurado constituye una de las peculiaridades más interesantes del análisis de supervivencia, ya que permite utilizar para el estudio, el tiempo de evolución conocido de los individuos, de los que luego perdemos su evolu- ción o no sabemos si, en ellos, se produce el evento por cualquier motivo. La estrategia, seguida en el proceso censurado, constituye un elemento clave en el di- seño y la interpretación de los estudios de supervivencia. A continuación, resumimos al- gunos elementos clave a tener en cuenta. La estrategia de censura debe ser adecuada a los objetivos Observemos en la Tabla VII la estrategia que se sigue en el registro de la EDTA-ERA (36, 37) con relación al proceso de censurado de las variables que definen los eventos de in- terés más importantes. Vemos que, cuando se analiza la supervivencia del enfermo en 121 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 121
  • 134.
    el tratamiento substitutivo(en su globalidad, independientemente de los procedimien- tos con los que sea tratado a lo largo de su evolución), el tiempo de observación hasta el evento muerte, se prolonga a través de todo cambio de procedimiento terapéutico (hemodiálisis, diálisis peritoneal, trasplante). Además del final del periodo de estudio, la única situación censurada es la recuperación de la función y la salida del enfermo de diá- lisis, pues la evolución, en este supuesto, no depende del tratamiento substitutivo. Por el contrario, en el estudio de supervivencia de los enfermos en tratamiento con al- guna modalidad de diálisis, además de las situaciones previamente descritas, los enfer- mos son censurados en la fecha en la que se produce el trasplante pues, evidentemen- te, se trata de una opción terapéutica diferente. Por tanto, en la población en diálisis só- lo permanecen, a efectos de supervivencia, los enfermos que nunca son trasplantados. Es decir, una población sesgada en la que persisten, generalmente, los enfermos de más edad y comorbilidad. Por eso, las curvas de supervivencia en diálisis muestran siempre un peor perfil y es difícil saber cuál sería la expectativa de supervivencia si los enfermos fueran tratados, únicamente, con diálisis. Por tanto, la utilidad de este tipo de curvas del registro de la EDTA-ERA es realmente muy limitada. Por el contrario, en su análisis de supervivencia del enfermo, después de un trasplante renal, los únicos supuestos de censurado son la pérdida en el seguimiento y al final del 122 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Tipo de supervivencia Evento Censurado TRS (pacientes) Muerte del Recuperación de Función. enfermo. Pérdida a seguimiento. Final periodo de estudio. Diálisis (pacientes) Muerte del Trasplante renal. enfermo. Recuperación de función. Pérdida de seguimiento. Final periodo de estudio. Primer TR (pacientes) Muerte del Pérdida de seguimiento. (cadáver o vivo) enfermo. Final periodo de estudio. Primer TR (injerto) Pérdida del Pérdida de seguimiento. (cadáver o vivo) injerto.Muerte Final periodo de estudio. con injerto funcionante. TRS = tratamiento renal substitutivo (cualquier modalidad). TR = trasplante renal. Tabla VII. Estudio de supervivencia. Registro EDTA-ERA. Evento y censurado (modificada de ERA-EDTA Registry. www.era-edta-reg.org). Cap 04 4/10/04 12:48 Página 122
  • 135.
    periodo de estudio(los casos que vuelven a diálisis por pérdida de función del injerto no son censurados). Este tipo de análisis sí es representativo de las probabilidades de su- pervivencia de estos casos. En cuanto a la supervivencia del injerto, sólo son censurados en los casos de fin del es- tudio (con riñón funcionante) o pérdida en la evolución. La muerte con riñón funcionante es considerada, por el registro de la EDTA-ERA, como pérdida del injerto, es decir, que no es motivo de censurado. La práctica actual por la que los enfermos, después de comenzar tratamiento dialítico, en- tran en lista de espera y reciben un trasplante renal, excepto aquellos en los que se desa- conseja la realización del mismo por la edad o la morbilidad asociadas, hace muy difícil co- nocer cuál sería el pronóstico de un enfermo si se tratara de forma aislada con uno sólo de los procedimientos terapéuticos (hemodiálisis, diálisis peritoneal o trasplante renal). Las cohortes de enfermos, tratados exclusivamente con sólo uno de los procedimien- tos, o son muy poco numerosas (enfermos sólo tratados con trasplante) o están sesga- das con los enfermos de peor pronóstico (enfermos sólo tratados con diálisis) (43, 44). No obstante, WOLFE y cols. (45), encuentran menor supervivencia de los enfermos tra- tados sólo con diálisis, cuando la cohorte en estudio la constituían enfermos que ya ha- bían sido incluidos en lista de espera para trasplante. Sin embargo, a mi juicio, el trabajo no demuestra la igualdad entre los dos grupos, que no garantiza el hecho de que ambos estén constituidos por enfermos incluidos en lista de espera. El proceso de censurado no puede ser informativo El censurado, en los casos perdidos en la evolución, es una fuente potencial de sesgos si la pérdida del caso se produce por causas que predeterminen o condicionen el evento de interés. Por ejemplo, en una determinada unidad que realiza trasplantes en enfermos que viven en zonas lejanas al hospital, y en el caso de mala evolución, son dados de alta en situación pre- terminal. Si luego, al desconocer la situación exacta de estos enfermos, se incluyeran co- mo perdidos en la evolución, se produciría un sesgo, que tendría mayor o menor importan- cia según el número de casos. Naturalmente, este tipo de problema es difícil que se pro- duzca en los Centros de Trasplante que mantienen un estrecho contacto con las unidades de hemodiálisis y con los pacientes. El número de casos perdidos a la evolución es importante Si a partir de un momento determinado, el número de enfermos, que no completan el estudio, es grande, es decir, hay muchos casos perdidos en la evolución, la cohorte pue- de no ser útil para determinar la probabilidad de que se produzca el evento de interés. 123 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 123
  • 136.
    Una pregunta clásicapor parte de los médicos, en relación a los análisis de superviven- cia, es ésta: ¿qué porcentaje de casos perdidos en la evolución podemos permitirnos para que un estudio sea válido? Aunque para responder a esta cuestión se han referido algunas aproximaciones para su utilización en la práctica –por ejemplo, la cifra del 30%– ninguna respuesta basada en porcentajes es rigurosa, pues no tiene en cuenta otros factores, como el número total de enfermos en riesgo o la homogeneidad de la población. Como hemos referido en otras ocasiones, el procedimiento matemático para evaluar si la información producida por el análisis de supervivencia es válida, viene dada por la va- loración del intervalo de confianza. Al disminuir los enfermos en riesgo, disminuye el denominador de la ecuación por la que se calcula el error estándar, y por tanto, éste au- menta y también lo hace el intervalo de confianza. Por ejemplo, la supervivencia del in- jerto del 65%, en un determinado tiempo de evolución, con un intervalo de confianza entre el 60% y el 70%, puede constituir una información útil desde el punto de vista clí- nico, pero no si el intervalo oscila entre el 35% y el 85%. Por otra parte, como hemos indicado previamente, la desigualdad en el número de ca- sos, que han completado el estudio entre dos cohortes en comparación, es una fuente potencial de sesgos. Aunque se han propuesto otras medidas (46), un indicador muy sencillo para detectarlos es comparar la proporción de individuos perdidos en el segui- miento. En general, diferencias entre grupos en este indicador señalan una posible fuente de sesgos. Por tanto, respecto a este parámetro, la proporción de casos perdidos en cada grupo debería ser analizado y reflejado, expresamente, en los estudios comparativos de su- pervivencia. Pérdidas en la evolución porque el sujeto experimenta un evento competitivo con el principal de interés Más complejo es el censurado en aquellos casos en los que el sujeto experimenta un evento distinto del principal de interés. Por ejemplo, la muerte con injerto funcionante, ¿deben ser considerados estos órganos trasplantados como perdidos o censurados y como perdidos en la evolución? Como hemos visto anteriormente en el primer su- puesto, los resultados de supervivencia del injerto serían peores, cuando en realidad la pérdida del mismo no se ha producido por fracaso inmunológico u otro de los factores que inciden en la supervivencia del injerto. Si adoptamos la segunda alternativa, la su- pervivencia del injerto sería mejor, pero estaríamos olvidando una causa de pérdida del injerto (el que se deriva del exitus aparentemente no relacionado con el trasplante), que incide en todas las poblaciones y que, sin duda, no puede ser despreciada en un estudio pronóstico. 124 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 124
  • 137.
    La consideración ono de estos casos, como censurados, afectará los resultados del es- tudio y debe realizarse en base a criterios objetivos, explicitando claramente en la meto- dología, la opción elegida y su justificación. No es correcto comparar dos poblaciones de enfermos trasplantados en las que se hu- bieran seguido criterios diferentes para el censurado, tanto en relación a este punto, co- mo para cualquier otro. Tiempo de seguimiento de los individuos El tiempo de seguimiento debe ser suficiente para que se puedan capturar bastantes eventos, y por tanto, disponer de un poder adecuado para los test estadísticos. Esto de- pende, naturalmente, de la enfermedad en estudio. Por ejemplo, un periodo de segui- miento de cinco años puede ser apropiado para el estudio de supervivencia en muchas variedades de cáncer. Sin embargo, es una estimación inadecuada para valorar la super- vivencia de enfermos en el tratamiento substitutivo por IRC. Como indicador de la longitud del seguimiento se suele usar la mediana del seguimiento (se llama la atención sobre que la mediana de seguimiento es la mediana de todos los tiempos, sean hasta el evento o hasta la censura, y que es diferente de la mediana de su- pervivencia, estimada como se explicó en el apartado Funciones de supervivencia y ries- go), aunque otros autores prefieren usar la mediana sólo de los tiempos censurados. Sin embargo, ambos métodos tienden a infraestimar el seguimiento y una medida más ro- busta es la obtenida a partir del método de Kaplan-Meier inverso (4); es decir, se calcula la mediana, como se explica en el apartado Funciones de supervivencia y riesgo, a partir de una curva de Kaplan-Meier en la que el evento es la censura. En la cohorte de enfermos trasplantados del Ramón y Cajal, para el evento pérdida del injerto, la mediana de segui- miento fue cinco años y tres meses, la mediana de los tiempos censurados ocho años y un mes, y la mediana estimada por el método de Kaplan-Meier inverso diez años y dos meses. Para supervivencia del enfermo en tratamiento sustitutivo de la insuficiencia renal, es necesario analizar puntos de mortalidad precoz (90 días, un año), y a partir de entonces es interesante constatar la supervivencia anual y tardía (diez años). Esto es especial- mente importante para la cohorte de enfermos que han recibido un trasplante renal con largos periodos de supervivencia del enfermo. No obstante, podemos obtener una in- formación clínicamente valiosa si se objetivan diferencias significativas entre dos gru- pos, en la mortalidad precoz (<1 año) o en tiempos intermedios (3 ó 5 años), especial- mente en las cohortes con factores pronósticos desfavorables. Para la supervivencia del injerto conviene, igualmente, analizar tiempos precoces (90 días, un año) y, a partir de entonces, supervivencia anual, siendo aconsejable reclutar una población suficiente para objetivarla durante un mínimo de cinco años. 125 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 125
  • 138.
    126 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL A. ¿ Son válidos los resultados del trabajo? Preguntas de eliminación Estudios de pronóstico Estudios de tratamiento ¿Se orienta el estudio a una pregunta claramente definida? (Una pregunta debe definirse por: a) la población en estudio, b) la intervención realizada y c) los resultados) ¿La metodología de selección de la ¿Fue aleatoria la asignación de los pacientes cohorte garantiza que es representativa a los tratamientos? de la población objetivo del estudio? ¿Se mantuvo oculta la secuencia de aleatorización? ¿Fue el seguimiento del paciente ¿Fueron adecuadamente considerados suficientemente prolongado hasta el fin del estudio todos y exhaustivo? los pacientes que entraron en él? ¿El seguimiento fue completo? (si contesta afirmativamente a estas preguntas merece la pena que continúe con el análisis del artículo respondiendo a las siguientes cuestiones). Preguntas de detalle Variables pronósticas Estudios de pronóstico Estudios de tratamiento ¿Se han estudiado las variables de ¿Se mantuvieron ciegos al tratamiento interés clínico con potencial influencia los pacientes, clínicos y personal del en el pronóstico? estudio? ¿Se objetiva (texto, tablas, etc.) cuál es ¿Se objetiva (texto, tablas etc), la igualdad la estructura de la cohorte en relación de los grupos terapéuticos en relación a las a las variables pronósticas más variables demográficas y pronósticas importantes? más importantes? Si se estratifica por variables ¿Al margen de la intervención en estudio pronósticas, ¿se objetiva (texto, tablas, los grupos fueron tratados de igual modo? etc.) que los subgrupos pronósticos son iguales en relación al resto de las variables pronósticas? ¿Se ha estudiado mediante análisis ¿El análisis de los resultados se hace por multivariante los factores pronósticos? intención de tratar? Se analiza la evolución del paciente en el grupo donde fue originariamente asignado Siga la columna de pronóstico o tratamiento según proceda. Contestar cada pregunta con SÍ/NO/indeterminado. Realizar un breve comentario, en cada caso, basado en su interpretación del texto. Tabla VIII. Cuestionario para la lectura crítica de un artículo basado en el análisis de supervivencia (este material ha sido desarrollado adaptando y modificando los desarrollados por el grupo CASPe, www.redcaspe.org). Cap 04 4/10/04 12:48 Página 126
  • 139.
    127 CURVAS DE VIDAY SUPERVIVENCIA ¿Se ha verificado la asunción de riesgo proporcional de las variables incluidas en el modelo de Cox? ¿Si se define un modelo con variables tiempo-dependientes se ha descartado su dependencia de las fijas o que sean un epifenómeno del evento? Preguntas de detalle Definición del origen, evento de interés y censurado Estudios de pronóstico Estudios de tratamiento ¿La definición del origen, evento de interés (resultado) y los criterios de censurado son objetivas y precisas, y se adaptan a los objetivos del estudio? (No deja fuera a pacientes que podrían tener interés en los resultados objetivo del estudio). ¿Se aplicaron criterios objetivos para la constatación del evento (resultado)? (Incluyendo las circunstancias en los que se produce fuera de la observación directa de los responsables del estudio). Los criterios de censura, ¿hacen improbable que ésta sea informativa? (Impide que se den casos frecuentes de casos censurados por circunstancias que anuncien o hagan probable que se produzca el evento (resultado). El punto de origen, ¿se sitúa en una ¿Los criterios de origen, evento y censurado fase precoz del comienzo de la son idénticos en todos los grupos enfermedad o fase de la enfermedad terapéuticos en estudio y en el grupo que se quiera estudiar? control? Definición del final del estudio, periodo de observación Estudios de pronóstico Estudios de tratamiento ¿Cuál es la mediana de seguimiento de la cohorte o los distintos subgrupos? ¿El tiempo de seguimiento es suficiente para reclutar un número de casos adecuado en los que se produzca el evento (resultado)? ¿Cuál es el porcentaje de casos perdidos a la evolución?, ¿se especifican las causas? ¿Se cuida que no se hayan producido ¿Los tiempos de seguimiento y en el tiempo cambios en los criterios el porcentaje de casos perdidos a la de selección, tratamiento, etc. que evolución son similares en los cambien el pronóstico (efecto cohorte)? distintos grupos en estudio? Cap 04 4/10/04 12:48 Página 127
  • 140.
    128 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL ¿Existe un número suficiente de casos en riesgo en todas las categorías de pronóstico y en todos los tiempos considerados? B. ¿Cuáles son los resultados? Análisis de supervivencia Estudios de pronóstico Estudios de tratamiento ¿Cuál es la precisión de la estimación en la probabilidad de supervivencia? ¿Hay constancia de los intervalos de confianza en los puntos más significativos de las curvas de supervivencia? ¿La disminución de los enfermos y aumento del intervalo de confianza hacen poco informativa la curva de supervivencia a partir de algún momento informativo? ¿Cuáles son las variables pronósticas ¿Cuál fue el efecto del tratamiento? que influyen sobre el resultado? ¿Cuál es el peso de estas variables ¿Cuál es la importancia clínica de la en la determinación del pronóstico? diferencia entre los grupos en estudio? ¿Hubo una validación en un grupo ¿Existe un análisis riguroso de los independiente de pacientes del efectos secundarios de la medicación “grupo de derivación”? en estudio? C. ¿Pueden ayudarnos estos resultados? Estudios de pronóstico Estudios de tratamiento ¿Los resultados de este estudio de ¿Pueden aplicarse estos resultados pronóstico pueden ser aplicados en en tu medio? tu medio? ¿Crees que los pacientes del ensayo son ¿Crees que la cohorte estudiada es semejantes a los tuyos? semejante a tus pacientes? ¿En qué circunstancias y en qué casos sí ¿En qué circunstancias y en qué serían aplicables a tu medio los resultados casos sí serían aplicables? del ensayo? ¿Cambia este trabajo en algo tu criterio ¿Se tuvieron en cuenta todos los acerca de lo que se debe contar a tus resultados de importancia clínica? pacientes en relación al pronóstico ¿En caso negativo, cómo influye esto de su enfermedad? en la decisión a tomar? Los beneficios terapéuticos obtenidos, ¿compensan los riesgos y los costes? Cap 04 4/10/04 12:48 Página 128
  • 141.
    El registro dela EDTA analiza las cohortes agrupadas por quinquenios, teniendo en cuenta la fecha de inicio del programa terapéutico. En su informe del 2001, se incluye la cohorte 1992-96, analizando supervivencias a los 90 días, 1, 2 y 5 años, y la 1995-99, en la que sólo se analiza a los 90 días, 1 y 2 años, tanto para el estudio global de los enfer- mos, en cualquier modalidad de tratamiento, como para diálisis o trasplante renal. El re- gistro americano incluye análisis de supervivencia de enfermo e injerto de hasta diez años. Otro problema es el que plantea la desigualdad en los periodos de observación entre los individuos que se incluyen en la cohorte. Es habitual que, en los análisis de superviven- cia, los sujetos en estudio presenten un distinto tiempo de seguimiento. Por una parte, habitualmente la observación no comienza en el mismo tiempo para todos los sujetos y, si el estudio se ha diseñado para que acabe en un tiempo determinado, los casos que entraron más tarde tienen menos tiempo de observación, y por tanto, menos probabili- dad de desarrollar el evento. En estos pacientes, con menor tiempo de seguimiento, no estamos seguros de que el hecho de que no se haya presentado el evento de interés, se debe a que existe poca probabilidad de que suceda o que el corto tiempo de evolu- ción impide el que éste sea observado. Una posible solución al problema planteado, por el desigual tiempo de observación en- tre los pacientes de la cohorte, es diseñar la fecha de fin del estudio para que acabe después de que todos los participantes hayan alcanzado un mismo periodo de observa- ción. Es decir, que acabe para todos en distintas fechas del calendario. Desgraciadamente, en los estudios a largo plazo esto tampoco suele ser posible. Por ejemplo, esperar que todos los enfermos trasplantados alcancen cinco años de evolu- ción puede demorar su análisis hasta hacerlo ineficiente. Por eso, en los análisis de su- pervivencia, generalmente el número de enfermos expuestos al riesgo casi siempre disminuye conforme más avanzado está el tiempo. Esto no invalida los resultados, pero disminuye su precisión. Por eso, como hemos reiterado a lo largo de este trabajo, para interpretar correctamen- te la información que proporciona una curva de supervivencia, hay que valorar el núme- ro de enfermos en riesgo y, sobre todo, el error estándar (y de ahí el intervalo de con- fianza) de la función de supervivencia del momento temporal que interese considerar. PROPUESTA DE SISTEMÁTICA PARA LA LECTURA CRÍTICA DE UN ARTÍCULO BASADO EN EL ANÁLISIS DE SUPERVIVENCIA Este trabajo ha pretendido aportar información para una mejor comprensión de los pro- blemas que tenemos los médicos cuando nos enfrentamos a los problemas metodoló- 129 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 129
  • 142.
    gicos del análisisde supervivencia, de tanta importancia para la toma de decisiones en nuestra profesión y, desde luego, en el mundo de los trasplantes. Sin embargo, en nuestra experiencia, el procedimiento idóneo para mejorar nuestra des- treza en estos temas, lo constituye la lectura crítica de trabajos originales que, a nuestro juicio, debería formar parte de cualquier programa serio de formación continuada. La práctica de la lectura crítica puede realizarse individualmente. Pero adquiere todo su po- tencial formativo cuando se realiza en pequeños grupos de profesionales que coinciden por el interés en una determinada materia, y con la presencia, como facilitador-moderador, de un profesional experto en metodología. En estos seminarios, la lectura crítica se facilita por medio de un cuestionario que nos ayude a leer de forma sistemática, el artículo o tra- bajo de que se trate y a crear las destrezas y los hábitos de hacerlo. Ésta es la propuesta que hacemos como colofón de nuestro trabajo (Tabla VIII). Para es- to, hemos diseñado un cuestionario, adaptando y modificando los desarrollados por CASPe (47, 48). Algunas de las preguntas están tomadas, literalmente, de estos cues- tionarios, así como la estructura de agrupamiento de las mismas, para responder a tres cuestiones básicas: ¿son válidos los resultados del trabajo?, ¿cuáles son los resulta- dos?, ¿pueden aplicarse estos resultados en mi medio? El cuestionario propuesto puede verse en la Tabla VIII. Las preguntas que se incluyen, están diseñadas para ayudar a realizar, de forma sistemática, la lectura crítica de un artí- culo científico que estudie el pronóstico o el tratamiento basados en el análisis de su- pervivencia. Sin duda, pueden existir puntos de interés en el artículo concreto que no estén contem- plados aquí, y así será frecuentemente. Este cuestionario sólo pretende ser una ayuda. El resto debe ponerlo el lector, mediante el trabajo individual y de grupo. Esto es lo que hace que el cuestionario mejore con el tiempo, hasta ser realmente útil. Ese sería nues- tro deseo. BIBLIOGRAFÍA 1. Pozo F, Ricoy JR, Lázaro P. Una estrategia de investigación en el Sistema Nacional de Salud: I. La epidemiología clínica. Med Clin (Barc) 1994; 102: 664-9. 2. Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic Research. Principles and Cuantitative Methods. New York: Van Nostrand Reinhold; 1982. 3. Hosmer DW, Lemeshow S. Applied Survival Analysis: Regression Modeling of Time to Event Data. New York: John Wiley & Sons; 1999. 4. Clark TG, Bradburn MJ, Love SB, Altman DG. Survival analysis part I: basic concepts and first analyses. Br J Cancer 2003; 89: 232-8. 130 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 130
  • 143.
    5. Pérez deVargas A, Abraira Santos V. Bioestadística. Madrid: Centro de Estudios Ramón Areces; 1996. 6. Abraira Santos V, Pérez de Vargas A. Métodos multivariantes en Bioestadística. Madrid: Centro de Estudios Ramón Areces; 1996. 7. Kleinbaum DG. Survival Analysis: a self-learning text. New York: Splinger-Verlag; 1996. 8. Casariego E, Abraira V, Corredoira JC, Alonso García MP, Rodríguez Feijoo A, López Álvarez MJ, Varela Otero J, Coira Nieto A, Rabuñal R, Rigueiro MT. A predictive mo- del for mortality of bloodstream infections. Bedside analysis with the Weibull func- tion. J Clin Epidemiol 2002; 55: 563-72. 9. Abraira V. Estimación: intervalos de confianza. SEMERGEN 2002; 28: 84-5. 10. Pocock SJ, Clayton TC, Altman DG. Survival plots of time-to-event outcomes in clini- cal trials: good practice and pitfalls. Lancet 2002; 359: 1686-9. 11. Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part II: multivariate da- ta analysis—an introduction to concepts and methods. Br J Cancer 2003; 89: 431-6. 12. Harrell FE. Regression Modeling Strategies with Applications to Linear Models, Logistics Regression, and Survival Analysis. New-York: Springer; 2001. 13. Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part III: multivariate data analysis — choosing a model and assessing its adequacy and fit. Br J Cancer 2003; 89: 605-11. 14. Peduzzi P, Concato J, Feinstein AR, Holford TR. Importance of events per indepen- dent variable in proportional hazards regression analysis. II. Accuracy and precision of regression estimates. J Clin Epidemiol 1995; 48: 1503-10. 15. Silva Ayçaguer LC, Barroso Utra I. Selección algorítmica de modelos en las aplicacio- nes biomédicas de la regresión múltiple. Med Clin (Barc) 2001; 116: 741-5. 16. Justice AC, Covinsky KE, Berlin JA. Assessing the generalizability of prognostic in- formation. Ann Intern Med 1999; 130: 515-24. 17. Altman DG, Royston P. What do we mean by validating a prognostic model? Stat Med 2000; 19: 453-73. 18. Verweij PJM, van Houwelingen HC. Cross-validation in survival analysis. Stat Med 1993; 12: 2305-14. 19. Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Clinical Epidemiology. Boston: Little, Brown and Co. (2 ed) 1991. 20. Khan IH, Catto GR, Edward N, Fleming LW, Henderson IS, McLeod AM. Influence of coexisting disease on survival on renal-replacement therapy. Lancet 1993; 341: 415-8. 21. Miskulin DC, Athienites NV, Yan G, Martin A, Ornt DB, Kusek JW, Meyer KB, Levey AS. Comorbidity assesment using the index of coexistent diseases in a multicenter clinical trial. Kidney Int 2001; 60: 1498-510. 22. Wolfe RA, Ashby VB, Milford EL, Ojo AO, Ettenger RE, Agodoa LYC, Held PJ, Port FK. Comparison of mortality in all patients on dialysis awaiting transplantation and recipients of a first cadaveric transplant. New Eng J Med 1999; 341: 1725-30. 131 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 131
  • 144.
    23. Gill JS,Abichandani R, Kausz AT, Pereira BJ. Mortality after kidney transplant fai- lure: the impact of non-immunologic factors. Kidney International 2002; 62(5): 1875-83. 24. Matas AJ, Gillingham KJ, Sutherland DER. Half-life and risk factors for kidney trans- plant outcome. Importance of death with function. Transplantation 1993; 55: 757- 61. 25. Tarshish P, Bernstein J, Tobin JN, Edelmann CM. Treatment of mesangiocapillary glomerulonephritis with alternate-day prednisone, A report of International Study of Kidney Diseases in Chlidren. Pediatr Nephrol 1992; 6: 120-3. 26. Hariharan S, Jonson CP, Bersnahan BA, Taranto SE, McIntosh MJ, Stablein D. Improved Graft Survival after Renal Transplantation in the United States 1988 to 1996. New Eng J Med 2000; 342: 605-12. 27. Wing AJ, D’Amaro J, Lamm LU, Selwood N. Evolving methodologies in computeri- zed European Registries. Kidney International 1983; 24: 507- 15. 28. Gjertson DW, Terasaki PI. The large center variation in half-life of kidney transplanta- tion. Transplantation 1992; 53: 357-62. 29. Thorogoog J, Houwelingen JC, Persijn GG, Zantvoort FA, Schreuder GM, Van Rood JJ. Prognostic indices to predict survival of first and second renal allografts. Transplantation 1991; 831-6. 30. Guttmann RD. The Graft Survival Curve: Ideology and rhetoric. Trasnsplant. Proc 1992; 24: 2407-10. 31. Fernández M, Abraira V, Quereda C, Ortuño J. Curvas de supervivencia y modelos de regresión: errores y aciertos en la metodología de aplicación. Nefrología 1996; 26: 383-90. 32. Clark TG, Bradburn MJ, Love SB, Altman DG. Survival Analysis. Basic concepts and first analyses. Br J Cancer 2003; 89: 232-8. 33. Van Manen JG, Korevaar JC, Dekker FW, Boeschoten EW, Bossuyt PM, Krediet RT. How to adjust for comorbidity in survival studies in ESRD patients: a comparison of different indices. Am J Kidney Dis. 40(1): 82-8. 34. Charlson M, Szatrowski TP, Petreson P, Gold J. Validation of a Combined Comorbidity Index. J Clin Epidemiol 1994; 47: 1245-51. 35. Hammelgan BR, Manns BJ, Quan H, Ghali WA. Adapting the Charlson Comorbidity index for use in patients with ESRD. Am J Kidney Dis 2003; 42: 125-32. 36. Van Dick PCW, Jager KJ, de Charro F, Collart R, Cornet FW, Dekker W, Grönhagen- Riska, Kramar R, Leivestad T, Simpson K, Briggs JD. Renal replacement therapy in Europe: the results of a colaborative effort by the ERA-EDTA registry and six natio- nal or regional registries. Nephrol Dial Trasplant 2001; 16: 1120-30. 37. ERA-EDTA Registry. www.era-edta-reg.org 38. Researcher´s Guide. www//usrds.org/research.htm 39. Mc Donald SP, Russ GR, Kerr PG, Collins JF. ESRD in Australia and New Zealand at the end of Milenium: a report from ANZDATA registry. Am J Kidney Dis 2002; 40: 1122-31. 132 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 04 4/10/04 12:48 Página 132
  • 145.
    40. Anzdata AnnualReports. www.anzdata.org.au/anzdata/AnzdataReport 41. Wolfe RA, Strawderman RL. Logical and Statistical Fallacies in the Use of Cox Regression Models. Am J Kidney Dis 1996; 27: 124-9. 42. Matas AJ, Gillingham KJ, Sutherland DER. Half-life and risk factors for kidney trans- plant outcome. Importance of death with function. Transplantation 1993; 55: 757-60. 43. Hutchinson TA, Thomas DC, Lemieux JC, Harvey CE. Prognostically controlled com- parison of dialysis and renal transplantation. Kidney International 1984; 26: 44-51. 44. Port FK, Wolfe RA, Mauger EA, Berling DP, Jiang K. Comparison of survival probabi- lities for dialysis patients vs. cadaveric transplantation. JAMA 1993; 270: 1339-43. 45. Wolfe RA, Ashby VB, Milford EL, Ojo AO, Ettenger RE, Aggoda LYC, Held PJ, Port FK. Comparison of mortality in all patients on dialysis awaiting transplantation and recipients of a first cadaveric trasplant. New E J Med 1999; 341: 1725-30. 46. Clark TG, Altman DG, De Stavola BL. Quantification of the completeness of follow- up. Lancet 2002; 359: 1309-10. 47. CASP España (CASPe). www.redcaspe.org 48. Lupacis A, Wells G, Richardson WS, Tugwell P. User´s Guides to the medical litera- ture; how to use an article about prognosis. JAMA 1994; 272: 234-7. 133 CURVAS DE VIDA Y SUPERVIVENCIA Cap 04 4/10/04 12:48 Página 133
  • 146.
    149 DE LAS BASESDE DATOS A LOS PROGRAMAS ESTADÍSTICOS J. C. Ruiz San Millán INTRODUCCIÓN La realización de un trabajo de investigación de cualquier tipo consiste en la resolución de una cuestión, planteada a priori (hipótesis nula), en base al análisis exhaustivo de la información pertinente, información que deberá ser recogida, estructurada y analizada de manera correcta. Esto significa que uno de los primeros pasos necesarios en el proceso de investigación, será la definición de cuál es la información necesaria que se debe recoger para la resolu- ción, de forma fiable, de la cuestión o cuestiones que se pretendan resolver. Un diseño incorrecto de esta fase puede hacer que se planteen problemas difíciles de resolver a posteriori, que retrasen o incluso invaliden todo el proceso. El tiempo invertido en las fa- ses iniciales del diseño de un estudio es, por tanto, crucial para el éxito del mismo. Hoy en día, es habitual que cualquier Unidad de Trasplante tenga un cierto nivel de infor- matización en su actividad asistencial diaria, nivel que raramente llega al 100% pero que, en algunas unidades, cubre ya una parte considerable de la actividad. Esto supone que ya existe una base de datos, a veces con gran cantidad de información, que será la fuente inicial para la obtención de los datos que vamos a utilizar en el proceso de investigación. Es decir, cuando nos planteamos un trabajo de investigación, tendremos que partir de ce- ro (es decir, diseñar una base de datos específica para el trabajo e introducir los datos a mano desde el principio) si no existe una aplicación que funcione rutinariamente y en la que se vayan introduciendo datos día a día, y en cambio, en este último caso podremos exportar datos de esta aplicación a nuestra base de datos específica, para nuestro tra- bajo, lo que nos ahorrará probablemente una considerable cantidad de tiempo. Cap 06 4/10/04 12:50 Página 149
  • 147.
    150 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Es de considerable importancia tener en cuenta esta posibilidad, la de realizar trabajos de investigación, cuando se diseña la informatización de una unidad de trasplantes (o de cualquier otra) para que, en el futuro, sea posible un análisis óptimo de la informa- ción almacenada. Es decir, al diseñar una aplicación para la gestión de una unidad de trasplantes, se debe pensar tanto en su utilidad para la actividad asistencial diaria (crea- ción de informes, listados de pacientes, etc.), como en su utilidad para la realización de trabajos de investigación, es decir, para el análisis de los datos. Así, un buen diseño evi- tará quebraderos de cabeza en el futuro. Para hacer una mejor descripción del manejo de una base de datos y del proceso de transferencia de datos a un paquete estadístico, utilizaremos un gestor de bases de da- tos concreto, el MS Access en su versión 2000 y un paquete estadístico, el SPSS en su versión 8.0. Estas dos aplicaciones son probablemente las más utilizadas en su campo en el entorno médico, y por ello, son las más adecuadas para utilizar de ejemplo. En mu- chas ocasiones los métodos descritos con ellas serán fácilmente extrapolables a otras aplicaciones semejantes, dado que la mayoría utilizan herramientas y sistemas de trans- ferencia de información entre aplicaciones semejantes. GESTORES DE BASES DE DATOS Un gestor de bases de datos es un programa informático que permite crear y manejar bases de datos. Una base de datos es una aplicación creada por un gestor de bases de datos que permite almacenar dichos datos. En nuestro caso, un gestor de bases de da- tos es MS Access y una base de datos es una aplicación que nosotros creamos con MS Access, a la que daremos un nombre, por ejemplo “TrasplantesRenales”. En el caso de MS Access, las bases de datos son archivos con la extensión *.mdb, por tanto, nuestra base de datos se llamaría “TrasplantesRenales.mdb” (Figura 1). Existen otros gestores de bases de datos de uso personal, como FoxPro (de Microsoft también), Paradox (de Borland), dBase (de Borland también) o Filemaker (de Apple), aunque el más utilizado en la actualidad es MS Access. Para poder trabajar con una base de datos deberemos primero instalar el gestor de ba- ses de datos (MS Access), que habitualmente viene incluido en el paquete de ofimática MS Office. Posteriormente, ejecutando MS Access, podremos crear una base de datos (el contenedor de los datos) y, dentro de ella, la estructura de tablas en las que irán alo- jándose los datos. Es importante tener en cuenta la versión de MS Access con la que ha sido creada una base de datos, porque ésta no podrá ser abierta por una versión anterior de MS Access. Sin embargo, MS Access 2000 permite guardar una base de datos, crea- da con esta versión, en el formato de una versión anterior, para que pueda ser ejecutada con ella (en la ventana de Base de Datos en Access 2000 hacer clic en el menú superior en Herramientas – Utilidades de la base de datos – Convertir base de datos – A una ver- sión anterior de la base de datos de Access...). Cap 06 4/10/04 12:50 Página 150
  • 148.
    En ocasiones podremostrabajar con una aplicación desarrollada con MS Access por ter- ceros, pero que funciona sin, aparentemente, haber instalado previamente el gestor MS Access en el ordenador. Esto es posible porque existe una versión de MS Access para distribución de aplicaciones ya desarrolladas que se denomina MS Access Run-Time. En estos casos, recibiríamos una serie de disquetes o un CD en los que estarían incluidos la base de datos y todos los archivos necesarios para su ejecución (el Access Run-Time) que, con un programa de instalación creado al efecto, nos instalaría todo en el ordena- dor. Esto permite abrir la base de datos, visualizar y modificar los datos, pero no nos per- mitiría modificar la estructura de la base de datos, ni por supuesto crear una nueva. Para esto, debemos tener instalada la versión completa de MS Access. Gestores de bases de datos relacionales Las bases de datos relacionales se llaman así porque los datos no se almacenan en una única tabla o lista de casos (registros), como es el caso de las hojas de cálculo (que se 151 DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS Figura 1. En esta figura se muestra el gestor de bases de datos Microsoft Access (la ventana principal) y, en su interior, la base de datos creada que se llama Tras- plantesRenales, aún sin tablas en su interior. Una vez creada la base de datos, será necesario ir creando las diferentes tablas para almacenar los datos en su interior. Cap 06 4/10/04 12:50 Página 151
  • 149.
    podrían considerar comouna base de datos plana), sino que se guardan en múltiples ta- blas en función de los datos que queremos guardar y, después, se unen unas tablas con otras por medio de uno o varios campos. Esto tiene la ventaja de que no se repiten los datos, lo que supone que se trabaja menos, se ocupa menos espacio en la base de da- tos y existe menos riesgo de inconsistencia de los datos (es decir, que el mismo dato, por ejemplo el nombre de un paciente, introducido en dos sitios diferentes, es distinto, con la dificultad que esto implica a la hora de localizar todos los datos de ese paciente) (Figura 2). Esto se entiende bien con el siguiente ejemplo: si tenemos que guardar las determinaciones analíticas de los pacientes, lo correcto es crear una tabla llamada Pacientes (con aquellos datos del paciente que son siempre los mismos, como el nom- bre, la fecha de nacimiento, el número de historia, la dirección, etc.) y una segunda tabla con las determinaciones analíticas (llamada, por ejemplo, Bioquímica y que incluya los campos Glucosa, Urea, Creatinina, etc.). En esta segunda tabla tendremos que crear un campo que sirva de enlace con la tabla Pacientes para identificar a qué paciente corres- ponden esos análisis. Este campo puede ser el número de historia, el DNI, el número de tarjeta sanitaria u otro que identifique unívocamente al paciente (no es correcto utili- zar el nombre y/o los apellidos porque estos pueden tener más variabilidad). De esta for- ma, introduciremos una sola vez los datos del paciente en esta tabla y, después, creare- mos tantos registros como necesitemos en la otra tabla (Bioquímica) de forma que el campo de enlace sirva para localizar el resto de los datos del paciente en la tabla Pacientes y mostrarlos sin tener que volver a introducirlos (Figura 3). 152 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 2. En este caso se ha creado una tabla para introducir los datos de los pa- cientes y la bioquímica juntos. El nombre del mismo paciente ha tenido que ser te- cleado cuatro veces y no siempre de la misma forma (aunque todas sean correc- tas) con la dificultad que esto implica al intentar localizar todos los registros de ese paciente. Cap 06 4/10/04 12:50 Página 152
  • 150.
    Gestores de basesde datos profesionales Cuando se ha llevado a cabo un proceso de informatización en la Unidad de Trasplantes o en el Servicio de Nefrología o a nivel hospitalario, es frecuente que los datos estén al- macenados en una aplicación soportada por unos gestores de bases de datos a los que llamamos profesionales, como pueden ser SQL Server, Oracle, Informix, etc., de admi- nistración más compleja. En estos casos, el acceso a los datos “en bruto” suele estar más restringido y, en general, administrado por el Servicio de Informática del hospital o, al menos, por personal más especializado. 153 DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS Figura 3. En esta imagen se aprecia cómo hemos creado dos tablas, una para guar- dar los datos de los pacientes y otra para las bioquímicas. Posteriormente, hemos creado una relación entre ambas tablas, utilizando el DNI como campo de enlace (es el único dato que hay que introducir de forma repetida). Esta relación nos per- mite, además, garantizar la integridad de los datos entre ambas tablas (integridad referencial). Esto supone que no se puede crear un registro en la tabla Bioquímica si no hay uno relacionado en la tabla Pacientes, y que no se puede borrar un regis- tro en la tabla Pacientes si tiene registros relacionados en la tabla Bioquímica (ya que quedarían huérfanos). Cap 06 4/10/04 12:50 Página 153
  • 151.
    En estos casos,deberíamos solicitar que nos exportaran los datos que necesitamos en un formato más manejable, como por ejemplo, en una hoja de cálculo de Excel (si son datos sencillos) o en una base de datos de Access (si son datos procedentes de varias tablas), a partir de la que nosotros ya podremos trabajar. Deberíamos hacer un listado de los datos que queremos recuperar, para que la persona responsable de la base de datos realice la exportación de la o las tablas (o de los campos de las tablas) que necesi- temos. Una vez que tengamos esto, trabajaremos ya con nuestra propia base de datos, sobre la que añadiremos más datos y, finalmente, realizaremos la exportación al paque- te estadístico para el análisis final. TRABAJAR CON ACCESS Como hemos dicho, MS Access es una base de datos relacional convencional de uso personal (o de usuario final), similar a la mayoría de los gestores de bases de datos de uso personal que existen hoy en día, aunque hay que reconocer que las últimas versio- nes, aparecidas en los últimos años, incluyen tal cantidad de funcionalidades y tal nivel de potencia que, realmente, las convierten en gestores muy sofisticados, capaces de soportar bases de datos de gran volumen, hasta con cientos de miles e incluso millones de registros en una tabla. El objetivo, como ya hemos dicho, a la hora de realizar un trabajo de investigación, será la estructuración de todos los datos que vayamos a necesitar para solucionar el proble- ma que nos plantea nuestro proyecto. Lo habitual es que hayamos conseguido capturar una parte de los datos de la aplicación de trabajo habitual de la Unidad o del hospital, pe- ro muy raramente conseguiremos el 100% de los datos necesarios. En un segundo pa- so, tendremos que evaluar qué datos nos faltan y añadir a nuestra base de datos los campos o las tablas que hagan falta para añadir estos datos, en general, a mano. Nuestra base de datos puede ser de pequeño tamaño, quizás con una única tabla conte- niendo unas cuantas decenas de registros, o puede tener un tamaño considerable, con gran número de tablas de gran tamaño, con miles de registros. En el primer caso, será sencillo transferir estos datos a SPSS para el análisis estadístico pero, en el segundo, tendremos que trabajar algo más una vez introducidos todos los datos, antes de transfe- rirlos al programa de análisis estadístico. En este segundo caso, es probable que nos in- terese hacer selecciones parciales de los datos contenidos en nuestra base de datos, pa- ra ir exportándolos en partes al SPSS e ir haciendo los análisis que consideremos. Para este proceso utilizaremos las consultas de MS Access. Esta es una herramienta de gran potencia que permite, de forma extremadamente sencilla, seleccionar datos (consultar) de entre los contenidos en una o varias de las tablas de la base de datos y obtener una vista de los mismos que podremos guardar, imprimir, exportar, copiar, etc. Permite aplicar multitud de condiciones del tipo “entre esta fecha y esta otra”, “los ca- 154 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 06 4/10/04 12:50 Página 154
  • 152.
    sos con estecampo mayor que este valor”, etc., bien de forma sumatoria (y) o de forma excluyente (o). Para realizar una consulta hay que ir al menú principal de la base de da- tos que está a la izquierda en la ventana y hacer clic en Consultas, debajo de Tablas, y después hacer clic en Crear una consulta en vista diseño, a la derecha. Nos aparecerá una ventana con todas las tablas de la base de datos para que seleccionemos las tablas que queremos incluir en la consulta, las cuales se irán colocando en la parte superior de la consulta. Posteriormente, podremos ir construyendo la consulta, seleccionando los campos de cada tabla que queremos que aparezcan en la misma (haciendo doble clic en cada campo se irán colocando en la parte inferior de la consulta). Finalmente, podremos añadir los criterios (condiciones) en cada campo, si es que queremos introducir alguno, y el orden de aparición de los registros (Figura 4). De esta forma, obtenemos vistas par- ciales sobre la totalidad de nuestros datos que nos pueden ayudar considerablemente en la evaluación y el manejo de los mismos. 155 DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS Figura 4. Hemos creado una consulta de selección utilizando datos de las tablas Pacientes y Bioquímica. De la primera tabla hemos seleccionado los campos Nombre, PrimerApe y SegundoApe y de la segunda tabla el campo Creatinina, y hemos puesto la condición de que nos muestre únicamente los registros en los que ésta sea mayor de 1,5 mg/dL. Al ejecutar la consulta, obtendremos un listado con los casos seleccionados, que aparecerán seleccionados por orden alfabético del primer apellido y después del segundo. Cap 06 4/10/04 12:50 Página 155
  • 153.
    156 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Análisis de datos con MS Access En muchas ocasiones se pueden realizar estudios estadísticos básicos con MS Access sin necesidad de exportar los datos a un paquete estadístico, lo cual simplifica el proce- so. Esto es posible utilizando las consultas de Access. Esto tiene la ventaja adicional de que, una vez realizada una consulta en MS Access (y guardada) que nos devuelva un re- sultado con parámetros estadísticos, siempre que se ejecute dicha consulta, estará ana- lizando los datos directamente de la base de datos y, por tanto, cuando añadamos o mo- difiquemos datos, los resultados estarán siempre actualizados. Para realizar este tipo de análisis se utilizan un tipo especial de consultas, que se deno- minan consultas de agrupamiento. En estas consultas se realiza un análisis de los datos seleccionados agrupándolos según una serie de órdenes sencillas. Una vez creada una consulta de selección, como explicábamos en el apartado anterior, podemos convertirla en una consulta de agrupamiento, seleccionando la opción adecuada en el menú supe- rior (Ver – Totales) o bien, haciendo clic en el botón Totales en la barra de botones, re- presentado por el símbolo Σ (sigma). Esto añade una nueva opción en la parte inferior de la vista de diseño de la consulta, denominada Total, y que nos permite realizar una serie de funciones nuevas entre las que están el cálculo de promedios, la desviación es- tándar, el máximo y el mínimo, la cuenta de registros y otros que añaden una funcionali- dad considerable a Access, sin tener que transferir los datos a SPSS. Transferencia de datos de MS Access a SPSS Existen varias formas de transferir los datos que queremos analizar a la aplicación de análisis estadístico que vamos a utilizar. La más sencilla consiste en copiar todos los da- tos, desde una vista de los mismos, en la base de datos, y pegarlos en la hoja de datos de SPSS. Este es el sistema más sencillo y quizás el adecuado para una pequeña canti- dad de datos. Consiste en abrir una hoja de datos de Access, ya sea una tabla o una consulta, y seleccionar los registros (filas) que queremos copiar. Si queremos copiar to- dos los registros iremos al menú Edición y haremos clic en la opción Seleccionar todos los registros para, posteriormente, en el mismo menú (Edición) hacer clic en Copiar (Figura 5). Ya tendremos los datos copiados para después ir a SPSS y pegarlos. Para es- ta segunda parte ejecutaremos SPSS, con lo que nos aparecerá la ventana de edición de datos (SPSS Data Editor) con una hoja de datos vacía. Colocando el ratón sobre la pri- mera celda (superior izquierda) y haciendo clic en el botón derecho del mismo, seleccio- naremos la opción Pegar con lo que nos pegará todos los datos que habíamos copiado en el mismo orden en el que estaban en la hoja de datos de Access. Sin embargo, este sencillo método tiene algunos problemas que hay que conocer: • Los nombres de los campos no son los originales, sino que SPSS llama a los mis- mos de forma estándar como var00001, var00002, var00003, y así sucesivamente. Cap 06 4/10/04 12:50 Página 156
  • 154.
    Estos nombres sepueden cambiar por los originales, pero habrá que hacerlo a ma- no, uno a uno (colocando el ratón sobre el nombre de un campo y haciendo clic en el botón derecho y seleccionando la opción Define Variable). • La primera fila de las copiadas aparecerá vacía y, realmente, los datos de nuestro pri- mer registro en Access aparecerán en la segunda fila en SPSS. La primera fila se deberá eliminar (seleccionando la primera fila, haciendo clic con el botón derecho del ratón en el botón de la izquierda donde pone 1 y seleccionando Cut). • Finalmente, los campos de texto (no numéricos) de Access aparecerán vacíos pues, por defecto, SPSS crea campos numéricos. Para evitar esto, antes de proceder a pe- gar los datos, habría que redefinir, en SPSS, las variables que vayan a recibir datos de tipo texto. Para ello, haciendo clic en el título de una variable con el botón derecho del ratón y seleccionando Define Variable, procederíamos a cambiar el tipo de varia- ble (Change Settings – Type), cambiando la opción Numeric por String (Figuras 6 y 7). Una segunda forma de transferir los datos es su exportación a un formato de datos fá- cilmente reconocible por SPSS, como puede ser Excel (*.xls) o dBase (*.dbf). En este caso, en Access procederemos a abrir la hoja de datos y, posteriormente, haremos clic en el menú superior Archivo y Exportar. Aparecerá un cuadro de diálogo en el que espe- 157 DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS Figura 5. Para copiar los datos de una tabla o consulta en Access abra la hoja de datos correspondiente, haga clic en el menú Edición y después en Seleccionar to- dos los registros. Aparecerán todos seleccionados (en negro) y después, de nuevo en Edición, haga clic en Copiar. Cap 06 4/10/04 12:50 Página 157
  • 155.
    cificaremos el nombredel archivo en el que se exportarán los datos, el formato de ex- portación (dBase, Excel, etc.) y el directorio en el que queremos guardar el archivo (es importante fijarse en este directorio para después recuperar el archivo desde SPSS). De esta forma, una vez exportados los datos, se creará un archivo en el disco duro con la extensión correspondiente. Finalmente, desde SPSS será sencillo abrir dicho archivo, cuyo contenido con todos los datos aparecerá en la ventana de datos de SPSS. Para es- to, una vez abierta la aplicación y en la ventana de edición de datos de SPSS, iremos al menú Archivo (File) – Abrir (Open). Aparece de nuevo una ventana de diálogo en la que seleccionaremos el directorio en el que está el archivo y, haciendo doble clic en éste, se procederá a la importación de los datos. En este caso, aparecerán los nombres de los campos como en Access y no será preciso redefinir ninguna de las variables. Por último, existe una tercera forma de transferir datos desde Access a SPSS de forma directa, que es utilizando el controlador ODBC adecuado (acrónimo de Object Data Base Conectivity), que ahora explicaremos. Este es un sistema que permite la transferencia de datos entre diferentes entornos. Es una especie de subprograma que actúa de “tra- ductor de datos” y que permite la comunicación entre dos entornos diferentes, en nues- 158 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Figura 6. Aquí se aprecia cómo aparecen los datos pegados desde SPSS. Las varia- bles no tienen los nombres originales, deberemos cambiarlos para reconocerlas mejor. La primera fila deberá ser eliminada, las tres primeras variables deberían ser redefinidas como variables de texto (String) para que acepten datos de este ti- po y la cuarta como variable de fecha (Date), y después volver a copiar todos los datos de nuevo. Ver instrucciones en el texto. El resultado de estos cambios se aprecia en la Figura 7. Cap 06 4/10/04 12:50 Página 158
  • 156.
    tro caso entreAccess y SPSS. El ODBC es una función que se instala en Windows con múltiples aplicaciones, entre ellas SPSS, y una vez instalado, tiene la funcionalidad que estamos describiendo, manteniéndose aunque se desinstale la aplicación con la que se instaló. En este caso, no tendremos que exportar los datos de Access, ni copiarlos, sino que directamente, desde SPSS, procederemos a capturarlos de Access directamente. Para realizar este proceso, abriremos SPSS y, una vez en la pantalla del editor de datos, haremos clic en File – Database capture – New Query. Nos aparecerá un asistente que nos guiará en el proceso de la captura de los datos (Figura 8). En esta ventana, mostrada en la Figura 8, tendremos que crear un origen de datos (ha- ciendo clic en el botón Add Data Source), que son las especificaciones que le indicarán a SPSS cuál es la base de datos a la que vamos a acceder para capturar los mismos, en qué formato está (Access o de otro tipo) y el directorio en el que reside. También podre- mos especificar una contraseña, en caso de que sea necesaria, para acceder a la base de datos. Una vez creado este origen de datos (Data Source), quedará grabado en el or- denador indefinidamente, de forma que, si hay que volver a capturar datos de esa base de datos, no será preciso definir el origen de los mismos. Es más, esta definición nos podrá servir igual si pretendemos acceder a esa base de datos desde otra aplicación di- ferente de SPSS, que utilice también ODBC (un estándar hoy en día). 159 DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS Figura 7. Resultado de copiar los datos tras las transformaciones especificadas en el texto (Figura 6). Los nombres de algunos campos ha sido preciso reducirlos da- do que SPSS acepta un máximo de ocho caracteres en el nombre de estos, aunque aún se reconocen sin problemas. Cap 06 4/10/04 12:50 Página 159
  • 157.
    160 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Figura 8. Este es el asistente que nos guiará en el proceso de captura de los datos de Access para su inclusión en la hoja de edición de datos de SPSS. Figura 9. En esta ventana aparecen los datos de configuración del origen de datos que estamos definiendo para capturar los datos de la base de datos de Access de- nominada TrasplantesRenales.mdb, que creamos previamente como ejemplo. Cap 06 4/10/04 12:50 Página 160
  • 158.
    Por tanto, paracrear el origen de datos haremos clic en el botón Add Data Source. Nos aparecerá una ventada denominada ODBC Data Source Administrador. Seleccio- naremos la opción User DSN y después haremos clic en el botón Add..., para añadir el nuevo origen de datos. En la siguiente ventana nos pide que elijamos el driver adecua- do, en nuestro caso el Driver de Microsoft Access (puede aparecer en diferentes idio- mas, en principio esto no es importante), aunque podríamos elegir otro para acceder a 161 DE LAS BASES DE DATOS A LOS PROGRAMAS ESTADÍSTICOS 1. Si participa en el diseño de una base de datos, para informatizar el trasplante, piense siempre en el análisis de los datos a la hora de estructurar la información. 2. A la hora de plantear un trabajo de investigación haga un análisis lo más detallado posible de la información que necesitará. Si lo hace bien le ahorrará mucho trabajo posteriormente. 3. Cree una base de datos e importe todos los datos que ya estén almacenados en otras bases de datos de la unidad que le puedan ser de utilidad. 4. Estructure la base de datos en tablas y cree relaciones entre ellas. 5. No introduzca espacios en los nombres de los campos y, a ser posible, no pase de 8 caracteres. Al exportar a SPSS esta aplicación sólo reconoce los 8 primeros caracteres del nombre del campo y, si es más largo, lo truncará. 6. Intente evitar los campos de texto libre, estos serán muy difícilmente analizables al final. Tendrá que hacer el esfuerzo de crear categorías y encajar los casos en un número limitado de éstas para poder analizarlas estadísticamente. 7. Introduzca todos los datos que necesite. Puede definir listas desplegables en los campos de las tablas para elegir directamente las opciones y no tener que teclearlas. Esto le ahorrará trabajo y reducirá el riesgo de errores. 8. Depure los datos. Busque los valores extremos de cada campo, realizando consultas y ordenando de forma ascendente o descendente. En muchas ocasiones se pueden detectar errores en la introducción de los datos que pueden dar resultados estadísticos erróneos. 9. Puede utilizar reglas de validación en Access para intentar evitar introducir datos erróneos que se alejen mucho de lo habitual (por ejemplo, la creatinina en sangre debería estar entre 0,5 y 20 mg/dL; un valor de 200 es un error seguro). 10. Cuando haya finalizado la introducción de los datos, haga la exportación al paquete estadístico para el análisis final de los datos. 11. Si hay que añadir o modificar datos, después de la exportación a SPSS, siempre es preferible hacerlo sobre la base de datos de Access y repetir la exportación tantas veces como haga falta. Es más seguro mantener los datos fuente actualizados en Access. Tabla I. Recuerde las normas básicas que le servirán para evitar problemas posteriores y facilitar el trabajo. Cap 06 4/10/04 12:50 Página 161
  • 159.
    una base dedatos en otro formato de la misma manera (dBase, etc.). Después, hare- mos clic en Finalizar y nos aparecerá una ventana nueva en la que tendremos que espe- cificar Data Source Name (un nombre elegido por nosotros) y, oprimiendo el botón Select, aparecerá un cuadro de diálogo en el que elegiremos la base de datos en cues- tión en su directorio (Figura 9). Una vez seleccionada la base de datos, haremos clic en OK dos veces y volveremos a la ventana del asistente de captura de datos (Database Capture Wizard), donde ya nos aparecerá el origen de datos que hemos creado con el nombre que le dimos. Posteriormente, haremos clic en Siguiente y nos aparecerán, en una ventana, las tablas y consultas de la base de datos con la que queremos trabajar y podremos elegir la tabla o tablas (o consultas) que queremos abrir en SPSS, para lo que arrastraremos la tabla a la casilla del lado derecho con el ratón. Al soltar, nos aparecerán los campos de dicha ta- bla y, haciendo clic en Finalizar, se traspasarán a la hoja de edición de datos del SPSS, pasando a estar disponibles para comenzar el análisis estadístico. A modo de compendio, a continuación exponemos en la Tabla I una relación de normas básicas que hemos podido ver en amplitud a lo largo del capítulo. 162 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 06 4/10/04 12:50 Página 162
  • 160.
    163 RESULTADOS DEL TRASPLANTE RENAL:ENSAYOS CLÍNICOS Y REGISTROS J. Pascual, D. Hernández ENSAYOS CLÍNICOS Concepto general y objetivos de un ensayo clínico. Nivel de evidencia El ensayo clínico (EC) es un estudio experimental planificado y prospectivo en el que se realiza una intervención que modifica el curso normal de los acontecimientos. A pesar de que la metodología de los EC es aplicable a diferentes intervenciones, es la realiza- ción de EC con medicamentos la que se encuentra más desarrollada y sometida a me- canismos de regulación más establecidos. El EC con medicamentos se realiza tanto en sujetos sanos como en pacientes para evaluar la eficacia y la seguridad de uno o varios procedimientos terapéuticos, profilácticos o diagnósticos. La definición legal de EC con medicamentos está reflejada en el artículo 59 de la Ley 25/1990 del Medicamento y en el artículo 2 del Real Decreto 56/1993 sobre EC con medicamentos (Tabla I). Es imprescindible definir, inicialmente, el objetivo u objetivos del EC que se plantea por- que ellos determinarán, en gran medida, el diseño más adecuado para alcanzar conclu- siones válidas. Los objetivos principal y secundarios del EC definen la razón que justifica su realización. El objetivo principal debería ser único y responder a la pregunta más rele- vante, y condicionará la elección de la variable principal y el cálculo del tamaño de la muestra. Una vez definido el objetivo u objetivos del EC, éste se desarrolla siguiendo un esquema básico que incluye, entre otros, la identificación de una muestra de sujetos a partir de una población, la asignación de los sujetos a uno u otro grupo de intervención, Cap 07 4/10/04 12:51 Página 163
  • 161.
    164 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL la aplicación de las intervenciones objeto de estudio y la medida de los resultados. En cualquiera de estos niveles existe la posibilidad de introducir sesgos o errores sistemáti- cos que pueden dificultar la interpretación del investigador sobre la eficacia de las dife- rentes intervenciones. De todos estos aspectos nos ocuparemos posteriormente. La medicina basada en la evidencia (MBE) nos permite analizar las mejores aportaciones científicas procedentes de estudios contrastados y relevantes, con el fin de obtener los mejores resultados en el diagnóstico y tratamiento de las enfermedades. La MBE nos per- mite optimizar la práctica clínica mediante la aplicación de argumentos científicos consoli- dados. A partir de la calidad científica de los distintos estudios científicos, se han estableci- do escalas de jerarquía lideradas por los meta-análisis y los EC (Tabla II). Con esta referen- cia, se han elaborado Guías de Práctica Clínica que contemplan niveles decrecientes de evidencia en función de la relevancia científica de dichos trabajos (Tabla III). Simplificando, un nivel de evidencia A, B o C tendría como sustrato un meta-análisis (o en su defecto un EC controlado), un EC no controlado o un estudio observacional, respectivamente. Artículo 2. Definición de ensayo clínico con medicamentos 1. De acuerdo con el artículo 59 de la Ley 25/1990 del Medicamento, se considera ensayo clínico toda evaluación experimental de una sustancia o medicamento, a través de su aplicación a seres humanos, orientada hacia alguno de los siguientes fines: a. Poner de manifiesto sus efectos farmacodinámicos o recoger datos referentes a su absorción, distribución, metabolismo y excreción en el organismo humano. b. Establecer su eficacia para una indicación terapéutica, profiláctica o diagnóstica determinada. c. Conocer el perfil de sus reacciones adversas y establecer su seguridad. 2. Se considerará siempre evaluación experimental aquel estudio en el que los sujetos sean asignados a uno u otro grupo de intervención terapéutica de forma aleatoria, o bien se condicione, directa o indirectamente, el proceso de prescripción médica habitual. 3. Se considerará siempre evaluación experimental aquel estudio en que se utilice una sustancia no autorizada como especialidad farmacéutica o bien se utilice una especialidad farmacéutica en condiciones de uso distinto de las autorizadas. 4. No se considera ensayo clínico la administración de la sustancia o medicamento a un solo paciente en el ámbito de la práctica médica habitual con el único propósito de conseguir un beneficio para el mismo, de acuerdo con lo previsto en el artículo 23 de este Real Decreto referente al uso compasivo de medicamentos. La práctica médica y la libertad profesional de prescripción del médico no ampararán, en ningún caso, ensayos clínicos no autorizados, ni la utilización de remedios secretos o no declarados a la autoridad sanitaria. Tabla I. Definición legal de ensayo clínico con medicamentos (Real Decreto 561/1993). Cap 07 4/10/04 12:51 Página 164
  • 162.
    Clasificación de losEC. Población del estudio y asignación Conceptualmente, sólo las tecnologías eficaces pueden ser efectivas, pero la eficacia en sí misma no es suficiente para alcanzar la efectividad. A título de ejemplo, disponemos de inmunosupresores muy eficaces en el arsenal terapéutico del trasplante renal. Sin embargo, si no se administran adecuadamente o el diagnóstico de rechazo no es pre- coz, estos fármacos no tendrán efectividad. Con estas premisas, Schwartz y Lellouch propusieron, en 1967, una clasificación de los EC de acuerdo a sus objetivos: 1) EC ex- plicativos, que son los que intentan demostrar la eficacia en el ser humano, partiendo de experimentos previos en animales y corresponden a los EC en fase I y II; y 2) EC prag- máticos, que intentan demostrar la efectividad y constituyen los EC en fase III y IV. En la Tabla IV se muestran las diferencias más importantes entre estos dos tipos de EC. En base a los objetivos planteados, los EC se pueden clasificar según la fase de desarro- llo del fármaco que se investiga (Tabla V). El ensayo en fase I constituye el primer paso en la investigación de un fármaco en humanos, principalmente orientados a proporcio- 165 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS 1. Meta-análisis de ensayos clínicos controlados aleatorizados. 2. Ensayos clínicos controlados aleatorizados de muestras grandes. 3. Ensayos clínicos controlados aleatorizados de muestras pequeñas. 4. Ensayos prospectivos controlados no aleatorizados. 5. Estudios de cohortes. 6. Estudios de casos y controles. 7. Series clínicas no controladas. 8. Estudios de vigilancia epidemiológica (registros y bases de datos). 9. Estudios descriptivos. 10. Casos clínicos. Tabla II. Nivel de evidencia científica en orden decreciente. Nivel Evidencia Tipo de estudio A Existe adecuada evidencia Meta-análisis para recomendar Ensayo controlado aleatorizado (uno grande o varios pequeños) B Existe cierta evidencia Ensayo controlado no aleatorizado para recomendar C Existe insuficiente evidencia Estudio observacional para recomendar Tabla III. Guías de práctica clínica en función de la calidad científica de los estudios. Cap 07 4/10/04 12:51 Página 165
  • 163.
    nar información sobrelos efectos y seguridad del fármaco que se evalúa. Se realizan ge- neralmente en voluntarios sanos y, con menos frecuencia, en pacientes. Los ensayos de fase II se realizan en pacientes con el objetivo de obtener información preliminar so- bre la eficacia de un fármaco, establecer la relación dosis-respuesta, y ampliar los datos de seguridad obtenidos en la fase I. El ensayo en fase III responde al modelo de ensayo clínico controlado, cuyo objetivo principal es la confirmación de la eficacia de un nuevo 166 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Explicativos Pragmáticos Intervención Standarizada Individualizado (dosis y periodos fijos). (dosis y periodos flexibles). Tratamiento concomitante Tratamiento concomitante controlado. según práctica habitual. Criterios inclusión Homogéneos. Todos los pacientes Muchos criterios exclusión. susceptibles. Diseño Énfasis en igualar los Énfasis en buscar beneficio predictores de la variable máximo. resultado. Variables estudio Con significado fisiológico. Con significado clínico. Medida variable Enmascaramiento. Con o sin enmascaramiento. Análisis datos Exclusión complicados. Analiza según intención de tratar. Tabla IV. Diferencias más significativas entre los EC explicativos y pragmáticos. Objetivos Sujetos Diseño Duración Fase I Farmacocinética. Voluntarios sanos Abierto o ciego. Breve Farmacodinamia. (n = 30-100) Controlado o 9-18 meses Seguridad. no controlado. Fase II FC, FD, seguridad. Pacientes Abierto o ciego. 1-3 años Búsqueda de dosis. (n = 100-400) Controlado o Eficacia preliminar. no controlado. Fase III Eficacia. Pacientes Ensayo clínico 1-4 años Indicaciones. (n>1.000) controlado. Fase IV Nuevas indicaciones, Pacientes Aleatorizado. Producto en el condiciones, etc. (n = 5000) Observacional. mercado. Tabla V. Ensayos clínicos según la fase de desarrollo del fármaco que se investiga. Cap 07 4/10/04 12:51 Página 166
  • 164.
    tratamiento en comparacióna un tratamiento utilizado habitualmente en la indicación evaluada. El desarrollo de esta fase es necesario para conseguir el registro y la comer- cialización de un medicamento. Los ensayos en fase IV son los que se realizan después de la comercialización del fármaco y pueden estar dirigidos a evaluar diversos objetivos: eficacia en nuevas indicaciones, nuevas condiciones de uso además de las autorizadas (pauta o vía de administración), efectividad y seguridad en la práctica habitual, etc. En la identificación de los sujetos candidatos a participar en el ensayo, la fuente de re- clutamiento (población general, pacientes ambulatorios u hospitalizados, etc.) y la espe- cificación de los criterios de inclusión y exclusión pueden ser determinantes de la repre- sentatividad y homogeneidad de la muestra. Cuando se establecen unos criterios de se- lección muy restrictivos, la muestra de sujetos es muy homogénea, pero será represen- tativa únicamente de un determinado subgrupo de la población, y los resultados o con- clusiones obtenidos a partir de estos ensayos pueden tener limitaciones en su aplica- ción en la población de referencia u otras poblaciones (validez externa). La selección de las variables que serán utilizadas para evaluar los fenómenos observa- dos en el ensayo, condicionan también la posibilidad de generalizar a la población las conclusiones del estudio. Además, si se utilizan medidas que representen adecuada- mente a las variables seleccionadas, se aumentará la probabilidad de que las conclusio- nes del estudio describan realmente los hallazgos derivados de la intervención realizada (validez interna). De lo comentado anteriormente se deduce que los EC deben aportar dos premisas inexcusables para respaldar con firmeza sus propias conclusiones: calidad y validez (interna y externa). De no ser así, incurriremos en lo que conocemos como los sesgos de los estudios controlados, que distorsionarán sistemáticamente los resulta- dos reales. Obviamente, la validez de un EC constituye la piedra angular de la calidad y, de una manera práctica, los criterios de validez interna se basan en un diseño correcto y en un óptimo manejo de los resultados mediante el análisis según “la intención de tra- tar”. Este planteamiento minimizará los sesgos y las diferencias observadas serán, sin duda, reflejo inequívoco de la intervención terapéutica realizada. Con estas condiciones, los EC deben ser potencialmente reproducibles y generalizables (validez externa). En otras palabras, deben aplicarse en otras circunstancias y en otras poblaciones, que constituye en definitiva el fin primordial de los EC. La evaluación de una variable está sometida a la influencia de la variabilidad debida al observador, al sujeto sometido a la intervención y al instrumento de medida. Las varia- bles objetivas o “duras” (como la mortalidad, la tensión arterial, la diuresis, etc.) son re- producibles de un sujeto a otro y de un observador a otro. Las variables subjetivas o “blandas” (como la sensación dolorosa, el estado de ánimo, etc.) son más difícilmente reproducibles y están sometidas a variabilidad de percepción. La objetividad puede ser optimizada reduciendo el grado de vinculación del observador a la medida y mejorando la estructura del instrumento de medida. 167 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 167
  • 165.
    Es frecuente quese utilicen variables intermedias o indirectas (surrogate end points) en sustitución de una variable clínicamente relevante, ya que son, en general, más fácil- mente medibles o identificables. Deben ser de fácil medida, plausibles biológicamente, predictivas de la evolución de la enfermedad y que su modificación, como respuesta a la intervención, se traduzca en un efecto sobre la variable clínica de interés (ejemplos en Tabla VI). El número de sujetos o el tamaño de la muestra que se ha de incluir, será definido en función de la variable de medida que se haya seleccionado, como la principal, para eva- luar el objetivo propuesto. Este número depende de diversos factores: • Magnitud de las diferencias que se quieren poner de manifiesto en la comparación. • Homogeneidad de la muestra, que confiere mayor probabilidad de detectar pequeñas diferencias, ya que existe menos variabilidad o desigualdad entre los grupos. • Probabilidad de afirmar, después de la evaluación de los resultados, que existen dife- rencias entre los grupos de tratamiento cuando en realidad éstas no existen (error tipo I o α). • Probabilidad de afirmar que no existen diferencias entre los grupos, cuando en reali- dad éstas existen (error tipo II o β). El EC controlado es el mejor método para demostrar la eficacia de un nuevo fármaco en el tratamiento de una determinada enfermedad y, salvo en situaciones excepcionales, debe demostrarse por comparación con un grupo de referencia o control que sea con- currente en el tiempo y en el espacio. La comparación de cualquier tratamiento con un grupo control contribuye a reducir o a eliminar la influencia de los factores que se rela- cionan con la propia enfermedad, como su evolución temporal o el manejo habitual de la enfermedad. El grupo control o de referencia puede estar sometido o no a una interven- ción, y dicha intervención puede ser un tratamiento farmacológico activo o inactivo (pla- cebo) o un tratamiento o intervención no farmacológica. Es posible que, en casos con- cretos, se utilicen controles históricos o retrospectivos, comparando los resultados del tratamiento evaluado con la experiencia de pacientes similares en el pasado, pero en 168 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Enfermedad Variable intermedia Variable primaria de interés Glaucoma Presión intraocular Pérdida de visión Diabetes Glucemia Morbilidad y mortalidad por complicaciones Cardiopatía isquémica Colesterol Riesgo cardiovascular Hipertensión arterial Presión arterial Riesgo cardiovascular Tabla VI. Ejemplos de variables intermedias o indirectas. Cap 07 4/10/04 12:51 Página 168
  • 166.
    general se consideraimprescindible la existencia de un grupo control concurrente para realizar una verdadera comparación. Para poder evaluar una comparación de dos tratamientos o intervenciones, no sólo es necesaria la concurrencia en el tiempo, sino que se deben utilizar las medidas necesa- rias para asegurar que los grupos son comparables o lo más parecidos posibles respec- to a los factores de importancia pronóstica, con la excepción evidente de la intervención a la que son sometidos. Existen múltiples factores (curso imprevisible de las enferme- dades, variabilidad en la respuesta, poder del efecto placebo, sesgo del observador o del observado) que condicionan una gran dificultad en la obtención de grupos iguales. Sin embargo, la asignación o distribución aleatoria, con el propósito de evitar o reducir al máximo los posibles sesgos derivados del proceso de selección de los participantes, permite reducir las diferencias entre los grupos comparados. La asignación aleatoria tie- ne como objetivo la obtención de una distribución homogénea de las características ba- sales de los sujetos, requiere un tamaño de muestra suficiente, así como la utilización de un buen método de aleatorización que no permita prever la secuencia de los trata- mientos. La selección del diseño del EC se ha de realizar en base a los objetivos. El ensayo con grupos paralelos es el más común y puede ser aplicable en la mayoría de situaciones. En ellos, los sujetos son asignados aleatoriamente a una u otra intervención durante el mismo periodo de tiempo. En los ensayos cruzados, los sujetos reciben de forma con- secutiva cada una de las intervenciones (experimental y control), y el sujeto se convier- te en su propio control. Este diseño se debería limitar a ensayos que evalúan enferme- dades crónicas y estables, y requiere frecuentemente la inclusión de un periodo de la- vado para evitar los efectos residuales. Instrumentos de medida y desarrollo El enmascaramiento o carácter ciego de un ensayo clínico es una medida o precaución fundamental para evitar los sesgos de valoración por parte de los implicados en el ensa- yo (sesgo del observador o del observado), que resulta en el desconocimiento del trata- miento asignado. El enmascaramiento se considera casi indispensable cuando las varia- bles de medida tienen un carácter subjetivo o cuando el conocimiento del paciente del tratamiento asignado puede condicionar el incumplimiento o abandono del estudio. Cuando no es posible enmascarar al investigador y al paciente (diseño doble ciego) pue- de realizarse una valoración de los resultados por un evaluador que desconoce el trata- miento que ha recibido cada paciente (evaluación ciega por terceros). El carácter ciego del ensayo no está indicado si implica riesgos innecesarios para el paciente, si puede perjudicar la relación entre médico y paciente, si no es posible disponer de una formula- ción galénica adecuada, y si los efectos farmacológicos permiten identificar fácilmente, como mínimo, uno de los fármacos estudiados. 169 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 169
  • 167.
    170 MÉTODOS ESTADÍSTICOS ENEL TRASPLANTE RENAL Algunos aspectos destacables sobre el desarrollo del ensayo son los referentes al se- guimiento de los pacientes e interpretación de los resultados. Para un seguimiento ade- cuado de los sujetos del ensayo, se debe evitar la sobrevaloración o infraestimación de los beneficios de una intervención y la invalidación de los resultados. Por ello es nece- sario, además de realizar una planificación de visitas y pruebas complementarias, definir y evaluar las pérdidas que se producen durante el mismo. Es importante especificar la circunstancia que conlleva la pérdida de un paciente durante el seguimiento. Generalmente, se distingue entre las pérdidas que se producen por la propia voluntad del sujeto a continuar en el ensayo (abandono o drop-outs) y las que se deben a circuns- tancias no relacionadas tan directamente con la voluntad del paciente (retiradas o with- drawal), como la aparición de acontecimientos adversos, la falta de eficacia y el incum- plimiento del tratamiento, entre otros. En algunos ensayos clínicos se define específica- mente la falta de eficacia o la aparición de acontecimientos adversos como criterios de retirada de los sujetos. Entre las posibles actuaciones a seguir, con posterioridad a es- tos acontecimientos, se incluyen la elección de recibir la otra intervención del ensayo, o bien, otros tratamientos de rescate. El análisis de los resultados se puede realizar con todos los sujetos incluidos según la intervención a la que fueron asignados de manera aleatoria al inicio del ensayo (es lo que se denomina análisis por intención de tratar) o realizarlo sólo con los sujetos que ha- yan recibido realmente la intervención (análisis por protocolo o de casos válidos). Generalmente, se considera más válida la realización de un análisis por intención de tra- tar, debido a que generalmente las pérdidas que se producen durante el desarrollo de un ensayo, no suelen producirse al azar, y si no son excluidas del análisis, se mide real- mente la efectividad de la intervención evaluada. Pero se debe tener en cuenta que, en casos justificados, se acepta la utilización de un análisis por protocolo. Posteriormente al análisis, en la interpretación de los resultados, es fundamental la dis- tinción entre una diferencia estadísticamente significativa y clínicamente significativa. Una diferencia puede ser significativa desde el punto de vista estadístico, pero tener es- caso valor clínico. La extrapolación y la aplicación de los resultados de los ensayos clínicos a la práctica clí- nica habitual, para la toma de decisiones relativas a la prescripción o aplicación de una intervención en pacientes determinados, es compleja. La dificultad de la aplicación prác- tica de los resultados se debe, en gran medida, a las diferencias que existen entre las condiciones, en las que se realizan los ensayos clínicos, y las de la práctica habitual. Entre ellas, se incluye el número limitado de sujetos expuestos a la intervención evalua- da antes de que ésta esté disponible en el mercado, la corta duración de los tratamien- tos, la escasa validez externa de los resultados, la falta de información en determinadas poblaciones (como sujetos de edad avanzada, población pediátrica, mujeres, pacientes con enfermedades en estadios menos evolucionados o comorbilidad, tratamientos múl- Cap 07 4/10/04 12:51 Página 170
  • 168.
    tiples), etc. Poreste motivo, se debe distinguir entre eficacia (grado en que una deter- minada intervención produce un resultado beneficioso en el contexto de un ensayo clí- nico controlado) y efectividad (grado en que una intervención origina un resultado bene- ficioso en las condiciones de la práctica habitual) de una intervención, conceptos ya co- mentados con anterioridad. Zonas “oscuras” de los EC Principios éticos de la investigación clínica Los EC son poderosas herramientas clínicas que tienen una gran influencia en las deci- siones clínico-terapéuticas de la práctica médica habitual. Al mismo tiempo, conllevan un importante despliegue de recursos económicos que induce a pensar que pudieran desarrollarse con fines básicamente comerciales. Todo ello implica que los EC deben llevarse a cabo bajo estrictas normas éticas de práctica clínica, y que organismos e insti- tuciones sanitarias competentes velen por la integridad de estos estudios. Los códigos éticos, considerados históricos (Código de Nuremberg y Declaración de Helsinki), fueron elaborados a partir de la Segunda Guerra Mundial a consecuencia de diferentes episodios desgraciados de experimentación en humanos, que pusieron de manifiesto la necesidad de regular la investigación clínica. El Código de Nuremberg (1947) es un documento centrado, principalmente, en los derechos de los sujetos que participan en una investigación, y establece el consentimiento del sujeto como un ele- mento esencial en la investigación en humanos. La Declaración de Helsinki fue aproba- da en 1964 por la Asamblea Médica Mundial con el propósito de autorregular la ética de la investigación en humanos, basándose en la integridad moral y las responsabilidades del médico. En Edimburgo, en el año 2000, se realizó el cambio más relevante de este documento a lo largo de su historia, con el objetivo de aproximar los postulados éticos a la nueva situación de la medicina y la investigación clínica. El Informe Belmont fue elaborado en 1978 por la Comisión Nacional para la Protección de las Personas Objeto de Experimentación Biomédica y de la Conducta, en el seno del Congreso de los Estados Unidos, para crear un documento que sirviera de base para la elaboración de una regulación federal sobre la investigación clínica. Se considera que el Informe Belmont incorpora el concepto más moderno de la investigación clínica, esto es, que la práctica médica debe ser evaluada a partir de datos objetivos y evaluados con un método científico y lógico, y no a partir de un método empírico basado en la expe- riencia personal. En este documento se definen los principios básicos de la bioética, a partir de los cuales se puede “formular, criticar e interpretar reglas o normas específicas de aplicación práctica de investigación clínica en seres humanos”: el principio de respe- to por las personas o de autonomía, la beneficiencia (posteriormente relacionado con el principio de no maleficiencia) y la justicia. 171 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 171
  • 169.
    El consentimiento informadoes la aplicación práctica de uno de los principios básicos de la bioética, el principio de autonomía, por el cual el sujeto debe ser capaz de tomar sus propias decisiones. Además, es un requisito legal que, en España, se encuentra de- finido en el Real Decreto 561/1993 sobre EC con medicamentos. Se considera que, pa- ra que el consentimiento informado sea válido, debe ser comprendido, competente (le- galmente) y voluntario. La información se debe dar al sujeto de manera que se ajuste a su capacidad de comprensión en cuanto a cantidad, contenido y forma de presentación. A este respecto, la última revisión de la Declaración de Helsinki (Edimburgo, 2000) in- corpora la necesidad de que el investigador se asegure de la comprensión de la infor- mación por parte del paciente. Actualmente existe la duda, documentada por múltiples estudios, de si los pacientes llegan a entender la información que reciben acerca del es- tudio en el que participan. Por otro lado, el carácter voluntario del consentimiento puede ser vulnerado por una presión externa, más o menos intencionada, pero que tiene, co- mo resultado final, la limitación de la libertad y, en definitiva, la autonomía del sujeto: la persuasión (inducción a aceptar libremente, por parte del sujeto, una opinión determina- da), la manipulación (modificación de manera intencionada de la percepción de las alter- nativas posibles para el sujeto) y la coerción (presión al sujeto con amenazas para lograr un objetivo). Estos elementos pueden surgir de la propia relación desigual que se esta- blece, habitualmente, entre el médico y el paciente, así como de otros factores, como por ejemplo, la limitación del tiempo para la toma de decisiones. Los Comités Éticos de Investigación Clínica (CEIC) son los encargados de ponderar los aspectos metodológicos, éticos y legales de los protocolos de EC propuestos, así co- mo de hacer una valoración de los beneficios y riesgos. En nuestro país, la autoridad sanitaria competente de cada Comunidad Autónoma es la que acredita a los CEIC. Su composición es multidisciplinar y debe de incluir un mínimo de siete personas, de las cuales dos deben ser ajenas a la profesión sanitaria. Según el Real Decreto 561/1993, los CEIC deben evaluar la idoneidad de los protocolos de EC y del equipo investigador, así como la información escrita que se entrega a los pacientes, comprobar la previsión de la compensación y tratamiento que se ofrecerá a los sujetos en caso de lesión o muerte, atribuibles al ensayo, conocer y evaluar el alcance de las compensaciones que se ofrecerán a los investigadores y a los sujetos de la investigación por su participación y, finalmente, realizar el seguimiento del EC desde su inicio hasta la recepción del in- forme final. Una de las premisas, que deben de cumplir los EC aleatorizados, es que exista una duda razonable sobre la relación beneficio/riesgo que se puede obtener con cada una de las opciones comparadas. La aplicación de esta premisa no es una tarea fácil y la selección del control más adecuado puede ser un dilema ético y científico. Por razo- nes éticas, el grupo control debe recibir el mejor tratamiento disponible y el ensayo debe comparar tratamientos que a priori no difieran aparentemente en su efectividad global. 172 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 172
  • 170.
    Está enormemente extendidoy es bien conocido el uso de placebo en la investigación clínica. El placebo es una sustancia desprovista de acción farmacológica que se prescri- be o administra para complacer a un paciente. En determinadas circunstancias y, princi- palmente, por razones científicas (por ejemplo, evitar posibles sesgos en la valoración de la eficacia de una estrategia terapéutica) es recomendable incluir un grupo tratado con placebo en un EC. Por otro lado, la necesidad de los EC, con un grupo tratado con placebo, viene condicionada en muchas ocasiones por los requerimientos de los orga- nismos reguladores que exigen este tipo de estudios para la autorización de un medica- mento en una determinada indicación. La utilización del placebo ha sido objeto de mucho debate en la comunidad científica: los códigos éticos establecen que el médico debe tratar al paciente con el mejor trata- miento disponible. Así, la Declaración de Helsinki refiere que “los posibles beneficios, riesgos, costes y eficacia de todo procedimiento nuevo deben ser evaluados mediante su comparación con los mejores métodos preventivos, diagnósticos y terapéuticos exis- tentes. Ello no excluye que pueda usarse un placebo, o ningún tratamiento, en estudios para los que no hay procedimientos preventivos, diagnósticos o terapéuticos proba- dos“. Una lectura más o menos estricta de este punto es el eje de las controversias que ha habido con relación con el uso del placebo, como grupo control en ensayos clínicos. No hay dudas cuando el ensayo evalúa un tratamiento para una enfermedad en la que no hay una estrategia probada. Sin embargo, incluso en las ocasiones en las que sí exis- te un tratamiento de referencia, puede haber dudas en lo que significa que un trata- miento se considere que está probado o que sea de referencia. Para superar estas situaciones, en las que se plantea la duda sobre la utilización del place- bo, es decir, cuando se disponga de un tratamiento activo para la enfermedad estudiada, se han propuesto estrategias en cuanto al diseño del ensayo clínico que permitan evitar caer en la violación de los principios éticos de la investigación clínica: limitar la duración del en- sayo clínico a un periodo de tiempo inferior al considerado en que la enfermedad evaluada pueda ocasionar un daño irreversible, establecer unos criterios de retirada del paciente por falta de eficacia, definir un tratamiento de rescate adecuado o utilizar el placebo en la eva- luación de un tratamiento añadido al tratamiento de referencia. En definitiva, se trata de es- trategias para evitar que la participación del sujeto en el ensayo no le suponga un incre- mento del riesgo de daño irreversible para él. Al mismo tiempo, es imprescindible informar de manera adecuada al sujeto de las posibles consecuencias del tratamiento con placebo durante el periodo de tiempo que dure el estudio, así como respetar el derecho a retirarse del estudio en cualquier momento y recibir posteriormente el tratamiento estándar. Aspectos legales de los ensayos clínicos La realización de EC con medicamentos está regulada por diferentes organismos nacio- nales e internacionales. A nivel europeo, el organismo responsable de la regulación de 173 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 173
  • 171.
    los medicamentos esla Agencia Europea de Evaluación de Medicamentos (European Medicines Evaluation Agency, EMEA), que depende de la Dirección General de Industria de la Unión Europea y de la Comisión Europea, pero son los Estados Miembros los que retienen las competencias de la regulación de ensayos clínicos. Las normas de buena práctica clínica son un conjunto de condiciones que debe cumplir un ensayo clínico para asegurar que se ha efectuado siguiendo un protocolo científica- mente adecuado, respetando los derechos de los sujetos incluidos en el mismo y ga- rantizando la validez de los datos y resultados obtenidos. La tendencia actual se acerca cada vez más a una mayor uniformidad de estas normas y de las legislaciones naciona- les en el área de los medicamentos. La Conferencia Internacional de Armonización (ICH) es un organismo que fue creado en 1989 por la industria farmacéutica y las autoridades reguladoras de los Estados Unidos, Europa, Japón y Canadá. El objetivo de este orga- nismo es elaborar documentos de carácter técnico que sirvan como directrices para la investigación y el desarrollo de nuevos fármacos, y que dichas directrices sean acepta- das por las autoridades reguladoras, como guía para la industria farmacéutica en la ela- boración de la solicitud de registro de un nuevo fármaco. Las agencias reguladoras de los medicamentos en los Estados Unidos y Europa, Food and Drug Administration (FDA) y EMEA han aceptado las normas ICH como base para la elaboración de los ensa- yos clínicos con medicamentos. También es importante destacar la existencia de un co- mité científico asesor de la EMEA, que entre otras, tiene como funciones la elaboración de documentos guía para la investigación clínica de medicamentos en distintas situacio- nes o patologías (Committee of Proprietary Medicinal Products, CPMP). A pesar de lo anteriormente expuesto, las normas que regulan los ensayos clínicos en los distintos países europeos tienen particularidades que dificultan la utilización de crite- rios comunes para la realización de los estudios multicéntricos en Europa. Por ello, re- cientemente ha sido desarrollada y publicada la Directiva 2001/20/CE que trata, entre otros aspectos, de simplificar y armonizar las disposiciones administrativas relativas a los ensayos clínicos multicéntricos. Con esta directiva se pretende dar un impulso a la investigación clínica europea, reduciendo el plazo necesario para iniciar los ensayos clí- nicos multicéntricos. Las disposiciones recogidas en la directiva deberían haberse publi- cado en los Estados Miembros, antes del 1 de mayo de 2003, y estar en funcionamien- to no más tarde del 1 de mayo de 2004. En España, actualmente, la investigación clínica con medicamentos está regulada por el título III de la Ley 25/1990 de 20 de diciembre del Medicamento, desarrollada por el Real Decreto 566/1993 de 16 de abril, por el que se establecen los requisitos para la re- alización de ensayos clínicos. Más recientemente, después de la constitución de la Agencia Española del Medicamento (organismo autónomo adscrito al Ministerio de Sanidad y Consumo, que tiene, entre las múltiples funciones atribuidas por la legislación vigente, la de evaluar, autorizar o limitar los ensayos clínicos y estudios y ensayos com- 174 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 174
  • 172.
    plementarios), ha sidodesarrollada la circular número 15/2001, que contiene la aplica- ción del Real Decreto 561/1993 de 16 de abril. Esta circular tiene por objetivo unificar, en un sólo documento, las instrucciones existen- tes sobre investigación clínica con medicamentos y aclarar aspectos que son motivo fre- cuente de consultas a la Agencia Española del Medicamento. Las principales disposicio- nes, contenidas en el Real Decreto y la posterior circular, hacen referencia, entre otras, a consideraciones generales y a principios básicos de los ensayos clínicos con medicamen- tos, así como las responsabilidades del promotor del ensayo, del investigador y del moni- tor, las atribuciones de los CEIC, las Comunidades Autónomas y la Agencia Española del Medicamento (algunas de ellas ya han sido comentadas previamente en este texto). Es importante mencionar, específicamente, algunos de los aspectos prácticos que define el Real Decreto, y que hay que tener en cuenta durante la planificación y la realización de un ensayo clínico: protocolización, aseguramiento y autorización de un ensayo clínico. • Las características de un ensayo clínico se deben definir íntegramente en un protoco- lo al cual se ajustará la realización del ensayo (Título I, Artículo 8). Se define como proto- colo el documento que establece la justificación del estudio, objetivos, diseño, metodo- logía, análisis previsto de los resultados, así como las condiciones bajo las cuales se desarrollará el ensayo (Tabla VII). 175 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Artículo 8. Protocolización de un ensayo clínico 1. Resumen. 2. Índice. 3. Información general. 4. Justificación y objetivos. 5. Tipo de ensayo clínico y diseño del mismo. 6. Selección de los sujetos. 7. Descripción del tratamiento. 8. Desarrollo del ensayo y evaluación de la respuesta. 9. Acontecimientos adversos. 10. Aspectos éticos. 11. Consideraciones prácticas. 12. Análisis estadístico. Anexo I. Cuaderno de recogida de datos. Anexo II. Manual del investigador. Anexo III. Procedimientos normalizados de trabajo. Anexo IV. Memoria analítica de las muestras a realizar. Tabla VII. Apartados básicos de un protocolo de ensayo clínico (Real Decreto 561/1993). Cap 07 4/10/04 12:51 Página 175
  • 173.
    • De acuerdocon el Real Decreto 561/1993, los ensayos clínicos, que evalúan productos en fase de investigación clínica (no comercializados) o nuevas indicaciones de medica- mentos ya autorizados, o cuando se realizan en situaciones en las que no existe interés terapéutico para el sujeto del ensayo (como los ensayos realizados en voluntarios sanos), sólo podrán realizarse si previamente se ha concertado un seguro que cubra los daños y perjuicios que pudieran derivarse de la participación del sujeto en el ensayo. Dicho segu- ro debe ser contratado por el promotor del ensayo. • Antes de iniciar un ensayo clínico, éste debe haber sido autorizado por el CEIC co- rrespondiente y por la Dirección General de Farmacia y Productos Sanitarios (actual- mente, Agencia Española del Medicamento). La solicitud de autorización debe ser realizada por el promotor del ensayo y el investigador principal y será acompañada del protocolo del ensayo, el compromiso del investigador, el correspondiente infor- me del CEIC y la conformidad del director del centro donde vaya a realizarse dicho ensayo. Papel de la industria farmacéutica Los EC pudieron desarrollarse, con fines esencialmente comerciales, debido al gran impacto económico que conllevan. En efecto, la empresa que desarrolla un medica- mento, puede tener importantes intereses económicos en la promoción del mismo. Pero, ¿este apoyo económico inclina la balanza hacia unos resultados del EC más fa- vorables para la compañía farmacéutica? Una revisión sistemática de 30 trabajos, pa- trocinados por la industria entre 1996 y 2002, reveló que hubo una tendencia a que los resultados de los EC fuesen publicados en revistas científicas con menor factor de impacto o en algunos simposium sin control de calidad. Asimismo, los resultados finales eran mayoritariamente favorables a la industria farmacéutica en cuestión. En esta misma línea, otro estudio investigó el sesgo de las múltiples publicaciones o pu- blicaciones selectivas. El resultado fue que los EC con efectos significativos y rele- vantes fueron publicados en una sola revista con gran factor de impacto, lo que no ocurrió en los EC con resultados más débiles, que fueron publicados parcialmente en diferentes revistas de menor calidad científica. Más aún, muchos de los EC con re- sultados negativos no son publicados y se quedan en el camino tras un gasto innece- sario de recursos humanos y económicos. La explicación a todo ello no es sencilla, pero la realidad es que enciende una luz sobre la existencia de posibles sesgos siste- máticos en la interpretación de resultados de los EC promovidos por la industria far- macéutica. Análisis fármaco-económicos Clásicamente, la utilización de un medicamento se ha basado en los datos de eficacia y seguridad que aportaban los resultados de un EC sobre dicho medicamento. En la ac- 176 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 176
  • 174.
    tualidad, además delos datos de eficacia, hay que tener en cuenta parámetros de efi- ciencia, esto es, la relación entre los recursos consumidos y los resultados clínicos ob- tenidos. En otras palabras, la incorporación de los análisis fármaco-económicos en los protocolos de los EC, va a permitir disponer de los datos de eficiencia para racionalizar la política de precios de un fármaco y su inclusión en los petitorios de los centros sani- tarios. Sin menoscabo de intentar una práctica médica de excelencia, esta política nos ayudará, sin duda, a tomar las decisiones clínicas más adecuadas. Dado que la inclusión de estudios fármaco-económicos en los EC supone una carga de trabajo adicional, derivado de la recogida de información extra del EC, se debe racionali- zar la incorporación de estos estudios fármaco-económicos en dichos EC. A efectos prácticos, es recomendable la inclusión de análisis fármaco-económicos en aquellos EC que cumplan los siguientes requisitos: 1) EC pragmáticos con un diseño correcto; 2) EC con datos fiables y con potenciales beneficios clínicos; 3) EC con cálculo del tamaño muestral; 4) EC con empleo sistemático de un fármaco control; 5) cuando se quiera mi- nimizar costes o realizar un estudio de coste-beneficio; y 6) cuando se requiera explici- tar los autores del EC, la fuente de financiación y la relación contractual entre ambos. Todo ello supondrá, también, una valiosa ayuda para las autoridades sanitarias a la hora de financiar un medicamento y decidir su incorporación en los formularios y guías de práctica clínica. Publicación de resultados de ensayos clínicos: Declaración CONSORT Para comprender los resultados de un EC controlado, aleatorizado, los lectores deben entender su diseño, desarrollo, análisis e interpretación. El objetivo sólo puede alcan- zarse a través de la absoluta transparencia de los autores. A mediados de los años 90, dos iniciativas independientes para mejorar la calidad de la publicación de los resulta- dos de los EC controlados, condujeron a la publicación de la Declaración CONSORT (Consolidated Standards of Reporting Trials), desarrollada por un grupo de investiga- dores clínicos, estadísticos, epidemiólogos y editores y apoyada por multitud de revis- tas biomédicas y grupos editoriales, incluido el Comité Internacional de Editores de Revistas Médicas (en inglés ICMJE), que es el más conocido como Grupo de Vancouver. En 2001, se publicó la edición revisada y actualizada. CONSORT se basa en el seguimiento de una lista (check list) de 22 cuestiones (ítem) y un diagrama de flujo que debe seguirse para publicar, revisar y evaluar un EC aleatorizado. La declara- ción, la lista, el diagrama y una explicación muy detallada son accesibles en www.consort-statement.org. La lista incluye cuestiones sobre el título, el resumen, la introducción, los métodos, los resultados y los comentarios, seleccionadas en base a que la ausencia de publicación de aspectos esenciales de información se asocia con sesgos en la estimación del efec- 177 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 177
  • 175.
    to del tratamiento,su fiabilidad o la relevancia de los hallazgos. El diagrama de flujo de- talla los pasos que sigue cada participante incluido en un EC en cuatro estadios: inclu- sión, asignación de intervención, seguimiento y análisis. El diagrama incluye, de modo explícito, el número de participantes distribuidos según su grupo de intervención asig- nado, de modo que resulta sencillo comprobar que los autores publican un análisis por intención de tratar. Lectura crítica de un ensayo clínico Los problemas inherentes al diseño, desarrollo y publicación de los resultados de los EC, esbozados previamente, justifican la importancia que, para el clínico que desea es- tar bien informado, tiene una buena lectura crítica del ensayo clínico publicado. La sim- ple lectura o la revisión superficial de los resultados de un EC no permiten asimilarlos adecuadamente y pueden convertirse en fuente incesante de falsas evidencias. Una adecuada lectura crítica de un EC implica atender a seis cuestiones principales: 1) si el EC es controlado o no; 2) si es aleatorio; 3) si es enmascarado; 4) si detalla de mo- do consistente las variables clínicas de resultado; 5) el análisis estadístico; y, por fin, 6) las medidas del efecto. Aunque la MBE se sustenta en los hallazgos de las revisiones sistemáticas y el meta-análisis de ensayos clínicos controlados, aleatorizados, no debe olvidarse que la base del progreso del conocimiento, según la propia MBE, es el estu- dio de la mejor evidencia disponible que, en innumerables ocasiones, como se verá más adelante, no proviene de EC aleatorizados. Por tanto, el primer paso a la hora de valorar críticamente un EC, es observar si se trata de un EC controlado, aleatorizado (primer rasgo de calidad en la consideración de las evidencias de más alta calidad). Los EC controlados con controles históricos, no aleatorizados, contienen profundos sesgos potenciales y, en este sentido, se asimilan con los EC no controlados. La aleatorización elimina los inconvenientes de los estudios con controles históricos o no controlados, evita los sesgos de selección, equilibra los grupos con respecto a las variables deter- minantes del pronóstico y garantiza la validez de las pruebas estadísticas de significa- ción. Otro aspecto relevante es el enmascaramiento, que influye sobremanera en la naturaleza de los resultados. El EC doble ciego es mucho más fiable, al evitar el efecto placebo. El análisis de los resultados debe hacerse con todos los pacientes aleatorizados, con in- dependencia de si completaron el tratamiento –el ya referido análisis por intención de tratar. No hacerlo así implica violar el proceso de aleatorización e impedir sus efectos de reducir el sesgo de selección. Por otro lado, este análisis se acerca más a las condicio- nes de aplicación de los tratamientos estudiados a la vida real. Los pacientes, incluidos en las comparaciones terapéuticas, deben contabilizarse en el grupo al que fueron asig- nados. 178 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 178
  • 176.
    En la TablaVIII se resumen las preguntas básicas a las que debe responderse durante una lectura crítica adecuada de un EC, modificadas de Guyatt, Sackett y Cook. Revisiones sistemáticas y meta-análisis. La Declaración QUORUM Cualquier clínico sufre una auténtica inundación de información que, con demasiada fre- cuencia, no es manejable por cuestiones de tiempo y método si tenemos en cuenta que, cada año, se publican más de dos millones de artículos en más de 20.000 revistas biomédicas. Se necesitan resúmenes sistemáticos, sintetizados y, a la vez, completos con el fin de dar respuesta a las preguntas que los pacientes plantean y conocer el esta- do del conocimiento en la materia de que se trate, además de establecer la consistencia de las conclusiones de cada estudio por separado. Una revisión sistemática implica la elaboración previa de un diseño de investigación ob- servacional y retrospectivo para obtener evidencia válida sobre un tema concreto. Su marco de referencia es toda la investigación accesible sobre un tema, y la unidad de análisis los estudios primarios (originales) de investigación. En contraposición a la revi- sión tradicional, que acumula la información disponible sobre un tema habitualmente 179 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS ¿Son válidos los resultados del ensayo? (1) • ¿Se orienta el ensayo a una pregunta claramente definida? • ¿Fue aleatoria la asignación de los pacientes a los tratamientos? • ¿Fueron adecuadamente considerados hasta el final del estudio todos los pacientes que entraron en él? • ¿Se mantuvieron ciegos al tratamiento los pacientes, los clínicos y el personal del estudio? • ¿Fueron similares los grupos al comienzo del ensayo? • ¿Al margen de la intervención en estudio, los grupos fueron tratados de igual modo? ¿Cuáles son los resultados? • ¿Cómo fue el efecto del tratamiento? • ¿Fue precisa la estimación del efecto del tratamiento? ¿Pueden ayudarnos estos resultados? • ¿Pueden aplicarse estos resultados en tu medio local? • ¿Se tuvieron en cuenta todos los resultados de importancia clínica? • ¿Los beneficios a obtener justifican los riesgos y los costes? (1) Si la respuesta a las tres primeras es SÍ, merece la pena seguir contestando las siguientes. Tabla VIII. Preguntas para una adecuada lectura crítica de un ensayo clínico (modificadas de Guyatt, Sackett y Cook). Cap 07 4/10/04 12:51 Página 179
  • 177.
    amplio de modosubjetivo, y la interpreta, la revisión sistemática utiliza metodología ex- plícita y rigurosa para identificar, seleccionar críticamente y sintetizar los estudios rele- vantes que tratan de responder a una pregunta concreta. En la Tabla IX se resumen las diez preguntas básicas que pueden responderse en la lec- tura crítica de una revisión sistemática, y que constituyen el análisis fundamental de su fiabilidad. El valor de las revisiones sistemáticas es cada vez más reconocido y su publi- cación más frecuente. El meta-análisis es un tipo de revisión sistemática que utiliza metodología estadística para combinar y resumir los resultados de diversos estudios primarios o individuales. Es una revisión sistemática en cuyo resumen de resultados se detalla una síntesis estadís- tica. Su cuantificación constituye el resultado, que puede determinarse como riesgo re- lativo (RR), odds ratio (OR) o número de pacientes que será necesario tratar para obte- ner el efecto (NNT). La precisión de este resultado vendrá determinado por los interva- los de confianza (IC). Este tipo de análisis es útil en la toma de decisiones y puede servir de base para la elaboración de guías de práctica clínica, evaluaciones económicas o fu- turos planes de investigación. Una iniciativa internacional, denominada Colaboración Cochrane (www.cochrane.org), se ha desarrollado con el objetivo básico de preparar, mantener y diseminar resultados 180 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL ¿Son válidos los resultados de la revisión? (1) • ¿Se hizo la revisión sobre un tema claramente definido (población, intervención, control o comparación y resultados considerados)? • ¿Buscaron los autores el tipo de artículos adecuado? • ¿Crees que estaban incluidos los estudios importantes y relevantes? • ¿Crees que los autores de la revisión han hecho suficiente esfuerzo para valorar la calidad de los estudios incluidos? • Si los resultados de los diferentes estudios han sido mezclados para obtener un resultado “combinado”, ¿era razonable hacer eso? ¿Cuáles son los resultados? • ¿Cuál es el resultado global de la revisión? • ¿Fueron precisos los resultados? ¿Pueden ayudarnos estos resultados? • ¿Pueden aplicarse estos resultados en tu medio local? • ¿Se tuvieron en cuenta todos los resultados de importancia clínica? • ¿Los beneficios a obtener justifican los riesgos y los costes? (1) Si la respuesta a las dos primeras es SÍ, merece la pena seguir contestando las siguientes. Tabla IX. Preguntas para una adecuada lectura crítica de una revisión sistemática (modificadas de Oxman et al.). Cap 07 4/10/04 12:51 Página 180
  • 178.
    de revisiones sistemáticassobre los efectos de la atención sanitaria, con el fin de ayu- dar a tomar decisiones clínicas y sanitarias bien fundamentadas. La biblioteca Cochrane y sus bases de datos constituyen ya fuentes básicas de investigación clínica. Como en cualquier trabajo de investigación, particularmente debido a su naturaleza ob- servacional, el meta-análisis y su publicación puede presentar importantes sesgos. Después de la iniciativa de la Declaración CONSORT, se ha desarrollado la Declaración QUORUM (Quality of Reporting of Meta-Analysis), con el fin de mejorar la calidad de las publicaciones de los meta-análisis de ensayos clínicos controlados aleatorizados. El gru- po QUORUM está formado por 30 epidemiólogos, clínicos, estadísticos y editores, que en 1999 elaboraron: 1) su Declaración; 2) una lista (checklist) para guiar la mejor manera de presentar el resumen, la introducción, los métodos, los resultados y la discusión dis- tribuida en 21 apartados y sub-apartados sobre las búsquedas, selección, análisis de va- lidez, extracción de datos, características de los estudios y síntesis cuantitativa; y 3) un diagrama de flujo con el que aportar la información de los números de ensayos identifi- cados, incluidos y excluidos, y las razones para excluirlos. La lista y el diagrama son ac- cesibles en www.thelancet.com. El ensayo clínico en el trasplante renal Introducción La mayor parte de ensayos clínicos, realizados en los últimos años en el área de tras- plante de órganos, han tratado de profundizar en nuevas pautas de inmunosupresión. Han sido, por tanto, ensayos clínicos de intervención terapéutica con medicamentos, habitualmente inmunosupresores. Después de más de una década de protagonismo ca- si exclusivo de la ciclosporina como fármaco útil en la prevención del rechazo agudo del injerto, se han desarrollado nuevos fármacos que han requerido la demostración de efi- cacia y seguridad comparadas con las pautas clásicas. El desarrollo de estos nuevos fármacos se ha llevado a cabo con EC de alta calidad; la inmensa mayoría han sido ensayos controlados y, aunque rara vez se han controlado con placebo, la asignación a las nuevas pautas y a las pautas control se ha hecho de modo realmente aleatorio, con lo que se ha asegurado la distribución homogénea de las características basales de los sujetos. Las características de los fármacos ensaya- dos, que habitualmente se monitorizan según los niveles sanguíneos, ha impedido, en la mayor parte de los casos, un diseño doble ciego que hubiera descartado buena par- te de los sesgos que se aprecian en estos ensayos. Problemas de diagnóstico de la va- riable principal de eficacia –habitualmente rechazo agudo– y sesgos subjetivos de tra- tamiento más intenso y vigilancia más estrecha en los grupos de intervención con fár- macos nuevos son aspectos bien conocidos en estos ensayos que les han restado par- te de su fiabilidad. 181 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 181
  • 179.
    Otro de losproblemas evidentes que se derivan del análisis de los ensayos de los últi- mos años, en este área terapéutica, es que la población estudiada suele estar seleccio- nada de forma que se aplican de modo controlado las nuevas terapias a sujetos con es- casa morbilidad asociada y bajo riesgo de desarrollar rechazo agudo, representativos de un determinado subgrupo de población con los problemas de validación externa que ello acarrea. Pero el problema más importante que subyace en la mayoría de estos ensayos, es que el promotor de casi todos ellos ha sido la empresa farmacéutica encargada de la comer- cialización del producto ensayado. La ingente cantidad de recursos necesarios para la realización de ensayos clínicos, en gran número de enfermos, ha conducido a que sean muy escasos los ensayos clínicos promovidos por los propios médicos o por la adminis- tración. Esta situación ha conducido a que las bases de datos clínicos de los ensayos se encuentren en manos de esas empresas, los análisis de los resultados, las comunica- ciones a los congresos y las publicaciones de estos resultados estén dirigidas por sus departamentos médicos y el control de lo que se publica o no –y cómo– se decida en reuniones internas de las empresas, sin intervención definitiva de los investigadores. Por todo ello, resulta imprescindible el diseño y la ejecución de ensayos clínicos de alta calidad en trasplante de órganos, no sólo en inmunosupresión, sino en todo tipo de inter- venciones terapéuticas, promovidos por investigadores y por la propia administración, con autonomía respecto de la industria farmacéutica. Ensayos en los que, además de la eficacia y la seguridad de nuevos fármacos, se analice la efectividad y el coste-efectivi- dad de nuevas pautas de tratamiento, en contextos generales y en poblaciones no ses- gadas, con análisis de calidad de vida. Esta autonomía conducirá al análisis objetivo de los resultados y permitirá su divulgación científica fiable, superando las deficiencias ac- tuales. Evolución de las variables finales (end points) en trasplante renal El objetivo primario habitual de los ensayos de trasplante recientes, de fase II y III, pre- vios al registro de nuevos fármacos inmunosupresores, ha sido la incidencia de rechazo agudo del órgano durante un periodo de tiempo relativamente corto post-trasplante (de 3 a 12 meses según los casos), en el que el riesgo de esos episodios de rechazo es má- ximo. El propio diseño de los ensayos no ha permitido, en general, la consecución de objetivos primarios de eficacia más contundentes, como la supervivencia del injerto o del propio enfermo. La demostración de diferencias de supervivencia de injerto o enfer- mo, entre los fármacos nuevos en desarrollo y los clásicos, hubiera requerido muestras de estudio mucho más numerosas y periodos de seguimiento más prolongados. Paradójicamente, la continua mejoría en la supervivencia del injerto y el descenso pro- gresivo de la incidencia de rechazo agudo, dificultan el análisis adecuado de la eficacia 182 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 182
  • 180.
    de los nuevosinmunosupresores con estas variables finales convencionales. Los inves- tigadores responden ante esta nueva realidad con el diseño de nuevas variables finales, denominadas variables subrogadas, tales como función renal o marcadores histológi- cos. Sus ventajas e inconvenientes más relevantes se muestran en la Tabla X. Hariharan et al., en una reciente revisión, postulan superar la debilidad progresiva de las variables finales convencionales aisladas con la utilización de variables finales compuestas (com- posite end points), que pueden integrar variables convencionales, como rechazo agudo, pérdida del injerto o muerte, con nuevas variables predictivas, como función renal du- rante el primer año o marcadores histológicos de cronicidad. 183 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Variable final Ventajas Inconvenientes Variables convencionales Rechazo agudo Bien definible. Cada vez menos frecuente. Se correlaciona con Para ser fiable requiere biopsia. función posterior. Pérdida del injerto Es la variable más Muy poco frecuente a corto contundente. y medio plazo. Supervivencia del Gran contundencia. Se requiere largo seguimiento y injerto a 5 años volumen importante de enfermos. Variables a corto plazo que predicen supervivencia a largo plazo Creatinina sérica Simplicidad. Depende de múltiples factores: Reproducibilidad. edad, sexo, peso, talla, Predictor de función masa muscular, etc. posterior. Aclaramiento de Algo más exacto que El calculado depende de creatinina calculado la creatinina sérica fórmulas con validación. o medido aislada limitada. El medido depende demasiado de una adecuada recogida de orina. Filtrado glomerular Bastante exacta medida Costoso y dependiente medido con isótopos de función renal. del técnico. Histología: fibrosis, Gran correlación con Invasivo, costoso índice de cronicidad función a largo plazo. y poco reproducible. Variabilidad intra e inter-observador. Tabla X. Ventajas e inconvenientes de diversas variables finales empleadas en ensayos clínicos de trasplante renal. Cap 07 4/10/04 12:51 Página 183
  • 181.
    Áreas de investigaciónclínica en trasplante renal Posiblemente, la ausencia de consenso y la gran variabilidad en el manejo clínico del en- fermo trasplantado renal se deben al desequilibrio entre un elevado nivel de evidencia, en áreas como las estrategias encaminadas a la prevención del rechazo agudo, y otras como la nefropatía crónica del injerto o la enfermedad cardiovascular, que carecen de tal nivel de prueba. Tres de las áreas más relevantes, sobre las que es probable que deba profundizarse en la búsqueda de más evidencias, son: 1) el perfil de riesgo pre-trasplante del enfermo con in- suficiencia renal y las estrategias para su detección y manejo precoces; 2) la individualiza- ción y la optimización de la inmunosupresión inicial y de mantenimiento; y 3) la prevención y el manejo de las complicaciones a largo plazo del enfermo trasplantado, principalmente la nefropatía crónica y la enfermedad cardiovascular. Se han hecho diversos intentos de sistematizar las evidencias disponibles en las diversas áreas relacionadas con el trasplante renal, y un análisis profundo de las mismas excede los límites de este capítulo (ver Orofino y Pascual 1998, García López y Amenábar 2000, Hernández y García López 2003). REGISTROS Registros y estudios observacionales (EO) en el trasplante renal. Su necesidad Tradicionalmente, los EC constituyen el “patrón oro” de la evidencia en cuanto a las de- cisiones clínicas en la práctica médica habitual. Sin embargo, algunas razones justifican la necesidad de llevar a cabo grandes EO y complementarlos con los EC en el campo del trasplante renal. En general, la tasa de supervivencia de los injertos renales, tras el primer año del implante con las actuales terapias inmunosupresoras, ronda el 90%. Esto apunta a que los EC pue- den carecer del poder estadístico suficiente para detectar pequeñas diferencias en las ta- sas de supervivencia entre las distintas intervenciones terapéuticas. Por dicha razón y co- mo ya se ha comentado en la sección anterior, en muchos EC se emplean variables fina- les intermedias como la tasa de rechazos agudos o la función renal, obviando como objeti- vo primario la supervivencia del injerto a corto y medio plazo. Asimismo, los EC se realizan en pacientes muy seleccionados y en condiciones muy rigurosas, lo que puede alejarnos de la práctica clínica habitual. A título de ejemplo, los EC con los modernos inmunosupre- sores (anticuerpos monoclonales antiCD-25 o el sirolimus) en pacientes trasplantados muy seleccionados demuestran con un alto nivel de evidencia que disminuyen significati- vamente la tasa de rechazos agudos frente al grupo control. Sin embargo, no se ha obser- vado aún que estos fármacos sean capaces de prolongar, significativamente, la supervi- vencia del injerto, posiblemente por la falta de poder estadístico de los mismos. 184 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 184
  • 182.
    Por otra parte,existe una gran variabilidad en el manejo de muchos aspectos clínicos del trasplante renal. Ya se ha sugerido más arriba que esta falta de consenso en las de- cisiones diagnósticas y terapéuticas de estos pacientes se debe, en buena parte, a un importante cuerpo de evidencia en algunas áreas del trasplante renal (inmunosupresión inicial o la de mantenimiento), frente a otras como la nefropatía crónica del injerto o la enfermedad cardiovascular, que obviamente carecen de este respaldo científico. Con estas premisas se infiere que los EC y los EO (registros, bases de datos, etc.) deben complementarse en el campo del trasplante renal para el óptimo manejo clínico de es- tos pacientes. Los EO analizan el pronóstico de miles de pacientes, proporcionando una visión real de todos los factores comórbidos que pudieran afectar el pronóstico. La comorbilidad de cualquier entidad clínica, incluida el trasplante renal, puede modificar el curso de la pro- pia enfermedad y predecir el riesgo de muerte. En la actualidad, los EO y los grandes re- gistros constituyen los pilares en la elaboración de los diferentes índices de comorbili- dad. El importante número de pacientes que incluyen durante un largo seguimiento, re- presentan las bases de tal afirmación. Finalmente, la información que aportan los EO y los grandes registros es, en general, más fácilmente accesible para su posterior aplicación en el campo del trasplante renal. Por el contrario, la disponibilidad de toda la información de los EC queda restringida, en general, a los propios líderes del EC, las instituciones sanitarias o la industria farmacéutica. Análisis de datos de registros de trasplante: beneficios y limitaciones La utilidad de los registros y EO en el campo de los trasplantes debe ser entendida en el contexto de otros tipos de estudios clínicos y de las condiciones inherentes al propio proceso del trasplante. Por su carácter prospectivo, los EC constituyen un instrumento esencial para poner a prueba determinadas hipótesis en la investigación médica. Sin embargo, los EC tiene también sus propias limitaciones, derivadas principalmente de sus condiciones de estudio y de su incapacidad para detectar pequeñas, pero importan- tes, diferencias entre los grupos que se analizan. En la Tabla XI se muestran las diferencias más notables entre los EC y los EO que nos facilitarán el análisis crítico de cada uno de estos tipos de estudios, a la vez que nos ayu- darán a comprender las ventajas y limitaciones de los mismos. En general, los EC miden la eficacia de las intervenciones terapéuticas bajo condiciones muy controladas y en pacientes muy seleccionados. Sin embargo, la eficacia de un de- terminado tratamiento pudiera debilitarse en circunstancias donde el paciente no recibe la misma atención del EC durante un largo seguimiento. Por el contrario, los EO y los 185 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 185
  • 183.
    grandes registros analizanla efectividad en condiciones habituales de la vida real. De ahí, que los estudios retrospectivos pueden llegar a confirmar si los efectos testados previamente en EC, son aplicables a otras poblaciones y en otras circunstancias. Alternativamente, algunas hipótesis de estudio pueden haber nacido inicialmente de los EO, y han justificado la realización de un EC para su posterior confirmación. No obstan- te, algunos datos conflictivos, que nacieron de EO, no han sido confirmados posterior- mente por EC. De esto se deduce que los EO son muy vulnerables a factores de confu- sión (confounding factors), principalmente por la visión retrospectiva inherente al propio EO. Afortunadamente, existen rigurosas herramientas estadísticas (análisis de Cox, es- tudios de propensión, regresión logística, entre otros) que minimizan esta situación y proyectan a los EO y los grandes registros a los niveles más altos de la evidencia. 186 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Ensayos clínicos Estudios observacionales/registros Objetivo Medir la eficacia. Medir la efectividad. Condiciones controladas. Condiciones de vida real. Población Muy seleccionados. Población habitual con todas las de pacientes condiciones de la vida real. Criterios de Previos a la obtención Posteriores a la obtención de inclusión. de los datos. los datos. Randomización Tamaño de 75-200 por grupo Miles de pacientes en cada grupo. la muestra de tratamiento. Duración Generalmente 6-12 En general, más de 10 años. meses. A veces, con estudio extensión. Obtención Riguroso y global. Menos datos por paciente. de datos Enviados por otros centros. Datos de costes En general, puede Sólo disponible en algunos casos. ser recogido. Tipo de análisis Análisis de variables Análisis de regresión que miden finales (end points) el efecto independiente de pre-definidas en variables pronósticas. tiempos concretos. Accesibilidad Generalmente, disponible Mas fácilmente disponibles. para los líderes de los EC. Tabla XI. Diferencias más representativas entre los EC y los EO. Cap 07 4/10/04 12:51 Página 186
  • 184.
    Los criterios deinclusión y la aleatorización en los EC se aplican previamente a la obten- ción de los datos. Por el contrario, esto se realiza con posterioridad en los EO. El tama- ño de la muestra y la duración de los EC es notoriamente menor que en los EO, los cua- les analizan miles de pacientes durante diez o más años de seguimiento. Adicionalmente, una potencial ventaja de los EO es el efecto drop-out o la pérdida de in- formación de los pacientes durante los EC. Esto puede dar lugar a sesgos, sobrestima- ciones o infravaloraciones del efecto del tratamiento en dichos EC. Por último, en los EC se analizan variables finales predefinidas en tiempos específicamente determina- dos, mientras que en los EO se emplean potentes análisis de regresión (análisis de Cox y regresión logística) que detectan el efecto independiente de muchas variables pronós- ticas que influyen en la supervivencia. En cualquier caso, los investigadores necesitan conocer qué factores no pueden explicarse. Con todo, y a modo de parangón, los EO pueden representar “mares muy extensos, pero poco profundos”. En efecto, los EO recaban información muy valiosa de una ingente can- tidad de pacientes, pero frecuentemente no especifican ni pormenorizan los detalles de tal información. En cualquier caso, los EO, lejos de competir con los EC en la escala de evidencia, deben complementarse y aunar sus conclusiones para lograr el máximo rendi- miento en la aplicación de sus resultados en los pacientes portadores de un injerto renal. Tipos de EO. ¿Sabemos distinguirlos? Desde una visión global, la investigación clínica se divide en dos grandes grupos, de- pendiendo de si los investigadores asignan o no una determinada intervención: investi- gación experimental e investigación observacional (Figura 1). Obviamente, en la experi- mental la primera distinción que se debe plantear, es si el estudio fue aleatorizado o no, y si se ajustó a la práctica clínica habitual. En los EO, el primer planteamiento debe ser si utiliza o no un grupo comparativo o con- trol. Si así fuera, el estudio se denomina analítico. Por el contrario, si carece de grupo control se define como descriptivo con la particularidad de que estos no permiten es- tudios de asociación. El siguiente paso es determinar la dirección de los EO analíticos. Si el estudio propone el análisis del parámetro a medir y el pronóstico en el mismo tiempo, se denomina estudio cross-sectional (transversal). La determinación de la creatinina plasmática, en los pacien- tes ingresados con rechazo frente a los que no tuvieron rechazo, sería el ejemplo de este tipo de estudios donde el parámetro de medida (creatinina) y el pronóstico (rechazo) se observan al mismo tiempo. Este tipo de estudios proporciona una visión puntual de la po- blación enferma y sana en el mismo tiempo. Esto permite detectar la presencia o ausen- cia de enfermedad y de una determinada exposición, proporcionando datos de prevalen- cia. Sin embargo, no aclaran la relación temporal entre el pronóstico y la exposición. 187 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 187
  • 185.
    Si el estudiocomienza con una exposición (por ejemplo, el tratamiento sustitutivo de la función renal: diálisis o trasplante renal) y se continúa con el seguimiento, durante años, hasta alcanzar el pronóstico (muerte del paciente o del injerto), se denomina estudio de cohortes (looking forward en el tiempo). Esta clase de estudio permite el cálculo de las tasas de incidencia, riesgo relativo y riesgos atribuibles. Sin embargo, para el análisis de infrecuentes o eventos raros, este tipo de estudios puede durar años, con el consi- guiente consumo de tiempo y recursos para su ejecución. Por último, si el estudio analítico en cuestión comienza con el planteamiento de un pro- nóstico (por ejemplo, la muerte del paciente trasplantado) y mira “hacia detrás” en el tiempo para una determinada exposición (uso de IECA y otros posibles “protectores” de función renal, rechazo agudo, un determinado inmunosupresor, etc.), se denomina estudio de casos y controles. Este tipo de estudio es muy útil para determinar el pro- nóstico de entidades que tardan muchos años en su desarrollo, como la enfermedad cardiovascular o el cáncer. Sin embargo, su punto más débil es elegir un adecuado gru- 188 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL ¿Asignación de exposición o intervención? Estudio experimental Estudio observacional ¿Randomización? Estudio cross-sectorial Exposición y pronóstico en el mismo tiempo Estudio de cohortes Exposición → Pronóstico Estudio de casos-controles Exposición ← Pronóstico ¿Comparación grupos? SÍ SÍ NO NO Estudio controlado randomizado Estudio no controlado randomizado SÍ NO Estudio analítico ¿Dirección? Estudio descriptivo Figura 1. Algoritmo para la clasificación de los diferentes tipos de investigación clínica. Cap 07 4/10/04 12:51 Página 188
  • 186.
    po control consimilares características a los casos, excepto para el pronóstico en cues- tión. Asimismo, en estos estudios se emplean las razones de probabilidad (odds ratio) para investigar la asociación entre el pronóstico y los posibles factores implicados. Calidad de los registros Los registros contribuyen, de una forma significativa, al análisis científico del pronóstico y las complicaciones de los pacientes trasplantados. Obviamente, esto conlleva una op- timización del cuidado de estos pacientes, a la vez que puede tener un impacto positivo sobre las políticas de trasplantes de diferentes regiones y países. En esta línea, existen diferentes registros en el mundo que recogen datos nacionales e internacionales de uno o más órganos (Tabla XII) con un objetivo común a todos ellos: conseguir la calidad de los datos recogidos. En general, la calidad de los registros depende de la inclusión de un grupo de pacientes representativo y de la propia calidad de los datos recogidos. Esto implica que los datos sean completos, precisos y fiables. Idealmente, las bases de datos deberían incluir la to- talidad de la población expuesta, pero en general esto no es factible. Por tanto, sí sería deseable, al menos, que los pacientes candidatos a ingresar en el registro, fueran en re- alidad incluidos en la base de datos. Pero, ¿cómo se puede asegurar la calidad de los registros? El primer paso es definir con claridad el objetivo para el cual se va a cumplimentar la base de datos. Seguidamente, es importante la creación de una base de datos, limitada en su tamaño, pero completa en cuanto a la utilidad de las variables que se quieran analizar. Asimismo, la recogida de datos debe llevarse a cabo en un entorno informático propicio para reducir los procesos de codificación y minimizar los errores de trascripción. Finalmente, debe realizarse la monitorización y el seguimiento estrecho durante la recogida de estos datos. Básicamente existen dos métodos para asegurar la calidad de los datos. El primero y más simple es analizar la calidad de los datos dentro de la misma base. Con ello, inicial- mente detectaremos los valores perdidos (valores missing). Asimismo, mediante la apli- cación de rangos en las variables categóricas, se pueden detectar valores incongruen- tes en esas bases de datos, que son más preocupantes que los valores missing. En efecto, los valores no congruentes pueden afectar más los resultados de un estudio epidemiológico que los valores perdidos. En otras palabras, en las grandes bases de da- tos es preferible tener un 5% de valores perdidos que 1,5% de valores incongruentes, de ahí la importancia de identificarlos. El segundo método, para garantizar y validar la ca- lidad de los datos, radica en reproducir exactamente la recogida de datos de una parte de la muestra inicial y compararla con la muestra original. El grado de acuerdo o concor- dancia entre las variables categóricas de las dos muestras será determinado por el índi- ce kappa. De esta manera, un índice de kappa que se acerque a la unidad, indicará una gran similitud entre las muestras y avalará, por tanto, la calidad de los datos. 189 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 189
  • 187.
    A pesar deestas medidas, es esperable que aún se cometan errores. Por ello, se hacen necesarias, en ocasiones, las auditorías de la veracidad de los registros, que comparan los datos contenidos en las propias bases de datos con los datos de las historias clínicas de los pacientes. En este sentido, un estudio reciente sobre el control de calidad del re- gistro europeo de trasplante hepático, en el que se auditó de modo aleatorio las bases de datos de 21 centros europeos (12 países), comprobó que los datos, en su gran ma- yoría, eran fiables, así como los resultados científicos derivados de los mismos. Los au- 190 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Registro/base Información Contenido y Dirección de datos de órganos recogida de datos electrónica UNOS Scientific Riñón, hígado Basal, 6 meses www.unos.org Registry Transplant páncreas, órganos y cada año hasta la Database (USA) torácicos y otros muerte o pérdida órganos sólidos de injerto USRDS (USA) Información sobre Datos demográficos, www.usrds.org tratamiento de la clínicos y insuficiencia renal económicos crónica terminal Collaborative Riñón, hígado, Basal, 3, 6 y www.ctstransplant.org Transplant Study. corazón, pulmón 12 meses (Coordinado por la y páncreas post-trasplante. Universidad de Después Heidelberg) anualmente Australia and New Insuficiencia renal Basal y cada www.anzdata.org Zealand Dialysis crónica terminal y 6 meses and Transplant trasplante de riñón Registry (ANZDATA) European Liver Hígado Datos demográficos, www.eltr.org Transplant Registry clínicos y epidemiológicos ISHLT International Órganos torácicos Comparte datos www.ishlt.org/ Registry for Heart con la UNOS, regist.htm and Lung Eurotransplant y Transplantation UK Transplant NAPRTCS Riñón Datos del trasplante http://spitfire.emmes. The North American y el crecimiento com/study/ped Pediatric Renal Transplant Cooperative Study Tabla XII. Información sobre algunas de las bases de datos o registros de trasplantes. Cap 07 4/10/04 12:51 Página 190
  • 188.
    tores concluyeron, eneste trabajo, que este método puede servir como modelo para auditar los registros y garantizar su calidad. Herramientas estadísticas. Medidas de propensión Contrariamente a los EC, los EO y los registros son muy vulnerables a factores de con- fusión que pueden debilitar la contundencia de sus resultados. Independientemente de especificar una clara hipótesis de trabajo previo al examen de los datos, la elección de modelos estadísticos apropiados (univariados o multivariados) es otro paso crucial para el análisis de los registros y las curvas de supervivencia en el trasplante renal. Concretamente, la aplicación de análisis de regresión multivariados minimizan el efecto de las variables de confusión en la interpretación de los resultados de los EO. Antes de realizar modelos de regresión múltiple, la primera aproximación para el análisis de supervivencia en estos enfermos, debe ser una curva de Kaplan-Meier de cada una de las variables que, potencialmente, pueden influir en dicha supervivencia. Con ello, se ob- servará el comportamiento individual de cada una de las variables sobre el pronóstico a estudiar. No obstante, cuando se comparan las curvas de supervivencia, resulta difícil ob- tener dos muestras homogéneas en todos los factores que puedan afectar al resultado del estudio. Asimismo, puede ocurrir que una variable, que condiciona mortalidad, se ana- lice individualmente y pierda su significación estadística al hacerla interrelacionar o ajus- tarla con otras variables. Para salvar estos obstáculos se requiere la aplicación de mode- los de regresión, como el desarrollado por Cox, denominado también modelo proporcio- nal. Este modelo permite calcular el riesgo relativo del pronóstico en cuestión, en función de posibles variables explicativas, asumiendo que, a medida que transcurre el tiempo, el riesgo de los dos grupos, que se están comparando, varía de una forma proporcional el uno con el otro. Estos aspectos se analizan en profundidad en otro capítulo de esta obra. Estos modelos de regresión pueden, a su vez, utilizarse con dos objetivos: 1) predicti- vo, en el que el interés del investigador es predecir la variable dependiente (muerte, fa- llo del injerto, etc.) en función de un conjunto de variables independientes (rechazos, función renal, etc.); y 2) estimativo, en el que el interés radica en estimar la relación de una o más variables independientes con la variable dependiente. El siguiente paso con- siste en establecer la estrategia de modelización o formas de desarrollar el modelo de regresión. Brevemente, estas estrategias se deben aplicar en función del tipo de estu- dios que queramos desarrollar y consisten en: 1. Estrategia Backward o “hacia detrás” (la más recomendada para estudios predicti- vos). Se aplica introduciendo el máximo número de variables que interese analizar y se van quitando, de una en una, en función del menor grado de significación esta- dístico (para objetivo predictivo) o en función de que sean o no “contundentes” (objetivo estimativo). 191 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 191
  • 189.
    2. Estrategia Forwardo “hacia delante”. Se parte de una única variable y se van intro- duciendo todas las demás variables, hasta conseguir el modelo definitivo. La inclu- sión de variables se hace en función, también, de que queramos un modelo predic- tivo o estimativo. 3. Estrategia Stepwise o “paso a paso”. Es una modificación de la anterior para evitar que una estrategia “hacia delante” quede con variables no significativas. El investigador debe elegir los factores de corrección apropiados (covariables) y conside- rar posibles interacciones entre las variables más relevantes. Asimismo, puede ser útil también la transformación de ciertas variables continuas, que no guardan una clara rela- ción con el modelo proporcional de riesgos, en variables categóricas de más fácil manejo en el contexto de estos modelos multivariados. En cualquier caso, la inclusión de varia- bles con alto grado de colinearidad (variables en función de otras o que están relacionadas entre sí) puede, también, sobrestimar el modelo innecesariamente. Por el contrario, la omisión de variables relevantes en dicho modelo puede conducir a la aparición de sesgos. Por otra parte, los valores perdidos (missing) también suponen un obstáculo en el análi- sis de los resultados de los registros de trasplante. De una manera simplista, pero en- gañosa, estos valores pueden ser ignorados. Sin embargo, esto puede conducir a la pér- dida de poder estadístico y, lo que es peor, puede contribuir a introducir sesgos en los resultados. La categorización de una variable, que incluya estos valores missing o su im- putación en el análisis estadístico, pueden ser algunas de las medidas correctoras para estos valores perdidos. En los EO, los grupos comparados son con frecuencia diferentes entre sí, producto de la falta de aleatorización de los mismos. Individuos con especiales características bioló- gicas pudieran tener más posibilidades de una determinada exposición o tratamiento que los pacientes del grupo comparativo. Estas características son los denominados factores de confusión, que pueden afectar el pronóstico final y producir sesgos en los resultados. La regresión logística es un método habitual para paliar esta situación. Su principal ventaja es su capacidad de controlar múltiples variables simultáneamente, pe- ro ante escasos eventos pudiera estar limitado el número de variables, que resulta ade- cuado incluir simultáneamente (en general, una variable por cada 8-10 eventos). Otro método interesante para solventar esta situación son los índices o medidas de propen- sión (propensity score). Conceptualmente, es la probabilidad condicional de que un indi- viduo reciba un determinado tratamiento o se exponga a un específico factor de riesgo, en función de las variables de confusión. Para el cálculo de un índice de propensión (IP) se utiliza la regresión logística, en la que se incluyen los factores de confusión como variables independientes, y como variable dependiente la exposición (el empleo de un determinado tratamiento, la presencia de rechazo agudo, etc.). Cada paciente tendrá, por tanto, un IP resultante de la suma de los coeficientes β de los diferentes factores que influyen sobre la variable dependiente (exposición determinada) en la regresión lo- 192 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 192
  • 190.
    gística. En estemomento, las probabilidades estimadas (variable con la suma del índice) se dividen en tertiles o quintiles para estratificar el riesgo. Finalmente, para estimar el impacto de la exposición sobre el pronóstico, usando el IP, se debe construir un modelo de regresión logística donde la variable dependiente es, ahora, el pronóstico y las varia- bles independientes son la exposición determinada y las categorías del IP (estratifica- ción del índice en tertiles quintiles). El IP es, en definitiva, una eficiente manera de con- densar la información de muchos factores confundentes en una sola variable. En conclusión, existen potentes herramientas estadísticas que mitigan los posibles fac- tores confundentes de los EO. Sin embargo, como toda técnica matemática, su uso ina- decuado o el desconocimiento de los principios básicos de su aplicación conducen a re- sultados que, aunque significativos, se alejan de la realidad de la práctica clínica. En el mejor de los casos, los investigadores deberían también ser conscientes de las limita- ciones de estos EO y ser cautos a la hora de establecer conclusiones más allá de los lí- mites del propio modelo de estudio. Comorbilidad y sus instrumentos de medida La comorbilidad es el conjunto de condiciones médicas distintas de la enfermedad en estudio (como por ejemplo, el tratamiento sustitutivo de la función renal) que, conjunta- mente, conlleva una mayor morbimortalidad. Obviamente, cuanto mayor es la comorbi- lidad, más se incrementa la mortalidad y el consumo de recursos económicos y sanita- rios. De ahí, la importancia de profundizar en su conocimiento. La más simple aproximación al estudio de la comorbilidad es clasificar a los pacientes en base a la presencia o ausencia de una o varias condiciones, potencialmente comórbi- das (diabetes, enfermedad cardiovascular, etc.). Otra manera de conocer la comorbili- dad es sumar las condiciones comórbidas coexistentes en un mismo individuo. Sin em- bargo, la manera más precisa de expresarla es a través de los índices de comorbilidad (IC), los cuales agrupan, en diferentes grados o escalas, los factores de riesgo de una entidad. Con ello, podremos conocer el impacto acumulativo de diferentes condiciones comórbidas sobre la mortalidad. El estudio de la comorbilidad puede representar una herramienta muy útil para controlar factores de confusión en los estudios epidemiológicos que emplean importantes bases de datos. Por tanto, los EO y los grandes registros representan los pilares de los dife- rentes IC. Básicamente, esto lo consiguen por el importante número de pacientes que incluyen durante un largo periodo de seguimiento (en general, más de diez años). De ello se infiere que los IC son predictores de supervivencia o de estados de salud que nos pueden ayudar como marcadores pronósticos en estudios longitudinales de dife- rentes entidades clínicas. Este conocimiento también servirá para diseñar estrategias terapéuticas específicas, en aras a disminuir la morbimortalidad. 193 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 193
  • 191.
    En general, elrendimiento predictivo de los IC, que se apoyan en los registros o gran- des bases de datos, depende de varios factores, que incluyen: 1) las condiciones clíni- cas incluidas en el IC y sus pesos estadísticos relativos; 2) la distribución de las condi- ciones comórbidas en la población de estudio; 3) la variable final primaria (end point) del estudio; y 4) la precisión de los datos. Existen múltiples IC en diferentes áreas de la me- dicina que cumplen estos criterios. El índice de Charlson o el índice de enfermedades coexistentes (ICED), en la población general, el índice de la Sociedad Americana de Anestesia (ASA Index), o el de la patología mamaria son algunos de los ejemplos más representativos. En todos, el denominador común es estratificar el riesgo con la finali- dad de predecir la mortalidad. Los enfermos renales no podían ser una excepción y la primera aproximación hacia la búsqueda de un IC sistemático, en estos pacientes, data de 1982: Hutchinson y cols., utilizando como factores comórbidos la edad, la diabetes mellitus y el fallo ventricular iz- quierdo, elaboraron un valioso IC mediante un modelo matemático. Desde entonces se han aplicado diversos IC en la población urémica con resultados satisfactorios. Algunos se basan en los IC de la población general como el de Charlson o el ICED, y otros son de nueva creación, como el índice de Khan, el índice de Davies o el de van Manen, en- tre otros. Todos predicen el riesgo de muerte con un alto índice de concordancia y todos han sido validados en diferentes poblaciones, en distintos periodos de tiempo, o se han aplicado de una forma aleatorizada en la misma población. Más aún, en todos estos IC se ha incluido la edad y otras condiciones comórbidas categorizadas en diferentes esca- las de riesgo. A pesar de que estos IC son buenos predictores de mortalidad en los pacientes en diáli- sis, poco se sabe sobre su utilidad en la población trasplantada. Aunque estos pacientes tienen un mejor pronóstico que la población en diálisis, presentan una mortalidad signifi- cativamente mayor que la población general de edad y sexo similares. Esta peor super- vivencia se debe, en general, a la suma de una alta prevalencia de factores clásicos de riesgo y factores inherentes al propio trasplante renal. Y es que, en pocas entidades clí- nicas se agregan tantos factores de riesgo como en el trasplante renal. En un estudio preliminar, nosotros elaboramos un IC de fácil manejo y aplicación a partir de 1.293 pacientes trasplantados renales incluidos en una base de datos. Para minimi- zar el sesgo de la sobreestimación del IC, se aleatorizó la muestra en dos subpoblacio- nes (población modelo y estudio), determinándose en la población modelo el peso es- pecífico (coeficiente ß) de cada factor de riesgo sobre la supervivencia (análisis de Cox). Estos factores incluían la edad, factores tradicionales de riesgo vascular y otros factores inherentes al trasplante renal, como necrosis tubular, condición de re-trasplante, recha- zos, tiempo previo en diálisis, etc.). Con esta información se estratificó la población de estudio en tres niveles de riesgo (alto, medio y bajo) y se determinaron las curvas de su- pervivencia de Kaplan-Meier en función de estas escalas de riesgo. Finalmente, los re- 194 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 194
  • 192.
    sultados fueron comparadoscon la aplicación del índice de Charlson, con ligeras modifi- caciones, en la población de estudio. Sorprendentemente, la concordancia estadística fue excelente con el nuevo índice y ligeramente superior al índice de Charlson (0,91 versus 0,90). Asimismo, el nuevo IC mostró una mejor capacidad discriminatoria para predecir la mortalidad, de manera que los enfermos de bajo riesgo presentaron unas tasas de su- pervivencia de 95 y 93% a los 2 y 5 años, respectivamente, tras la aplicación de este nuevo IC. Con las reservas de sus limitaciones, la confirmación de estos resultados en otras poblaciones y con mayor número de pacientes puede representar un método fia- ble, elaborado a la cabecera del enfermo, para mejorar el pronóstico de los pacientes con trasplante renal. BIBLIOGRAFÍA RECOMENDADA Sección 1. Ensayos clínicos 1. Bakke OM, Carné X, García Alonso F. Ensayos clínicos con medicamentos. Fundamentos básicos, metodología y práctica. Barcelona: Ediciones Doyma 1994. 2. Real Decreto 561/1993, de 16 de abril, por el que se establecen los requisitos para la realización de ensayos clínicos con medicamentos. Ministerio de Sanidad y Consumo. BOE nº 114, 1993. 3. International Conference on Harmonisation of technical requirements for registra- tion of pharmaceuticals for human use. ICH tripartite guideline for Good Clinical Practice. Ginebra: ICH Secretariat 1996. 4. Directiva 2001/20/CE del Parlamento Europeo y del Consejo de 4 de abril de 2001 relativa a la aproximación de las disposiciones legales, reglamentarias y administrati- vas de los Estados miembros sobre la aplicación de buenas prácticas clínicas en la realización de ensayos clínicos de medicamentos de uso humano. Diario Oficial de la Comunidades Europeas. 1 de mayo de 2001. L 121/34-44. 5. EMEA/CPMP Position Statement on the use of placebo in clinical trials with regard to the revised Declaration of Helsinki. London, 28 June 2001. EMEA/17424/01. 6. The Nuremberg Code. JAMA 1996; 276: 1.691. 7. The World Medical Association, Inc. Declaration of Helsinki. Recommendation gui- ding physicians in biomedical research involiving human subjects. Adopted by the 18th World Medical Assembly, Helsinki, 1964. Amended by the 29 th WMA, Tokio, 1975; 35 th WMA, Venecia, 1983; 41 th WMA, Hong Kong, 1989; 48 th WMA, Somerset West, 1996; 52 th WMA, Edimburgo, 2000. 8. Moher D, Schulz KF, Altman DG for the CONSORT Group. The CONSORT state- ment: revised recommendations for improving the quality of reports of parallel- group randomised trials. Lancet 2001; 357: 1191-4. 9. Guyatt GH. Sachett DL, Cook DJ. User´s guides to the medical literature. II. How to use an article about therapy or prevention. JAMA 1993; 270: 2598-601 y 271: 59-63. 195 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 195
  • 193.
    10. Oxman AD,Cook DJ, Guyatt GH. User´s guides to the medical literature. VI. How to use an overview. JAMA 1994; 272: 1367-71. 11. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF for the QUORUM Group. Improving the quality of reports of meta-analysis of randomised controlled trials: the QUORUM statement. Lancet 1999; 354: 1896-1900. 12. Schwart D, Lellouch J. Explanatory and pragmatic attitudes in therapeutic trials. J Chron Dis 1967; 20: 637-48. 13. Lexchin J, Bero LA, Djulbegovic B, Clark O. Pharmaceutical industry sponsorship and research outcome and quality: systematic review. BMJ 2003; 326: 1-10. 14. Mekander H, Ahlqvist-Rastad J, Meijer G, Beermann B. Evidence based medicine- selective reporting from studies sponsored by pharmaceutical industry: review of studies in new drug apllications. BMJ 2003; 326: 1-5. 15. Manheimer E, Anderson D. Survey of public information about ongoing clinical trials funded by industry: evaluation of completeness and accessibility. BMJ 2002; 325: 528-31. 16. Soto Álvarez J. Inclusión de análisis farmacoeconómicos en ensayos clínicos: princi- pios y prácticas. Med Clin (Barc) 2003; 120: 227-35. 17. Hariharan S, MCbride MA, Cohen EP. Evolution of endpoints for renal transplant out- come. Am J Transplant 2003; 3: 933-41. 18. Orofino L, Pascual J (eds). Nefrología basada en la evidencia. Nefrología 1998 (su- plemento). 19. García López F, Amenábar Iríbar JJ. The intrincate relationship between evidence and clinical practice in kidney transplantation. J Nephrol 2000; 13: 405-14. 20. Hernández D, García López F. Ensayos clínicos en trasplante renal: muchos y pocos. Un análisis de la evidencia. Nefrología 2003; 23: 211-8. Sección 2. Registros y estudios observacionales 21. Grimes DA, Schulz KF. An overview of clinical research: the lay of the land. Lancet 2002; 359: 57-61. 22. Hornberger J, Wrone E. When to base clinical policies on observational versus ran- domized trial data. Ann Intern Med 1997; 127 (8 Pt 2): 697-703. 23. Michels KB, Braunwald E. Estimating treatment effects from observational data. JAMA 2002; 287: 3130-2. 24. Hanto DW. Reliability of voluntary and compulsory databases and registries in the United States. Transplantation 2003; 75: 2162-4. 25. Van der Meulen JHP, Jaco M, Copley L. Assessing the quality of the data in a trans- plant registry: the European liver transplant registry. Transplantation 2003; 75: 2164-7. 26. Karam V, Gunson B, Roggen F, Grande L, Wannoff W, Janssen M, Guckelberger O, Delvart V, Bismuth H, Höckerstedt K, Rogiers X, Adam R. Quality control of the European liver transplant registry: results of audit visits to the contributing centers. Transplantation 2003; 75: 2167-3. 196 MÉTODOS ESTADÍSTICOS EN EL TRASPLANTE RENAL Cap 07 4/10/04 12:51 Página 196
  • 194.
    27. Kaplan B,Schold J, Meier-Kriesche H-U. Overview of large database analysis in re- nal transplantation. Am J Transplant 2003; 3: 1052-6. 28. Fernández M, Abraira V, Quereda C, Ortuño J. Curvas de supervivencia y modelos de regresión: errores y aciertos en la metodología de aplicación. Nefrología 1996; 16: 383-90. 29. Klabunde CN, Warren JL, Legler JM. Assesing comorbidity using claims data. Med Care 2002; 40 (Suppl.): IV26-IV35. 30. Schneeweiss S, Seeger JD, Maclure M, Wang PS, Avorn J, Glynn RL. Performance of comorbidity scores to control for confounding in epidemiologic studies using claims data. Am J Epidemiol 2001; 154: 854-64. 31. Schneeweiss S, Maclure M. Use of comorbidity scores for control of confounding in studies using administrative databases. Int J Epidemiol 2000; 29: 891-8. 32. Hutchinson TA, Thomas DC, MacGibbon B. Predicting survival in adults with end-sta- ge renal disease: an age equivalence index. Ann Intern Med 1982; 96: 417-23. 33. Charlson ME, Pompei P, Ales KL, MacKenzie CR. A new method of classifying prog- nostic comorbidity in longitudinal studies: development and validation J Chron Dis 1987; 40: 373-83. 34. Khan IH, Catto GRD, Edward N, Fleming LW, Henderson IS, MacLeod AM. Influence of coexisting disease on survival on renal-replacement therapy. Lancet 1993; 341: 415-8. 35. Beddhu S, Zeidel ML, Saul M, Seddon P, Samore MH, Stoddard GJ, Bruns FJ. The effects of comorbid conditions on the outcomes of patients undergoing peritoneal dialysis. Am J Med 2002; 112: 696-701. 36. Van Manen JG, Korevaar JC, Dekker FW, Boeschoten EW, Bossuyt PMM, Krediet RT. How to adjust for comorbidity in survival studies in ESRD patients: a comparison of different indices. Am J Kidney Dis 2002; 40: 82-9. 37. Lash TL, Thwin SS, Horton NJ, Guadagnoli E, Silliman RA. Multiple informants: a new method to assess breast cancer patient´s comorbidity. Am J Epidemiol 2003; 157: 249-57. 197 RESULTADOS DEL TRASPLANTE RENAL: ENSAYOS CLÍNICOS Y REGISTROS Cap 07 4/10/04 12:51 Página 197