SlideShare una empresa de Scribd logo
1 de 12
Descargar para leer sin conexión
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

7
Año 4, Vol. II, N° 6
ISSN: 1856 8327

Pruebas estadísticas para comparar curvas de
supervivencia de k grupos con eventos recurrentes
Statistical tests to compare survival curves of k groups with recurrent
events
Carlos Martínez, Guillermo Ramírez y Maura Vásquez
Palabras Clave: Análisis de supervivencia, eventos recurrentes, pruebas estadísticas, procesos contadores
Key Words: Survival analysis, recurrent events, statistical tests, counting processes

RESUMEN
El objetivo de la presente investigación
consiste en proponer pruebas estadísticas para
comparar las curvas de supervivencia de k
grupos con eventos recurrentes. Los eventos
recurrentes se producen en muchas áreas
importantes para los científicos, cabe
mencionar: psicología, ingeniería, medicina, física,
astronomía, biología, economía. Son muy
comunes en nuestro entorno, como por
ejemplo: enfermedades virales, ataque de
epilepsias, tumores cancerígenos, fiebres, fallas en
maquinarias y equipos, terremotos, lluvias,
accidentes laborales, accidentes de automóviles,
entre otros. La idea consiste en generalizar las
pruebas
estadísticas
ponderadas
para
comparar curvas de supervivencia del análisis
de supervivencia clásico al campo recurrente.
Las funciones de supervivencia en los grupos
se estiman con el uso del modelo Generalized
Product Limit Estimator (GPLE) propuesto
por Peña, Strawderman y Hollander (2001),
modelos donde se usan dos procesos de
conteo. Para realizar las estimaciones se
diseñaron rutinas en lenguaje R y se
emplearon paquetes del lenguaje, como:
survival y survrec. En la investigación se utilizó
la base de datos del experimento Byar, donde

se midió el tiempo (meses) de la reaparición
de tumores en 116 enfermos con cáncer
superficial de vejiga. En el experimento los
pacientes fueron asignados al azar a los
siguientes tratamientos: placebo (47 pacientes),
pyridoxine (31 pacientes) y thiotepa (38
pacientes). El propósito de utilizar esa base de
datos en esta investigación es comparar las
curvas de supervivencia de los tres grupos y
determinar si existen diferencias significativas
entre los tratamientos.

ABSTRACT
The objective of this paper is to propose
statistical tests to compare k survival curves
involving recurrent events. Recurrent events
occur in many important scientific areas:
psychology, bioengineering, medicine, physics,
astronomy, biology, and economics, Such events
are very common in the real world: viral
diseases, seizure, carcinogenic tumors, fevers,
machinery and equipment failures, births,
murders, rain, industrial accidents, car accidents
and so on. The idea is to generalize the
weighted statistics used to compare survival
curves in classical models. The estimation of
the survival functions is based on a non
parametric model (GPLE model) proposed by

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

Peña et al., using counting processes.
R language programs using known routines
like survival and survrec were designed to
make the calculations. In this research it is
used the database Byar experiment, in which
the time (months) of recurrence of tumors in
116 sick patients with superficial bladder
cancer is measured. These patients were
randomly allocated to the following
treatments: placebo (47 patients), pyridoxine (31
patients) and thiotepa (38 patients). The aim is
to compare the survival curves of the three
groups and to determine if there are
significant differences between treatments.

INTRODUCCIÓN
El Análisis de Supervivencia (AS) es una
rama de la estadística donde se dispone de
un conjunto de métodos para modelar el
tiempo que transcurre hasta la ocurrencia
de un evento determinado. El evento
puede describir muertes, enfermedades,
fallas de maquinarias o equipos u otro
acontecimiento de interés.
Tradicionalmente los estudios del análisis
de supervivencia se aplicaban para
estudiar muertes de individuos por causas
de enfermedades terminales. Sin embargo,
el uso de estas técnicas fueron dirigidas
por ingenieros al estudios de fallas en
sistemas mecánicos y/o eléctricos y se le
llamó Análisis de Confiabilidad (AC). En
la mayoría de las situaciones la ocurrencia
de tal evento no es deseable, por lo tanto,
uno de los principales objetivos es evaluar
el efecto de un tratamiento en la
prevención de estos eventos. Cuando los
estudios de supervivencia analizan la
ocurrencia de un evento por unidad de

8
Año 4, Vol. II, N° 6
ISSN: 1856 8327

estudios se le conoce como AS clásico. Sin
embargo, muchas situaciones prácticas
implican repetidas, en donde una unidad
de materia o de la muestra puede tener
cualquier número de eventos durante toda
la vida. Hay un creciente interés en el
análisis de este tipo de eventos, conocidos
como Eventos Recurrentes (ER). Cuando
los datos son eventos recurrentes, los
métodos estadísticos se hacen más
complicados. Los objetivos de un estudio
AS clásico, generalmente son dos: las
estimaciones
de
funciones
de
supervivencia y la comparación de
grupos. En relación a las estimaciones de
funciones del análisis se dispone de
modelos
estadísticos
suficientemente
potentes para realizarlas, cabe mencionar:
los modelos actuariales, Kaplan Meier
(KM) (1958), Cox (1972), entre otros. Con
relación al problema de comparación, se
tienen: las pruebas de: Mantel Haenszel
(1959), Gehan (1965a, 1965b), Mantel
(1966), Kruskal Wallis propuesta por
Breslow (1970), Peto Peto (1972), Tarone
Ware (1977), Prentice (1978), Fleming et al.
(1980),
Harrington Fleming
(1982).
Autores como: Prentice et al. (1981),
Andersen Gill (1982) y Wei et al.(1989),
diseñaron un conjunto de estimadores
para ER, al igual que Wang Chang (1999),
Peña et al. (2001), entre otros. El problema
de comparación de grupos con datos
recurrentes lo abordaron Doganaksoy
Nelson (1998) y Martínez (2009) en su
disertación de tesis doctoral.

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
9

Ingeniería Industrial.
Actualidad y Nuevas Tendencias

METODOLOGÍA
La principal variable aleatoria en el AS es
el tiempo de ocurrencia de un evento T.
Esta variable tiene asociada un conjunto
de funciones, como son: la función de
densidad de probabilidad (fdp) f, la
función de distribución acumulada (FDA)
F, la función de supervivencia (fs) S, la
función de riesgo (fdr) h y la función de
riesgo acumulado (fra) H. Por definición:
F(t)=P(T t), S(t)=P(T>t) y por lo tanto,
S(t)=1 F (t). Se puede demostrar que:

ht

f t
St

(1)

y

t

H (t )

0

h s ds (2)

Año 4, Vol. II, N° 6
ISSN: 1856 8327

de unidades a riesgo justo antes del
tiempo tj y dj es el número de ocurrencia
en el tiempo tj. Cox propuso el modelo de
riesgos proporcionales:

ht/X

h0 t e

S t/X

e

t

X

( 4)

y
t

h s / X ds

0

(5)

Donde X es un vector de p covariables,
digamos: X1, X2 ... Xp, donde estas
covariables pueden ser dependientes o
independiente del tiempo de ocurrencia
del evento. ho(t) es la función de riesgo
base, S(t/X) es la función de supervivencia
y es el vector de parámetros.
Modelos del AS con ER

Modelos Clásicos del AS
Entre los modelos clásicos del análisis de
supervivencia se encuentran: los modelos
actuariales (modelo de Bhomer, 1912),
modelo de Berkson Gage (1952) y el
modelo de Cutler Ederer (1958), el modelo
de Kaplan Meier (1958) y modelo de Cox
(1972). La estimación de la función de
supervivencia de KM se obtiene como el
producto de probabilidades condicionales
de la ocurrencia del evento, donde se
asume independencia en los tiempos de
ocurrencia. El estimador de KM para
tiempos de ocurrencia no repetidos, se
define como:
j

S (t j )

1
i 1

di
ni

(3)

Donde, j representa el j ésimo momento
de ocurrencia del evento, ni es el número

Wang Chang (1999) (WC) propuso una
modelo para estimar la función de
supervivencia en casos donde los tiempos
entre ocurrencia del evento pueden estar
correlacionados. El estimador de WC fue
definido usando dos procesos d*(t) y R*(t):
d*(t) que denota la suma de la proporción
de las unidades con tiempos de
interocurrencias iguales t, y R*(t) que
representa el promedio ponderado de las
veces que unidades estuvieron a riesgo en
el tiempo t. Así:
n

S (t )

1
i 1

j :Tij t

d * Tij
R * Tij

(6)

Donde Tij denota el tiempo de
interocurrencia
j ésimo en el i ésima
unidad (ver Figura 1).
Peña et al. (2001) propusieron dos modelos
de
supervivencia
para
Eventos

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
10

Ingeniería Industrial.
Actualidad y Nuevas Tendencias

Recurrentes (ER): un modelo llamado
GPLE que generalizó el estimador clásico
de la función de supervivencia de KM
para unidades con ER, asumiendo
independencia en los tiempos de
interocurrencias y el modelo de fragilidad
para los casos donde existen individuos
cuya probabilidad de ocurrencia del
evento sigue una ley de probabilidades.
En el primer modelo los autores
consideraron dos escalas de tiempo: una
escala que mide el tiempo calendario
denotada por la letra S y otra que mide los

Año 4, Vol. II, N° 6
ISSN: 1856 8327

tiempos de interocurrencias, denotada por
la letra T. Los autores definieron os
procesos de conteo, N(s,t) representa el
número de eventos observados en el
período calendario [0,s] con T t y Y(s,t)
representa el número de eventos
observados en el periodo [0,s] con T t. El
estimador GPLE se define como:
S (t )
w t

Donde,

Tiempos de interocurrencias

Si0 = 0

Ti2
Si1

Fin del estudio

Evento no observado

Ti3
Si2

(7)

N(s,w)=N(s,w+ w) N(s,w).

Ti4
Ti1

N s, w
Y s, w

1

i

Si3

–Ti4

Si4
i

Tiempos calendarios

Tiempo de estudio

Figura 1. Representación gráfica de un evento recurrente en la i ésima unidad
Pruebas no paramétricas para comparar
grupos en el AS clásico
El objetivo de la comparación de grupos
en el AS es similar al procedimiento
utilizado
para
comparar
muestras
independientes. Sin embargo, hay ciertos
aspectos en el AS, tales como: la censura y
no normalidad de los datos que generan
gran dificultad cuando se trata de
analizarlos
usando
las
pruebas
tradicionales.
Varios
autores
han
desarrollado pruebas estadísticas para

comparar grupos en el AS: la prueba
logrank propuesta Mantel Haenszel (1958),
la prueba generalizada de Wilcoxon
propuesta por Gehan (1965a, 1965b), la
prueba de Mantel (1966), la prueba
generalizada de Kruskal Wallis propuesta
por Breslow (1970), la prueba de Peto Peto
(1972), la prueba de Tarone Ware (1977), la
prueba de los rango lineales con datos
censurados por la derecha propuesta por
Prentice (1978), la prueba Fleming et
al.(1980) y una prueba más general dada
por Harrington Fleming (1982). Ahora se

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

describe la prueba de Mantel Haenszel
(1959) para comparar dos curvas de
supervivencia de dos grupos. Supóngase
que djz denota el número de ocurrencia de
un evento en el tiempo tz en el grupo j,
para j =1,2 y z = 1,2 ... p. En el grupo

11
Año 4, Vol. II, N° 6
ISSN: 1856 8327

combinado dz = d1z + d2z. La Tabla 1 ilustra
que, en el tiempo tz hay n1z unidades a
riesgo en el primer grupo y n2z unidades a
riesgo en el segundo grupo. Así, en el
tiempo tz se tienen nz unidades a riesgo en
el grupo combinado y dz eventos.

Tabla 1. Número de ocurrencias del evento en el tiempo tz para G1 y G2
Número
Grupo
Número de eventos Número de sobrevivientes
unidades a riesgo
n1z d1z
n1z
G1
d1z
G2
d2z
n2z d2z
n2z
Combinado
dz
nz dz
nz
La variable aleatoria d1z sigue una
distribución hipergeométrica H(nz,n1z,dz)
cuyo valor esperado es dz×n1z/nz y cuya
varianza es:
Var (d1z )

dz

n1z nz n1z nz d z
nz
nz
nz 1

(8)

Para contrastar la hipótesis nula de no
diferencia
entre
las
curvas
de
supervivencia de los grupos se puede
realizar usando el estadístico:

(9)
Donde wz son los pesos para cada
momento tz. Se puede demostrar que la
variable aleatoria Z se comporta como una
distribución normal y en consecuencia su
cuadrado sigue una distribución 2 con un
grado de libertad. Para diferentes valores
de wz se obtienen varias pruebas de
comparación. Si wz=1 se obtiene la prueba
de Mantel Haenszel (logrank). Si wz=nz se
obtiene la prueba generalizada de

Wilcoxon
(Gehan).
Tarone Ware
propusieron una modificación de la
prueba de Wilcoxon, con wz=(nz)1/2. En la
prueba de Peto Peto (1972), wz = SPM(tz),
que da mayor peso a las primeras
diferencias y donde, SPM(tz) representa la
estimación de la función de supervivencia
a través del método de Prentice Marek
(1979). El resto de las pruebas son
adaptaciones de las pruebas anteriores,
como la prueba de Fleming et al. y la
prueba de Harrington Fleming. En el
campo de recurrencia: Pepe Cai (1993)
señaló que la prueba de comparación
logrank pueden ser utilizadas para ER.
Doganaksoy Nelson (1998) propusieron
un método de comparación basado en las
estimaciones de las funciones media
acumulada para eventos con datos
recurrentes y
Martínez (2009), que
propusieron una generalización de las
pruebas clásicas ponderadas a eventos
recurrentes.

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
12

Ingeniería Industrial.
Actualidad y Nuevas Tendencias

PROPUESTA
Problema
En esta sesión se dan a conocer las
propuestas o estadísticos de comparación
de la hipótesis de prueba de que no hay
diferencias en las k funciones de
supervivencia:
Ho: S1(t) = S2(t) = ... = Sk(t)
Donde, S1(t), S2(t) ... Sk(t) son las funciones
de supervivencia de los k grupos de
individuos bajo estudio.

Año 4, Vol. II, N° 6
ISSN: 1856 8327

Notación
La notación utilizada es similar a la usada
por Peña et al. (2001), con la diferencia que
se utiliza el tercer subíndice r para
identificar a los grupos, ver Martínez et al.
(2009). Un supuesto fundamental en la
propuesta es que los individuos bajo
estudio
han
sido
previamente
y
apropiadamente clasificados en cada
grupo de acuerdo a una variable de
estratificación. De esta manera, se puede
estimar la función de supervivencia para
cada grupo, con la siguiente expresión:
S r (t )

1
z t

N s, z; r
Y s, z; r

r

1,2,..., k . (10)

Tabla 2. Resumen del número de ocurrencias del evento en el tiempo de
interocurrencia z para los diferentes grupos.
Grupo

Número a
riesgo

Número de
eventos

Número de
sobrevivientes

1

Y(s,z;1)

N(s,z;1)

Y(s,z;1) - N(s,z;1)

.
r

.
Y(s,z;r)

.
N(s,z;r)

.
Y(s,z;r) - N(s,z;r)

´

Y(s,z;r’)

N(s,z;r’)

Y(s,z;r’) - N(s,z;r’)

.
k

.
Y(s,z;k)

.
N(s,z;k)

.
Y(s,z;k) - N(s,z;k)

Combinado

Y(s,z)

N(s,z)

Y(s,z) - N(s,z)

r

La Tabla 2 presenta el resumen de los
datos de los grupos en tiempo de
ocurrencia z, donde
N(s,z)= N(s,z;1)+…+ N(s,z;r)+ N(s,z;r )
+…+ N(s,z;k)
y
Y(s,z)=Y(s,z;1)+…+Y(s,z;r)+Y(s,z;r )+….
Y(s,z;k).
Y s, z; r w rz

Ur
z t

N s, z; r
Y s, z; r

La idea consiste en comparar la
proporción de ocurrencias de evento en
cada grupo N(s,z;r)/Y(s,z;r), con respecto
a la proporción de ocurrencia en el grupo
combinado N(s,z)/Y(s,z). Si Ho es cierta la
proporción en el grupo es similar a la del
grupo combinado. El siguiente estadístico
es una combinación lineal de las
diferencias:
N s, z
Y s, z

r

1,2,..., k . (11)

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
13

Ingeniería Industrial.
Actualidad y Nuevas Tendencias

Donde, wrz son los pesos para cada
momento de ocurrencia z en los r ésimo
grupo. Donde, las variables Ur son tales
que U1 + U2 + ... + Uk = 0 con
w1z = w2z = ... = wkz = wz, lo que implica que
2
w rz

Cov U r , U r '
z

Y s, z
N s, z
Y s, z

2
gl k 1

Ut

1
U

U

una de ellas es combinación lineal de las
restantes, y en consecuencia, la matriz de
varianzas y covarianzas de las Ur no es
invertible.

Y s , z; r
Y s, z

N s, z

Para resolver este problema se suprime
una de ellas, por ejemplo la primera. Con
ello, no hay pérdida sustantiva de
información, y la matriz de varianzas y
covarianzas del nuevo vector U con k 1
componentes será invertible, condición
que se requiere para poder proponer el
siguiente estadístico:

(13)

Año 4, Vol. II, N° 6
ISSN: 1856 8327

rr '

Y s, z; r
Y s, z

con

1 if r
rr '

r'

0 if r

r'

(12)

distribución chicuadrado con k 1 grados
de libertad bajo la hipótesis nula. Esta
estructura es similar a una propuesta por
Tarone Ware para comparar grupos. Con
una selección apropiada de los pesos, que
se muestra en la Tabla 3, se obtiene una
generalización de algunas pruebas clásicas
al caso recurrente. Observe que el
subíndice rec se utiliza para indicar la
prueba correspondiente para ER.

Este estadístico tiene forma cuadrática y se
distribuye asintóticamente como una
Tabla 3. Propuesta de pesos para las pruebas de comparación de curvas en el AS con ER.
Comportamiento
Pruebas tipo
Notación
Pesos (wz)
Mantel Haenzsel
Gehan
Peto Peto

LRrec
Grec
PPrec

Tarone Ware

TWrec

Peto Prentice

PPrrec

SC(tz 1)

Decreciente

Prentice Marek

PMrec

SC(t) × Y(s,z) / [Y(s,z) +1]

Decreciente

Fleming Harrington
O’sullivan

FHOrec

[SC(t)]

1: Decreciente
=0: Constante
0< <1:Creciente

Fleming et al.

Frec

[SC(t)] [1 SC(t)] r

Martinez

Mrec

[SC(t)] [1 SC(t)] r Y(s,z) / [Y(s,z) +1]

Martínez Ramírez Vásquez

MRVrec

1
Y(s,z)
SC(t)
Y (s , z )

N(s, z)

Constante
Decreciente
Decreciente
Decreciente

Aleatorio

Sc(t)=Estimación de la función de supervivencia (modelo GPLE) para el grupo combinado

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

APLICACIÓN
Los datos del experimento de Byar (1980)
corresponden
a
los
tiempos
de
reapariciones de tumores medidos en
meses para ciento dieciséis (116) pacientes
enfermos con cáncer superficial de vejiga,
(ver Martínez et al. (2009) datos
disponibles en Andrews Herzberg (1985).
Los pacientes fueron sometidos a un
proceso de aleatorización en la asignación
de los tratamientos: placebo (47 pacientes),
pyridoxine (31 pacientes) y thiotepa (38
pacientes). Al inicio del experimento, los
tumores presentes en los pacientes fueron
removidos. En algunos casos se presentó
recurrencia múltiple de tumores que
también fueron extirpados al ser
encontrados en los chequeos médicos. Al
inicio, a cada paciente se le midieron dos
variables de interés: el número inicial de
tumores (num) y el tamaño (size) o
diámetro del mayor de ellos, medido en
DISCUSIÓN DE RESULTADOS

La Figura 2 muestra los tiempos de
reaparición de los tumores en los pacientes
tratados con placebo, thiotepa y pyridoxine.
La Figura 3 muestra tanto las curvas de
supervivencia de los tiempos de
reaparición de tumores de los tres grupos
como la curva de supervivencia del grupo
combinado. Las estimación de dichas

14
Año 4, Vol. II, N° 6
ISSN: 1856 8327

centímetros. El objetivo de la investigación
de Byar consistía en determinar si las
variables num y/o size tenían efectos
significativos en la reaparición de los
tumores de los pacientes, y luego
comparar los tres tratamientos. El objetivo
planteado en esta investigación es
determinar
si
existen
diferencias
significativas entre las curvas de
supervivencia de los tiempos de
reaparición de los tumores entre los tres
grupos: placebo, thiotepa y pyridoxine.
Debido a que una de las restricciones del
modelo GPLE es que el último tiempo de
ocurrencia esté censurado por la derecha,
se realizaron algunos cambios en la base
de datos de aquellos pacientes donde esto
no sucede. El cambio se hizo en aquellos
pacientes cuyo período de observación
culminó con una ocurrencia, a los que se le
adicionó un dato censurado con un tiempo
ligeramente superior al último momento
de ocurrencia.
curvas fueron realizadas usando el modelo
de Peña et al. (2001) (modelo GPLE). En
dicha figura se aprecia diferencias entre
ellas, las cuales deben ser corroboradas
utilizando las pruebas de comparación
propuesta en este trabajo.
La Tabla 4 muestra los resultados de la
comparación
de
las
curvas
de
supervivencia de los tres grupos tratados.

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

15
Año 4, Vol. II, N° 6
ISSN: 1856 8327

Figura 2 Representación gráfica de tiempos de reaparición de tumores en tres grupos.

Figura 3 Representación gráfica de las curvas de supervivencia de los grupos

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

16
Año 4, Vol. II, N° 6
ISSN: 1856 8327

Tabla 4. Resultados de las pruebas de comparación de los tres grupos
Pruebas

Chi cuadrado

p valor

LRrec
Grec
TWrec
PPrec
PMrec
PPrrec
Frec =0, r=0
Mrec =0, r=0,
Mrec =0, r=0,
Mrec =0, r=0,
Mrec =1, r=0,
Mrec =1, r=1,
MRVrec

2.98493
1.86934
2.37678
1.79447
1.78768
1.95451
2.98493
2.98493
1.86935
2.37678
1.79447
6.67953
3.16468

0.22482
0.39271
0.30471
0.40769
0.40908
0.37634
0.22482
0.22482
0.39271
0.30471
0.40769
0.03544
0.20549

=0,
=0
=1,
=0
=1/2, =0
=0 , = 0
=1, = 1

Para realizar las estimaciones de las
pruebas de comparación propuestas en
este trabajo fue necesario diseñar rutinas
en lenguaje R. Todas las pruebas indican
que desde el punto de vista estadístico no
hay diferencias significativas
entre
tratamientos, a excepción de la prueba
de Mrec con parámetros: = 1 , r =1, = 1

y = 1 que indica que si existe diferencia
entre los tres tratamientos, tal como se
aprecia en la Figura 3. Esto significa que
para casos como éste si se escoge
parámetros adecuados y convenientes la
prueba Mrec es capaz de detectar
diferencias que las otras pruebas no
detectan.

CONCLUSIONES

detectan. La prueba Mrec es una
generalización de todas las pruebas del AS
tanto en el área clásica como en el campo
de eventos recurrentes. Todas las pruebas
del AS son casos particulares de la prueba
Mrec, con excepción de la prueba MRVrec
cuyos pesos son aleatorios y dependen de
la cantidad de eventos que ocurran en
cada momento durante el período de
estudio.

En este trabajo se plantearon pruebas
estadísticas para comparar curvas de
supervivencia de grupos con eventos
recurrentes. Así mismo, se lograron
generalizar las pruebas de comparación
del AS clásico al campo de la recurrencia.
La prueba Mrec es capaz de detectar
diferencias que las otras pruebas no

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

17
Año 4, Vol. II, N° 6
ISSN: 1856 8327

REFERENCIAS
Andersen, P. y Gill, R. (1982). Cox s regression
model for counting processes: A large sample
study. Annals of Statistics, 10, 1100 1120.
Andrews D. y Herzberg A. (1985). Data. A
collections of problems from many fields for
the student and research worker. Springer
series in Statistics, Springer Verlag, USA.
Berkson J. y Gage R. (1952). Survival curve
cancer patients following treatment. American
Statistical Association Journal, 501 515.
Bhomer P. (1912). Theorie der unabhängigen
Wahrscheinlichkeiten, en Rapports. Mémoires
et Procès verbaux
de Septième
Congrès
International d´Áctuaries, Ámsterdam, 2, 327 343.
Breslow, N. (1970). A generalized Kruskal
Wallis test for comparing K samples subject to
unequal patterns of censorship. Biometrika, 57,
579 594.
Byar, D. (1980). The veterans administrations
study of chemoprophylaxis for recurrent stage
I bladder tumors: Comparisons of placebo,
pyridoxine, and topical thiotepa. In Bladder
tumor and other Topics in Urological Oncology.
New York: Plenum, 363 370.
Cox, D. (1972). Regression models and life
tables. Journal of the Royal Statistical Society,
Series B, 34, 187 220.
Cutler S. y Ederer F. (1958). Maximum
utilization on the life table method in
analyzing survival. Biostatistics. Journal of
chronic Diseases, 8, 699 712.
Doganaksoy N. y Nelson W. (1998). A method
to compare two samples of recurrence data.
Lifetime Data Analysis, 48, 51 63.
Fleming, T., O Fallon, J., O Brien, P.
yHarrington,
D.
(1980).
Modified
Kolmogorov Smirnov test procedures with
application to arbitrarily right censored data.
Biometrics, 36, 607 625.

Gehan, E. (1965a). A generalized Wilcoxon test
for comparing arbitrarily singly censored
samples. Biometrika, 52, 203 223.
Gehan, E. (1965b). A generalized two sample
Wilcoxon test for doubly censored data.
Biometrika, 52, 650 653.
Harrington D. y Fleming T. (1982). A class of
rank test procedure for censored survival data.
Biometrika, 60 (3), 553 566.
Kaplan, E. y Meier, P. (1958). Nonparametric
estimation from incomplete observations.
Journal of the American Statistical Association,
53, 457 481.
Mantel, N. (1966) Evaluation of survival data
and two new rank order statistical arising in
its consideration. Cancer Chemother. Rep.,50,
163 170.
Mantel, N. y Haenszel, W. (1959). Statistical
aspects of the analysis of data from
retrospective studies of disease. Journal of the
National Cancer Institute, 22 (4), 719 748.
Martínez, C. (2009). Generalizaciones de algunas
pruebas clásicas de comparación de curvas de
supervivencia al caso de eventos de naturaleza
recurrente. Tesis doctoral. Universidad Central
de Venezuela. Caracas, Venezuela.
Martínez, C., Ramírez, G. y Vásquez, M.
(2009). Pruebas no paramétricas para
comparar curvas de supervivencia de dos
grupos que experimentan eventos recurrentes.
Propuestas. Revista Ingeniería U.C., Vol. 16, N°
3, 45 55.
Peña, E., Strawderman, R. y Hollander, M.
(2001). Nonparametric estimation with
recurrent event data. J.A.S.A., 99, 1299 1315.
Pepe, M. y Cai, J. (1993). Some graphical
display and marginal regression analyses for
recurrent failure times and time dependent
covariates. J.A.S.A, 88, 811 820.

Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
Ingeniería Industrial.
Actualidad y Nuevas Tendencias

Peto R. y Peto J. (1972). Asymptotically
efficient rank invariant test procedures (with
discussion). J.R.S.S., A, 135, 185 207.
Prentice, R. (1978). Linear rank tests with right
censored data. Biometrika, 65(1), 167 179.
Prentice, R. y Marek, P. (1979). Qualitative
discrepancy between censored data rank
test.Biometrics, 35, 861 867.
Prentice, R., Williams, B. y Peterson, A. (1981).
On the regression analysis of multivariate
failure time data. Biometrika, 68(2), 373 379.
Tarone, R. y Ware, J. (1977). On distribution
free tests for equality of survival distributions.
Biometrika, 64 (1), 156 160.

18
Año 4, Vol. II, N° 6
ISSN: 1856 8327

Wang, M. y Chang, S. (1999). Nonparametric
estimation of a recurrent survival function.
Journal of the American Statistical Association, 94,
146 153.
Wei, L., Lin, D. y Weissfeld, L. (1989).
Regression analysis of multivariate incomplete
failure time data by modeling marginal
distributions. Journal of the American Statistical
Association, 84, 1065 1073.
Wilcoxon, F. (1945). Individual comparisons
by ranking methods. Biometrics, 1, 80 83.

Autores
Carlos Martínez. Profesor Asociado a Dedicación Exclusiva, Departamento de Investigación
Operativa, Escuela de Ingeniería Industrial de la Facultad de Ingeniería de la Universidad de
Carabobo, Valencia Venezuela. Graduado en la Maestría en Ingeniería Industrial (U.C.) y Doctor
en Estadística graduado en la Universidad Central de Venezuela.
E mail: cmmm7031@gmail.com
Guillermo Ramírez. Profesor Titular de la Escuela de Estadística de la Facultad de Ciencias
Económicas y Sociales (FACES) de la Universidad Central de Venezuela, Doctor en Estadística
graduado en la Universidad de Salamanca España. Director de la Comisión de Estudios de
Postgrado de FACES, UCV.
E mail: guillermo.ramirez.ucv@gmail.com
Maura Vásquez. Profesora Titular jubilada de la Escuela de Estadística de la Facultad de
Ciencias Económicas y Sociales (FACES) de la Universidad Central de Venezuela, Doctora en
Estadística graduada en la Universidad de Salamanca España.
E mail: mauralvasquez@gmail.com
Recibido: 05/04/2011

Aceptado: 31/05/2011

Martínez et al., Pruebas estadísticas para comparar curvas de supervivencia, p.7 18

Más contenido relacionado

Similar a Pruebas estadísticas para comparar curvas de supervivencia de k grupos con eventos recurrentes. Statistical tests to compare survival curves of k groups with recurrent events

OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
Carlos Andr Ochoa
 
Presentacion dea larga
Presentacion dea largaPresentacion dea larga
Presentacion dea larga
ecorpas
 
Estudios pronostico.pptx
Estudios pronostico.pptxEstudios pronostico.pptx
Estudios pronostico.pptx
AlanRafaelGarcaYnez1
 
InvestigaciòN Estadistica
InvestigaciòN EstadisticaInvestigaciòN Estadistica
InvestigaciòN Estadistica
guestf78e1
 
Tema 5 procesos temporales clase
Tema 5  procesos temporales claseTema 5  procesos temporales clase
Tema 5 procesos temporales clase
SINAVEF_LAB
 
Teoria de probabilidadades
Teoria de probabilidadadesTeoria de probabilidadades
Teoria de probabilidadades
Ale Almarza
 

Similar a Pruebas estadísticas para comparar curvas de supervivencia de k grupos con eventos recurrentes. Statistical tests to compare survival curves of k groups with recurrent events (20)

Pruebas no paramétricas para comparar curvas de supervivencia de dos grupos q...
Pruebas no paramétricas para comparar curvas de supervivencia de dos grupos q...Pruebas no paramétricas para comparar curvas de supervivencia de dos grupos q...
Pruebas no paramétricas para comparar curvas de supervivencia de dos grupos q...
 
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
OCHOA_C, El modelo Lee-Carter para estimar y pronosticar mortalidad, Una apli...
 
Tac corporal total en trauma
Tac corporal total en traumaTac corporal total en trauma
Tac corporal total en trauma
 
EPIDEMIOLOGIA salud publica 2023-03.pptx
EPIDEMIOLOGIA salud publica 2023-03.pptxEPIDEMIOLOGIA salud publica 2023-03.pptx
EPIDEMIOLOGIA salud publica 2023-03.pptx
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informatica
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informatica
 
La
LaLa
La
 
Presentacion dea larga
Presentacion dea largaPresentacion dea larga
Presentacion dea larga
 
Medidas de frecuencia
Medidas de frecuenciaMedidas de frecuencia
Medidas de frecuencia
 
Medidas de frecuencia, asociación, e impacto
Medidas de frecuencia, asociación, e impactoMedidas de frecuencia, asociación, e impacto
Medidas de frecuencia, asociación, e impacto
 
Descripción cuantitativa de enfermedades de las plantas
Descripción cuantitativa de enfermedades de las plantasDescripción cuantitativa de enfermedades de las plantas
Descripción cuantitativa de enfermedades de las plantas
 
Funciones Aplicaciones
Funciones AplicacionesFunciones Aplicaciones
Funciones Aplicaciones
 
Funciones Aplicaciones
Funciones AplicacionesFunciones Aplicaciones
Funciones Aplicaciones
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Analisis de varianza
Analisis de varianzaAnalisis de varianza
Analisis de varianza
 
Estudios pronostico.pptx
Estudios pronostico.pptxEstudios pronostico.pptx
Estudios pronostico.pptx
 
InvestigaciòN Estadistica
InvestigaciòN EstadisticaInvestigaciòN Estadistica
InvestigaciòN Estadistica
 
Tema 5 procesos temporales clase
Tema 5  procesos temporales claseTema 5  procesos temporales clase
Tema 5 procesos temporales clase
 
Matemáticas y Cáncer
Matemáticas y CáncerMatemáticas y Cáncer
Matemáticas y Cáncer
 
Teoria de probabilidadades
Teoria de probabilidadadesTeoria de probabilidadades
Teoria de probabilidadades
 

Último

16. Sustentación de la tesis de investigación.pptx
16. Sustentación de la tesis de investigación.pptx16. Sustentación de la tesis de investigación.pptx
16. Sustentación de la tesis de investigación.pptx
MedalytHuashuayoCusi
 
(2024-05-17). DOCTOR, ESTOY EMBARAZADA ¿Y AHORA QUÉ? (DOC)
(2024-05-17). DOCTOR, ESTOY  EMBARAZADA ¿Y AHORA  QUÉ? (DOC)(2024-05-17). DOCTOR, ESTOY  EMBARAZADA ¿Y AHORA  QUÉ? (DOC)
(2024-05-17). DOCTOR, ESTOY EMBARAZADA ¿Y AHORA QUÉ? (DOC)
UDMAFyC SECTOR ZARAGOZA II
 
Anamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICA
Anamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICAAnamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICA
Anamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICA
MELANIEMICHELLERIOSR
 

Último (20)

Módulo III, Tema 7: Amebas Comensales y Patógenas
Módulo III, Tema 7: Amebas Comensales y PatógenasMódulo III, Tema 7: Amebas Comensales y Patógenas
Módulo III, Tema 7: Amebas Comensales y Patógenas
 
16. Sustentación de la tesis de investigación.pptx
16. Sustentación de la tesis de investigación.pptx16. Sustentación de la tesis de investigación.pptx
16. Sustentación de la tesis de investigación.pptx
 
Pòster "Exploración de la identidad mediante el collage artístico en grupos t...
Pòster "Exploración de la identidad mediante el collage artístico en grupos t...Pòster "Exploración de la identidad mediante el collage artístico en grupos t...
Pòster "Exploración de la identidad mediante el collage artístico en grupos t...
 
2.3 Odontologia Legal. Este lección tiene como objetivo proporcionar
2.3 Odontologia Legal. Este lección tiene como objetivo proporcionar2.3 Odontologia Legal. Este lección tiene como objetivo proporcionar
2.3 Odontologia Legal. Este lección tiene como objetivo proporcionar
 
FLUJOGRAMA PROCESO DE FACTURACIÓN EN SERVICIOS DE SALUD.pdf
FLUJOGRAMA PROCESO DE FACTURACIÓN  EN SERVICIOS DE SALUD.pdfFLUJOGRAMA PROCESO DE FACTURACIÓN  EN SERVICIOS DE SALUD.pdf
FLUJOGRAMA PROCESO DE FACTURACIÓN EN SERVICIOS DE SALUD.pdf
 
Cuadernillo trabajo y manejo de ansiedad
Cuadernillo trabajo y manejo de ansiedadCuadernillo trabajo y manejo de ansiedad
Cuadernillo trabajo y manejo de ansiedad
 
PAE mujer enfermeria..2024mejor..pae,,pae
PAE mujer enfermeria..2024mejor..pae,,paePAE mujer enfermeria..2024mejor..pae,,pae
PAE mujer enfermeria..2024mejor..pae,,pae
 
Embriogénesis del aparato genital femenino, formación de.pptx
Embriogénesis del aparato genital femenino, formación de.pptxEmbriogénesis del aparato genital femenino, formación de.pptx
Embriogénesis del aparato genital femenino, formación de.pptx
 
Tipos y niveles de Ambulatorios en venezuela.pptx
Tipos y niveles de Ambulatorios en venezuela.pptxTipos y niveles de Ambulatorios en venezuela.pptx
Tipos y niveles de Ambulatorios en venezuela.pptx
 
PERFILES DE SODIO Y ULTRAFILTRACION.pptx
PERFILES DE SODIO Y ULTRAFILTRACION.pptxPERFILES DE SODIO Y ULTRAFILTRACION.pptx
PERFILES DE SODIO Y ULTRAFILTRACION.pptx
 
(2024-05-17). DOCTOR, ESTOY EMBARAZADA ¿Y AHORA QUÉ? (DOC)
(2024-05-17). DOCTOR, ESTOY  EMBARAZADA ¿Y AHORA  QUÉ? (DOC)(2024-05-17). DOCTOR, ESTOY  EMBARAZADA ¿Y AHORA  QUÉ? (DOC)
(2024-05-17). DOCTOR, ESTOY EMBARAZADA ¿Y AHORA QUÉ? (DOC)
 
IMAGEN PERSONAL Y LA AUTOESTIMA EN EL CONDUCTOR PROFESIONAL.ppt
IMAGEN PERSONAL Y LA AUTOESTIMA EN EL CONDUCTOR PROFESIONAL.pptIMAGEN PERSONAL Y LA AUTOESTIMA EN EL CONDUCTOR PROFESIONAL.ppt
IMAGEN PERSONAL Y LA AUTOESTIMA EN EL CONDUCTOR PROFESIONAL.ppt
 
secreto profesional, tipos de secreto, natural, prometido, confiado
secreto profesional, tipos de secreto, natural, prometido, confiadosecreto profesional, tipos de secreto, natural, prometido, confiado
secreto profesional, tipos de secreto, natural, prometido, confiado
 
Resumen Final Oclusión Dental, RELACION CENTRICA, MAXIMA INTERCUSPIDACION
Resumen Final Oclusión Dental, RELACION CENTRICA,  MAXIMA INTERCUSPIDACIONResumen Final Oclusión Dental, RELACION CENTRICA,  MAXIMA INTERCUSPIDACION
Resumen Final Oclusión Dental, RELACION CENTRICA, MAXIMA INTERCUSPIDACION
 
trauma hepatobiliar, ANATOMIA Y TÉCNICAS QUIRURGICAS
trauma hepatobiliar, ANATOMIA Y TÉCNICAS QUIRURGICAStrauma hepatobiliar, ANATOMIA Y TÉCNICAS QUIRURGICAS
trauma hepatobiliar, ANATOMIA Y TÉCNICAS QUIRURGICAS
 
Clase 18 miologia generalides 2024.pdf
Clase 18   miologia generalides 2024.pdfClase 18   miologia generalides 2024.pdf
Clase 18 miologia generalides 2024.pdf
 
EMBRIOLOGÍA- LANGMAN 13ºEDICIÓN. Resumen
EMBRIOLOGÍA- LANGMAN 13ºEDICIÓN. ResumenEMBRIOLOGÍA- LANGMAN 13ºEDICIÓN. Resumen
EMBRIOLOGÍA- LANGMAN 13ºEDICIÓN. Resumen
 
Anamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICA
Anamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICAAnamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICA
Anamnesis-Carlos-Alberto-Seguin-pdf.pdf ANAMNESIS PSICOSOMATICA
 
INTERVENCIONES PARA LA PROMOCION Y MANTENIMIENTO DE LA SALUD PARA LAS PERSONA...
INTERVENCIONES PARA LA PROMOCION Y MANTENIMIENTO DE LA SALUD PARA LAS PERSONA...INTERVENCIONES PARA LA PROMOCION Y MANTENIMIENTO DE LA SALUD PARA LAS PERSONA...
INTERVENCIONES PARA LA PROMOCION Y MANTENIMIENTO DE LA SALUD PARA LAS PERSONA...
 
sangrado uterino anormal (Presentación) Nicole 2024
sangrado uterino anormal (Presentación) Nicole 2024sangrado uterino anormal (Presentación) Nicole 2024
sangrado uterino anormal (Presentación) Nicole 2024
 

Pruebas estadísticas para comparar curvas de supervivencia de k grupos con eventos recurrentes. Statistical tests to compare survival curves of k groups with recurrent events

  • 1. Ingeniería Industrial. Actualidad y Nuevas Tendencias 7 Año 4, Vol. II, N° 6 ISSN: 1856 8327 Pruebas estadísticas para comparar curvas de supervivencia de k grupos con eventos recurrentes Statistical tests to compare survival curves of k groups with recurrent events Carlos Martínez, Guillermo Ramírez y Maura Vásquez Palabras Clave: Análisis de supervivencia, eventos recurrentes, pruebas estadísticas, procesos contadores Key Words: Survival analysis, recurrent events, statistical tests, counting processes RESUMEN El objetivo de la presente investigación consiste en proponer pruebas estadísticas para comparar las curvas de supervivencia de k grupos con eventos recurrentes. Los eventos recurrentes se producen en muchas áreas importantes para los científicos, cabe mencionar: psicología, ingeniería, medicina, física, astronomía, biología, economía. Son muy comunes en nuestro entorno, como por ejemplo: enfermedades virales, ataque de epilepsias, tumores cancerígenos, fiebres, fallas en maquinarias y equipos, terremotos, lluvias, accidentes laborales, accidentes de automóviles, entre otros. La idea consiste en generalizar las pruebas estadísticas ponderadas para comparar curvas de supervivencia del análisis de supervivencia clásico al campo recurrente. Las funciones de supervivencia en los grupos se estiman con el uso del modelo Generalized Product Limit Estimator (GPLE) propuesto por Peña, Strawderman y Hollander (2001), modelos donde se usan dos procesos de conteo. Para realizar las estimaciones se diseñaron rutinas en lenguaje R y se emplearon paquetes del lenguaje, como: survival y survrec. En la investigación se utilizó la base de datos del experimento Byar, donde se midió el tiempo (meses) de la reaparición de tumores en 116 enfermos con cáncer superficial de vejiga. En el experimento los pacientes fueron asignados al azar a los siguientes tratamientos: placebo (47 pacientes), pyridoxine (31 pacientes) y thiotepa (38 pacientes). El propósito de utilizar esa base de datos en esta investigación es comparar las curvas de supervivencia de los tres grupos y determinar si existen diferencias significativas entre los tratamientos. ABSTRACT The objective of this paper is to propose statistical tests to compare k survival curves involving recurrent events. Recurrent events occur in many important scientific areas: psychology, bioengineering, medicine, physics, astronomy, biology, and economics, Such events are very common in the real world: viral diseases, seizure, carcinogenic tumors, fevers, machinery and equipment failures, births, murders, rain, industrial accidents, car accidents and so on. The idea is to generalize the weighted statistics used to compare survival curves in classical models. The estimation of the survival functions is based on a non parametric model (GPLE model) proposed by Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 2. Ingeniería Industrial. Actualidad y Nuevas Tendencias Peña et al., using counting processes. R language programs using known routines like survival and survrec were designed to make the calculations. In this research it is used the database Byar experiment, in which the time (months) of recurrence of tumors in 116 sick patients with superficial bladder cancer is measured. These patients were randomly allocated to the following treatments: placebo (47 patients), pyridoxine (31 patients) and thiotepa (38 patients). The aim is to compare the survival curves of the three groups and to determine if there are significant differences between treatments. INTRODUCCIÓN El Análisis de Supervivencia (AS) es una rama de la estadística donde se dispone de un conjunto de métodos para modelar el tiempo que transcurre hasta la ocurrencia de un evento determinado. El evento puede describir muertes, enfermedades, fallas de maquinarias o equipos u otro acontecimiento de interés. Tradicionalmente los estudios del análisis de supervivencia se aplicaban para estudiar muertes de individuos por causas de enfermedades terminales. Sin embargo, el uso de estas técnicas fueron dirigidas por ingenieros al estudios de fallas en sistemas mecánicos y/o eléctricos y se le llamó Análisis de Confiabilidad (AC). En la mayoría de las situaciones la ocurrencia de tal evento no es deseable, por lo tanto, uno de los principales objetivos es evaluar el efecto de un tratamiento en la prevención de estos eventos. Cuando los estudios de supervivencia analizan la ocurrencia de un evento por unidad de 8 Año 4, Vol. II, N° 6 ISSN: 1856 8327 estudios se le conoce como AS clásico. Sin embargo, muchas situaciones prácticas implican repetidas, en donde una unidad de materia o de la muestra puede tener cualquier número de eventos durante toda la vida. Hay un creciente interés en el análisis de este tipo de eventos, conocidos como Eventos Recurrentes (ER). Cuando los datos son eventos recurrentes, los métodos estadísticos se hacen más complicados. Los objetivos de un estudio AS clásico, generalmente son dos: las estimaciones de funciones de supervivencia y la comparación de grupos. En relación a las estimaciones de funciones del análisis se dispone de modelos estadísticos suficientemente potentes para realizarlas, cabe mencionar: los modelos actuariales, Kaplan Meier (KM) (1958), Cox (1972), entre otros. Con relación al problema de comparación, se tienen: las pruebas de: Mantel Haenszel (1959), Gehan (1965a, 1965b), Mantel (1966), Kruskal Wallis propuesta por Breslow (1970), Peto Peto (1972), Tarone Ware (1977), Prentice (1978), Fleming et al. (1980), Harrington Fleming (1982). Autores como: Prentice et al. (1981), Andersen Gill (1982) y Wei et al.(1989), diseñaron un conjunto de estimadores para ER, al igual que Wang Chang (1999), Peña et al. (2001), entre otros. El problema de comparación de grupos con datos recurrentes lo abordaron Doganaksoy Nelson (1998) y Martínez (2009) en su disertación de tesis doctoral. Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 3. 9 Ingeniería Industrial. Actualidad y Nuevas Tendencias METODOLOGÍA La principal variable aleatoria en el AS es el tiempo de ocurrencia de un evento T. Esta variable tiene asociada un conjunto de funciones, como son: la función de densidad de probabilidad (fdp) f, la función de distribución acumulada (FDA) F, la función de supervivencia (fs) S, la función de riesgo (fdr) h y la función de riesgo acumulado (fra) H. Por definición: F(t)=P(T t), S(t)=P(T>t) y por lo tanto, S(t)=1 F (t). Se puede demostrar que: ht f t St (1) y t H (t ) 0 h s ds (2) Año 4, Vol. II, N° 6 ISSN: 1856 8327 de unidades a riesgo justo antes del tiempo tj y dj es el número de ocurrencia en el tiempo tj. Cox propuso el modelo de riesgos proporcionales: ht/X h0 t e S t/X e t X ( 4) y t h s / X ds 0 (5) Donde X es un vector de p covariables, digamos: X1, X2 ... Xp, donde estas covariables pueden ser dependientes o independiente del tiempo de ocurrencia del evento. ho(t) es la función de riesgo base, S(t/X) es la función de supervivencia y es el vector de parámetros. Modelos del AS con ER Modelos Clásicos del AS Entre los modelos clásicos del análisis de supervivencia se encuentran: los modelos actuariales (modelo de Bhomer, 1912), modelo de Berkson Gage (1952) y el modelo de Cutler Ederer (1958), el modelo de Kaplan Meier (1958) y modelo de Cox (1972). La estimación de la función de supervivencia de KM se obtiene como el producto de probabilidades condicionales de la ocurrencia del evento, donde se asume independencia en los tiempos de ocurrencia. El estimador de KM para tiempos de ocurrencia no repetidos, se define como: j S (t j ) 1 i 1 di ni (3) Donde, j representa el j ésimo momento de ocurrencia del evento, ni es el número Wang Chang (1999) (WC) propuso una modelo para estimar la función de supervivencia en casos donde los tiempos entre ocurrencia del evento pueden estar correlacionados. El estimador de WC fue definido usando dos procesos d*(t) y R*(t): d*(t) que denota la suma de la proporción de las unidades con tiempos de interocurrencias iguales t, y R*(t) que representa el promedio ponderado de las veces que unidades estuvieron a riesgo en el tiempo t. Así: n S (t ) 1 i 1 j :Tij t d * Tij R * Tij (6) Donde Tij denota el tiempo de interocurrencia j ésimo en el i ésima unidad (ver Figura 1). Peña et al. (2001) propusieron dos modelos de supervivencia para Eventos Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 4. 10 Ingeniería Industrial. Actualidad y Nuevas Tendencias Recurrentes (ER): un modelo llamado GPLE que generalizó el estimador clásico de la función de supervivencia de KM para unidades con ER, asumiendo independencia en los tiempos de interocurrencias y el modelo de fragilidad para los casos donde existen individuos cuya probabilidad de ocurrencia del evento sigue una ley de probabilidades. En el primer modelo los autores consideraron dos escalas de tiempo: una escala que mide el tiempo calendario denotada por la letra S y otra que mide los Año 4, Vol. II, N° 6 ISSN: 1856 8327 tiempos de interocurrencias, denotada por la letra T. Los autores definieron os procesos de conteo, N(s,t) representa el número de eventos observados en el período calendario [0,s] con T t y Y(s,t) representa el número de eventos observados en el periodo [0,s] con T t. El estimador GPLE se define como: S (t ) w t Donde, Tiempos de interocurrencias Si0 = 0 Ti2 Si1 Fin del estudio Evento no observado Ti3 Si2 (7) N(s,w)=N(s,w+ w) N(s,w). Ti4 Ti1 N s, w Y s, w 1 i Si3 –Ti4 Si4 i Tiempos calendarios Tiempo de estudio Figura 1. Representación gráfica de un evento recurrente en la i ésima unidad Pruebas no paramétricas para comparar grupos en el AS clásico El objetivo de la comparación de grupos en el AS es similar al procedimiento utilizado para comparar muestras independientes. Sin embargo, hay ciertos aspectos en el AS, tales como: la censura y no normalidad de los datos que generan gran dificultad cuando se trata de analizarlos usando las pruebas tradicionales. Varios autores han desarrollado pruebas estadísticas para comparar grupos en el AS: la prueba logrank propuesta Mantel Haenszel (1958), la prueba generalizada de Wilcoxon propuesta por Gehan (1965a, 1965b), la prueba de Mantel (1966), la prueba generalizada de Kruskal Wallis propuesta por Breslow (1970), la prueba de Peto Peto (1972), la prueba de Tarone Ware (1977), la prueba de los rango lineales con datos censurados por la derecha propuesta por Prentice (1978), la prueba Fleming et al.(1980) y una prueba más general dada por Harrington Fleming (1982). Ahora se Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 5. Ingeniería Industrial. Actualidad y Nuevas Tendencias describe la prueba de Mantel Haenszel (1959) para comparar dos curvas de supervivencia de dos grupos. Supóngase que djz denota el número de ocurrencia de un evento en el tiempo tz en el grupo j, para j =1,2 y z = 1,2 ... p. En el grupo 11 Año 4, Vol. II, N° 6 ISSN: 1856 8327 combinado dz = d1z + d2z. La Tabla 1 ilustra que, en el tiempo tz hay n1z unidades a riesgo en el primer grupo y n2z unidades a riesgo en el segundo grupo. Así, en el tiempo tz se tienen nz unidades a riesgo en el grupo combinado y dz eventos. Tabla 1. Número de ocurrencias del evento en el tiempo tz para G1 y G2 Número Grupo Número de eventos Número de sobrevivientes unidades a riesgo n1z d1z n1z G1 d1z G2 d2z n2z d2z n2z Combinado dz nz dz nz La variable aleatoria d1z sigue una distribución hipergeométrica H(nz,n1z,dz) cuyo valor esperado es dz×n1z/nz y cuya varianza es: Var (d1z ) dz n1z nz n1z nz d z nz nz nz 1 (8) Para contrastar la hipótesis nula de no diferencia entre las curvas de supervivencia de los grupos se puede realizar usando el estadístico: (9) Donde wz son los pesos para cada momento tz. Se puede demostrar que la variable aleatoria Z se comporta como una distribución normal y en consecuencia su cuadrado sigue una distribución 2 con un grado de libertad. Para diferentes valores de wz se obtienen varias pruebas de comparación. Si wz=1 se obtiene la prueba de Mantel Haenszel (logrank). Si wz=nz se obtiene la prueba generalizada de Wilcoxon (Gehan). Tarone Ware propusieron una modificación de la prueba de Wilcoxon, con wz=(nz)1/2. En la prueba de Peto Peto (1972), wz = SPM(tz), que da mayor peso a las primeras diferencias y donde, SPM(tz) representa la estimación de la función de supervivencia a través del método de Prentice Marek (1979). El resto de las pruebas son adaptaciones de las pruebas anteriores, como la prueba de Fleming et al. y la prueba de Harrington Fleming. En el campo de recurrencia: Pepe Cai (1993) señaló que la prueba de comparación logrank pueden ser utilizadas para ER. Doganaksoy Nelson (1998) propusieron un método de comparación basado en las estimaciones de las funciones media acumulada para eventos con datos recurrentes y Martínez (2009), que propusieron una generalización de las pruebas clásicas ponderadas a eventos recurrentes. Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 6. 12 Ingeniería Industrial. Actualidad y Nuevas Tendencias PROPUESTA Problema En esta sesión se dan a conocer las propuestas o estadísticos de comparación de la hipótesis de prueba de que no hay diferencias en las k funciones de supervivencia: Ho: S1(t) = S2(t) = ... = Sk(t) Donde, S1(t), S2(t) ... Sk(t) son las funciones de supervivencia de los k grupos de individuos bajo estudio. Año 4, Vol. II, N° 6 ISSN: 1856 8327 Notación La notación utilizada es similar a la usada por Peña et al. (2001), con la diferencia que se utiliza el tercer subíndice r para identificar a los grupos, ver Martínez et al. (2009). Un supuesto fundamental en la propuesta es que los individuos bajo estudio han sido previamente y apropiadamente clasificados en cada grupo de acuerdo a una variable de estratificación. De esta manera, se puede estimar la función de supervivencia para cada grupo, con la siguiente expresión: S r (t ) 1 z t N s, z; r Y s, z; r r 1,2,..., k . (10) Tabla 2. Resumen del número de ocurrencias del evento en el tiempo de interocurrencia z para los diferentes grupos. Grupo Número a riesgo Número de eventos Número de sobrevivientes 1 Y(s,z;1) N(s,z;1) Y(s,z;1) - N(s,z;1) . r . Y(s,z;r) . N(s,z;r) . Y(s,z;r) - N(s,z;r) ´ Y(s,z;r’) N(s,z;r’) Y(s,z;r’) - N(s,z;r’) . k . Y(s,z;k) . N(s,z;k) . Y(s,z;k) - N(s,z;k) Combinado Y(s,z) N(s,z) Y(s,z) - N(s,z) r La Tabla 2 presenta el resumen de los datos de los grupos en tiempo de ocurrencia z, donde N(s,z)= N(s,z;1)+…+ N(s,z;r)+ N(s,z;r ) +…+ N(s,z;k) y Y(s,z)=Y(s,z;1)+…+Y(s,z;r)+Y(s,z;r )+…. Y(s,z;k). Y s, z; r w rz Ur z t N s, z; r Y s, z; r La idea consiste en comparar la proporción de ocurrencias de evento en cada grupo N(s,z;r)/Y(s,z;r), con respecto a la proporción de ocurrencia en el grupo combinado N(s,z)/Y(s,z). Si Ho es cierta la proporción en el grupo es similar a la del grupo combinado. El siguiente estadístico es una combinación lineal de las diferencias: N s, z Y s, z r 1,2,..., k . (11) Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 7. 13 Ingeniería Industrial. Actualidad y Nuevas Tendencias Donde, wrz son los pesos para cada momento de ocurrencia z en los r ésimo grupo. Donde, las variables Ur son tales que U1 + U2 + ... + Uk = 0 con w1z = w2z = ... = wkz = wz, lo que implica que 2 w rz Cov U r , U r ' z Y s, z N s, z Y s, z 2 gl k 1 Ut 1 U U una de ellas es combinación lineal de las restantes, y en consecuencia, la matriz de varianzas y covarianzas de las Ur no es invertible. Y s , z; r Y s, z N s, z Para resolver este problema se suprime una de ellas, por ejemplo la primera. Con ello, no hay pérdida sustantiva de información, y la matriz de varianzas y covarianzas del nuevo vector U con k 1 componentes será invertible, condición que se requiere para poder proponer el siguiente estadístico: (13) Año 4, Vol. II, N° 6 ISSN: 1856 8327 rr ' Y s, z; r Y s, z con 1 if r rr ' r' 0 if r r' (12) distribución chicuadrado con k 1 grados de libertad bajo la hipótesis nula. Esta estructura es similar a una propuesta por Tarone Ware para comparar grupos. Con una selección apropiada de los pesos, que se muestra en la Tabla 3, se obtiene una generalización de algunas pruebas clásicas al caso recurrente. Observe que el subíndice rec se utiliza para indicar la prueba correspondiente para ER. Este estadístico tiene forma cuadrática y se distribuye asintóticamente como una Tabla 3. Propuesta de pesos para las pruebas de comparación de curvas en el AS con ER. Comportamiento Pruebas tipo Notación Pesos (wz) Mantel Haenzsel Gehan Peto Peto LRrec Grec PPrec Tarone Ware TWrec Peto Prentice PPrrec SC(tz 1) Decreciente Prentice Marek PMrec SC(t) × Y(s,z) / [Y(s,z) +1] Decreciente Fleming Harrington O’sullivan FHOrec [SC(t)] 1: Decreciente =0: Constante 0< <1:Creciente Fleming et al. Frec [SC(t)] [1 SC(t)] r Martinez Mrec [SC(t)] [1 SC(t)] r Y(s,z) / [Y(s,z) +1] Martínez Ramírez Vásquez MRVrec 1 Y(s,z) SC(t) Y (s , z ) N(s, z) Constante Decreciente Decreciente Decreciente Aleatorio Sc(t)=Estimación de la función de supervivencia (modelo GPLE) para el grupo combinado Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 8. Ingeniería Industrial. Actualidad y Nuevas Tendencias APLICACIÓN Los datos del experimento de Byar (1980) corresponden a los tiempos de reapariciones de tumores medidos en meses para ciento dieciséis (116) pacientes enfermos con cáncer superficial de vejiga, (ver Martínez et al. (2009) datos disponibles en Andrews Herzberg (1985). Los pacientes fueron sometidos a un proceso de aleatorización en la asignación de los tratamientos: placebo (47 pacientes), pyridoxine (31 pacientes) y thiotepa (38 pacientes). Al inicio del experimento, los tumores presentes en los pacientes fueron removidos. En algunos casos se presentó recurrencia múltiple de tumores que también fueron extirpados al ser encontrados en los chequeos médicos. Al inicio, a cada paciente se le midieron dos variables de interés: el número inicial de tumores (num) y el tamaño (size) o diámetro del mayor de ellos, medido en DISCUSIÓN DE RESULTADOS La Figura 2 muestra los tiempos de reaparición de los tumores en los pacientes tratados con placebo, thiotepa y pyridoxine. La Figura 3 muestra tanto las curvas de supervivencia de los tiempos de reaparición de tumores de los tres grupos como la curva de supervivencia del grupo combinado. Las estimación de dichas 14 Año 4, Vol. II, N° 6 ISSN: 1856 8327 centímetros. El objetivo de la investigación de Byar consistía en determinar si las variables num y/o size tenían efectos significativos en la reaparición de los tumores de los pacientes, y luego comparar los tres tratamientos. El objetivo planteado en esta investigación es determinar si existen diferencias significativas entre las curvas de supervivencia de los tiempos de reaparición de los tumores entre los tres grupos: placebo, thiotepa y pyridoxine. Debido a que una de las restricciones del modelo GPLE es que el último tiempo de ocurrencia esté censurado por la derecha, se realizaron algunos cambios en la base de datos de aquellos pacientes donde esto no sucede. El cambio se hizo en aquellos pacientes cuyo período de observación culminó con una ocurrencia, a los que se le adicionó un dato censurado con un tiempo ligeramente superior al último momento de ocurrencia. curvas fueron realizadas usando el modelo de Peña et al. (2001) (modelo GPLE). En dicha figura se aprecia diferencias entre ellas, las cuales deben ser corroboradas utilizando las pruebas de comparación propuesta en este trabajo. La Tabla 4 muestra los resultados de la comparación de las curvas de supervivencia de los tres grupos tratados. Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 9. Ingeniería Industrial. Actualidad y Nuevas Tendencias 15 Año 4, Vol. II, N° 6 ISSN: 1856 8327 Figura 2 Representación gráfica de tiempos de reaparición de tumores en tres grupos. Figura 3 Representación gráfica de las curvas de supervivencia de los grupos Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 10. Ingeniería Industrial. Actualidad y Nuevas Tendencias 16 Año 4, Vol. II, N° 6 ISSN: 1856 8327 Tabla 4. Resultados de las pruebas de comparación de los tres grupos Pruebas Chi cuadrado p valor LRrec Grec TWrec PPrec PMrec PPrrec Frec =0, r=0 Mrec =0, r=0, Mrec =0, r=0, Mrec =0, r=0, Mrec =1, r=0, Mrec =1, r=1, MRVrec 2.98493 1.86934 2.37678 1.79447 1.78768 1.95451 2.98493 2.98493 1.86935 2.37678 1.79447 6.67953 3.16468 0.22482 0.39271 0.30471 0.40769 0.40908 0.37634 0.22482 0.22482 0.39271 0.30471 0.40769 0.03544 0.20549 =0, =0 =1, =0 =1/2, =0 =0 , = 0 =1, = 1 Para realizar las estimaciones de las pruebas de comparación propuestas en este trabajo fue necesario diseñar rutinas en lenguaje R. Todas las pruebas indican que desde el punto de vista estadístico no hay diferencias significativas entre tratamientos, a excepción de la prueba de Mrec con parámetros: = 1 , r =1, = 1 y = 1 que indica que si existe diferencia entre los tres tratamientos, tal como se aprecia en la Figura 3. Esto significa que para casos como éste si se escoge parámetros adecuados y convenientes la prueba Mrec es capaz de detectar diferencias que las otras pruebas no detectan. CONCLUSIONES detectan. La prueba Mrec es una generalización de todas las pruebas del AS tanto en el área clásica como en el campo de eventos recurrentes. Todas las pruebas del AS son casos particulares de la prueba Mrec, con excepción de la prueba MRVrec cuyos pesos son aleatorios y dependen de la cantidad de eventos que ocurran en cada momento durante el período de estudio. En este trabajo se plantearon pruebas estadísticas para comparar curvas de supervivencia de grupos con eventos recurrentes. Así mismo, se lograron generalizar las pruebas de comparación del AS clásico al campo de la recurrencia. La prueba Mrec es capaz de detectar diferencias que las otras pruebas no Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 11. Ingeniería Industrial. Actualidad y Nuevas Tendencias 17 Año 4, Vol. II, N° 6 ISSN: 1856 8327 REFERENCIAS Andersen, P. y Gill, R. (1982). Cox s regression model for counting processes: A large sample study. Annals of Statistics, 10, 1100 1120. Andrews D. y Herzberg A. (1985). Data. A collections of problems from many fields for the student and research worker. Springer series in Statistics, Springer Verlag, USA. Berkson J. y Gage R. (1952). Survival curve cancer patients following treatment. American Statistical Association Journal, 501 515. Bhomer P. (1912). Theorie der unabhängigen Wahrscheinlichkeiten, en Rapports. Mémoires et Procès verbaux de Septième Congrès International d´Áctuaries, Ámsterdam, 2, 327 343. Breslow, N. (1970). A generalized Kruskal Wallis test for comparing K samples subject to unequal patterns of censorship. Biometrika, 57, 579 594. Byar, D. (1980). The veterans administrations study of chemoprophylaxis for recurrent stage I bladder tumors: Comparisons of placebo, pyridoxine, and topical thiotepa. In Bladder tumor and other Topics in Urological Oncology. New York: Plenum, 363 370. Cox, D. (1972). Regression models and life tables. Journal of the Royal Statistical Society, Series B, 34, 187 220. Cutler S. y Ederer F. (1958). Maximum utilization on the life table method in analyzing survival. Biostatistics. Journal of chronic Diseases, 8, 699 712. Doganaksoy N. y Nelson W. (1998). A method to compare two samples of recurrence data. Lifetime Data Analysis, 48, 51 63. Fleming, T., O Fallon, J., O Brien, P. yHarrington, D. (1980). Modified Kolmogorov Smirnov test procedures with application to arbitrarily right censored data. Biometrics, 36, 607 625. Gehan, E. (1965a). A generalized Wilcoxon test for comparing arbitrarily singly censored samples. Biometrika, 52, 203 223. Gehan, E. (1965b). A generalized two sample Wilcoxon test for doubly censored data. Biometrika, 52, 650 653. Harrington D. y Fleming T. (1982). A class of rank test procedure for censored survival data. Biometrika, 60 (3), 553 566. Kaplan, E. y Meier, P. (1958). Nonparametric estimation from incomplete observations. Journal of the American Statistical Association, 53, 457 481. Mantel, N. (1966) Evaluation of survival data and two new rank order statistical arising in its consideration. Cancer Chemother. Rep.,50, 163 170. Mantel, N. y Haenszel, W. (1959). Statistical aspects of the analysis of data from retrospective studies of disease. Journal of the National Cancer Institute, 22 (4), 719 748. Martínez, C. (2009). Generalizaciones de algunas pruebas clásicas de comparación de curvas de supervivencia al caso de eventos de naturaleza recurrente. Tesis doctoral. Universidad Central de Venezuela. Caracas, Venezuela. Martínez, C., Ramírez, G. y Vásquez, M. (2009). Pruebas no paramétricas para comparar curvas de supervivencia de dos grupos que experimentan eventos recurrentes. Propuestas. Revista Ingeniería U.C., Vol. 16, N° 3, 45 55. Peña, E., Strawderman, R. y Hollander, M. (2001). Nonparametric estimation with recurrent event data. J.A.S.A., 99, 1299 1315. Pepe, M. y Cai, J. (1993). Some graphical display and marginal regression analyses for recurrent failure times and time dependent covariates. J.A.S.A, 88, 811 820. Martínez et al., Análisis de Supervivencia con Eventos Recurrentes, p.7 18
  • 12. Ingeniería Industrial. Actualidad y Nuevas Tendencias Peto R. y Peto J. (1972). Asymptotically efficient rank invariant test procedures (with discussion). J.R.S.S., A, 135, 185 207. Prentice, R. (1978). Linear rank tests with right censored data. Biometrika, 65(1), 167 179. Prentice, R. y Marek, P. (1979). Qualitative discrepancy between censored data rank test.Biometrics, 35, 861 867. Prentice, R., Williams, B. y Peterson, A. (1981). On the regression analysis of multivariate failure time data. Biometrika, 68(2), 373 379. Tarone, R. y Ware, J. (1977). On distribution free tests for equality of survival distributions. Biometrika, 64 (1), 156 160. 18 Año 4, Vol. II, N° 6 ISSN: 1856 8327 Wang, M. y Chang, S. (1999). Nonparametric estimation of a recurrent survival function. Journal of the American Statistical Association, 94, 146 153. Wei, L., Lin, D. y Weissfeld, L. (1989). Regression analysis of multivariate incomplete failure time data by modeling marginal distributions. Journal of the American Statistical Association, 84, 1065 1073. Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics, 1, 80 83. Autores Carlos Martínez. Profesor Asociado a Dedicación Exclusiva, Departamento de Investigación Operativa, Escuela de Ingeniería Industrial de la Facultad de Ingeniería de la Universidad de Carabobo, Valencia Venezuela. Graduado en la Maestría en Ingeniería Industrial (U.C.) y Doctor en Estadística graduado en la Universidad Central de Venezuela. E mail: cmmm7031@gmail.com Guillermo Ramírez. Profesor Titular de la Escuela de Estadística de la Facultad de Ciencias Económicas y Sociales (FACES) de la Universidad Central de Venezuela, Doctor en Estadística graduado en la Universidad de Salamanca España. Director de la Comisión de Estudios de Postgrado de FACES, UCV. E mail: guillermo.ramirez.ucv@gmail.com Maura Vásquez. Profesora Titular jubilada de la Escuela de Estadística de la Facultad de Ciencias Económicas y Sociales (FACES) de la Universidad Central de Venezuela, Doctora en Estadística graduada en la Universidad de Salamanca España. E mail: mauralvasquez@gmail.com Recibido: 05/04/2011 Aceptado: 31/05/2011 Martínez et al., Pruebas estadísticas para comparar curvas de supervivencia, p.7 18