El objetivo del presente trabajo consiste en proponer estadísticos de contraste para comparar curvas de supervivencia de dos grupos que experimentan eventos recurrentes. La idea proviene de los modelos de comparación del análisis clásico y constituyen generalizaciones de los estadísticos de comparación ponderados del análisis de supervivencia tradicional. Un evento es recurrente si puede ocurrir en más de una ocasión en la unidad bajo estudio.
Pruebas no paramétricas para comparar curvas de supervivencia de dos grupos que experimentan eventos recurrentes
1. R I´ UC, V. 16, N. 3, 2009 58 - 71
ı
Pruebas no param´ tricas para comparar curvas de supervivencia de dos grupos que
e
experimentan eventos recurrentes
Carlos Mart´nez∗,a , Guillermo Ram´rezb , Maura V´ squezb
ı
ı
a
a
Universidad de Carabobo. Facultad de Ingenier´a. Escuela de Ingenier´a Qu´mica. Valencia–Venezuela.
ı
ı
ı
b
Universidad Central de Venezuela. Caracas–Venezuela
Resumen.El objetivo del presente trabajo consiste en proponer estad´sticos de contraste para comparar curvas de supervivencia de
ı
dos grupos que experimentan eventos recurrentes. La idea proviene de los modelos de comparaci´ n del an´ lisis cl´ sico y
o
a
a
constituyen generalizaciones de los estad´sticos de comparaci´ n ponderados del an´ lisis de supervivencia tradicional. Un
ı
o
a
evento es recurrente si puede ocurrir en m´ s de una ocasi´ n en la unidad bajo estudio. Hasta la d´ cada de los a˜ os ochenta,
a
o
e
n
´
el an´ lisis de supervivencia se hab´a centrado en el estudio de una unica ocurrencia del evento por unidad de estudio. Sin
a
ı
embargo, en investigaciones recientes se han propuesto varios modelos para estudiar este tipo de fen´ menos. Estos eventos
o
´
son fen´ menos que ocurren en muchas areas, infinidades de eventos de este tipo suelen ocurrir en nuestro entorno, como:
o
enfermedades virales, aparici´ n de tumores cancerigenos, fiebres, fallas en maquinarias y equipos, nacimientos, homicidios,
o
terremotos, lluvias, erupciones de volcanes, accidentes laborales, accidentes automovil´sticos, entre otros. Recientemente, se
ı
han desarrollo novedosas t´ cnicas y modelos para estudiar los fen´ menos recurrentes. En esta investigaci´ n, se enumeran
e
o
o
algunos de ellos y nuestro objetivo es la comparaci´ n de curvas de supervivencia entre grupos que experimentan estos
o
fen´ menos. Nos proponemos, generar estad´sticos de comparaci´ n que permitan medir las diferencias estad´sticas de las curvas
o
ı
o
ı
de supervivencia estimadas con los modelos no param´ tricos. La idea consiste en generalizar los estad´sticos ponderados
e
ı
del an´ lisis cl´ sico al caso recurrente. En la investigaci´ n se dise˜ ar´ n rutinas en lenguaje R para evaluar los estad´sticos
a
a
o
n a
ı
propuestos. En este trabajo se emplean la base de datos del experimento de Byar, que es un experimento que mide los tiempos
(meses) de reapariciones de tumores de ciento diecis´ is (116) pacientes enfermos con c´ ncer superficial de vejiga tratado con:
e
a
placebo, thiotepa y piridoxina. El objetivo del estudio en esta aplicaci´ n consiste en comparar las curvas de supervivencia de
o
los tres grupos, medidos dos a dos, para determinar si existen diferencias significativas entre los tratamientos.
Palabras clave: An´ lisis de supervivencia, eventos recurrentes, pruebas no param´ tricas
a
e
Nonparametric Tests for Comparison Survival Curves of Two Groups with Recurrent
Events
Abstract.The objective of this paper is to propose statistical to compare survival curves of groups what experienced recurrent events.
The idea comes from the comparison of the models of classical analysis and they are generalizations of the statistical
comparison of the weighted traditional survival analysis. An event is recurring if it can happen more than once in the unit
under study. Survival analysis techniques have traditionally had focused its study of a single occurrence of the event per
unit. However, recent research has proposed several models to study such phenomena. These events are phenomena that
occur in many areas. Infinities such events tend to occur in our environment include: viral diseases, cancer tumors, fevers,
machinery and equipment failures, births, murders, earthquakes, rain, volcanic eruptions, industrial accidents, car accidents,
among others. Recently, have been developing new techniques and models to study recurrent phenomena. In this research,
are listed some of them and our aim is to compare survival curves between groups who experience these phenomena. We
intend to generate statistical comparison to measure the statistical differences in survival curves what have estimated with
the nonparametric models. The idea consist in generalize classical tests weighted of the statistical analysis and will apply on
recurrent events. In the investigation, we will design programs in R language to evaluate the proposed. In this work we will
use the database the experiment of Byar, that is an experiment that measures the time (months) of recurrence of tumors of one
hundred sixteen (116) patients with superficial bladder cancer treated with placebo, thiotepa and pyridoxine. The aim of this
study consist in the application of the proposed to compare the survival curves of the three groups, and determine whether
there are significant differences between treatments.
Keywords: Survival analysis, recurrent events, nonparametric tests
Revista Ingenier´a UC
ı
2. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
1. Introducci´ n
o
En el an´ lisis de supervivencia (AS) se dispone de
a
un conjunto de herramientas estad´sticas para estudiar
ı
la aparici´ n de eventos en el tiempo. Este lapso de
o
tiempo se mide desde un momento inicial, (inicio de un
tratamiento, diagn´ stico, operaci´ n, entre otros) hasta
o
o
el momento de la ocurrencia de un evento terminal
predefinido (evento que puede representar muerte, falla,
aparici´ n de tumores, mejoras, entre otras). Los datos
o
del AS esta formada; adem´ s, de una serie de variables
a
medidas en las unidades bajo estudio, de tiempos
de supervivencia completos (unidades con eventos
terminales ocurridos en el tiempo de observaci´ n) y
o
de tiempos de supervivencia censurados (con eventos
terminales no ocurridos en el tiempo de observaci´ n).
o
Cuando el AS es aplicado al estudio de eventos de
tipo biol´ gico asociados con la ocurrencia de eventos
o
que provienen de plantas, animales o seres humanos, es
llamado an´ lisis de supervivencia y cuando el an´ lisis
a
a
es dirigido a las industrias o seres inanimados, se le
conoce como an´ lisis de confiabilidad.
a
´
El uso del AS se ha extendido a otras areas
de investigaci´ n como: la sicolog´a, bioingenier´a,
o
ı
ı
medicina, f´sica, astronom´a, estudio de eventos de
ı
ı
vida, entre otras. Tradicionalmente los estudios de
´
supervivencia se orientaron al an´ lisis de una unica
a
ocurrencia de un evento por unidad bajo estudio (AS
cl´ sico). Sin embargo, desde hace cuatro d´ cadas los
a
e
estudios se han extendido a la aparici´ n de eventos
o
recurrentes (AS recurrente). Los eventos recurrentes
´
son sucesos que pueden presentarse en muchas areas,
cabe mencionar: fallas en maquinarias y equipos,
reaparici´ n de tumores en personas enfermas con
o
c´ ncer, ataques de epilepsia, fiebre provocada por
a
enfermedades infecciosas, accidentes automovil´sticos,
ı
accidentes laborales, delitos, matrimonios, divorcios,
nacimientos, entre otros. En el AS se pueden enumerar
dos conjuntos de modelos, los modelos tradicionales
y los modelos para eventos recurrentes. En los modelos recurrentes; se incluyen, tanto los trabajos de
Prentice et al [1] que son modelos de regresi´ n
o
tipo Cox adaptados al caso recurrente; como los
modelos propuesto por Pe˜ a et al [2]. Los modelos
n
de regresi´ n tipo Cox son modelos que consideraan el
o
efecto de covariables y son conocidos como modelos
semiparam´ tricos, mientras que los modelos que no
e
59
consideran los efectos de covariables son conocidos
como modelos no param´ tricos. En los modelos tipo
e
Cox se asume que los tiempos entre ocurrencias del
evento son independientes e id´ nticamente distribuidos
e
e independientes de los tiempos de censura, con
excepci´ n del modelo de Wang–Chang [3] y el modelos
o
de fragilidad de Pe˜ a et al [2], donde estos datos pueden
n
o no estar correlacionados.
2. Metodolog´a
ı
2.1. Notaci´ n b´ sica del an´ lisis de supervivencia
o a
a
La variable aleatoria principal de un estudio en el
AS es el tiempo (T ). Esta variable se utiliza para
medir el lapso de tiempo que transcurre desde un
momento inicial definido hasta la aparici´ n del evento,
o
la cual tiene asociada una serie de funciones; entre
las que se encuentran: La funci´ n de densidad de
o
probabilidades (fdp o f ), la funci´ n (F) o funci´ n de
o
o
distribuci´ n acumulada (fda), la funci´ n (S ) o funci´ n
o
o
o
de supervivencia, la funci´ n de riesgo instant´ neo,
o
a
(h o λ) y la funci´ n de riesgos acumulados, (H
o
o ∧). Funciones que definimos a continuaci´ n: Si,
o
T la variable aleatoria que representa el tiempo de
ocurrencia del evento de estudio y F es la fda de
la variable T , entonces: F(t) = P(T ≤ t); y en
consecuencia, S (t) = 1 − F(t), (Ec. 1 y 2)
t
F(t) =
f (s)ds
(1)
0
∞
F(t) =
f (s)ds
(2)
t
para funciones discretas (Ec. 3 y 4)
F(t) =
f (s)∆t
(3)
s≤t
F(t) = 1 −
f (s)∆t
(4)
s≤t
Sea, h la raz´ n instant´ nea de ocurrencia de un evento
o
a
de estudio, definida como en (Ec. 5):
l´m
ı
∆t→0
P(t ≤ T < t + ∆t/T ≥ t)
t
(5)
As´
ı
h(t) =
f (t)
S (t)
(6)
Y si, H la funci´ n de riesgo acumulado (Ec. 7):
o
t
∗
H(t) =
Autor para correspondencia
Correo-e: cmartinez@uc.edu.ve (Carlos Mart´nez)
ı
h(s)ds
0
Revista Ingenier´a UC
ı
(7)
3. 60
C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
2.3.
(8)
Otros modelos cl´ sicos del an´ lisis de supera
a
vivencia
En la Tabla 1 se agrupan otro conjunto de modelos
´
cl´ sicos, no param´ tricos utiles para estimar S con
a
e
eventos no recurrentes.
(9)
Tabla 1: Estimadores cl´ sicos no param´ tricos del AS
a
e
Entonces, para funciones continuas (Ec. 8):
t
H(t) =
0
dF(s)
S (s)
y para funciones discretas (Ec. 9):
H(t) =
s≤t
∆F(s)
S (s)
Autor
2.2. Modelos cl´ sicos de supervivencia
a
Los modelos del AS cl´ sicos m´ s conocidos, son: los
a
a
modelos actuariales, el modelo de Kaplan–Meier [4] y
el modelo de riesgos proporcionales de Cox [5]. Entre
los modelos actuariales m´ s utilizados, se encuentran:
a
Bhomer [6], Berkson–Gage [7] y Cutler–Ederer [8].
´
Los modelos actuariales son utiles en aquellos casos
donde no se dispone de los tiempos exactos de
ocurrencia del evento. Por ello, la informaci´ n se
o
presenta agrupada en intervalos de tiempo. Kaplan–
Meier [4] proponen un estimador de la S , en presencia
de datos censurados u observaciones incompletas,
conocido hoy en d´a como estimador ((L´miteproducı
ı
to)). Este modelo es de tipo cl´ sico no param´ tricos. El
a
e
estimador Kaplan–Meier con tiempos de supervivencia
no repetidos, esta dado por (Ec. 10):
j
S (t j ) =
i=1
ni − di
ni
(10)
Donde, di representa el numero total de ocurrencia
en el i–´ simo momento y ni representa el numero de
e
unidades a riesgo justo antes del tiempo t j . El modelo
de riesgos proporcionales propuesto por Cox [5],
supone que existe un conjunto de covariables, digamos:
X = (x1 , x2 , . . . , x p )′ , que afectan el comportamiento
del tiempo de ocurrencia de los eventos. El modelo
asume independencia entre las observaciones de cada
unidad y entra en la clasificaci´ n de los modelos
o
cl´ sicos, semiparam´ tricos y multivariante. Para este
a
e
modelo, la funci´ n de riesgo condicionada, esta dada
o
por (Ec. 11 y 12):
q
β j X j)
(
h(t/X) = ho (t)e
S (t/X) = S o (t)
j=1
′
(β X)
e j
(11)
(12)
Donde, h0 (t) es la funci´ n de riesgo base, S 0 (t) es
o
la funci´ n de supervivencia base y β es el vector de
o
par´ metros desconocidos que miden los efectos de las
a
covariables.
A˜ o
n
Estimador de S (t)
Kaplan–Meier
1958
S (t j ) =
j
i=1
j
Alshuler
1970
S (t j ) =
i=1
j
Prentice
1978
S (t j ) =
i=1
j
Prentice–Marek
1979
S (t j ) =
i=1
j
Andersen et al
1982
S (t j ) =
Harris–Albert
1991
S (t j ) =
Moreau et al
1992
S (t j ) =
Hosmer–Lemeshow
1999
S (t j ) =
ni −di
ni
exp − dii
n
ni
ni +1
ni −di +1
ni +1
ni −di +1 n j
ni +1
n j +1
i=1
j
ni +di −1
ni +di
i=1
j
ni
ni +di
i=1
j−1
ni −di +1 n j
ni +1 n j +1
i=1
2.4.
Otros modelos para an´ lisis de supervivencia
a
con eventos recurrentes
Mart´nez–Borges (2008) propusieron un conjunto
ı
de modelos no param´ tricos del AS con eventos
e
recurrentes. Propuestas que se fundamentan en el
trabajo de Pe˜ a et al. (2001), quienes derivaron el
n
estimador GPLE para eventos recurrentes, a partir
de los estimadores cl´ sicos Nelson–Aalen y Kaplan–
a
Meier. Los autores del estimador GPLE dise˜ aron
n
dos procesos contadores a los que denotaron, con la
siguiente notaci´ n: N(s, t) y Y(s, t). La Tabla 2 ilustra
o
los modelos propuestos por Mart´nez–Borges [9].
ı
3. Modelos de supervivencia para eventos recurrentes
Los primeros aportes del AS recurrente datan desde
los a˜ os ochenta, con los trabajos de Prentice et
n
al [1], Andersen–Gill [10] y Wei et al [11]. Los
aportes m´ s recientes, se incluyen los trabajos de:
a
Wang–Chang [3], Pe˜ a et al [2], Nelson [12], Hollann
der Setruraman [13], Gonz´ lez–Pe˜ a [14], Gonz´ lez–
a
n
a
Pe˜ a [15], Pe˜ a-Slate [16], Pe˜ a E. [17] y Mart´nez–
n
n
n
ı
Borges [9]. Wayne Nelson [12] public´ un trabajo
o
donde resuelve problemas de modelaci´ n de fallas en
o
sistemas industriales de tipo mec´ nico y el´ ctrico.
a
e
Revista Ingenier´a UC
ı
4. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
61
Tabla 2: Estimadores no param´ tricos del AS para eventos recurrene
tes
Estimador tipo
Estimador de S (t)
Kaplan–Meier
N(s,∆w)
Y(s,w)
w≤t j
1−
w≤t j
exp − N(s,∆w)
Y(s,z)
Alshuler
Prentice
w≤t j
Prentice–Marek
w≤t j
Andersen et al
w≤t j
Harris–Albert
w≤t j
Moreau et al
w≤t j
GPLE
GEAlsh
Y(s,w)
Y(s,w)+1
GEPren
Y(s,w)+1−N(s,∆w)
Y(s,w)+1
GEPrMa
Y(s,w)+1−N(s,∆w) Y(s,w)
Y(s,w)+1
Y(s,w)+1
GEAnde
Y(s,w)+1−N(s,∆w)
Y(s,w)+N(s,∆w)
GEHaAl
Y(s,w)
Y(s,w)+N(s,∆w)
GEPrMo
Hosmer–Lemeshow
w≤t j−1
3.1.
Notaci´ n
o
Y(s,w)+1−N(s,∆w) Y(s,w)
Y(s,w)+1
Y(s,w)+1
GEHoLE
Modelo de Wang y Chang (Modelo WC)
Wang–Chang [3] propusieron un modelo de estimaci´ n de curvas de supervivencias S para eventos
o
recurrentes que es aplicable tanto a casos donde existe
independencia entre los tiempos entre ocurrencias
como aquellas situaciones en presencia de datos correlacionados. El estimador propuesto por Wang–Chang
(WC) es un estimador que se puede definir utilizando
dos procesos de conteo, d∗ (t) y R∗ (t), d∗ (t) representa
la suma total de las proporciones de tiempos de entre
ocurrencias iguales a t y R∗ (t) representa el promedio
de individuos que est´ n en riesgo en el momento t. De
a
modo que (Ec. 13):
n
ˆ
S (t) =
i=1 { j:T i j ≤t}
1−
d∗ (T i j )
R∗ (T i j )
Figura 1: Representaci´ n gr´ fica de la recurrencia de eventos en la
o
a
i–´ sima unidad de investigaci´ n
e
o
3.2.
modelos de Pe˜ a, Strawderman y Hollander
n
(Modelo PHS)
Pe˜ a et al. (2001) propusieron dos modelos de supern
vivencia para eventos recurrentes. Uno, que generaliza
el estimador cl´ sico de la curva de supervivencia de
a
´
Kaplan–Meier a eventos recurrentes, util para aquellos
casos donde existe independencia entre los tiempos
de interocurrencia, denotado como modelo GPLE de
Pe˜ a et al. y otro modelo que considera la fragilidad
n
o probabilidad de ocurrencia del evento en la unidad
de estudio. En esta propuesta los autores definieron dos
procesos de conteo N e Y, que permiten realizar las
estimaciones de su modelo y dise˜ aron una herramienta
n
gr´ fica que permiten realizar estos proceso (Figura 2).
a
(13)
Donde, T i j es el tiempo de interocurrencia del j–´ simo
e
evento en la i–´ sima unidad de investigaci´ n, S i j es el
e
o
tiempo calendario de la j–´ sima ocurrencia del evento
e
en la i–´ sima unidad (Figura 1).
e
S´, S i0 = 0 y S i j = T i1 + T i2 + . . . + T iki , tal que,
ı
Ki es el n´ mero de eventos que experimenta la i–´ sima
u
e
unidad de investigaci´ n, Ki = max{ j : S i j ≤ τi }, τi es
o
el tiempo total de observaci´ n de la i–´ sima unidad de
o
e
investigaci´ n y n es el n´ mero total de ocurrencias del
o
u
evento.
Figura 2: Gr´ fica de la ocurrencia de un evento recurrente en una
a
unidad
´
En el caso de una unica ocurrencia del evento, los
procesos quedan definidos por N e Y. Pero, para el caso
de eventos recurrentes, es necesario definir dos escalas
de tiempo: un tiempo calendario S i j y un tiempo de
interocurrencias T i j . El tiempo calendario S acumula
Revista Ingenier´a UC
ı
5. 62
C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
los tiempos de interocurrencias T en cada una de las
unidades bajo estudio. Los procesos N e Y se definen
como: N(s, t) e Y(s, t). Donde, N(s, t) representa el
n´ mero de eventos observados en el per´odo calendario
u
ı
[0, s] con tiempos de interocurrencias menores e iguales
a t e Y(s, t) representa el n´ mero el n´ mero de
u
u
eventos observados en el per´odo calendario [0, s] con
ı
tiempos de interocurrencias mayores e iguales1 a t.
De modo que, si Ni (s, t) es el n´ mero de eventos
u
observados en el per´odo calendario [0, s] con tiempos
ı
de interocurrencias menores e iguales a t para la i–
´
esima unidad de investigaci´ n, Yi (s, t) ser´ el n´ mero
o
a
u
de eventos observados en el per´odo calendario [0, s]
ı
con tiempos de interocurrencias mayores e iguales a t,
en cada unidad bajo estudio (Ec. 14 a 16).
supervivencia condicionada que definida en la Ec. 19:
t
S (t/Zi = z) = [S 0 (t)]z
n
n
Ki
Ni (s, t) o
i=1
n
Y(s, t) =
i=1 j=1
I Ti j ≤ t
(14)
i=1
n
i=1
j=1
(15)
Ki
Y(s, t) =
I T i j ≥ t + I τi − S iKi ≥ t
(16)
De esta manera, el estimador generalizado del l´mite–
ı
producto de Kaplan–Meier propuestos por Pe˜ a et al.
n
(2001), quedo definido como (Ec. 17):
ˆ
S (t) =
w≤t
1−
N(s, ∆w)
Y(s, w)
(17)
(18)
El otro modelo propuesto por es el modelo de fragilidad
donde se asume que existe una variable aleatoria no
medible o variable latente que representa el grado de
heterogeneidad entre las unidades de los grupos en
estudio, la cual se asume independiente de la censura.
El termino fragilidad se entiende como heterogeneidad
individual, debido a que existen unidades que tienen
mayor probabilidad de experimentar el evento que
otros. Este es conocido como modelo de fragilidad
multiplicativa y si se asume que la variable de fragilidad
sigue una distribuci´ n gamma con par´ metros de forma
o
a
y escala iguales a α. Si para cada unidad existe
una variable de fragilidad no observable y positiva,
digamos Zi ; tal que, para cada momento t la funci´ n de
o
0
du
(19)
α
α + ∧0 (t)
α
(20)
Donde, ∧0 (t) es la funci´ n de riesgo base acumulada.
o
3.3.
Yi (s, t)
o S (t/Zi = z) = e
Donde, λ0 (t) es la funci´ n de riesgo base y S 0 (t) es
o
la funci´ n de supervivencia basal. Con, Z1 , Z2 , . . . , Zn
o
como las variables de fragilidad de las unidades,
se asumen id´ nticamente distribuidas con una cierta
e
distribuci´ n com´ n H para todas ellas. En el modelo
o
u
FRMLE, H se distribuye gamma con par´ metros de
a
forma y escala iguales a α. La funci´ n S del modelo
o
FRMLE se puede expresar como (Ec. 20):
S (t) =
N(s, t) =
−z λ0 (u)
Otros modelos para an´ lisis de supervivencia
a
con eventos recurrentes
Mart´nez–Borges (2008) propusieron un conjunto
ı
de modelos no param´ tricos del AS con eventos
e
recurrentes. Propuestas que se fundamentan en el
trabajo de Pe˜ a et al. (2001), quienes derivaron el
n
estimador GPLE para eventos recurrentes, a partir
de los estimadores cl´ sicos Nelson–Aalen y Kaplan–
a
Meier. Los autores del estimador GPLE dise˜ aron
n
dos procesos contadores a los que denotaron, con la
siguiente notaci´ n: N(s,t) y Y(s,t). La Tabla 2 ilustra
o
los modelos propuestos por Mart´nez–Borges (2008).
ı
4. Pruebas cl´ sicas del an´ lisis de supervivencia
a
a
4.1.
Introducci´ n
o
El objetivo de la comparaci´ n en el AS es similar
o
a aquellos procedimientos dise˜ ados para comparar
n
estad´sticos provenientes de muestras independientes,
ı
como la prueba t, la prueba de los signos, la prueba
no param´ trica de los rangos signados de Wilcoxon
e
(1945), la prueba U de Mann–Whitney (1947), la
prueba de Kruskal–Wallis (1952), la prueba ponderada
de Cochran (1954) y la prueba de an´ lisis de varianza
a
de dos o m´ s v´as. Todas estas pruebas de comparaci´ n
a ı
o
se utilizan para evaluar diferencias entre estad´sticos
ı
que han sido estimados basados en la informaci´ n que
o
se obtiene de subgrupos poblaciones independientes
entre si. Sin embargo, en el AS sucede un fen´ meno que
o
no es considerado en estas pruebas que es la censura.
Esta es la raz´ n que imposibilita la aplicaci´ n directa
o
o
Revista Ingenier´a UC
ı
6. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
de estas pruebas en la comparaci´ n de subgrupos en el
o
AS. Por ello, muchos investigadores se han dedicado
a dise˜ ar pruebas de comparaci´ n espec´ficas para
n
o
ı
utilizar en el AS. Entre las m´ s utilizadas para comparar
a
curvas en el AS tradicional podemos mencionar la
prueba del logaritmo del rango (logrank) propuesta
por Mantel–Haenszel (1959); la prueba generalizada de
Wilcoxon propuesta por Gehan (1965); la prueba de
Peto–Peto (1972), la prueba de Tarone–Ware (1977),
la prueba de rangos lineales con datos censurados por
la derecha propuesta por Prentice (1978), la prueba
de Harrington–Fleming (1982) que generaliza parte
de las pruebas anteriores y una versi´ n m´ s general
o
a
propuesta por Fleming et al. (1987). Detalles sobre
estas pruebas se pueden consultar en: Therneau et al.
(1990), Fleming–Harrington (1991), entre otros.
4.2.
Prueba de comparaci´ n de dos grupos en el
o
an´ lisis de supervivencia tradicional
a
Mantel–Haenszel (1959) propusieron un estad´stico
ı
que permite relacionar las pruebas de asociaci´ n de
o
las Tablas de contingencia con los contrastes de
igualdad de curvas de supervivencia entre subgrupos
poblacionales. Sup´ ngase que se quiere contrastar las
o
curvas de supervivencia de dos grupos poblacionales.
Sup´ ngase adem´ s que hay p tiempos diferentes
o
a
de ocurrencia del evento en el grupo combinado,
digamos:t(1) , t(2) , . . . , t(p) y que en el momento tz
ocurren dlz eventos en el primer grupoo y d2z eventos en
el segundo, para todo z = 1, 2, . . . , p. En cada momento
tz , hay n1z unidades a riesgo en el primer grupo y n2z
unidades en el segundo.
En consecuencia, en el momento tz habr´ nz = n1z +
a
n2z unidades a riesgo en el grupo combinado y ocurrir´ n
a
dz = d1z + d2z eventos (ver Tabla 03).
Tabla 3: N´ mero de ocurrencias del evento en el momento tz para
u
los grupos G1 y G2.
Grupos
Y(s, z; r)
N(s, ∆z; r)
Y(s, z; r) − N(s, ∆z; r)
G1
G2
d1z
d2z
n1z − d1z
n2z − d2z
n1z
n2z
Combinados
dz
nz − dz
nz
Si se considera que en el momento z–´ simo se tiene
e
una poblaci´ n formada por dos grupos, digamos G1
o
y G2 y se define la variable aleatoria d1z como el
n´ mero de eventos que ocurren en el grupo G1 en el
u
momento tz . En ese momento se tiene un poblaci´ n
o
de tama˜ o nz definida por el total de individuos a
n
63
riesgo, clasificada en dos subpoblaciones de tama˜ os
n
n1z para el grupo G1 y n2z para el grupo G2. Si
se pudiera considerar que el n´ mero de ocurrencias
u
dz para los dos grupos combinados es una muestra
aleatoria sin reemplazamiento de la poblaci´ n anterior,
o
entonces la variable aleatoria d1z sigue una distribuci´ n
o
hipergeom´ trica H(nz , n1z , dz ) cuya media es igual a
e
dz n1z /nz y varianza (Ec. 21):
var{d1z } = dz
n1z nz − n1z nz − dz
nz
nz
nz − 1
(21)
La hip´ tesis nula (Ho ) que se desea contrastar es que
o
no hay diferencia entre las curvas de supervivencia de
ambos grupos, lo que se logra evaluando la diferencia
entre el n´ mero de eventos observados y el n´ mero
u
u
de eventos esperados en cada uno de los momentos
de ocurrencia, bajo los supuestos de Ho . Esto es
equivalente a comparar el n´ mero de eventos ocurridos
u
en cualquiera de los grupos con respecto al n´ mero
u
de eventos esperados en el grupo combinado. El
estad´stico de contraste se basa en una funci´ n de la
ı
o
variable aleatoria definida por el n´ mero de eventos
u
en cada momento y se construye como una suma de
variables aleatorias independientes estandarizadas, bajo
el supuesto de que las ocurrencias en un momento
determinado son independientes de las que ocurren en
cualquier otro momento (Ec. 22).
p
Z=
z=1
wz d1z − E(d1z )
(22)
p
Var(d1z )
z=1
La variable aleatoria Z se comporta como una distribuci´ n normal tipificada y en consecuencia su cuadrado
o
sigue una distribuci´ n χ2 con un grado de libertad.
o
La prueba de Mantel–Haenszel es muy potente para
detectar diferencias cuando los logaritmos de las curvas
de supervivencia son proporcionales. Sin embargo, la
potencia de la prueba disminuye cuando las curvas
de supervivencia que se entrecruzan. Las pruebas de
comparaci´ n del AS cl´ sico son modificaciones del
o
a
estad´stico de Cochran y lo que las hace diferentes
ı
es el uso de los pesos wz . Si wz = 1 se obtiene la
prueba de Mantel–Haenszel (log–rank). Si wz = nz se
obtiene la prueba generalizada de Wilcoxon (Gehan).
Esta prueba da mayor peso a las diferencias de los
primeros tiempos de supervivencia del evento. Tarone–
Ware propusieron una modificaci´ n de la prueba
o
1/2 . Peto–Peto (1972)
de Wilcoxon, con wz = (nz )
Revista Ingenier´a UC
ı
7. 64
C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
propusieron una prueba con una ponderaci´ n wz =
o
S PM (tz ), que tambi´ n da mayor peso a las primeras
e
diferencias entre los eventos observados y los eventos
esperados de los primeros tiempos de supervivencia.
S PM (tz ) representa la estimaci´ n de la funci´ n de
o
o
supervivencia a trav´ s del m´ todo de Prentice–Marek,
e
e
la cual disminuye desde uno a cero en la medida que
aumentan los tiempos de supervivencia. El resto de las
pruebas son modificaciones de las pruebas anteriores o
generalizaciones de las anteriores, como la de Fleming
et al. y la de Harrington–Fleming.
5. Propuestas
En una investigaci´ n bibliogr´ fica sobre pruebas de
o
a
comparaci´ n en fen´ menos con eventos recurrentes,
o
o
s´ lo se logr´ detectar tres trabajos que considero
o
an el tema: Pepe–Cai (1993), Glyn–Buring (1996)
y Doganaksoy–Nelson (1998). La metodolog´a de
ı
comparaci´ n m´ s cercana a las propuestas de esta
o
a
investigaci´ n es la indicada por Pepe–Cai.
o
5.1.
los conceptos y en los modelos del AS cl´ sico, para
a
extender el uso de los estad´sticos de comparaci´ n al
ı
o
caso recurrente. Para ello, se utilizaran los conceptos y
notaciones propuestas por Pe˜ a et al. (2001).
n
5.2. Notaci´ n b´ sica
o a
Utilizaremos la letra r para denotar los grupos
(r = 1, 2), nr representar´ el total de unidades bajo
a
estudio en el r–´ simo grupo, con n = n1 + n2 . Ki
e
denota el total de ocurrencias del evento en la i–´ sima
e
unidad bajo estudio en el grupo combinado y Kri el
total de eventos experimentados por la i–´ sima unidad
e
en el r–´ simo grupo. K es el total de eventos en todas
e
las unidades en el grupo combinado y Kr el total
de eventos en las unidades pertenecientes al r–´ simo
e
grupo. Entonces (Ec. 23):
K = K1 + K2 + . . . + Kn o K = K1 + K2
o tambi´ n (Ec. 24)
e
2
nr
K=
Kri
(24)
r=1 i=1
Problema de Investigaci´ n
o
Sup´ ngase que estamos interesados en comparar las
o
curvas de supervivencia de dos grupos poblacionales
que experimentan un evento recurrente, cuyas curvas
han sido estimadas usando el modelo GPLE y cuyos
grupos han sido definidos a trav´ s de la estratificaci´ n
e
o
de una variable de inter´ s, por ejemplo sexo, edad o
e
estrato social. Nuestro problema consiste en comparar
´
las curvas y determinar si estas difieren significativamente. Para realizar la comparaci´ n de las curvas nos
o
planteamos el siguiente contraste de hip´ tesis:
o
H0 : S 1 (t) = S 2 (t)
H1 : S 1 (t)
(23)
S 2 (t)
Para efectuar dicho contrate es necesario evaluar la
diferencia que existe entre el n´ mero observado de
u
eventos en cualquiera de los grupos y el n´ mero
u
esperado de eventos en el grupo combinado, bajo el
supuesto que la hip´ tesis nula es cierta. Si ambas curvas
o
son iguales, el n´ mero observado de eventos en el grupo
u
seleccionado (en todos los momentos de ocurrencia)
es igual al n´ mero esperado de eventos del grupo
u
combinado. As´, comparar las curvas de ambos grupos
ı
es equivalente a comparar la curva de cualquiera de
los grupos con la curva de supervivencia esperada del
grupo combinada, Mantel–Haenszel (1959). Nuestra
idea consiste en introducir ciertas modificaciones en
´
Estas ultimas notaciones est´ n escritas en negrillas,
a
para diferenciar los Ki de los Kr . El sub´ndice i se
ı
utiliza para identificar a la i–´ sima unidad en los
e
grupos. El sub´ndice j se utiliza para indicar a la j–
ı
´
esima ocurrencia del evento en cualesquiera de las n
unidades bajo estudio, con j = 1, 2, . . . , Ki o j =
1, 2, . . . , Kri dependiendo de si se est´ considerando
a
el grupo combinado o el r–´ simo grupo. T i j describe
e
el j–´ simo tiempo de interocurrencia del evento en la
e
i–´ sima unidad bajo estudio en el grupo combinado
e
y T ri j el j–´ simo tiempo de interocurrencia de la i–
e
´
esima unidad en el r–´ simo grupo. Los tiempos T i j
e
se asumen independientes e id´ nticamente distribuidos.
e
La funci´ n de distribuci´ n de los T i j viene dada por:
o
o
F(t) = P(T i j ≤ t). Donde, S i j se define como el
tiempo transcurrido desde el momento inicial hasta
que se produce la j–´ sima repetici´ n del evento en el
e
o
individuo i del grupo combinado (tiempo calendario).
Se conviene en establecer que S i0 = 0 y T i0 = 0 para
todo i = 1, 2, . . . n. Se tiene, entonces que (Ec. 25):
j
S ij =
T i j′
(25)
j′ =0
∀i = 1, 2, . . . , n ∧ j = 1, 2, . . . , Ki
S i j se define como el j–´ simo tiempo calendario de la
e
i–´ sima unidad en el r–´ simo grupo, y se asume que
e
e
Revista Ingenier´a UC
ı
8. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
S ri0 = 0 y T ri0 = 0, para todo i = 1, 2, . . . , nr y para
todo r = 1, 2. Se tiene, entonces que (Ec. 26):
j
S ri j =
T ri j′
(26)
j′ =0
∀r = 1, 2; i = 1, 2, . . . , n ∧ j = 1, 2, . . . , Kri
τi y τri denotan el tiempo de observaci´ n de la i–´ sima
o
e
unidad bajo estudio en el grupo combinado y en el
r–´ simo grupo respectivamente. Para cada unidad se
e
dispone de un tiempo de observaci´ n igual a [0, τi ] o
o
[0, τri ], dependiendo de si se est´ considerando el grupo
a
combinado o el grupo r. El tiempo de observaci´ n τ
o
es una variable aleatoria con funci´ n de probabilidades
o
desconocida igual a: G(t) = P(τ ≤ t). Si denotamos
el tiempo de censura de la i–´ sima unidad como Ci ,
e
tenemos (Ec. 27):
Ci = τi − S iKi ∀i = 1, 2, . . . , n
Cri = τri − S riKri ∀i = 1, 2, . . . , n ∧ r = 1, 2
(28)
Asumiremos independencia entre las censuras y los
tiempos de interocurrencias, y s´ lo consideraremos
o
censuras por la derecha. Al igual que Pe˜ a et al.
n
(2001), definiremos procesos contadores en cada uno
de los grupos. En el modelo GPLE, Ni (s, t) representa el n´ mero de eventos observados en la i–´ sima
u
e
unidad en el tiempo calendario [0, s] con tiempos
de interocurrencias menores o iguales a t e Yi (s, t)
representa el n´ mero de eventos observados en la i–
u
´
esima unidad en el tiempo calendario [0, s] con tiempos
de interocurrencias mayores o iguales a t. Definiremos
aqu´ (Ec. 29 y 30):
ı
j
Ni (s, t j ) =
j′ =1
I T i j′ ≤ t j
∀ i = 1, 2, . . . , n ∧ j = 1, 2, . . . , Ki (s−)
j′ =1
n
N(s, t) =
Utilizando estos conceptos, ellos plantearon y desarrollaron el estimador GPLE de la funci´ n del AS tipo
o
limite–producto de Kaplan–Meier:
s(t) =
ˆ
z≤1
1−
N(s, ∆z)
Y(s, ∆z)
(33)
Donde, la variable N(s, ∆z) es el n´ mero de eventos
u
observados en las unidades bajo estudio en el tiempo calendario [0, s] con tiempos de interocurrencias
iguales a z, donde, el ´ndice z representa los tiempos
ı
de interocurrencias de los eventos ordenados. z = { T i j :
con T i j ordenados en forma creciente i = 1, . . . , n y
j = 1, . . . , ki }
En forma an´ loga, definiremos en este trabajo los
a
siguientes procesos contadores: Nri (s, t) que representa
el n´ mero de eventos observados en la i–´ sima unidad
u
e
del r–´ simo grupo en el tiempo calendario [0, s] con
e
tiempos de interocurrencias menores o iguales a t:
j
Nri (s, t j ) =
j′ =1
I T ri j′ ≤ t j
r = 1, 2
∀ i = 1, 2, . . . , n
j = 1, 2, . . . , K (s−)
ri
(34)
Yri (s, t) que representa el n´ mero de eventos observados
u
en la i–´ sima unidad en el r–´ simo grupo en el
e
e
tiempo calendario [0, s] con tiempos de interocurrencias mayores o iguales a t:
j
j′ =1
(30)
Los autores del modelo GPLE tambi´ n definieron dos
e
procesos agregados: N(s, t) que representa el n´ mero
u
(32)
i=1
+ I min(s, τi ) − S iKi(s−) ≥ t j
∀ i = 1, 2, . . . , n ∧ j = 1, 2, . . . , Ki (s−)
(31)
Yi (s, t)
Y(s, t) =
Yri (s, t j ) =
I T i j′ ≥ t j
Ni (s, t)
i=1
n
(29)
j
Yi (s, t j ) =
de eventos observados en todas las unidades en el
tiempo calendario [0, s] con tiempos de interocurrencias menores o iguales a t e Y(s, t) que representa el
n´ mero de eventos observados en todas la unidades en
u
el tiempo calendario [0, s] con tiempos de interocurrencias mayores o iguales a t (Ec. 31 y 32):
(27)
Para referirnos a los grupos se utiliza la notaci´ n Cri
o
que es el tiempo de censura de la i–´ sima unidad en el
e
grupo r (Ec. 28):
65
I T ri j′ ≤ t j + I min(S , τri ) − S riKri (s−) ≥ t j
r = 1, 2
∀ i = 1, 2, . . . , n
j = 1, 2, . . . , K (s−)
ri
(35)
De modo que los procesos agregados en los grupos
quedan definidos, como: N(s, t; r) que es el n´ mero
u
Revista Ingenier´a UC
ı
9. 66
C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
de eventos observados en las unidades del r − −´ simo
e
grupo en el tiempo calendario [0, s] con tiempos de
interocurrencias menores o iguales a t:
son iguales a:
E N(s, ∆z; 1) = N(s, ∆z)
nr
N(s, t; r) =
i=1
Nri (s, t) ∀r = 1, 2
(36)
var N(s, ∆z; 1) =
Y(s, t; r) que es el n´ mero de eventos observados en las
u
unidades del r–´ simo grupo en el tiempo calendario
e
[0, s] con tiempos de interocurrencias mayores o
iguales a t:
nr
Y(s, t; r) =
i=1
Yri (s, t) ∀r = 1, 2
(37)
Los procesos agregados generales quedan definidos
como:
2
nr
N(s, t) =
2
Nri (s, t) o
N(s, t) =
r=1 i=1
nr
Y(s, t) =
(42)
[Y(s, z) − N(s, ∆z)]
[Y(s, z) − 1]
N(s, ∆z)
Y(s, z; 1)
Y(s, z; 1)
1−
Y(s, z)
Y(s, z)
(43)
La Tabla 4 muestra la variable que representa el
n´ mero de eventos observados en [0, s] con tiempos
u
de interocurrencias iguales a z, tanto en el grupo
combinado como para los grupos, as´ como la variable
ı
del n´ mero de eventos experimentados por todas las
u
unidades con tiempos de interocurrencias mayores o
iguales a z.
N(s, t; r)
r=1
(38)
2
Y(s, z; 1)
Y(s, z)
Tabla 4: N´ mero de ocurrencias del evento en el momento z–´ simo
u
e
para los grupos 1 y 2
2
Yri (s, t) o
Y(s, t) =
r=1 i=1
Grupos
Y(s, z; r)
N(s, ∆z; r)
Y(s, z; r) − N(s, ∆z; r)
1
2
Y(s, z; 1)
Y(s, z; 2)
N(s, ∆z; 1)
N(s, ∆z; 2)
Y(s, z; 1) − N(s, ∆z; 1)
Y(s, z; 2) − N(s, ∆z; 2)
Combinados
Y(s, z)
N(s, ∆z)
Y(s, z) − N(s, ∆z)
Y(s, t; r)
r=1
(39)
y los estimadores de las funciones de supervivencia
para cada grupo, queda definido como:
sr (t) =
ˆ
z≤1
N(s, ∆z; r)
1−
Y(s, ∆z; r)
El estad´stico de prueba se define como:
ı
∀r = 1, 2
(40)
Y el estimador de la funci´ n del AS para el grupo
o
combinado, sC (t), queda definido como:
sC (t) =
ˆ
z≤1
5.3.
1−
N(s, ∆z)
Y(s, ∆z)
Z=
z=t
wz N(s, ∆z; 1) − E N(s, ∆z; 1)
z=t
(41)
Propuestas para la comparaci´ n de dos grupos
o
Sea N(s, ∆z; 1) el n´ mero de eventos observados en
u
las unidades del 1er grupo en el tiempo calendario [0, s]
y con tiempos de interocurrencias iguales z en un total
de eventos observados igual a N(s, ∆z). Donde, N(s, ∆z)
es el n´ mero de eventos observados en las unidades
u
del grupo combinado en el tiempo calendario [0, s] con
tiempos de interocurrencias iguales a z. De la definici´ n
o
de la variable N(s, ∆z; 1) se desprende que se trata de
una variable aleatoria con distribuci´ n hipergeom´ trica
o
e
H(Y(s, z), Y(s, z, 1), N(s, ∆z)), cuyas media y varianza
≈ N(0, 1)
w2 Var N(s, ∆z; 1)
z
(44)
El estad´stico propuesto es un estad´stico de contraste
ı
ı
ponderado que puede ser utilizado para comparar grupos del AS con eventos recurrentes. Se define como una
combinaci´ n lineal de las diferencias que existen entre
o
el n´ mero de eventos experimentados por las unidades
u
en un grupo determinado en todos los momentos
de ocurrencias del evento y su valor esperado. Esta
combinaci´ n lineal es una suma ponderada de variables
o
aleatorias estandarizadas que se asumen independientes. El estad´stico Z tiene un comportamiento asint´ tico
ı
o
normal, ver Childs–Balakrishan (2000). Su cuadrado
tendr´ un comportamiento aproximado chi–cuadrado
a
Revista Ingenier´a UC
ı
10. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
(χ2 ) con un grado de libertad:
2
Z =
∀z
wz N(s, ∆z; 1) − E N(s, ∆z; 1)
z=t
w2 Var N(s, ∆z; 1)
z
≈ χ2
gl=1
(45)
En la secci´ n 2.6.2 se mencionaron las diferentes
o
pruebas para comparar curvas de supervivencia en el
AS cl´ sico. Resulta razonable pensar que es posible
a
extender el de esta pruebas ponderadas a problemas de
comparaci´ n de curvas de supervivencia con eventos
o
recurrentes, generalizando su uso hacia ese campo. En
la Tabla 05, presentamos una serie de ponderaciones
que dan lugar a generalizaciones de las pruebas
´
cl´ sicas al ambito recurrente, el sub´ndice rec indica
a
ı
su adaptaci´ n al caso recurrente. Para mayores detalles
o
sobre estas pruebas y sobre las rutinas en lenguaje R
para las estimaciones de las mismas, se recomienda
consultar tesis doctoral de Mart´nez (2009).
ı
67
´
modelo GPLE es que el ultimo tiempo en el paciente
est´ censurado por la derecha, nos hemos visto en la
e
necesidad de realizar algunos cambios en la base de
datos de aquellos experimentos donde esto no suceda.
El cambio consiste en que aquellas pacientes que
culminen el per´odo de observaci´ n con una aparici´ n
ı
o
o
´
del tumor, estos deben ser censurados con un tiempo
´
ligeramente superior al ultimo tiempo de registro.
La Figura 3 ilustra los tiempos de reaparici´ n
o
de los tumores. La gr´ fica muestra los tres grupos
a
involucrados en el estudio. En este trabajo se aplicaran
las pruebas propuestas para: a) Comparar las curvas de
supervivencia en pacientes tratados con thiotepa y el
grupo placebo, b) comparar curvas de supervivencia en
pacientes tratados con piridoxina y el grupo placebo,
c) para comparar curvas de supervivencia en pacientes
tratados con thiotepa y con piridoxina.
6. Aplicaci´ n y Discusi´ n de resultados
o
o
6.1.
Datos del experimento de Byar (1980)
La Tabla del Anexo A ilustra los datos del experimento de Byar (1980) que corresponde a los
tiempos de reapariciones de tumores medidos en meses
para ciento diecis´ is (116) pacientes enfermos con
e
c´ ncer superficial de vejiga, v´ r trabajo de Andrews–
a
e
Herzberg (1985). Estos pacientes fueron sometidos
a un proceso de aleatorizaci´ n en la asignaci´ n en
o
o
los siguientes tratamientos placebo (47 pacientes),
piridoxina (31 pacientes) y thiotepa (38 pacientes).
Al inicio del estudio los tumores presentes en los
pacientes fueron removidos. En los casos donde se
presentaron recurrencia m´ ltiples de tumores, tambi´ n
u
e
les fueron extirpados justo cuando fueron encontrados
en los chequeos m´ dicos. Al inicio del estudio, a cada
e
paciente se le midieron dos variables de inter´ s: el
e
n´ mero inicial de tumores (num) y el tama˜ o (size) o
u
n
di´ metro del mayor de los tumores encontrados (cm.).
a
Byar ten´a como objetivo principal determinar si las
ı
variables num y/o size ten´an efectos significativos en la
ı
reaparici´ n de los tumores de los pacientes para los tres
o
tratamientos. Nuestro objetivo en esta investigaci´ n es
o
determinar si existen diferencias significativas entre las
curvas de supervivencia de la reaparici´ n de tumores
o
entre los tres grupos: placebo, thiotepa y piridoxina.
En vista de que una de las restricciones para uso del
Figura 3: Representaci´ n gr´ fica de tiempos de reaparici´ n de
o
a
o
tumores en tres grupos
6.2.
Comparaci´ n curvas de supervivencia grupo
o
placebo vs. grupo thiotepa
La Figura B1 y la Tabla B1 del anexo B muestran
las salidas de la rutina dise˜ ada en lenguaje R.
n
Las rutinas dise˜ adas permiten estimar y graficar las
n
funciones de supervivencia de los grupos en estudio.
Adicionalmente permiten calcular los estad´sticos de
ı
comparaci´ n de las curvas, as´ como los valores
o
ı
p–valores correspondientes. La figura B1 muestra
las curvas de supervivencia de los grupos placebo,
thiotepa y el grupo combinado. Se aprecian diferencias
Revista Ingenier´a UC
ı
11. 68
C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
Tabla 5: Propuestas de pesos para pruebas de comparaci´ n en el AS con recurrencia, S C (tz ): Supervivencia de la muestra combinada estimada
o
por el modelo GPLE
Prueba cl´ sica
a
Prueba
Peso (wz )
Peso relativo
Mantel–Haenzsel
Gehan
Peto–Peto
Tarone–Ware
Peto–Prentice
Prentice–Marek
Fleming–Harrington–O’Sullivan
Fleming et al
Mart´nez
ı
CMart´nez
ı
LRrec
Grec
PPrec
TWrec
PPrec
PMrec
FHOrec
FHrec
Mrec
CMrec
1
Y(s, z)
S
√ C (t)
Y(s, z)
S C (tz−1 )
S C (t) × Y(s, z)/[Y(s, z) + 1]
[S C (t)]ρ
[S C (t)]ρ [1 − S C (t)]r
[S C (t)]ρ [1 − S C (t)]r Y(s, z)α /[Y(s, z) + 1]β
[Y(s, z) − N(s, ∆z)]/Y(s, z)
constante
decreciente
decreciente
decreciente
ρ ≥ 1 : decreciente, ρ = 0 : constante, 0 < ρ < 1 : creciente
decreciente
importantes entre las curvas de supervivencia de
placebo y thiotepa. Aunque, los resultados presentados
en la Tabla B1 indican que la hip´ tesis de igualdad de
o
las curvas de supervivencia no puede ser rechazada. Lo
que permite concluir que el tratamiento con thiotepa
en pacientes enfermos con c´ ncer de vejiga no tiene
a
efectos significativos en los tiempos de reaparici´ n de
o
los tumores.
6.3.
Comparaci´ n curvas de supervivencia del grupo
o
placebo vs. grupo piridoxina
La figura del anexo B2 ilustra las curvas de supervivencia de los grupos que han sido estimadas a trav´ s
e
del modelo GPLE. Esta figura muestra las curvas de
supervivencia de los grupos placebo, piridoxina y el
grupo combinado, observ´ ndose leves diferencias entre
a
los grupos. Los resultados de la Tabla B2 indican que
no se puede rechazar la hip´ tesis de igualdad entre
o
dichas curvas. As´ que el tratamiento con piridoxina
ı
en pacientes enfermos con c´ ncer de vejiga no tiene
a
efectos significativos en los tiempos de reaparici´ n de
o
los tumores.
6.4.
Comparaci´ n curvas de supervivencia grupo
o
piridoxina vs. thiotepa
La figura B3 del anexo B ilustra las curvas de
supervivencia de piridoxina y thiotepa, estimadas a
trav´ s del modelo GPLE y la Tabla B3 muestra los
e
resultados de las pruebas correspondientes. Esta figura
muestra las curvas de supervivencia de los grupos
piridoxina, thiotepa y grupo combinado. En la gr´ fica
a
B3, se observa que existe una leve diferencia entre
las curvas de supervivencia de ambos grupos. No se
puede rechazar la hip´ tesis de igualdad de las curvas
o
de supervivencia de los grupos piridoxina y thiotepa.
Tabla 6: Resultados de las pruebas de comparaci´ n de las curvas
o
de supervivencia de los grupos placebo y thiotepa utilizando
propuestas
Pruebas
LRrec
Grec
TWrec
PPec
PMrec
PPrrec
FHrec1=0, p2=0
CMrec p1=0, p2=0, p3=0, p4= 0
CMrec p1=0, p2=0, p3=1, p4= 0
CMrec p1=0, p2=0, p3=1/2, p4= 0
CMrec p1=1, p2=0, p3=0 , p4= 0
CMrec p1=1, p2=0, p3=1, p4= -1
Mrec
χ2
1.8160
0.2162
0.8589
0.4025
0.3934
0.5038
1.8160
1.8160
0.2162
0.8589
0.4025
0.3934
1.7971
p–valor
0.1778
0.6420
0.3540
0.5258
0.5305
0.4778
0.1778
0.1778
0.6420
0.3540
0.5258
0.5305
0.1801
7. Conclusiones
En este trabajo se logr´ dise˜ ar una serie de
o
n
estad´sticos de pruebas que generaliza las pruebas
ı
del AS cl´ sico al caso recurrente. La importancia
a
de este trabajo, radica en que su dise˜ o dota a
n
´
los investigadores del area de nuevas y poderosas
herramientas para el an´ lisis de fen´ menos recurrentes.
a
o
Otra conclusi´ n de importancia, con relaci´ n a las
o
o
pruebas propuestas es que con la prueba CMrec es
posible generar el resto de las pruebas de comparaci´ n,
o
nos referimos a las pruebas LRrec, Grec, TWrec,
PPrec, PMrec, PPrrec y FHrec. Por lo tanto, la prueba
CMrec es la versi´ n generalizada de todas las pruebas
o
anteriores. Con relaci´ n a la aplicaci´ n de las pruebas
o
o
en el experimento de Byar, se puede concluir que
los tratamientos piridoxina o thiotepa, no producen
efectos significativos en la reaparici´ n de tumores en
o
los pacientes enfermos con c´ ncer de vejiga.
a
Revista Ingenier´a UC
ı
12. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
69
Tabla 7: Resultados de las pruebas de comparaci´ n de las curvas de
o
supervivencia de los grupos placebo y piridoxina
Pruebas
LRrec
Grec
TWrec
PPec
PMrec
PPrrec
FHrec1=0, p2=0
CMrec p1=0, p2=0, p3=0, p4= 0
CMrec p1=0, p2=0, p3=1, p4= 0
CMrec p1=0, p2=0, p3=1/2, p4= 0
CMrec p1=1, p2=0, p3=0 , p4= 0
CMrec p1=1, p2=0, p3=1, p4= -1
Mrec
χ2
0.3052
1.445
0.9552
1.1323
1.1430
1.4669
0.3052
0.3052
1.4448
0.9552
1.1323
1.1430
0.2441
p–valor
0.5806
0.2294
0.3284
0.2873
0.28501
0.2258
0.5806
0.5806
0.2294
0.3284
0.2873
0.2850
0.6213
(a)
(b)
Tabla 8: Resultados de las pruebas de comparaci´ n de las curvas de
o
supervivencia de los grupos piridoxina y thiotepa
Pruebas
LRrec
Grec
TWrec
PPec
PMrec
PPrrec
FHrec1=0, p2=0
CMrec p1=0, p2=0, p3=0, p4= 0
CMrec p1=0, p2=0, p3=1, p4= 0
CMrec p1=0, p2=0, p3=1/2, p4= 0
CMrec p1=1, p2=0, p3=0 , p4= 0
CMrec p1=1, p2=0, p3=1, p4= -1
Mrec
χ2
2.3297
1.1681
1.8256
1.3048
1.2921
1.6872
2.3297
2.3297
1.1681
1.8256
1.3048
1.2921
2.2223
p–valor
0.1269
0.2798
0.1766
0.2533
0.2557
0.1940
0.1269
0.1269
0.2798
0.1766
0.2533
0.2557
0.1360
(c)
Figura 4: (a) Representaci´ n gr´ fica de la comparaci´ n del
o
a
o
grupo placebo vs. grupo thiotepa, (b) Representaci´ n gr´ fica
o
a
de la comparaci´ n del grupo placebo vs. grupo piridoxina, (c)
o
Representaci´ n gr´ fica de la comparaci´ n del grupo piridoxina vs
o
a
o
thiotepa
Revista Ingenier´a UC
ı
14. C. Mart´nez et al / Revista Ingenier´a UC, Vol. 16, No. 3, diciembre 2009, 58-71
ı
ı
Referencias
[20]
[1] Prentice, R., Williams, B. y Peterson, A. (1981), On
the regression analysis of multivariate failure time data,
Biometrika, 68(2), 373–379.
[2] Pe˜ a, E., Strawderman, R. y Hollander, M. (2001), Nonparan
metric estimation with recurrent event date, JASA, 99, 1299–
1315.
[3] Wang, M. y Chang, S. (1999), Nonparametric estimation
of a recurrent survival function, Journal of the American
Statistical Association, 94, 146–153.
[4] Kaplan, E. L. y Meier, P. (1958), Nonparametric estimation
from incomplete observations, Journal of the American
Statistical Association, 53, 457–481.
[5] Cox, D. R. (1972), Regression models and life–tables, Journal
of the Royal Statistical Society, Series B, 34, 187–220.
[6] Bhomer P., (1912), ((Theorie der unabh¨ ngigen Wahrscheina
lichkeiten)) en Rapports, M´ moires et Proc` s–verbaux de
e
e
´
´
Septi` me Congr` s International d´Actuaries, Amsterdam
e
e
volumen 2 p.p. 327–343.
[7] Berkson J., Gage R., (1952), ((Survival curve cancer patients
following treatment)). American Statistical Association Journal, 501–515.
[8] Cutler S. y Ederer F. (1958), Maximun utililization on the life
table method in analysing survival, Biostatistics, Journal of
Choronic Diseases, 8, 699–712.
[9] Mart´nez, C., Borges R. (2008), modelos de estimaciones
ı
no param´ tricas del an´ lisis de supervivencia con eventos
e
a
recurrentes. Propuestas. Revista de Ingenier´a UC. 15(3).
ı
[10] Andersen, P., Borgan, F., Gill, R. y Keiding, N. (1982),
((Linear nonparametric test for comparison of counting
processes, with aplications to censored survival data (with
discussion))), Internat. Statis. Review, 50, 219–258.
[11] Wei, L., Lin, D. y Weissfeld, L. (1989), Regression analysis
of multivariate incomplete failure time data by modeling
marginal distributions, Journal of the American Statistical
Association, 84, 1065–1073.
[12] Nelson W., (2002), ((Recurrent Events Data Analysis for
Product Repairs, Disease Recurrences, and other Applications)), ASA–SIAM, Series on Statistics and Aplied
Probability #10, Philadelphia.
[13] Hollander M ., Sethuraman, J., (2004), ((Nonparametric
inference for repair models)), The Indian Journal of Statistics.
Special issue in memory of D. Basu, 64, Serie A, Pt. 3, 693–
706.
[14] Gonz´ lez, J. y Pe˜ a, E. (2003), Bootstraping median survival
a
n
with recurrent event data, IX conferencia Espa˜ ola de
n
Biometr´a, A Coru˜ a, Mayo 28–30.
ı
n
[15] Gonz´ lez, J. y Pe˜ a, E. (2004), Estimaci´ n no parametrica
a
n
o
de la funci´ n de supervivencia para datos con eventos
o
recurrentes, Revista Espa˜ ola de Salud P´ blica, 78, 189–199.
n
u
[16] Pe˜ a E., Slate E., (2005). ((Dynamic Modeling in reliability
n
and survival analysis)). Modern Statistical and Mathematical
Methods in Reliability. (A. Wilson, N. Limnios, Keller–
McNulty and Y. Armijo, eds) 55–71. World Scientific,
Singapore.
[17] Pe˜ a, E., (2006). ((Dynamic Modeling and Statistical Analysis
n
of Events Times)). Statistical Science, 21(4), 487–500.
[18] Wilcoxon F., (1945), ((Individual comparisons by ranking
methods)). Biometrics, 1, 80–83.
[19] Mann H., Whitney D., (1947), ((On a test of whether one of
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
[34]
71
two random variables is stochasticalll larger than the other)).
Ann. Math. Statist. 18, 50–60.
Kruskal W., Wallis W., (1952), ((Use of ranks in one–criterion
variance analysis)). Journal of the American Statistical
Association, 47, 583–621.
Cochran W., (1954), ((Some methods of strengthening the
common ?2 tests)), Biometrics, 10, 417–451.
Mantel N., Haenszel W., (1959), ((Statistical aspects of the
analysis of data from retrospective studies of disease)). Journal
of the National Cancer Institute, 22 (4), 719–748.
Gehan E., (1965), ((A generalized Wilcoxon test for
comparing arbitrarily singly–censored samples)). Biometrika,
52, 203–223.
Peto R., Peto J.,(1972), ((Asymptotically efficient rank
invariant test procedures (with discussion))). J.R.S.S., A, 135,
185–207.
Tarone R., Ware J., (1977), ((On distribution–free tests for
equality of survival distributions)). Biometrika, 64 (1), 156–
160.
Prentice, R. (1978), Linear rank tests with right censored data,
Biometrika, 65(1), 167–179.
Harrington D., Fleming T., (1982), ((A class of rank test
procedure for censored survival data)), Biometrika, 60 (3),
553–566.
Fleming, T., O’Fallon, J., O’Brien, P. y Harrinton, D.
(1980), Modified Kolmogorov–Smirnov test procedures with
application to arbitrarily right–censored data, Biometrics, 36,
607–625.
Pepe M., Cai J., (1993), ((Some graphical display and
marginal regression analyses for recurrent failure times and
time dependent covariates)). J.A.S.A, 88, 811–820.
Glynn R., Buring J., (1996), ((Ways of measuring rates
of recurrent events)). Division of Preventive Medicine,
Deparment of Medicine, Brighan and Wome´s Hospital and
Harvard Medical School, Boston, MA 02215, USA. BMJ,
312, 364–367.
Doganaksoy N., Nelson W., (1998), ((A method to Compare
Two Samples of Recurrence Data)), Lifetime Data Analysis,
48, 51–63.
Mart´nez, C. M. (2009), Generalizaciones de algunas pruebas
ı
de cl´ sicas de comparaci´ n de curvas de supervivencia al
a
o
caso de eventos de naturaleza recurrente. Tesis doctoral. UCV,
ISBN: 978–980–12–3605–4. Caracas–Venezuela.
Byar D., (1980): ((The veterans administrations study of
chemoprophylaxis for recurrent stage I bladder tumors:
Comparisons of placebo, pyridoxine, and topical thiotepa)).
In Bladder tumor and other Topics in Urological Oncology.
New York: Plenum, 363–370.
Andrews D., Herzberg A., (1985), ((Data. A collections of
problems from many Fields for the student and research
worker)). Springer series in Statistics, Springer–Verlag, USA.
Revista Ingenier´a UC
ı