Minería de secuencias de datos

Minería de secuencias de datos
Autor: Manuel Martín Salvador

9 de diciembre de 2011

„utoresX vuis wF de g—mpos y ƒilvi— e™id

I

Índice
1. Introducción 5

2. Los datos 5
PFIF ƒe™uen™i—s de d—tos F F F F F F F F F F F F F F F F F F F F F F F F F F S
PFPF g—m˜ios de ™on™epto F F F F F F F F F F F F F F F F F F F F F F F F F T

3. Algoritmos de clasicación de secuencias de datos 8
QFIF eprendiz—je online F F F F F F F F F F F F F F F F F F F F F F F F F F V
QFPF we™—nismos de olvido F F F F F F F F F F F F F F F F F F F F F F F F W
QFQF „—xonomí— de métodos de —prendiz—je F F F F F F F F F F F F F F F IH
QFRF iv—lu—™ión del pro™eso de —prendiz—je F F F F F F F F F F F F F F F II

4. Aplicaciones 14

5. Revisión de métodos de aprendizaje con disparadores 15
SFIF elgoritmos ™on dete™™ión de ™—m˜io F F F F F F F F F F F F F F F F IS
SFIFIF hhw @hrift hete™tion wethodA F F F F F F F F F F F F F F F IS
SFIFPF ihhw @i—rly hrift hete™tion wethodA F F F F F F F F F F IV
SFIFQF wétodo de uifer F F F F F F F F F F F F F F F F F F F F F F F IV
SFIFRF eh‡sx @ed—ptive ‡indowingA F F F F F F F F F F F F F F F IW
SFPF elgoritmos ™on vent—n— de entren—miento F F F F F F F F F F F F F PP
SFPFIF wétodo de ulinken˜erg F F F F F F F F F F F F F F F F F F F PQ
SFPFPF psƒr @unipied snst—n™e ƒele™tion —lgoritrmA F F F F F F F PR

6. Aportaciones 26
TFIF woreirrorswoving F F F F F F F F F F F F F F F F F F F F F F F F F F PT
TFPF w—xwoving F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PV
TFQF wovingever—ge F F F F F F F F F F F F F F F F F F F F F F F F F F F F PW

7. MOA (Massive Online Analysis) 34
UFIF il entorno F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QR
UFPF qener—™ión de se™uen™i—s de d—tos F F F F F F F F F F F F F F F F F QS
UFQF wétodos de ™l—si(™—™ión F F F F F F F F F F F F F F F F F F F F F F F QW
UFRF wétodos de ev—lu—™ión F F F F F F F F F F F F F F F F F F F F F F F F QW
UFRFIF roldout F F F F F F F F F F F F F F F F F F F F F F F F F F F F QW
UFRFPF snterle—ved „estE„henE„r—in @o €requenti—lA F F F F F F F F RH

Q

8. Experimentación 41
VFIF gonjuntos de d—tos re—les F F F F F F F F F F F F F F F F F F F F F F RI
VFPF f—terí— de prue˜—s F F F F F F F F F F F F F F F F F F F F F F F F F F RP
VFQF ‚esult—dos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RQ

9. Conclusión y trabajo futuro 57

10.Bibliografía 59

R

1. Introducción
in este tr—˜—jo v—mos — tr—t—r el pro˜lem— del —prendiz—je —utomáti™o so˜re
se™uen™i—s de d—tosF in un entorno ™lási™o se dispone de un— ˜—se de d—tos
™omplet— y estáti™—D y el o˜jetivo es —prender un modelo que represente lo más
(elmente posi˜le di™hos d—tosF in ™—m˜ioD ™u—ndo en lug—r de disponer de todos
los d—tos —l tiempoD estos v—n lleg—ndo de t—nto en t—ntoD en un— se™uen™i— de
d—tosD — priori de longitud in(nit—D tenemos que —˜ord—r el pro˜lem— del —prenE
diz—je de diferente m—ner—F il pro˜lem— diverge —ún más ™u—ndo l— distri˜u™ión
de los d—tos que se v— re™i˜iendo v—rí— — lo l—rgo del tiempo y por t—nto se h—™e
ne™es—rio —just—r el modelo dur—nte todo el pro™esoF
€or elloD en primer lug—r será ne™es—rio ™on™ret—r este ™on™epto de d—tos que
™onstituye l— entr—d— — un nuevo sistem— de —prendiz—je que se des™ri˜e en l—
ƒe™™ión PF e ™ontinu—™iónD se est—˜le™en los requerimientos de ™u—lquier —lgoE
ritmo de ™l—si(™—™ión so˜re se™uen™i—s de d—tos y l— estru™tur— gener—l de ™ómo
se —˜ord— este pro˜lem— en l— liter—tur— @ƒe™™ión QAF v— minerí— de se™uen™i—s
de d—tos tiene un gr—n ™—mpo de —pli™—™ión ™omo se muestr— en l— ƒe™™ión RF
entes de expli™—r nuestr—s propuest—s en l— ƒe™™ión TD se h—™e un— revisión de
los tr—˜—jos más dest—™—dos en l— dete™™ión de ™—m˜ios de ™on™epto @ƒe™™ión
SAF €—r— l— p—rte experiment—l h— sido ne™es—rio est—˜le™er un m—r™o de tr—˜—jo
que puede ser referen™i— p—r— futur—s experiment—™iones y se h— utiliz—do p—r—
re—liz—r el estudio ™omp—r—tivo de los diferentes métodos sele™™ion—dos @ƒe™™ión
VAF „odo ello h— sido des—rroll—do dentro un entorno softw—re que tr—˜—j— so˜re
™l—si(™—™ión ™on se™uen™i—s de d—tosD que se expli™—rá en l— ƒe™™ión UF pin—lE
menteD de l— p—rte experiment—l se extr—en ™on™lusiones y se est—˜le™en nuevos
o˜jetivos p—r— tr—˜—jos futuros en l— ƒe™™ión WF

2. Los datos
2.1. Secuencias de datos
h—do un pro˜lem— de un dominio determin—doD un— se™uen™i— de d—tos @data
stream A está ™ompuest— por un— serie de inst—n™i—s que lleg—n —l sistem— — dis™reE
™iónD de un— en un— o en p—quetes de t—m—ño regul—r o v—ri—˜leF v—s inst—n™i—s
que ™omponen l—s se™uen™i—s de d—tos en un pro˜lem— orient—do — l— ™l—si(™—E
™iónD suelen est—r form—d—s por un ™onjunto de v—ri—˜les o˜serv—d—s x1 , ..., xn y
un— ™l—se y F in prin™ipio est—s se™uen™i—s tienen un t—m—ño ilimit—do y —demás
es posi˜le que el pro˜lem— presente ™—m˜ios en l— distri˜u™ión su˜y—™ente — lo
l—rgo del tiempo que se re)ejen en l— se™uen™i—D por lo que no se pueden us—r
los enfoques tr—di™ion—les de minerí— de d—tosF il entorno de tr—˜—jo ne™es—rio
p—r— oper—r ™on se™uen™i—s de d—tos de˜e ™umplir ™iert—s restri™™iones ‘frzIH“X

IF xo se pueden —lm—™en—r todos los d—tos en memori—F ƒolo se permite
registr—r un— pequeñ— ™—ntid—d de inst—n™i—sD mientr—s que el resto se v—n
elimin—ndo un— vez pro™es—d—sF
PF v— velo™id—d ™on l— que se re™i˜en los d—tos impli™— que el pro™es—miento
de˜e h—™erse en tiempo re—lF

S

QF v— distri˜u™ión de los d—tos puede v—ri—r en el tiempoD de m—ner— que los
d—tos —ntiguos se vuelven irrelev—ntes p—r— l— et—p— —™tu—lF

v— restri™™ión I impli™— limit—r el t—m—ño de l— memori— utiliz—d— dur—nte el
—prendiz—jeD mientr—s que l— P limit— el tiempo de pro™es—miento de ™—d— muesE
tr—F in —quellos entornos en los que l—s se™uen™i—s de d—tos se—n evolutiv—s
@presenten ™—m˜iosAD h—y que tener en ™uent— l— restri™™ión Q en el pro™eso de
—prendiz—je e in™orpor—r métodos de dete™™ión de ™—m˜ios que permit—n evoluE
™ion—r el modeloF

2.2. Cambios de concepto
h—do un pro˜lem— de un dominio determin—doD se denomin— ™—m˜io de ™on™epto
@concept drift A — l— situ—™ión que se produ™e ™u—ndo los d—tos de un— se™uen™i—
p—s—n de tener un— distri˜u™ión de pro˜—˜ilid—d S1 — otr— distri˜u™ión S2 D
donde S1 y S2 son de orígenes diferentes @ver pigur— IAF iste tipo de se™uen™i—s
de d—tos se suelen denomin—r evolutiv—s o dinámi™—sD frente — l—s estáti™—sD que
no present—n ™—m˜ios de ™on™eptoF

pigur— IX ‚epresent—™ión visu—l de un ™—m˜io de ™on™epto gr—du—l — lo l—rgo del
tiempo ‘liIH—“

v— n—tur—lez— del ™—m˜io de ™on™epto es imprede™i˜leD por lo que no se tr—t— de
™—m˜ios ™on periodi™id—d ™ono™id—D si no que l— suposi™ión prin™ip—l ™u—ndo se
—˜ord— este pro˜lem— es l— in™ertidum˜re so˜re el futuroF il ™—m˜io de ™on™epto
se puede d—r por tres ™—us—s ‘ureWW“X

IF g—m˜io en l—s pro˜—˜ilid—des — priori de l—s ™l—ses P (c1 ), . . . , P (ck )

PF g—m˜io en l—s distri˜u™iones de pro˜—˜ilid—d ™ondi™ion—d—s P (X|ci )D i =
1, . . . , k

T

QF g—m˜io en l—s pro˜—˜ilid—des — posteriori P (ci |X)D i = 1, . . . , k

gomo ejemplos de ™—m˜io de ™on™epto se pueden ™onsider—r los ™orreos ˜—sur—
@spam AD que intent—n v—ri—r su ™ontenido p—r— s—lt—rse los (ltros de ™orreoD o l—
evolu™ión de l— s—lud de un p—™iente —l in™luir un nuevo medi™—mentoF
ƒe pueden en™ontr—r en l— liter—tur— ‘frzIH“ h—st— seis tipos de ™—m˜ios so˜re
un— v—ri—˜le — lo l—rgo del tiempoD t—l y ™omo se puede o˜serv—r en l— pigur— PF
v— primer— grá(™— @Sudden A muestr— un ™—m˜io —˜ruptoD en el que ™—m˜i— el
v—lor de l— ™l—se de form— inst—ntáne—F v—s siguientes grá(™—s muestr—n ™—m˜ios
que se produ™en más lent—menteF v— diferen™i— entre in™rement—l y gr—du—l r—E
di™— en si ™—m˜i—n los v—lores de l—s v—ri—˜les o ˜ien l— distri˜u™ión de l— ™l—seD
—unque h—˜itu—lmente se us—n ™omo sinónimosF in l— (l— de —˜—jo tenemos l—
primer— grá(™— @Recurring A ™on un ™—m˜io tempor—l y que vuelve — su est—do
norm—l tr—s un interv—lo de tiempoF v— siguiente grá(™— @Blip A represent— un
evento ex™ep™ion—l y no de˜e tr—t—rse ™omo un ™—m˜io de ™on™eptoF v— últim—
grá(™— @Noise A muestr— ™—m˜ios —le—toriosD — los que ll—m—remos ruido y t—mE
po™o de˜en ™onsider—rse ™omo un ™—m˜io en l— distri˜u™iónF in l— liter—tur— lo
más fre™uente es en™ontr—rse ™on tr—˜—jos que ™onsider—n t—n solo los ™—m˜ios
—˜ruptosD gr—du—les o in™rement—lesFF

pigur— PX „ipos de ™—m˜ios

U

3. Algoritmos de clasicación de secuencias de
datos
vos ™l—si(™—dores de se™uen™i—s de d—tos de˜en ser ™—p—™es de —prender de los
d—tos de form— in™rement—l en vez de por lotes @batch A y re—™™ion—r —nte los
™—m˜ios de ™on™eptoF em˜os requisitos se ™onsiguen —pli™—ndo aprendizaje
online y mecanismos para olvidar los d—tos que y— no son relev—ntesF

3.1. Aprendizaje online
il —prendiz—je onlineD t—m˜ién ll—m—do —prendiz—je in™rement—lD se ™entr— en el
pro™es—miento de inst—n™i—s de form— se™uen™i—l tr—t—ndo de que el ™l—si(™—dor
entren—do se— t—n pre™iso ™omo si se hu˜iese entren—do ™on todo el ™onjunto
de d—tos — l— vez @en batch AF …n ˜uen —lgoritmo de —prendiz—je online de˜erí—
tener est—s ™u—lid—des ‘frzIH“X

IF sn™rement—lX el —lgoritmo de˜e ser ™—p—z de leer y pro™es—r d—tos — lo l—rgo
del tiempo sin tener que disponer de todos los d—tos desde el prin™ipioF

PF „r—t—r ™—d— inst—n™i— en un— p—s—d—X el —lgoritmo solo puede re—liz—r un—
le™tur— so˜re los d—tos y luego li˜er—r el esp—™ioF

QF vimit—™ión de tiempo y memori—X ™—d— vez que se pro™ese un ejemplo de˜e
h—™erse en el menor tiempo posi˜le y l— ™—ntid—d de memori— ne™es—ri—
p—r— el pro™es—miento de˜e ser ™onst—nteF

RF il —lgoritmo de˜e propor™ion—r un modelo ™ompleto en ™u—lquier inst—nte
de tiempoF in un ™—so ide—lD el ™l—si(™—dor entren—do in™rement—lmente
h—st— un inst—nte t de˜e ser equiv—lente —l mismo entren—do de form—
tr—di™ion—l ™on tod—s l—s inst—n™i—s disponi˜les h—st— el inst—nte tF

€—r— s—tisf—™er est—s restri™™iones de po™os d—tos — l— vez y disponi˜ilid—d del
modelo en ™u—lquier inst—nteD se suelen —pli™—r té™ni™—s de resumen — los d—E
tos t—les ™omo sliding windows @vent—n—s desliz—ntesAD sampling @muestreoA o
sketching @es˜ozoAD —lgun—s de l—s ™u—les se ™onsider—rán en este tr—˜—joF
v—s prin™ip—les diferen™i—s entre el pro™eso de ™l—si(™—™ión ™on todos los d—tos
en un modo tr—di™ion—l y un pro™eso de ™l—si(™—™ión p—r— se™uen™i—s de d—tos
se pueden ver — modo de resumen en el gu—dro IF

Tradicional Secuencial
xúmero de p—s—d—s wúltiple …n—
„iempo de pro™es—miento slimit—do ‚estringido
…so de memori— slimit—do ‚estringido
„ipo de result—do €re™iso eproxim—do
gon™epto istáti™o ivolutivo

gu—dro IX gomp—r—tiv— de minerí— de d—tos tr—di™ion—l frente — l— minerí— de
se™uen™i—s de d—tos ‘qqHU“

V

in gener—lD el pro™eso de —prendiz—je puede verse ™omo en l— pigur— QF

pigur— QX €ro™eso de —prendiz—je in™rement—l en el inst—nte t ‘liIH˜“F

3.2. Mecanismos de olvido
sn™orpor—r me™—nismos de olvido es un —spe™to que tiene espe™i—l interés en
se™uen™i—s evolutiv—sD y— que existe un modelo —ntes y otro distinto después de
dete™t—rse el ™—m˜ioF €or t—ntoD un ™l—si(™—dor de˜e ser ™—p—z de re—™™ion—r
—nte un ™—m˜io de ™on™epto y olvid—r —quello que y— no se— relev—nteD ™omo
los d—tos que son de ™on™eptos —ntiguosF il prin™ip—l pro˜lem— es ™ómo s—˜er
qué de˜e olvid—rF v— solu™ión más sen™ill— es ir olvid—ndo p—ul—tin—mente los
d—tos —ntiguos y us—r un— ventana ™on los ejemplos más re™ientes p—r— entren—r
el ™l—si(™—dorF isto permite —demás m—ntener redu™ido el número de inst—n™i—s
ne™es—ri—s p—r— el entren—mientoF iste primer enfoque de vent—n—s de t—m—ño
™onst—nte en los d—tos más re™ientesD present— un ™ompromiso entre est—˜ilid—d
y )exi˜ilid—dD y— que si l— vent—n— es dem—si—do pequeñ— re—™™ion—rá rápido —
los ™—m˜iosD pero — l— vez ˜—j—rá l— pre™isión porque está entren—ndo ™on po™os
d—tosF in ™—m˜ioD si l— vent—n— es muy gr—ndeD el ™l—si(™—dor será más est—˜le
pero t—rd—rá más en dete™t—r los ™—m˜ios ‘uunHV“F
ytro enfoque ™onsiste en —just—r el t—m—ño de l— vent—n— de —prendiz—je ™u—ndo
se dete™te un ™—m˜io de ™on™epto p—r— tr—t—r de en™ontr—r un equili˜rio entre
pre™isión y )exi˜ilid—dF istos métodos fun™ion—n mejor ™u—ndo h—y ™—m˜ios
˜rus™osF
…n enfoque —ltern—tivo ™onsiste en ponder—r l—s muestr—s ™on un peso que irá
disminuyendo — lo l—rgo del tiempo p—r— v—ri—r l— in)uen™i— de l—s mism—s
dur—nte el pro™esoF iste enfoque se denomin— fading factor @f—™tor de olvidoAF

W

€—r— nuestros métodos v—mos — us—r vent—n—s de t—m—ño (jo y— que nos f—™ilit—n
l— interpret—˜ilid—d de los result—dosF

3.3. Taxonomía de métodos de aprendizaje
e ™ontinu—™ión present—mos un— posi˜le ™l—si(™—™ión de métodos de —prendiz—je
de se™uen™i—s de d—tos evolutiv—sD propuest— en ‘liIH˜“F

IF Algoritmos de aprendizaje con disparadores (Learner with triggers)X
dependen de un— señ—l que indi™— que es ne™es—rio —™tu—liz—r el modeloF

a A Detección de cambio (Change detectors) X son los más fre™uentes en
l— ˜i˜liogr—fí—F istos métodos fun™ion—n mejor en entornos ™on ™—mE
˜ios ˜rus™os en los que se suele re™onstruir el modelo por ™ompleto
en vez de —™tu—liz—rloF vo más ™omún es monitoriz—r los d—tosD los
p—rámetros del ™l—si(™—dor o l— s—lid— del —lgoritmo de —prendiz—jeF
‘ƒƒHVD qwg‚HRD fqdgep+ HT“
in el supuesto de que l—s se™uen™i—s de d—tos se—n estáti™—s @sin
™—m˜iosAD l—s té™ni™—s de dete™™ión de ™—m˜ios t—m˜ién pueden ser
utiliz—d—s p—r— dete™t—r diferen™i—s signi(™—tiv—s respe™to —l modelo
que se está entren—ndo y se tr—t—rí— de ™omplet—r el —nterior p—r—
lleg—r — un modelo mejor —just—doF
b A Ventana de entrenamiento (Training windows) X estos métodos se
˜—s—n en heurísti™—s p—r— —just—r el t—m—ño de l— vent—n— de entreE
n—mientoF ‘‡uWTD rƒhHID fwHV“
c A Muestreo adaptativo (Adaptive sampling) X ˜—sándose en l— rel—E
™ión entre l— inst—n™i— de prue˜— y unos prototipos prede(nidos o
˜ien el históri™o de inst—n™i—s entren—d—sD se sele™™ion— un ™onjunto
de entren—miento —de™u—doF ‘‰‡HVD €ruHV“

PF Algoritmos de aprendizaje evolutivos (Evolving learners)X estos méE
todos —™tu—liz—n el modelo de form— gr—du—l y no requieren de un dete™tor
de ™—m˜ios de ™on™eptoF

a A Conjuntos adaptativos (Adaptive ensembles) X son los más popul—E
resD y ˜ási™—mente ™om˜in—n l— s—lid— de distintos ™l—si(™—dores del
™onjunto p—r— d—r un— de™isión (n—lF ‘uwHUD ƒt—HQD xuHI“
b A Ponderación de instancias (Instance weighting) X estos —lgoritmos
no ™om˜in—n regl—s de de™isiónD sino que l— —d—pt—˜ilid—d se ™onsigue
modi(™—ndo el ™onjunto de entren—mientoF …tiliz— ide—s de boostingD
d—ndo más import—n™i— — —quell—s inst—n™i—s m—l ™l—si(™—d—sF ‘uoyHHD
ƒHVD gHR“
c A Espacio de características (Feature space) X estos métodosD próE
ximos — l— sele™™ión de ™—r—™terísti™—sD ™onsiguen l— —d—pt—˜ilid—d
sele™™ion—ndo de form— dinámi™— l—s ™—r—™terísti™—s emple—d—s p—r—
l— ™l—si(™—™iónF ‘porHTD ‡qgHTD eerHV“
d A Dependientes del modelo (Base model specic) X estos métodos se
—d—pt—n modi(™—ndo los p—rámetros del modelo que estén us—ndoF
‘xnpwHUD ureWWD ƒvƒWW“

IH

3.4. Evaluación del proceso de aprendizaje
ƒegún v—rios —utores ‘qƒ—‚HW“D h—y tres —spe™tos import—ntes — tener en ™uent—
— l— hor— de ev—lu—r —lgoritmos de —prendiz—je de se™uen™i—s de d—tosX

Espacio o™up—do en memori— — lo l—rgo del pro™eso de —prendiz—jeF
Tiempo de pro™es—miento de un— muestr— @esto puede limit—r l— fre™uenE
™i— de re™ep™ión de los d—tosAF
€oder de generalizaciónX efe™tivid—d del modelo —l represent—r el ™onE
™epto su˜y—™ente de los d—tosF

xosotros nos v—mos — o™up—r úni™—mente de ev—lu—r y ™omp—r—r —lgoritmos
por el último ™riterioD según su efe™tivid—d dur—nte l— ™l—si(™—™iónF ƒin em˜—rgo
—unque no tr—t—mos de minimiz—r ™onsumo de memori—D ni tiempo de pro™eE
s—mientoD sí se respet—n los requerimientos de —prendiz—je onlineD de un— sol—
p—s—d— so˜re los d—tos y que l—s muestr—s no se —™umul—n tod—s en memori—F
xuestro propósito por t—nto esD ev—lu—r —lgoritmos propios y —jenos por l— efe™E
tivid—d del modelo —prendidoD p—r— poder est—˜le™er ™omp—r—™iones y r—nkings
de los mismos y extr—er ™on™lusiones so˜re los modelos —prendidosF
vos métodos de ev—lu—™ión de —lgoritmos de —prendiz—je en ˜—t™hD —prenden
so˜re un ™onjunto de entren—miento @training A y utiliz—˜—n un ™onjunto de test
independiente so˜re los que estim—r l— pro˜—˜ilid—d de error holdoutF in el ™—so
de no disponerse de —m˜osD se estim— l— pro˜—˜ilid—d de error del modelo o˜teE
nido — p—rtir del ™onjunto de tr—ining medi—nte té™ni™—s de v—lid—™ión ™ruz—d—
y sus v—ri—ntes @leaving-one-out A o bootstrapF ƒin em˜—rgoD en el ™ontexto de seE
™uen™i—s donde los d—tos son poten™i—lmente in(nitosD l— v—lid—™ión ™ruz—d— y l—s
estr—tegi—s de muestreo no son —pli™—˜lesF edemásD el he™ho de que los ™on™eptos
de l—s se™uen™i—s de d—tos pued—n ™—m˜i—r en el tiempo tiene impli™—™iones en
l—s té™ni™—s de ev—lu—™iónF
ƒe ne™esit—n por t—nto nuev—s estr—tegi—s de ev—lu—™iónF il prin™ip—l pro˜lem—
™onsiste en monitoriz—r l— evolu™ión del pro™eso de —prendiz—jeF xos en™ontr—mos
™on dos —ltern—tiv—sX

IF HoldoutX ™omo en su homólogo en ˜—t™hD se tr—t— de un ™onjunto de test
que se —pli™— —l modeloD pero en este ™—so extr—ído — interv—los regul—resD
p—r— estim—r l—s t—s—s de errorD lo que es —de™u—do p—r— se™uen™i—s dináE
mi™—sF r—y que (j—r fre™uen™i— y —n™hur— del ™onjunto de test so˜re l—
se™uen™i—F ƒe tr—t— de un estim—dor no sesg—doD pues —l moverse — lo l—rgo
de l— se™uen™i— no d— lug—r — so˜re—justeF
PF PrequentialX t—m˜ién ™ono™ido ™omo test-then-train ‘fuHW—“F il término
prequenti—l proviene de €redi™tive ƒequenti—l ‘h—wVR“F il error del modelo
n
se estim— so˜re l— se™uen™i— de d—tosX S = i=1 L(yi , yi ) donde L es
ˆ
l— fun™ión de pérdid— tr—s h—˜er predi™ho l— ™l—se de form— ™orre™t— o
in™orre™t—F ƒe ™ono™e que este estim—dor es pesimist—D es de™irD en l—s
mism—s ™ondi™ionesD l— estr—tegi— holdout v— — d—r mejores v—loresF il
error estim—do ™on prequenti—l v— — est—r in)uen™i—do por los errores que
se h—y—n podido ™ometer —l prin™ipio de l— se™uen™i— de d—tosF €or elloD se
h—n us—do me™—nismos de olvido t—les ™omoX

II

a A Ventanas temporales (time window): en lug—r de m—ntener un ™ál™ulo
de l—s t—s—s de éxito —™umul—do desde el ini™io de l— se™uen™i—D se
re—liz— est— estim—™ión p—r™i—l so˜re un— vent—n— de t—m—ño k D (jo
@— (j—r — prioriAD que se v— despl—z—ndoF iste me™—nismo ™onverge
más rápid—mente —l método holdoutF
b A Factores de olvido (fading factor): se introdu™e un f—™tor de olvido α
p—r— que l— in)uen™i— de ™—d— error en l— estim—™ión v—y— de™—yendo
™onforme —ument— l— dist—n™i—F he est— m—ner—D podemos ™—l™ul—r el
L +α·S
error prequenti—l ™omo Ei = Bi = nii+α·Bi−1 donde S1 = L1 y ni
S
i i−1
es el número de ejemplos us—dos p—r— ™—l™ul—r Li F in el ™—so de que
α = 1 impli™— que no h—y olvidoF iste me™—nismo tiene l— vent—j— de
que requiere po™— memori—D y— que solo requiere —lm—™en—r el v—lor
—nterior y el —™tu—lD frente —l uso de vent—n—s donde se tienen que
—lm—™en—r k v—lores de pérdid—F

em˜os me™—nismos están muy rel—™ion—dosD y por ende sus p—rámetrosF
esíD p—r— v—lores ˜—jos de k y de αD l—s estim—™iones he™h—s son más —
™orto pl—zo y ™omo ™onse™uen™i— l—s os™il—™iones de l—s estim—™iones son
m—yoresF €or otro l—doD p—r— v—lores —ltos de k @m—yor vent—n—A y de
α @™er™—nos — IAD v—n — intervenir más d—tos en l—s estim—™iones de los
erroresF

in nuestr— experiment—™ión hemos us—do l— estim—™ión prequenti—l y— que es l—
más extendid—D de˜ido — que no se ex™luye ningún d—to en el entren—mientoD y
se ev—lú— puntu—lmente ™on ™—d— muestr— de l— se™uen™i—D por lo que se o˜tiene
de un estim—dor no sesg—doF
e l— hor— de ™omp—r—r el rendimiento que present—n dos —lgoritmos @e y fA
frente — l— mism— se™uen™i— de d—tos podemos us—r el est—dísti™o Qi (A, B) =
1−S A
log 1−Si D donde Si y Si son los v—lores de l— fun™ión de pérdid— —™umuE
B
A B
i
l—dos de ™—d— —lgoritmoF il v—lor de Qi es útil p—r— ™ompro˜—r l—s diferen™i—s
entre —m˜os —lgoritmosD de m—ner— que si el —lgoritmo e present— un mejor
™omport—miento que el fD v—mos — o˜tener v—lores positivosD mientr—s que en
™—so ™ontr—rio o˜tendremos v—lores neg—tivosD y si son igu—les será ™eroF
il pro˜lem— de est—s medid—s es que evolu™ion—n — lo l—rgo del tiempo y es
posi˜le que visu—lmente no pod—mos re™ono™er qué método es mejor que otro
y— que uno se puede ™omport—r mejor en un— p—rte de l— se™uen™i—D mientr—s
que otro lo h—g— en otr— o™—siónF €or elloD p—r— d—r un v—lor (n—l en nuestr—
experiment—™ión hemos us—do ™omo medid— el áre— ˜—jo l— ™urv— @e…gA de
los v—lores o˜tenidos ™on l— estr—tegi— prequenti—l desde el ini™io de l— se™uen™i—
h—st— que (n—liz—F he est— m—ner—D si tenemos dos —lgoritmos @e y fAD de(nimos
N
AU CA = i=0 ni · (1 − Ei ) donde ni es el número de ejemplos us—dos p—r—
A

™—l™ul—r Ei y N el número de v—lores de Ei disponi˜les @ídem p—r— fAF hiremos
A A

que e es mejor que f si AU CA AU CB F
ytro —spe™to interes—nte — ev—lu—r en el ™—so de que tr—˜—jemos ™on se™uen™i—s
sintéti™—s ™on ™—m˜ios de ™on™eptos ™ono™idos es el número de drifts ™orre™t—E
mente dete™t—dosD los f—lsos positivosD los f—lsos neg—tivosD —sí ™omo l— dist—n™i—
tr—ns™urrid— desde que se produ™e un ™—m˜io h—st— que se dete™t—F il ™ál™ulo de
est— dist—n™i— v— — ser diferente dependiendo del tipo de ™—m˜io que presente l—

IP

se™uen™i—D y— que h—y que tener en ™uent— que los ™—m˜ios gr—du—les se produ™en
— lo l—rgo de un— vent—n— donde se entremez™l—n muestr—s de —m˜os ™on™eptosF
v— dist—n™i— se ™—l™ul— entre el punto de drift re—l y el drift dete™t—do más
™er™—no — élF in ™—so de h—˜er más de un drift dete™t—doD se ™—l™ul— l— dist—n™i—
del primero y el resto se ™onsider—n f—lsos positivosF ƒi el ™—m˜io es gr—du—lD
el punto de ™—m˜io re—l ™onsider—mos que ™orresponde ™on l— ™ot— inferior del
interv—lo de ™—m˜ioF ƒe puede ver un ejemplo en l— pigur— RF

Cambios Abruptos Cambios Graduales

0 10 20 30 40 50 0 10 20 30 40 50
Instancias Instancias

pigur— RX in l— grá(™— de l— izquierd— s—˜emos que h—y P ™—m˜ios —˜ruptos en
PH y RH @líne—s roj—s ™ontínu—sAF il método —pli™—do h— dete™t—do Q drifts en
PSD QH y RP @líne—s —zules dis™ontínu—sAF hiremos que h— dete™t—do dos drifts
™orre™t—mente @en los puntos PS y RPA y un f—lso positivo @QHAF v— dist—n™i— —l
primer drift será de 25 − 20 = 5 y —l segundo de 42 − 40 = 2F €or otro l—doD en
l— grá(™— de l— dere™h— h—y P ™—m˜ios gr—du—les que tienen lug—r en ‘ISD PS“ y
‘QSD RS“F in este ™—so diremos que h— dete™t—do dos drifts ™orre™t—mente @IS y
RPA y dos f—lsos positivos @PI y QHAF v— dist—n™i— —l primer drift será 15 − 15 = 0
y —l segundo 42 − 35 = 7F

IQ

4. Aplicaciones
e ™ontinu—™ión present—mos distint—s áre—s de —pli™—™ión p—r— el —prendiz—je
o l— ™l—si(™—™ión de se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF „odos ellos
tienen en ™omún l— —)uen™i— ™onst—nte de nuevos d—tos y un— posi˜le evolu™ión
de los ™on™eptos en el tiempoF

Monitorización y controlX en l—s —pli™—™iones de monitoriz—™ión y ™onE
trol se tr—˜—j—n ™on ™—ntid—des de d—tos muy gr—ndes que ne™esit—n pro™eE
s—rse en tiempo re—lF ƒe pueden diferen™i—r dos tipos de t—re—sX preven™ión
y prote™™ión frente — —t—quesD o monitoriz—™ión ™on propósitos de gestiónF

ˆ ƒegurid—d informáti™—X dete™™ión de intrusosF ‘vfWW“
ˆ ƒe™tor (n—n™ieroX preven™ión de fr—udesF ‘honHR“
ˆ „r—nsporteX gestión del trá(™oF ‘wƒthHW“
ˆ €osi™ion—mientoX r—streo inter—™tivoF ‘v€puHU“
ˆ sndustri—X monitoriz—™ión de pro™esos de produ™™iónF ‘†yq+ HV“

Información y asistencia personalizadaX est—s —pli™—™iones org—niz—n
o person—liz—n un )ujo de inform—™iónF

ˆ esisten™i— person—lX (ltr—do de inform—™iónF ‘qƒgwHU“
ˆ €er(les de ™lientesX segment—™ión de ™lientesF ‘vrgHV“
ˆ snform—™iónX org—niz—™ión de do™umentosF ‘fvHT“

Toma de decisionesX est—s —pli™—™iones no ne™esit—n que l—s de™isiones
se—n en tiempo re—lD pero sí que su respuest— se— pre™is— y— que los ™ostes
de ™ometer un error pueden ser muy —ltosF

ˆ ƒe™tor (n—n™ieroX predi™™ión de morosid—dF ‘‚‚HU“
ˆ fiomedi™in—X efe™tos de medi™—mentos en p—™ientesF ‘„€g€HV“

Inteligencia articial y robóticaX el ™—m˜io de ™on™epto en est—s —pliE
™—™iones se suele de˜er — ™—m˜ios en el entornoF

ˆ ƒistem—s móviles y ro˜óti™osX diseño de ro˜ots ™—p—™es de —d—pt—rse
—l entornoF ‘€wqHW“
ˆ ƒistem—s inteligentesX solu™iones p—r— domóti™—F ‘‚gHW“
ˆ ‚e—lid—d virtu—lX diseño de videojuegos y simul—doresF ‘gww+ HS“

IR

5. Revisión de métodos de aprendizaje con dis-
paradores
…n— vez expuesto el ™ontexto en el que se des—rroll— el tr—˜—joD v—mos — re—liz—r
un estudio det—ll—do so˜re el pro˜lem— ™on™reto del —prendiz—je ™on disp—r—E
doresD en espe™i—l los dos primeros —p—rt—dos que nom˜r—mos en l— t—xonomí—X
utiliz—ndo detección de cambio y ventanas de entrenamientoF
ƒ™hlimmer y qr—nger present—ron en IWVT el pro˜lem— del —prendiz—je in™remenE
t—l so˜re d—tos ™on ruido y pu˜li™—ron el —lgoritmo ƒ„eqqi‚ ‘ƒqVT“F hesde
que introdujeron el término ™on™ept driftD h— h—˜ido tres pi™os de interés en
l— investig—™iónX en IWWV ™on un— edi™ión espe™i—l de l— revist— Machine Lear-
ning ‘h‡uWV“D en PHHR ™on un espe™i—l en l— revist— Intelligent Data Analysis
‘ƒuHU“ y el ter™ero ™omenzó en PHHU ™omo result—do de l— ™ontinu— produ™™ión
de se™uen™i—s de d—tos en l— industri— y que ™omo se h— det—ll—do —nteriormente
prosigue —ún en l— —™tu—lid—dF

5.1. Algoritmos con detección de cambio
in el ™—so de se™uen™i—s dinámi™—s de d—tosD el propósito de estos —lgoritmos es
dete™t—r un ™—m˜io de ™on™epto en los d—tos que v—n lleg—ndo y —vis—r —l —lgoritE
mo de —prendiz—je que indu™e el modelo de que de˜e —™tu—liz—r o re™onstruir su
modelo p—r— —just—rse mejor — los nuevos d—tosF €or otro l—do si se tr—˜—j—n ™on
se™uen™i—s estáti™—s de d—tosD el o˜jetivo de estos —lgoritmos es —™tiv—r el pro™eso
de —prendiz—je p—r— —just—rse mejor —l —porte de d—tos —di™ion—lesF vo h—˜itu—l
es que los —lgoritmos de dete™™ión de ™—m˜ios —™túen — priori so˜re los d—tosD
esto esD (ltren l— se™uen™i— de d—tos y —™tiven los pro™esos de —prendiz—je @muE
™hos más pes—dos ™omput—™ion—lmenteA ™on l— lleg—d— de nuevos ™on™eptosF …n
—lgoritmo de dete™™ión de ™—m˜ios puede —fe™t—r —l rendimiento del ™l—si(™—dorF
v— form— de pro™eder de un dete™tor de ™—m˜ios es re—liz—r un test est—dístiE
™o que ™omprue˜e si el error del ™l—si(™—dor o l— distribución de l— ™l—se se
m—ntienen ™onst—ntes en el tiempoF
vos primeros tests propuestos p—r— tr—t—r ™on se™uen™i—s numéri™—s fueron g…E
ƒ…w @Cumulated Sum A ‘€—gSR“ y qwe @Geometric Moving Average A ‘‚o˜SW“F
il primero de ellos l—nz— un— señ—l de —l—rm— si l— medi— de los d—tos de enE
tr—d— es signi(™—tiv—mente distint— de ™eroD mientr—s que qwe ™omprue˜— si
l— medi— ponder—d— de los ejemplos de un— vent—n— es m—yor que un determiE
n—do um˜r—lF €—r— se™uen™i—s ™on estru™tur—s más ™omplej—s se h—n propuesto
tests ™omo el de Kolmogorov-SmirnovF e ™ontinu—™ión veremos —lgunos de los
métodos de dete™™ión de ™—m˜io más re™ientes que pueden —pli™—rse — ™u—lquier
—lgoritmo de minerí— so˜re se™uen™i—s de d—tosF

5.1.1. DDM (Drift Detection Method)
q—m— et —lF ‘qwg‚HR“ present—n el método de dete™™ión de ™—m˜io @hhwA
que monitoriz— l— t—s— de error us—ndo un Shewhart P-ChartD un— herr—mient—

IS

est—dísti™— de ™ontrol de ™—lid—dD ™uyos prin™ipios se ˜—s—n en l— distri˜u™ión
˜inomi—lF
ƒe di™e que un— v—ri—˜le X sigue un— distri˜u™ión ˜inomi—l si ™umple l—s siE
guientes ™ondi™ionesX

IF g—d— o˜serv—™ión es l— re—liz—™ión de un— v—ri—˜le —le—tori— de fernoulli
™on dos posi˜ilid—des @éxito o f—lloA y un p—rámetro p @pro˜—˜ilid—d de
f—lloAF

PF v—s diferentes o˜serv—™iones son independientes entre síF

QF il número de o˜serv—™iones n es (joF

he est— m—ner— podemos o˜tener l— medi— y l— desvi—™ión típi™— de l— distri˜uE
p(1−p)
™ión ™omo µ = p y σ = n F
ƒi n ≥ 30D l— distri˜u™ión se puede —semej—r — un— xorm—l y —pli™—r los límites
de ™ontrol del €Egh—rtX

CL @genter vineAX µ
UWL @…pper ‡—rning vimitAX µ + α · σD ™on 0 α 3
UCL @…pper gontrol vimitAX µ + 3 · σ @—proxim—d—menteD el WWFU 7 de l—s
o˜serv—™iones de˜erí—n est—r en este um˜r—lA

istos límitesD sirven p—r— de(nir unos niveles de ™ontrolD ™omo puede o˜serv—rse
en l— pigur— SF v— líne— ™entr—l gv represent— l— medi— de l— ™u—lid—d que se
esté midiendoF ƒi en —lgún momento se so˜rep—s— el límite …‡v se est—˜le™e un
nivel de —viso @warning AD indi™—ndo de est— m—ner— que es posi˜le que se v—y—
— produ™ir un ™—m˜io de ™on™eptoF ƒi sigue l— tenden™i— y so˜rep—s— el límite
…gvD se est—˜le™e el nivel de ™—m˜io de(nitivo @drift AF v—s inst—n™i—s re™i˜id—s
en el interv—lo que tr—ns™urre desde que se —™tiv— el nivel de —viso y h—st— el que
se —™tiv— nivel de drift se —lm—™en—n en un— memori— — ™orto pl—zoD y se us—rán
p—r— re™onstruir o —™tu—liz—r el modelo ™u—ndo se— ne™es—rioF ƒi se h— disp—r—do
el nivel de —viso y el v—lor ™ontrol—do vuelve — des™enderD situándose —lrededor
de l— líne— ™entr—l gv @l— medi—AD se di™e que se h— produ™ido un— f—ls— —l—rm—
y se reini™i— l— memori— — ™orto pl—zoF
€—r— —just—r dinámi™—mente estos v—lores ™u—ndo l— medi— no es un— ™onst—nteD
™omo en un entorno prequentialD se est—˜le™en pmin y smin ™omo l— medi— y desE
vi—™ión típi™— menores h—st— el momentoF g—d— vez que lleg— un nuevo ejemploD
se —™tu—liz—rán estos v—lores si pi + si pmin + smin F in est— situ—™iónD el nivel
de —viso @warning A se —l™—nz—rá ™u—ndo pi + si ≥ pmin + 2 · smin D mientr—s que
el nivel de ™—m˜io de(nitivo @drift A se d—rá en pi + si ≥ pmin + 3 · smin F in l—
pigur— T podemos ver un ejemplo grá(™o del —juste de estos límitesF

IT

11.0
UCL

UWL
Quality characteristic

10.0 CL

LWL
LCL
9.0
3 6 9 12 15
Sample

pigur— SX vímites de ™ontrol de Shewhart P-ChartF vos puntos de l— grá(™— están
todos en los límites de lo esper—doD s—lvo el punto II que super— el límite …‡v
de —visoD pero se tr—t— de un— f—ls— —l—rm—F

pigur— TX €Egh—rt ™on —juste dinámi™oF v— ™u—lid—d que se mide —quí es l— t—s—
de errorD por lo que niveles por de˜—jo de l— medi— signi(™— que el ™l—si(™—dor
es ™orre™to @no h—y ™—m˜ios de ™on™eptoAD de m—ner— que no es ne™es—rio tener
límites de ™ontrol inferiores ™omo hemos visto —nteriormente en l— pigur— SF
‘g—sHV“

iste método se puede us—r ™on ™u—lquier ™l—si(™—dorD y los mismos —utores lo
in™orpor—ron —l AdPreqFr4SL @—d—pt—™ión dinámi™— de k-Dependence Bayesian
Classiers A ‘gqHT“F vos niveles de ™—m˜io d—n lug—r — distintos gr—dos de —jusE
te del modeloX un —viso impli™— l— —™tu—liz—™ión p—r—métri™— o de estru™tur—D

IU

mientr—s que un drift supone un ™—m˜io en el modelo ™on un —umento en l—
™omplejid—d del modeloF

5.1.2. EDDM (Early Drift Detection Method)
v— propuest— de f—en—Eq—r™í— et —lF ‘fqdgep+ HT“ es simil—r —l método hhwD
pero en vez de ™ontrol—r l— t—s— de errorD monitoriz— l— distancia entre errores
de clasicación @número de inst—n™i—s ™orre™t—mente ™l—si(™—d—s de form—
™onse™utiv—AF
ƒe denot— pi adist—n™i— medi— entre dos errores y si adesvi—™ión típi™—F
ƒe de(nen pmax y smax ™omo v—lores máximos y se —™tu—liz—n ™u—ndo pi +2·si
pmax + 2 · smax ™—d— vez que lleg—n nuevos d—tosF
il método ™omienz— — fun™ion—r después de que se h—y—n produ™ido QH errores
de ™l—si(™—™iónF iste es el mínimo número de v—lores ne™es—rios p—r— estim—r
l— distri˜u™ión de l—s dist—n™i—s entre errores y poder h—™er ™omp—r—™ionesF he
est— form— pmax + 2 · smax represent— el WS 7 de l— distri˜u™iónF
…s—ndo estos v—loresD se —just—n dos um˜r—les de ™ontrolX

Aviso @warning AX (pi + 2 · si )/(pmax + 2 · smax ) α donde α = 0,95F v—s
inst—n™i—s se v—n —lm—™en—ndo p—r— ser ™onsider—d—s por el —lgoritmo de
—prendiz—je en el ™—so de d—rse por de(nitivo el ™—m˜io de ™on™eptoF
Cambio denitivo @drift AX (pi + 2 · si )/(pmax + 2 · smax ) β donde
β = 0,90F ƒe re—prende un nuevo modelo us—ndo l—s inst—n™i—s que se h—n
ido —lm—™en—ndo dur—nte el nivel de —viso previoF „—m˜ién se reini™i—n los
v—lores de pmax y smax F

ƒi p—s—do el nivel de —viso se vuelve — l— norm—lid—d @esto esD l— fun™ión so˜re
l— dist—n™i— entre errores regres— — niveles inferiores —l límite de —visoAD se eliE
min—n l— se™uen™i— de inst—n™i—s —lm—™en—d— h—st— el momento y se ™ontinú—
eje™ut—ndo el métodoF
vos v—lores de α y β se (j—n —d ho™ tr—s re—liz—r diferentes experimentosF

5.1.3. Método de Kifer
il método de uifer et —lF ‘ufdqHR“ no solo tr—t— de dete™t—r el ™—m˜io de
™on™eptoD si no t—m˜ién de ™u—nti(™—rloD de m—ner— que se pued— des™ri˜ir l—
n—tur—lez— del mismoF €—r— elloD utiliz—n un— medid— de dist—n™i— entre dos
distri˜u™iones de d—tos P1 y P2 D de l—s que —l menos se dispondrá de n puntos
de ™—d— un— p—r— poder re—liz—r un— dete™™ión de ™—m˜ioF
ƒe present— un nuevo método @ver elgoritmo IAD que estim— l— distri˜u™ión de
pro˜—˜ilid—d de dos vent—n—s W1 e W2 so˜re l— se™uen™i— de d—tosD donde W1
es un— vent—n— de t—m—ño m1 ≥ n (j—d— en el inst—nte c0 D mientr—s que W2 es
un— vent—n— de t—m—ño m2 ≥ n que se despl—z—rá — lo l—rgo de l— se™uen™i—D
™omenz—ndo en c0 + m1 D de m—ner— que no se sol—pen l—s muestr—s entre —m˜—s
vent—n—sF gu—ndo l— dist—n™i— entre l— distri˜u™ión de d—tos de W1 y l— de W2

IV

es m—yor que un ™ierto um˜r—l αD se est—˜le c0 —l inst—nte —™tu—lD se reini™i—liz—n
l—s vent—n—s y se noti(™— que se h— produ™ido un ™—m˜io de ™on™epto en el
inst—nte c0 F
v— ele™™ión del p—rámetro α de(nirá el equili˜rio entre sensi˜ilid—d y ro˜ustez
de l— dete™™iónD por lo que v—lores pequeños serán ™—p—™es de dete™t—r ™—m˜ios
—˜ruptosD pero se tendrá más riesgo de dete™t—r f—lsos ™—m˜iosF v— fun™ión de
dist—n™i— de˜e ser —de™u—d— p—r— ™u—nti(™—r el gr—do de ™—m˜io y de un— form—
intuitiv—F in el —rtí™ulo ‘ufdqHR“ se pueden ™onsult—r l—s nuev—s propuest—s de
medid—s de dist—n™i— entre dos distri˜u™iones de d—tosF

Algorithm 1 wet—E—lgortimo de uifer p—r— dete™t—r ™—m˜ios de ™on™eptoF il
uso de l— v—ri—˜le i permite eje™ut—r h—st— k —lgoritmos ™on diferentes p—rámeE
tros de form— p—r—lel—F

I f o r i = 1...k do
P c0 ← 0
Q W indow1,i ← f i r s t m1,i p o i n t s from time c0
R W indow2,i ← next m2,i p o i n t s i n stre—m
S end f o r
T w h i l e not — t end o f stre—m do
U f o r i = 1...k do
V ƒ l i d e W indow2,i ˜y I p o i n t
W i f distance(W indow1,i , W indow2,i ) αi then
IH c0 ← ™ u r r e n t time
II ‚eport ™h—nge — t time c0
IP g l e — r — l l windows —nd qy„y s t e p I
IQ end i f
IR end f o r
IS end w h i l e

5.1.4. ADWIN (Adaptive Windowing)
eF fifet y ‚F q—v—ldà ‘fqHU“D que t—m˜ién h—˜í—n p—rti™ip—do en el des—rrollo de
ihhwD present—n el método eh‡sxD que us— un— vent—n— desliz—nte W p—r—
monitoriz—r l— t—s— de error del modelo y poder dete™t—r ™—m˜iosF e diferen™i—
del método de uiferD expli™—do —nteriormenteD est— vent—n— solo ™ontiene v—lores
˜in—rios @—™ierto o f—llo en l— predi™™ión de ™—d— inst—n™i—A y —demás se modi(™—
su t—m—ño de form— dinámi™—F wientr—s no h—y— ningún ™—m˜io de ™on™epto en
l— distri˜u™ión de los d—tosD l— vent—n— ™re™e h—st— el momento en que se dete™te
un ™—m˜ioD que disminuyeF
v— ide— de l— dete™™ión ™onsiste enX ™u—ndo dos su˜vent—n—s su(™ientemente
gr—ndes de W tienen medi—s su(™ientemente distint—sD se puede ™on™luir que
los v—lores esper—dos de ™—d— su˜vent—n— se—n diferentesF vos v—lores su(™ienE
temente se pre™is—rán ™u—ndo se es™oj— el test est—dísti™o y dependerá del nivel
de ™on(—nz— δ ∈ (0, 1)F
il test est—dísti™o utiliz—do p—r— ™omp—r—r l—s distri˜u™iones de l—s su˜vent—n—s
W0 y W1 D ™omprue˜— si l— diferen™i— de l—s medi—s de —m˜—s su˜vent—n—s es
m—yor — un determin—do um˜r—l cut @ver elgoritmo PAF

IW

Algorithm 2 elgoritmo eh‡sx
I s n i t i — l i z e ‡indow W
P f o r e—™h t 0
Q do W ← W ∪ xt @ i F e F D —dd xt t o t h e he—d o f ‡A
R r e p e — t hrop e l e m e n t s from t h e t — i l o f W
S u n t i l |ˆW0 − µW1 | cut h o l d s
µ ˆ
T f o r e v e r y s p l i t o f W i n t o W = W0 · W 1
U output µW ˆ

il v—lor de cut p—r— un— p—rti™ión W0 · W1 de W se ™—l™ul— de l— siguiente
form—X

ƒe—n n0 y n1 l—s longitudes de W0 y W1 respe™tiv—menteF v— longitud de
W es n = n0 + n1 F
ƒe—n µW0 y µW1 l—s medi—s de los v—lores en W0 y W1 respe™tiv—menteF ‰
ˆ ˆ
µW0 y µW1 sus v—lores esper—dosF
€—r— g—r—ntiz—r el rendimiento del método de(nimosX

ˆ m= 1
1/n0 +1/n1 @medi— —rmóni™— de n0 y n1 A
ˆ δ = δ
n @p—r— evit—r pro˜lem—s ™on múltiples hipótesisA

il um˜r—l se ™—l™urá ™omo cut = 1
2m · ln δ F
4

ƒe puede ver un ejemplo del fun™ion—miento de este método en el gu—dro PF ƒi
µt se m—ntiene ™onst—nte en W D l— pro˜—˜ilid—d de que se reduz™— l— vent—n— en
el inst—nte t es ™omo mu™ho de δ D ™on lo que se limitan los falsos positivosF
ƒuponiendo que p—r— —lgun— p—rti™ión de W en W0 y W1 D tenemos que |µW0 −
µW1 | 2 · cut F inton™esD l— vent—n— W se redu™irá —l t—m—ño de W1 D o menorD
™on pro˜—˜ilid—d 1 − δ D por lo que se limitan así los falsos negativosF

PH

W0 W1 µW0
ˆ µW1
ˆ |ˆW0 − µW1 |
µ ˆ m cut |ˆW0 − µW1 | ≥
µ ˆ cut
[1] [01010110111111] 1/1 10/14 0.2857 0.9333 0.8617 No
[10] [1010110111111] 1/2 10/13 0.2692 1.7333 0.6323 No
[101] [010110111111] 2/3 9/12 0.0833 2.4 0.5374 No
[1010] [10110111111] 2/4 9/11 0.3181 2.9333 0.4861 No
[10101] [0110111111] 3/5 8/10 0.2 3.3333 0.4560 No
[101010] [110111111] 3/6 8/9 0.3888 3.6 0.4387 No
[1010101] [10111111] 4/7 7/8 0.3035 3.7333 0.4308 No
[10101011] [0111111] 5/8 6/7 0.2321 3.7333 0.4308 No
[101010110] [111111] 5/9 6/6 0.4444 3.6 0.4387 Sí
[1010101101] [11111] 6/10 5/5 0.4 3.3333 0.4560 No
[10101011011] [1111] 7/11 4/4 0.3636 2.9333 0.4861 No
[101010110111] [111] 8/12 3/3 0.3333 2.4 0.5374 No
[1010101101111] [11] 9/13 2/2 0.3076 1.7333 0.6323 No
[10101011011111] [1] 10/14 1/1 0.2857 0.9333 0.8617 No
gu—dro PX ijemplo del fun™ion—miento de eh‡sxF †ent—n— —™tu—lX W =
[101010110111111]F δ = 1F el h—˜erse dete™t—do un ™—m˜ioD l— vent—n— disE
minuirá su t—m—ño p—r— el próximo inst—nte de tiempoF

il pro˜lem— de este método es que es ™omput—™ion—lmente ™ostoso porque tiene
que ™ompro˜—r tod—s los posi˜les p—res de su˜vent—n—s de W F €—r— mejor—rloD
los —utores present—ron un— nuev— versión ll—m—d— eh‡sxP más e(™iente en
tiempo y memori—F

ADWIN2 (Adaptive Windowing 2)
€—r— redu™ir el ™oste ™omput—™ion—l de eh‡sxD en vez de m—ntener un— vent—n—
W en memori—D tiene un— estru™tur— de d—tos ™ompuest— por ™uõs @buckets A
que —lm—™en—n v—lores ˜in—riosF g—d— ™uõ de˜e ™ontener un— poten™i— de P de
I9sF ƒe (j— un p—rámetro M ™omo el máximo número de ™uõs ™on el mismo
t—m—ñoD p—r— ™ontrol—r —sí l— ™—ntid—d de memori—F ƒe puede ver un ejemplo en
el gu—dro QF

PI

ƒuponemos un— vent—n— de t—m—ño W = 14 ™on v—lores ˜in—rios @—™ierto y f—llo
de ™l—si(™—™iónA y est— serí— su estru™tur— en form— de ™uõsX
guõsX IHIHIHI IHI II I I
gontenidoX R P P I I
g—p—™id—dX U Q P I I
vleg— un nuevo elementoX
guõsX IHIHIHI IHI II I I I
gontenidoX R P P I I I
g—p—™id—dX U Q P I I I
„eniendo en ™uent— que M = 2D es ne™es—rio ™omprimir dos de los tres últimos
™uõsD y— que tienen el mismo ™ontenidoF
guõsX IHIHIHI IHI II II I
gontenidoX R P P P I
g—p—™id—dX U Q P P I
hespués de ™omprimir dos ™uõsD nos en™ontr—mos de nuevo ™on que tenemos
tres ™uõs ™on el mismo ™ontenidoD por lo que volvemos — ™omprimirF he est—
form— se est—rí—n form—ndo l—s su˜vent—n—sF
guõsX IHIHIHI IHIII II I
gontenidoX R R P I
g—p—™id—dX U S P I
ƒi se dete™t— un ™—m˜ioD se elimin— el ™uõ más —ntiguoX
guõsX IHIII II I
gontenidoX R P I
g—p—™id—dX S P I

gu—dro QX ijemplo de fun™ion—miento de eh‡sxP

v— e(™ien™i— —hor— es de O(M · log(W/M )) p—l—˜r—s de memori—D y el tiempo de
pro™es—miento por ™—d— ejemplo es O(log W ) en el peor ™—so y O(1) en el mejorF
y˜tiene l— ™—ntid—d de I9s de tod—s los ™uõs en O(1)F gon ello el número de
su˜vent—n—s — ev—lu—r disminuye y se —pli™—n los tests más rápid—mente — l—s
se™uen™i—s en los ™uõsF

5.2. Algoritmos con ventana de entrenamiento
il uso de vent—n—s permite limit—r el número de inst—n™i—s que se —prenden
simultáne—menteD —demásD sirven p—r— elimin—r —quellos d—tos que son de ™onE
™eptos —ntiguosF il pro™edimiento ˜ási™o de vent—n— desliz—nte que se us— en
minerí— de se™uen™i—s de d—tos se puede ver en el elgoritmo QF g—d— nuev—
inst—n™i— se —ñ—de — l— vent—n—D y ™u—ndo el ™l—si(™—dor se —™tu—liz— utiliz—
l—s inst—n™i—s de di™h— vent—n— p—r— el —prendiz—jeF il —spe™to ™l—ve de estos
—lgoritmos reside en ™ómo se de(ne este tipo de vent—n—sF
il enfoque más simple es us—r un— vent—n— de t—m—ño (jo e in™luir solo los
ejemplos más re™ientes de l— se™uen™i— de d—tos y dese™h—r por l— p—rte más
—ntigu—F ehor— ˜ienD se present— un ™ompromiso — l— hor— de es™oger el t—m—ño
de l— mism—F ƒi l— vent—n— es de pequeño t—m—ñoD el ™l—si(™—dor será ™—p—z
de —just—rse rápid—mente — los ™—m˜iosD pero perderá pre™isión en periodos de
est—˜ilid—dF il pro™eso de —prendiz—je se ˜—s— en po™os d—tos y por t—ntoD est—rá

PP

sujeto — más os™il—™ionesF in ™—m˜ioD si se es™oge un t—m—ño gr—nde o™urrirá lo
™ontr—rioD el pro™eso de —prendiz—je es más inmune — ™—m˜ios menores o ruidoD
pero por el ™ontr—rio tiene más iner™i—D por t—nto será más lento — l— hor— de
—d—pt—rse — los ™—m˜iosF €or est— r—zónD se propusieron distintos métodos de
—juste dinámi™o de l— —n™hur— de l— vent—n—F

Algorithm 3 elgoritmo ˜ási™o ™on vent—n—
I intr—d— X S X s e ™ u e n ™ i — de d — t o s
P W X vent—n— de e j e m p l o s
Q ƒ — l i d — X C X ™ l — s i f i ™ — d o r ™ o n s t r u i d o ™on l o s d — t o s de W
R
S i n i ™ i — l i z — r vent—n— W Y
T p—r— t o d o s l o s e j e m p l o s xi en S X
U W ← W ∪ xi Y
V e l i m i n — r e j e m p l o s — n t i g u o s de W s i e s n e ™ e s — r i o Y
W r e ™ o n s t r u i r o — ™ t u — l i z — r C us—ndo W Y

5.2.1. Método de Klinkenberg
il método de ulinken˜erg et —lF ‘u‚WV“ está orient—do — l— ™l—si(™—™ión de do™uE
mentos por lotes @batch A en entornos ™—m˜i—ntes @™onsider— ™—m˜ios gr—du—les y
—˜ruptosAD y fue uno de los primeros en monitoriz—r diversos indi™—doresD ™on™reE
t—mente l— pre™isión @accuracy AD l— espe™i(™id—d @precision A y l— exh—ustivid—d
@recall AF
€—r— —just—r l— vent—n— de entren—miento en primer lug—r se ™—l™ul— l— medi— y
l— desvi—™ión típi™— p—r— ™—d— uno de los indi™—dores @e™™ a e™™ur—™yD ‚e™ a
‚e™—ll y €re™ a €re™isionA en ˜—se — los M últimos lotesD y — ™ontinu—™ión se
utiliz— l— siguiente heurísti™—X

ƒi —lguno de los indi™—dores ex™ede de su medi— α ve™es su desvi—™ión
típi™—D se di™e que se h— s—lido de su interv—lo de ™on(—nz— y h— o™urrido
un ™—m˜ioF

€—r— ™ono™er l— n—tur—lez— del ™—m˜io @˜rus™o o gr—du—lAD se ™omprue˜—
si el indi™—dor en el inst—nte t h— experiment—do un— ™—íd— β del v—lor del
mismo en el inst—nte t − 1

ˆ ƒi el ™—m˜io es ˜rus™oD se redu™e l— vent—n— de entren—miento —l
mínimo @B a I ˜—t™hAF
ˆ ƒi el ™—m˜io es gr—du—lD se redu™e l— vent—n— en ˜—se — un p—rámetro
γ de(nido — prioriF

in el elgoritmo R se det—ll— en pseudo™ódigo l— heurísti™— emple—d—F ƒi h—
o™urrido un ™—m˜io ˜rus™oD es de™irD se veri(™— l— primer— ™ondi™ión @líne—s P
— RA y se redu™e l— vent—n— —l mínimo @I ˜—t™hAF in otro ™—soD si el ™—m˜io
dete™t—do es gr—du—l @se ™umple l— segund— ™ondi™iónD que —˜—r™— l—s líne—s T —

PQ

VA l— vent—n— se redu™e —l t—m—ño γ · 100 %F he no dete™t—rse ningún ™—m˜ioD el
t—m—ño de l— vent—n— ™re™e un lote másF

Algorithm 4 reurísti™— de ulinken˜erg p—r— —just—r el t—m—ño de l— vent—n—
de entren—mientoF
I €ro ™edure heterminexew‡indowƒize @ |Wt | D M D α D β D γ A
P i f ((Acct AvgM (Acc) − α · StdErrM (Acc)) and (Acct β · Acct−1 )) or
Q ((Rect AvgM (Rec) − α · StdErrM (Rec)) and (Rect β · Rect−1 )) or
R ((P rect AvgM (P rec) − α · StdErrM (P rec)) and (P rect β · P rect−1 ))
S then |Wt+1 | := |B| Y
T else i f (Acct AvgM (Acc) − α · StdErrM (Acc) or
U (Rect AvgM (Rec) − α · StdErrM (Rec) or
V (P rect AvgM (P rec) − α · StdErrM (P rec)
W then |Wt+1 | := max(|B|, |Wt | − γ · |Wt |) Y
IH else |Wt+1 | := |Wt | + |B| Y
II return |Wt+1 | Y

5.2.2. FISH (uniFied Instance Selection algoritHm)
¢
sF lio˜—ité propuso un— nuev— f—mili— de —lgoritmos ll—m—d— psƒr ‘liIH—“D que
us— simil—rid—des de tiempo y esp—™io entre inst—n™i—s p—r— —just—r dinámi™—E
mente l— vent—n— de entren—mientoF €—r— expli™—rlo podemos ˜—s—rnos en el
siguiente ejemplo ilustr—tivo de l— pigur— UF ƒe tr—t— de un pro˜lem— de ™l—siE
(™—™ión ˜in—ri— @puntos ˜l—n™os y negrosA en el que l—s fuentes de gener—™ión
de d—tos v—rí—n — lo l—rgo del tiempo de form— gr—du—l ™on l— rot—™ión de un
hiperpl—noF €—r— un ™ierto áre— @™ir™unferen™i— roj—AD vemos que l— ™l—se ™orre™E
t— en ™—d— inst—nte es diferenteF iste ejemplo muestr— que l— simil—rid—d en un
dominio del pro˜lem— dinámi™o depende del tiempo y del esp—™ioF

pigur— UX ijemplo de rot—™ión de hiperpl—noF szquierd—X fuente ini™i—l ƒIF gentroX
fuente ƒP tr—s rot—r RSºF here™h—X fuente ƒQ tr—s rot—r WHºF

v— —utor— propuso sele™™ion—r los ejemplos de l— vent—n— de entren—miento ˜—E
sándose en un— medid— de dist—n™i— Dij que se de(ne de est— form—X

PR

(s) (t)
Dij = a1 dij + a2 dij

donde d(s) es l— dist—n™i— en el esp—™ioD d(t) l— dist—n™i— en el tiempo y a1 , a2
son los ™oe(™ientes de ponder—™iónF €—r— dos ejemplos xi , xj D l— —utor— propone
l— dist—n™i— eu™líde— ™omo dist—n™i— en el esp—™io y el número de ejemplos que
los sep—r—n ™omo dist—n™i— en el tiempoF were™e l— pen— dest—™—r que si a2 = 0D
l— medid— se ™onvierte en un— sele™™ión de inst—n™i—sD mientr—s que si a1 =
0D tenemos un— vent—n— ™uyos pesos disminuyen ™on el tiempoF ƒe es™ogerán
—quell—s inst—n™i—s ™on m—yor v—lor de dist—n™i— p—r— ™omponer l— vent—n— de
entr—mientoF
v— f—mili— de —lgoritmos está ™ompuest— porX

psƒrIX el t—m—ño de l— vent—n— de entren—miento se (j— — prioriF

psƒrPX el t—m—ño de l— vent—n— de entren—miento se —just— de form—
dinámi™—D pero los pesos a1 , a2 se (j—n — prioriF

psƒrQX idénti™o — psƒrPD s—lvo que los p—rámetros a1 , a2 se re™—l™ul—n
dinámi™—mente — lo l—rgo del tiempoF

PS

6. Aportaciones
in primer lug—r v—mos — de(nir el m—r™o de nuestro tr—˜—joF gomo hemos
™oment—do —nteriormenteD est—mos en un entorno in™rement—l @ver pigur— VAF in
™—d— inst—nte t tenemos un— se™uen™i— de d—tos etiquet—dos X H = (X1 , ..., Xt )D
™on l— que se ™onstruye un ™l—si(™—dor Lt F gu—ndo lleg— un— nuev— inst—n™i—
Xt+1 h—y que prede™ir su ™l—se yt+1 F
†—mos — tr—˜—j—r ™on se™uen™i—s de d—tos que in™luyen ™—m˜ios de ™on™eptoF
g—d— inst—n™i— Xt es gener—d— por un origen St F wientr—s este origen se m—ntenE
g— ™onst—nte diremos que el ™on™epto no h— ™—m˜i—doD pero ™u—ndo St = St+1 D
nuestro propósito es dete™t—r di™ho ™—m˜io en el inst—nte más próximo —l punto
en que se produjo en l— se™uen™i—F

pigur— VX v—s inst—n™i—s de d—tos se pro™es—n de form— in™rement—l ‘liIH˜“F

€—r— nuestr—s diferentes propuest—sD nos hemos ˜—s—do en l— heurísti™— del métoE
do hhw de q—m— en el que se utiliz— l— herr—mient— Shewhart P-Chart —pli™—d—
so˜re distint—s ™u—lid—desF in primer lug—r se est—˜le™e un nivel de —viso @war-
ning A que ™u—ndo se —™tive v— — empez—r — —lm—™en—r inst—n™i—s en un— memori—
— ™orto pl—zoD —sí ™omo un nivel de ™—m˜io @drift AD que forz—rá — que se re—prend—
el ™l—si(™—dor ™on los ejemplos —lm—™en—dos en di™h— memori—F he est— m—ner—
se ™onsigue que —nte un ™—m˜io de ™on™eptoD el ™l—si(™—dor olvide inform—™ión
—nti™u—d— y —prend— ™on inst—n™i—s que pertene™en —l nuevo ™on™eptoF
e ™ontinu—™ión v—mos — present—r diferentes —ltern—tiv—s que hemos pl—nte—do
siguiendo estos supuestos de tr—˜—jo y de l—s que se llev—ron — ™—˜o su impleE
ment—™ión y experiment—™iónF

6.1. MoreErrorsMoving
€—r— nuestr— primer— propuest—D que hemos denomin—do woreirrorswovingD
se tr—t— de monitoriz—r los errores de ™l—si(™—™iónF €—r— ello ™ont—mos ™on un
históri™o Hi = {ei−n , . . . , ei } ™on los n últimos result—dos de ™l—si(™—™ión en el
inst—nte ti @ei = 0 en ™—so de —™iertoD ei = 1 en ™—so de f—lloAF †—mos — est—˜le™er
el siguiente supuestoX si se produ™e un ™—m˜io de ™on™eptoD el ™l—si(™—dor v— —
ver deterior—do su rendimiento y— que no será ™—p—z de ™l—si(™—r ™orre™t—mente
los nuevos d—tosF v— t—re— de dete™™ión que proponemos es ™ontrol—r el número

PT

de errores de ™l—si(™—™ión que se v—n produ™iendo — lo l—rgo del tiempoD h—™iendo
uso del históri™o Hi F
n
ej
ƒe— ci = j=0 |ej ∈ Hi l— t—s— de error del históri™o en el inst—nte de tiempo
n
ti F in ™—d— inst—nte de tiempoD se ™omprue˜— si ci−1 ci @se h— in™rement—do
el número de errores en el históri™oA y en este ™—so se di™e que h— o™urrido
un empeor—miento e in™rement—mos el ™ont—dor de empeor—mientosF in ™—so
™ontr—rioD si ci−1 ci D quiere de™ir que se h— redu™ido el número de errores en el
históri™oD por lo que se ™onsider—rá un— mejor— y se reini™i—liz— — H el ™ont—dor
de empeor—mientos ™onse™utivosF in el ™—so de que se m—nteng— el v—lor de cD
es de™irD si ci−1 = ci D el ™ont—dor de empeor—mientos se m—ntiene ™on el v—lor
—nterior que tuvieseF €odemos ver un— represent—™ión grá(™— de los v—lores que
tom— ci — lo l—rgo del tiempo en l— pigur— WF

pigur— WX ‚epresent—™ión de l— t—s— de error del históri™o @naWAF

e™tu—mos según l— siguiente heurísti™—X

ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE
so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori—
— ™orto pl—zoF @U W L = k A
ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes
™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori—
— ™orto pl—zoF @U CL = k + dA
in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— —
™orto pl—zoF @CL = 0A

…n ejemplo ilustr—tivo se puede ver en l— pigur— IH donde k = 2 y d = 2F

PU

10
memoria a drift
corto plazo detectado
warning
activado
Empeoramientos

UCL=k+d
5

UWL=k

0 CL=0
10 20 30 40 50
Instancias

pigur— IHX €Egh—rt p—r— woreirrorswovingF in l— inst—n™i— QVD se h— dete™t—do
un ™—m˜io de ™on™epto porque se h— super—do el um˜r—l …gvF in l—s inst—nE
™i—s PH y SHD —l produ™irse un— mejor— del rendimiento se vuelve —l nivel de
norm—lid—d y se reini™i—liz— el ™ont—dor de empeor—mientosF

€—r— l— eje™u™ión de este método h—y que de(nir los v—lores de los p—rámetros
nD k y d — prioriF

6.2. MaxMoving
…n— nuev— propuest—D denomin—d— w—xwovingD tr—t— de monitoriz—r l—s t—s—s de
éxito del ™l—si(™—dorF istá ˜—s—d— en l— siguiente suposi™iónX mientr—s el origen
del ™on™epto se m—nteng— ™onst—nteD el ™l—si(™—dor v— — mejor—r su pre™isión —
lo l—rgo del tiempo @mientr—s sig— re™i˜iendo inst—n™i—sAD pero en el momento en
que se produz™— un ™—m˜io @drift AD l—s t—s—s de éxito empez—rán — empeor—r y—
que el modelo —™tu—l no prede™irá ™orre™t—mente l— ™l—se de l—s nuev—s inst—n™i—sF
f—sándonos en estoD m—ntenemos un históri™o Hi = {ai−n , . . . , ai } ™on l—s n
últim—s t—s—s de éxito —™umul—d—s desde el último ™—m˜ioF ƒe— ai = 1 − Nii l—e

t—s— de éxito —™umul—d— h—st— el inst—nte ti D donde ei y Ni son el número de
errores de ™l—si(™—™ión y el número de inst—n™i—s pro™es—d—s h—st— el inst—nte
ti D respe™tiv—menteF ƒe— mi = m´x{aj |aj ∈ Hi } l— mejor t—s— de éxito del históE
a
ri™o en el inst—nte ti F wientr—s se estén ™l—si(™—ndo inst—n™i—sD ™ompro˜—mos si
mi−1 mi D y si es —síD ™onsider—mos que se está mejor—ndo l— t—s— de éxito —™uE
mul—d—F in ™—so ™ontr—rioD en el que el nuevo máximo es menor que el —nteriorD
diremos que h— empeor—do e in™rement—mos un ™ont—dor de empeor—mientosF
ƒi mi−1 = mi D es de™irD el máximo en el históri™o —nterior y el —™tu—l no h—
™—m˜ioD m—ntenemos el v—lor que y— tuviese el ™ont—dor de empeor—mientosF
il uso del máximo so˜re el históri™o Hi de t—m—ño nD nos permite —mortigu—r
l—s pequeñ—s os™il—™iones del tipo ai−1 ai ai+1 D ™—so en el que l— t—s— de
éxito ™omienz— — des™enderD pero luego remont— rápid—menteF ƒe puede ver un—
represent—™ión grá(™— de los distintos v—lores que tom— mi — lo l—rgo del tiempo
en l— pigur— IIF

PV

Máximo del histórico de tasas de éxito

1.0
0.8
0.6
Max. Accuracy
0.4
0.2
0.0

0 10000 20000 30000 40000 50000
Instances

pigur— IIX ‚epresent—™ión de l—s mejores t—s—s de éxito —™umul—d—s en el hisE
tóri™o — lo l—rgo del tiempoF v—s ™—íd—s del rendimiento se de˜en — ™—m˜ios de
™on™eptoF

v— ™u—lid—d que v—mos — ™ontrol—r en el €Egh—rt es el número de empeor—mienE
tosD de m—ner— que pod—mos dete™t—r ™uándo el modelo y— no es —de™u—ndo
p—r— los d—tos que se están re™i˜iendo y es ne™es—rio re—prenderF gonsider—mos
l— siguiente heurísti™—X

ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE
so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori—
— ™orto pl—zoF @U W L = k A
ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes
™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori—
— ™orto pl—zoF @U CL = k + dA
m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— —
™orto pl—zoF @CL = 0A

€—r— l— eje™u™ión del dete™tor w—xwoving es ne™es—rio est—˜le™er — priori los
v—lores de los p—rámetros n, k y dF

6.3. MovingAverage
„r—s re—liz—r diversos experimentos ™on los dos métodos —nterioresD nos dimos
™uent— de que se produ™í—n mu™hos f—lsos positivosD es de™irD se dete™t—˜—n ™—mE
˜ios inexistentes en l— se™uen™i— de d—tosF isto se de˜í— — que l—s dos fun™iones
monitoriz—d—s present—˜—n mu™h—s os™il—™iones @grá(™—s en dientes de sierr—A

PW

que en o™—siones er—n tom—d—s erróne—mente ™omo ™—m˜iosF €—r— intent—r p—E
li—r este defe™toD —pli™—mos el método est—dísti™o de l—s medi—s móviles @moving
average A que ™onsiste en ™re—r series de promedios d—do un ™onjunto de puntosF
in nuestro ™—soD queremos promedi—r l—s t—s—s de éxito us—ndo un— vent—n— de
su—viz—do de t—m—ño m p—r— que l— grá(™— presente un ™omport—miento ™on
menos os™il—™iones @ver ejemplo de l— pigur— IPAF

Original Moving Average (100)
100

100
80

80
60

60
Accuracy

Accuracy
40

40
20

20
0

0

0 5000 10000 15000 20000 0 5000 10000 15000 20000
Instances Instances

Moving Average (500) Moving Average (1000)
100

100
80

80
60

60
Accuracy

Accuracy
40

40
20

20
0

0

0 5000 10000 15000 20000 0 5000 10000 15000 20000
Instances Instances

pigur— IPX v— primer— grá(™— @—rri˜— izquierd—A es l— origin—lD mientr—s que en
el resto se represent— en rojo l— medi— móvil simpleD ƒweD ™on su—viz—do de
maIHHD SHH y IHHHD respe™tiv—mente —pli™—do so˜re los v—lores de l— líne— gris
@origin—lAF

fási™—mente h—y dos tipos de medi—s móvilesX

IF Media móvil simple (SMA)X que se ™—l™ul— ™omo l— medi— —ritméti™— de
l—s últim—s m o˜serv—™ionesF st = m
1 m−1 xt +xt−1 +xt−2 +···+xt−(m−1)
n=0 xt−n = m =
xt −xt−m
st−1 + m

PF Media móvil ponderada (WMA)X se ™—l™ul— utiliz—ndo un ™onjunto
de m pesos @que en tot—l sum—n IA que se —pli™—n — ™—d— o˜serv—™iónF
m−1
st = n=0 wn xt−n = w0 xt + w1 xt−1 + · · · + wm−1 xt−(m−1)

in nuestro método solo hemos us—do el primer tipo @ƒweAD —unque p—r— un
tr—˜—jo futuro serí— interes—nte pro˜—r el segundo @‡weAD de m—ner— que se
—justen los pesos p—r— d—rle más import—n™i— — los o˜serv—™iones más re™ientesF

QH

v—s o˜serv—™iones — promedi—r en nuestro método wovingever—ge v—n — ser l—s
t—s—s de —™ierto —™umul—d—s de l—s m últim—s muestr—sF e l— hor— de dete™t—r
™—m˜ios hemos pl—nte—do dos heurísti™—s diferentes que tr—t—n de ™—r—™teriz—r
dos tipos de ™—m˜ios en los d—tosX gr—du—les y —˜ruptosF v— primera heurística
es —de™u—d— p—r— ™—m˜ios gr—du—lesD que ™onsider— que se h— produ™ido un
empeor—miento si st st−1 y fun™ion— de l— siguiente m—ner— @ver ejemplo en
gu—dro RAX

ƒi dur—nte k ve™es ™onse™utiv—s h— empeor—do l— t—s— promedi—d—D —™tiv—E
mos el nivel de —viso @warning A y ™omenz—mos — —lm—™en—r l—s inst—n™i—s
re™i˜id—s en un— memori— — ™orto pl—zoF
ƒi se produ™en k+d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
™—m˜io @drift AF
m—lid—d y se elimin—n l—s inst—n™i—s de l— memori— — ™orto pl—zoF

Instancias →

Predicción 0 1 0 0 1 1 1 0 0 0 0 0 0 1 1

Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 4/12 0/1 1/2 2/3

Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 0.36 - - 0.38

Empeoramientos 0 0 0 0 1 0 0 0 1 2 3 4 0 0 0

Nivel N N N N N N N N N W W D N N N

gu—dro RX ijemplo de fun™ion—miento de l— primer— heurísti™— del método woE
vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF
v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift
dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il
nivel de w—rning @‡A se —™tiv— ™u—ndo h—y k = 2 empeor—mientos ™onse™utivos
y el de drift @hA ™u—ndo h—y R @d = 2AD en otro ™—so se en™uentr— en norm—lid—d
@xAF

in ™—so de tr—t—rse de ™—m˜ios ˜rus™os entre ™on™eptos muy distintosD l— t—s—
de —™ierto no de™—e progresiv—menteD si no de form— drásti™—D por lo que ™on
l— heurísti™— —nterior o˜tendrí—mos f—lsos neg—tivos —l no dete™t—rse medi—nte
empeor—mientos su™esivosF €or elloD implement—mos un— segunda heurística
˜—s—d— en el s—lto o diferen™i— en los v—lores de l—s t—s—s de éxito p—r— poder
dete™t—r est— ™—íd— de rendimiento @ver ejemplo en gu—dro SAF sgu—l que —ntesD se
monitoriz— l— t—s— de —™ierto —™umul—d— promedi—d— de l—s m últim—s muestr—sD
pero —demás m—ntenemos un históri™o de t—m—ño n ™on estos v—lores promediosF
ehor—D p—r— ™—d— inst—nte de tiempo t:

ƒe o˜tiene smax ™omo el mejor v—lor del históri™oD —sí ™omo l— t—s— de
—™ierto promedi—d— —™tu—l st F
ƒi l— diferen™i— entre st y smax super— un ™ierto um˜r—l uD —™tiv—remos el
nivel de —viso @warning AF wientr—s que si super— un um˜r—l v D —™tiv—remos
el nivel de ™—m˜io @drift AF ƒe de˜e ™umplir que u v F istos v—lores reE
present—n el por™ent—je de ™—íd— de rendimiento frente — smax y tom—rán
v—lores entre H y IF

QI

ƒi no se d— ninguno de estos dos ™—sosD se est—˜le™e el nivel de norm—lid—dF

Instancias →

Predicción 0 1 0 0 1 1 1 0 0 0 0 0 1 1

Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 0/1 1/2 2/3

Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 - - 0.38

Máx. media móvil - - - - 0.36 0.38 0.49 0.52 0.52 0.52 0.50 - - -

Diferencia - - - - 0.04 0 0 0 0.02 0.08 0.10 - - -

Nivel N N N N N N N N N W D N N N

gu—dro SX ijemplo de fun™ion—miento de l— segund— heurísti™— del método woE
vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF
v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift
dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il
históri™o ne™es—rio p—r— ™—l™ul—r el máximo está ™ompuesto por n = 3 últim—s
medi—s móvilesF il nivel de w—rning @‡A se —™tiv— ™u—ndo l— diferen™i— es m—yor
o igu—l que u = 5 % y el de drift @hA ™u—ndo es m—yor o igu—l que v = 10 %D en
otro ™—so se en™uentr— en norm—lid—d @xAF

pin—lmente ™om˜in—mos —m˜—s heurísti™—s en el método wovingever—ge p—r—
poder dete™t—r ™u—lquier— de los dos ™—m˜ios men™ion—dosF €—r— ello se de˜e
tener en ™uent— el sol—p—miento de los niveles de —viso y de ™—m˜io de ™—d— un—
de l—s heurísti™—sF ƒe—n ω1 y ω2 los niveles de —visoD δ1 y δ2 los niveles de drift
y η1 y η2 los niveles de norm—lid—d de l—s heurísti™—s I y P respe™tiv—menteF
he(nimos pues los niveles de nuestr— heurística híbrida ™omoX

IF xivel de norm—lid—dX ηH = η1 ∧ η2 ⇒!ω1 ∧!ω2 ∧!δ1 ∧!δ2 F

PF xivel de —viso @warning AX ωH = ω1 ∨ ω2 F

QF xivel de ™—m˜io @drift AX δH = δ1 ∨ δ2 F

in el elgoritmo S se puede ver el pseudo™ódigo de este métodoF

QP

Algorithm 5 elgoritmo woving ever—ge rí˜rido
I δ1 a δ2 a ω1 a ω2 a pevƒi Y
P — ™ ™ u r — ™ y a I − e r r o r s G numsnst—n™es Y
Q window F —dd @ — ™ ™ u r — ™ y A Y GG remove o l d e s t i f window F s i z e m
R i f window F s i z e aa mX
S ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e a window F — v e r — g e @ A
T
U GG −− ˜ e g i n f i r s t h e u r i s t i ™ −− GG
V i f ™urrente™™ur—™yever—ge ` previouse™™ur—™yever—ge X
W ™ o n s e ™ u t i v e h r o p s CCY GG worse
IH else i f ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e b p r e v i o u s e ™ ™ u r — ™ y e v e r — g e X
II ™ o n s e ™ u t i v e h r o p s a H Y GG ˜ e t t e r
IP else X
IQ ™ o n s e ™ u t i v e h r o p s a ™ o n s e ™ u t i v e h r o p s Y GG s—me
IR
IS previouse™™ur—™yever—ge a ™urrente™™ur—™yever—ge Y
IT
IU if ™ o n s e ™ u t i v e h r o p s b kCd X
IV δ1 a „‚…iY
IW else i f ™ o n s e ™ u t i v e h r o p s b k X
PH ω1 a „‚…iY
PI GG −− end o f f i r s t h e u r i s t i ™ −− GG
PP
PQ h i s t o r y F —dd @ ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e A GG remove o l d e s t i f h i s t o r y F s i z e n
PR i f h i s t o r y F s i z e aa n X
PS GG −− ˜ e g i n s e ™ o n d h e u r i s t i ™ −− GG
PT d i f f e r e n ™ e a h i s t o r y F m—x @ A − ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e Y
PU if differen™e b vX
PV δ2 a „‚…iY
PW else i f d i f f e r e n ™ e b u X
QH ω2 a „‚…iY
QI GG −− end s e ™ o n d h e u r i s t i ™ −− GG
QP
QQ if or δ2 X
δ1
QR return h‚sp„ Y
QS else i f ω1 or ω2 X
QT return ‡e‚xsxqY
QU else X
QV return xy‚wevY

el igu—l que en los métodos —nterioresD los v—lores de n, kD d, u y v h—y que
(j—rlos — prioriF

QQ

7. MOA (Massive Online Analysis)
€—r— ev—lu—r nuestr—s propuest—s y re—liz—r un— ™omp—r—tiv— ™on —lgunos de los
métodos des™ritos —nteriormente se h— utiliz—do el entorno de des—rrollo wye
@w—ssive ynline en—lysisA ‘fuHW˜D fru€IH“F wye es un softw—re des—rroll—E
do en l— …niversid—d de ‡—ik—to @xuev— el—nd—A p—r— re—liz—r experimentos
de ™l—si(™—™ión y ™lustering ™on se™uen™i—s de d—tosF istá rel—™ion—do ™on el
proye™to ˜ien ™ono™ido ‡iue ‘fpr+ IH“ @de minerí— de d—tos tr—di™ion—lAF
„—m˜ién está implement—do en t—v— y tiene li™en™i— q€vF intre otr—s utiliE
d—desD propor™ion— muestr—s y se™uen™i—s de d—tos y— que ™ontiene un— ˜uen—
™ole™™ión de gener—dores de se™uen™i—s de d—tosF edemásD in™luye —lgoritmos de
™l—si(™—™ión y —grup—miento @™lusteringAD —sí ™omo v—rios métodos de ev—lu—E
™iónF in este —p—rt—do ex™lusiv—mente v—mos — det—ll—r l— p—rte de ™l—si(™—™ión
y de gener—doresD que son l—s que hemos us—do en l— se™™ión experiment—l del
tr—˜—joF

7.1. El entorno
v— form— de utiliz—r wye es medi—nte l— eje™u™ión de t—re—s @tasks AF ist—s t—E
re—s se pueden l—nz—r t—nto — tr—vés de un— interf—z grá(™—D ™omo por líne— de
™om—ndos y mu™h—s de ell—s se pueden en™—den—r @ver pigur— IQAF v—s t—re—s
prin™ip—les son de —prendiz—je y ev—lu—™iónD —unque h—y otr—s útiles ™omo geE
ner—r un— se™uen™i— de d—tos que —demás se puede gu—rd—r en e‚pp @form—to
utiliz—do por ‡iue muy ™omún en minerí— de d—tosAF

pigur— IQX plujo de tr—˜—jo en wye

v— interf—z grá(™— de wye permite utiliz—r los métodos de minerí— de d—tos
tr—di™ion—l @en modo ˜—t™hA de ‡iueF isto result— espe™i—lmente útil p—r—
™omp—r—r el —prendiz—je online ™on un —prendiz—je ˜—t™h ™omo referen™i—F edeE
másD nos permite l—nz—r v—ri—s t—re—s de form— simultáne— y ver l— evolu™ión
de ™—d— un—D pudiendo detener ™u—lquier— de ell—s en ™u—lquier momentoF in
l— pigur— IR podemos ver un ejemplo de l— vent—n— prin™ip—l de l— —pli™—™ión
dur—nte l— eje™u™ión de un— t—re— de ™l—si(™—™iónF

QR

pigur— IRX †ent—n— prin™ip—l de wyeF ije™u™ión de un— t—re— de ev—lu—™ión
@€requenti—lA de un método de ™l—si(™—™ión @roe'ding„reeA ™on dete™™ión de
™—m˜io @ihhwA so˜re un— se™uen™i— de d—tos gener—d— por ƒieqener—torF in
l— p—rte superior se puede ver l— t—re— eje™ut—d— y en l— p—rte inferior l— s—lid—
de l— mism— — interv—los de IHHH inst—n™i—s @de(nido previ—menteAF

7.2. Generación de secuencias de datos
gomo y— indi™—mosD un— ™—r—™terísti™— muy útil de wye es l— posi˜ilid—d de
gener—r se™uen™i—s de d—tos — p—rtir de diversos gener—dores que in™orpor— por
defe™to y que list—mos — ™ontinu—™iónF

STAGGER Concepts GeneratorX vos ™on™eptos de ƒ„eqqi‚ ‘ƒqVT“
™onform—n un estánd—r en l— ev—lu—™ión de ™l—si(™—dores en entornos ™on
se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF il pl—nte—miento origin—l
present— un— serie de ejemplos ™on tres —tri˜utosX

ˆ color ∈ {green, blue, red}
ˆ shape ∈ {triangle, circle, rectangle}
ˆ size ∈ {small, medium, large}

v— se™uen™i— de d—tos se divide en tres ™on™eptosX en los primeros RH
ejemplosD el ™on™epto es color = red ∧ size = smallY en los siguientes RH

QS

ejemplosD el ™on™epto es color = green shape = circleY por últimoD los
RH ejemplos (n—les se ™onstruyen ™on el ™on™epto size = medium size =
largeF istos ™on™eptos se pueden o˜serv—r de form— visu—l en l— pigur—
ISF ƒe h— us—do en ‘†xII“‘‡uWT“‘fr€+ HW“‘qwg‚HR“‘uwHU“F

pigur— ISX †isu—liz—™ión de los ™on™eptos ƒ„eqqi‚ ‘uwHU“

SEA Concepts GeneratorX iste ™onjunto de d—tos —rti(™i—l present—E
do en ‘xuHI“ está ™ompuesto por ™u—tro ˜loques de d—tos ™on diferentes
™on™eptosF vos d—tos ™onst—n de tres —tri˜utos y un— ™l—se ˜in—ri—F v—
™l—si(™—™ión se re—liz— solo ™on dos —tri˜utosD mientr—s que el ter™ero es
irrelev—nteD siguiendo est— fun™iónX f1 + f2 ≤ θD donde f1 y f2 son los
dos primeros —tri˜utos y θ es un um˜r—l que se —just— p—r— ™—d— uno
de los ˜loques de d—tos siguiendo este orden {9, 8, 7, 9,5}F he est— forE
m—D l— se™uen™i— de d—tos se de(ne ™omo l— unión ™onse™utiv— de SEA9 D
SEA8 D SEA7 y SEA9,5 D donde ™—d— ™onjunto ™onst— de IPSHH inst—n™i—sD
present—ndo un ™—m˜io ˜rus™o entre ™—d— ™on™eptoF is posi˜le —demás inE
™orpor—r un por™ent—je de ruido por medio del p—rámetro nF ƒe h— us—do
en ‘fr€+ HW“‘uwHU“‘qƒ—‚HW“F
Random RBF GeneratorX in est— se™uen™i—D se gener— un número (jo
de ™entroides @™l—sesA de form— —le—tori— y — ™ontinu—™ión se ™re—n nuevos
ejemplos eligiendo ™u—lquier— de estos ™entroides de m—ner— que ™—ig—n
™er™— de los mismosF v— dist—n™i— —l ™entroide se o˜tiene de form— —le—tori—
de un— distri˜u™ión q—usi—n— ™uy— desvi—™ión típi™— viene determin—d—
por el ™entroideF ƒolo se utiliz—n —tri˜utos numéri™osF €—r—r introdu™ir un
™—m˜io de ™on™epto se despl—z—n los ™entroides en el esp—™io indi™—ndo el
número k de ™entroides — despl—z—r y l— velo™id—d s ™on l— que lo v—n —
h—™erF ƒe h— us—do en ‘fr€+ HW“F
LED GeneratorX ist— se™uen™i— de d—tos ‘fpyƒVR“ ™onst— de PR —triE
˜utos ˜in—riosD IU de los ™u—les son irrelev—ntesF il o˜jetivo es prede™ir el
dígito mostr—do en un displ—y vih de U segmentos en el que ™—d— —tri˜uE
to tiene un IH 7 de posi˜ilid—des de est—r invertidoF ƒe puede in™luir un

QT

™—m˜io de ™on™epto indi™—ndo el número d de —tri˜utos ™on ™—m˜iosF ƒe
h— us—do en ‘†xII“‘fr€+ HW“F

Waveform GeneratorX ist— se™uen™i— de d—tos —p—re™ió t—m˜ién en
‘fpyƒVR“F il o˜jetivo es diferen™i—r entre Q ™l—ses diferentes de ond—sD
donde ™—d— un— de l—s ™u—les se h— gener—do por un— ™om˜in—™ión de
P o Q ond—s ˜—sesF ixisten dos versiones de este pro˜lem—X w—vePI ™on
PI —tri˜utos numéri™os ™on ruido y w—veRH ™on IW —tri˜utos extr— irreE
lev—ntesF ixiste l— posi˜ilid—d de introdu™ir ™—m˜ios en un determin—do
número d de —tri˜utos p—r— forz—r un ™—m˜io de ™on™eptoF ƒe h— us—do en
‘†xII“‘fr€+ HW“‘qƒ—‚HW“F

Function Generator (Agrawal)X iste ™onjunto de fun™iones se presentó
en ‘esƒWQ“ y h— sido us—do p—r— ™ompro˜—r l— es™—l—˜ilid—d en —lgoritmos
de —prendiz—je ™on ár˜oles de de™isiónF v— se™uen™i— de d—tos se puede
gener—r en ˜—se — IH fun™iones diferentes ™on W —tri˜utos des™ritos en el
gu—dro T @T numéri™os y Q ™—tegóri™osA y un— ™l—se ˜in—ri—D de m—ner—
que simul— un— hipotéti™— —pli™—™ión de ™on™esión de prést—mos ˜—n™—E
riosF eunque es un— ˜uen— form— de gener—r se™uen™i—s ™on ™—m˜ios de
™on™eptos de˜ido — l— v—ried—d de sus fun™ionesD en l— ˜i˜liogr—fí— de deE
te™™ión de drifts solo hemos en™ontr—do que se h— us—do en ‘fr€+ HW“F

Atributo Descripción Valores
salary Sueldo Entre 20000 y 150000
commision Comisión Si salary ≥ 75000 ⇒ comission = 0, en otro caso, entre 10000 y 75000
age Edad Entre 20 y 80
elevel Nivel educativo Entre 0 y 4 (categórico)
car Marca del coche Entre 1 y 20 (categórico)
zipcode Código postal Entre 1 y 9 (categórico)
hvalue Valor de la vivienda Entre 0.5k100000 y 1.5k100000 donde k depende de zipcode
hyears Edad de la vivienda Entre 1 y 30
loan Valor del préstamo Entre 0 y 500000
gu—dro TX hes™rip™ión de los —tri˜utos de egr—w—l

Rotating HyperplaneX v—s se™uen™i—s de d—tos gener—d—s por medio de
un hiperpl—no rot—torio se us—ron ini™i—lmente en ‘rƒhHI“F …n hiperpl—no
en un esp—™io dEdimension—l es el ™onjunto de puntos en x que s—tisf—™e
d d
i=1 wi xi = w0 = i=1 wi donde xi es l— iEésim— ™oorden—d— de xF vos
ejemplos m—yores o igu—les que w0 son etiquet—dos ™omo positivosD y el
resto ™omo neg—tivosF €—r— introdu™ir un ™—m˜ioD ˜—st—rá ™on ™—m˜i—r el
peso de un —tri˜uto wi = wi + dσ D donde d es el ™—m˜io que se —pli™— y
σ l— pro˜—˜ilid—d de que se produz™— di™ho ™—m˜ioF vos hiperpl—nos son
útiles p—r— simul—r ™—m˜ios de ™on™eptosD porque permiten modi(™—r l—
orient—™ión y l— posi™ión del hiperpl—no de un— m—ner— su—ve —just—ndo
el peso de ™—d— —tri˜utoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘fqHU“F

in l— pigur— IT se puede o˜serv—r l— interf—z de wye p—r— gener—r se™uen™i—s
de d—tos y —lm—™en—rl—s en (™heros e‚ppF

QU

pigur— ITX snterf—z p—r— gener—r un— se™uen™i— de IHHH d—tos us—ndo el gener—dor
ƒ„eqqi‚F

ƒi nuestro propósito es disponer de se™uen™i—s ™on ™—m˜io de ™on™eptoD un —sE
pe™to interes—nte es l— posi˜ilid—d de in™orpor—r ™—m˜ios ™ontrol—dos1 F €—r— ello
se pueden utiliz—r los gener—dores ™oment—dos —nteriormente y ™om˜in—rlos meE
di—nte un— fun™ión sigmoide @ver pigur— IUA que determin— el ™—m˜io de un
origen de d—tos — otroF gomo p—rámetros de l— fun™ión podemos de(nir el moE
mento t0 en el que su™ede el ™—m˜ioD —sí ™omo —just—r l— ˜rusqued—d ™on l— que
se produ™e por medio de αD o ˜ienD l— longitud del mismo us—ndo W F hur—nte
este interv—lo se v—n — mez™l—r en l— se™uen™i— de d—tos inst—n™i—s de —m˜os
™on™eptosF ytr— posi˜ilid—d es gener—r v—ri—s se™uen™i—s de d—tos de form— inE
dependiente y luego junt—rl—s de form— ™onse™utiv— en un— sol— se™uen™i—F
1 De cara a la experimentación es fundamental saber cuántos cambios, en qué momento y
el tiempo de cambio producido en la secuencia de datos, para luego llevar a cabo evaluaciones
y comparaciones entre métodos.

QV

pigur— IUX pun™ión sigmoide f (t) = 1/(1 + e−s(t−t0 ) ) F gu—nto m—yor se— αD
menor será W y el ™—m˜io será más ˜rus™oF‘fuHW—“

7.3. Métodos de clasicación
vos prin™ip—les métodos de ™l—si(™—™ión online que se en™uentr—n y— impleE
ment—dos en wye sonX x—ive f—yesD x—ive f—yes wultinomi—l ‘wxWV“D heE
™ision ƒtumpD roe'ding „ree ‘rƒhHI“D roe'ding yption „ree ‘€ruHU“D f—gE
ging ‘yz—HS“D foosting ‘yz—HS“D f—gging using eh‡sx ‘fqHU“D f—gging using
ed—ptiveEƒize roe'ding „rees ‘fr€+ HW“D €er™eptronD ƒqhX ƒto™h—sti™ qr—dient
hes™entD €eg—sos ‘ƒƒƒƒgHU“D €er™eptron ƒt—™king of ‚estri™ted roe'ding „rees
‘fpr€IH“ y vever—ging f—gging ‘fr€IH“F edemás de estosD t—m˜ién nos perE
mite in™orpor—r los —lgoritmos desde ‡iue —sí ™omo ™om˜in—r ™u—lquier— de
ellos ™on un método de dete™™ión de ™—m˜ioF

7.4. Métodos de evaluación
7.4.1. Holdout
in el —prendiz—je en ˜—t™hD lo h—˜itu—l es utiliz—r v—lid—™ión ™ruz—d—D pero ™omo
y— se h— indi™—do en l— ƒe™™ión QFR es invi—˜le us—r este método p—r— el —prendiE
z—je por se™uen™i—s de d—tos y— que se vuelve muy ™ostosoF €or elloD en ‘fuHW—“
propusieron us—r el método holdout que us— un ™onjunto de entren—miento y
otro de testF
in wye podemos de(nir ™—d— ™uánto se ev—lú— el modelo entren—doF €—r—
se™uen™i—s de d—tos sin ™—m˜io de ™on™eptoD podemos us—r siempre el mismo
™onjunto de testD pero en ™—so de que se— un— se™uen™i— ™on drift es ne™es—rio
que el ™onjunto de test se —™tu—li™e ™on el tiempo y— que si no podrí—mos est—r
ev—lu—ndo ™on inst—n™i—s que pertene™en — un— distri˜u™ión de d—tos distint— —
l— entren—d—F v— implement—™ión de wye solo ™ontempl— —™tu—lmente el uso
de ™onjuntos de test estáti™osD por lo que no es indi™—do p—r— ev—lu—r se™uen™i—s
™on ™—m˜iosF

QW

7.4.2. Interleaved Test-Then-Train (o Prequential)
ytro método diferente ™onsiste en ev—lu—r el modelo ™on ™—d— nuev— inst—n™i—
y luego us—rlo p—r— el entren—mientoF ist— té™ni™— se puede us—r t—nto p—r—
se™uen™i—s de d—tos ™on ™—m˜ios y sin ™—m˜ios de ™on™eptoF il in™onveniente de
este método es que —l ™omienzo de l— ev—lu—™ión es pro˜—˜le que o˜teng—mos
peores result—dos de˜ido — que el modelo no está tod—ví— ˜ien entren—doF in l—
pigur— IV podemos ver un ejemplo de un— vent—n— de ™on(gur—™ión de wye
p—r— est—˜le™er l— ev—lu—™iónF
ƒegún el estudio re—liz—do por q—m— et —lF ‘qƒ—‚HW“ este método es más indi™—do
p—r— se™uen™i—s de d—tosF

pigur— IVX †ent—n— de ™on(gur—™ión p—r— un— t—re— de ev—lu—™iónF il método de
—prendiz—je es roe'ding„ree ™on dete™™ión de ™—m˜io ihhwF v— se™uen™i— de
d—tos de IHHFHHH inst—n™i—s se gener— medi—nte ƒie qener—torF v— ev—lu—™ión
se re—liz— en un entorno prequenti—l y se v—n — mostr—r l—s t—s—s de éxito —™uE
mul—d—s ™—d— IFHHH inst—n™i—s pro™es—d—sF …n ejemplo de l— s—lid— por p—nt—ll—
de l— eje™u™ión puede verse en l— pigur— IRF

RH

8. Experimentación
€—r— ™ompro˜—r l— e(™—™i— de los métodos propuestosD hemos re—liz—do un— expeE
riment—™ión so˜re diferentes se™uen™i—s de d—tosF gomo el propósito es ev—lu—r
los diferentes métodos de dete™™ión de ™—m˜iosD se h—n prep—r—do se™uen™i—s
t—nto ™on ™—m˜ios ˜rus™os ™omo ™on ™—m˜ios gr—du—lesD —demás de v—ri—s seE
™uen™i—s ™on d—tos re—les disponi˜les en httpXGGmo—F™sFw—ik—toF—™FnzGd—t—setsG
y que se h—n utiliz—do en l— liter—tur—F
v— ev—lu—™ión se h— re—liz—do medi—nte l— estr—tegi— prequenti—lD en l— que se
™l—si(™—n y luego se entren—n ™—d— un— de l—s inst—n™i—s de l— se™uen™i— ™onforme
se v—n re™i˜iendoF €—r— poder h—™er un— ™omp—r—tiv— entre los distintos métoE
dosD se h— (j—do ™omo —lgoritmo de ™l—si(™—™ión el x—ivef—yes y se h— ™—l™ul—do
el e…gD áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s desde el prin™ipio de
l— eje™u™iónF ytros d—tos ™—l™ul—dos h—n sido el número de ™—m˜ios dete™t—dos
™orre™t—mente e in™orre™t—mente @f—lsos positivos y f—lsos neg—tivosAD —sí ™omo
l— dist—n™i— medid— en número de inst—n™i—s desde que s—˜emos que se produ™e
el ™—m˜io de ™on™epto h—st— que (n—lmente se dete™t—F in el ™—so de l—s se™uenE
™i—s de d—tos re—lesD no podemos ™—l™ul—r est— dist—n™i—D y— que des™ono™emos
™uántos ™—m˜ios present—n y ™uándo se produ™enF

8.1. Conjuntos de datos reales
Electricity Market (ELEC)
iste es uno de los ™onjuntos de d—tos re—les más utiliz—dos en dete™™ión de
driftsF ƒe tr—t— de un— se™uen™i— de d—tos (nit— ™ompuest— por RSFQIP inst—n™i—sD
donde ™—d— muestr— represent— un periodo de QH minutos ™on v—lores de l—
ofert— y dem—nd— de l— energí— elé™tri™— de un— ™iud—d eustr—li—n—D donde los
pre™ios v—rí—n según l— dem—nd—F il v—lor de l— ™l—se se re(ere — l— v—ri—™ión
del pre™io ™on respe™to — l— medi— de l—s últim—s PR hor—sF ƒe h— us—do en
‘fr€+ HW“‘qwg‚HR“‘fqHU“‘fqdgep+ HT“‘uwHU“F

Forest Covertype (Forest)
iste ™onjunto de d—tos ™ontiene v—lores so˜re el tipo de suelo forest—l en regiones
de ist—dos …nidosF istá ™ompuesto por SVIFHIP inst—n™i—s ™on SR —tri˜utos y U
™l—sesF ƒe h— us—do en ‘†xII“‘fr€+ HW“F

Poker-Hand (Poker)
iste ™onjunto está ™ompuesto por IFHPSFHIH inst—n™i—sD donde ™—d— muestr—
represent— un— m—no de S ™—rt—s es™ogid—s de un— ˜—r—j— ™on SP ™—rt—sF g—d—
™—rt— se des™ri˜e ™on dos —tri˜utos @p—lo y v—lorAD por lo que en tot—l h—˜rá IH
—tri˜utosF v— ™l—se des™ri˜e l— m—no de póker y ™onst— de IH posi˜les v—loresF
r—y que tener en ™uent— que el orden de l—s ™—rt—s es import—nteF ƒe h— us—do
en ‘fqHU“ ‘fr€+ HW“F €—r— nuestr— experiment—™ión hemos utiliz—do l— versión
norm—liz—d— disponi˜le en l— we˜ de wyeD de m—ner— que no import— el orden

RI

Minería de secuencias de datos

Minería de secuencias de datos

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (6)

Más de Manuel Martín

Más de Manuel Martín (20)

Minería de secuencias de datos