3. Índice
1. Introducción 5
2. Los datos 5
PFIF ƒe™uen™i—s de d—tos F F F F F F F F F F F F F F F F F F F F F F F F F F S
PFPF g—m˜ios de ™on™epto F F F F F F F F F F F F F F F F F F F F F F F F F T
3. Algoritmos de clasicación de secuencias de datos 8
QFIF eprendiz—je online F F F F F F F F F F F F F F F F F F F F F F F F F F V
QFPF we™—nismos de olvido F F F F F F F F F F F F F F F F F F F F F F F F W
QFQF „—xonomí— de métodos de —prendiz—je F F F F F F F F F F F F F F F IH
QFRF iv—lu—™ión del pro™eso de —prendiz—je F F F F F F F F F F F F F F F II
4. Aplicaciones 14
5. Revisión de métodos de aprendizaje con disparadores 15
SFIF elgoritmos ™on dete™™ión de ™—m˜io F F F F F F F F F F F F F F F F IS
SFIFIF hhw @hrift hete™tion wethodA F F F F F F F F F F F F F F F IS
SFIFPF ihhw @i—rly hrift hete™tion wethodA F F F F F F F F F F IV
SFIFQF wétodo de uifer F F F F F F F F F F F F F F F F F F F F F F F IV
SFIFRF eh‡sx @ed—ptive ‡indowingA F F F F F F F F F F F F F F F IW
SFPF elgoritmos ™on vent—n— de entren—miento F F F F F F F F F F F F F PP
SFPFIF wétodo de ulinken˜erg F F F F F F F F F F F F F F F F F F F PQ
SFPFPF psƒr @unipied snst—n™e ƒele™tion —lgoritrmA F F F F F F F PR
6. Aportaciones 26
TFIF woreirrorswoving F F F F F F F F F F F F F F F F F F F F F F F F F F PT
TFPF w—xwoving F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PV
TFQF wovingever—ge F F F F F F F F F F F F F F F F F F F F F F F F F F F F PW
7. MOA (Massive Online Analysis) 34
UFIF il entorno F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QR
UFPF qener—™ión de se™uen™i—s de d—tos F F F F F F F F F F F F F F F F F QS
UFQF wétodos de ™l—si(™—™ión F F F F F F F F F F F F F F F F F F F F F F F QW
UFRF wétodos de ev—lu—™ión F F F F F F F F F F F F F F F F F F F F F F F F QW
UFRFIF roldout F F F F F F F F F F F F F F F F F F F F F F F F F F F F QW
UFRFPF snterle—ved „estE„henE„r—in @o €requenti—lA F F F F F F F F RH
Q
4. 8. Experimentación 41
VFIF gonjuntos de d—tos re—les F F F F F F F F F F F F F F F F F F F F F F RI
VFPF f—terí— de prue˜—s F F F F F F F F F F F F F F F F F F F F F F F F F F RP
VFQF ‚esult—dos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RQ
9. Conclusión y trabajo futuro 57
10.Bibliografía 59
R
5. 1. Introducción
in este tr—˜—jo v—mos — tr—t—r el pro˜lem— del —prendiz—je —utomáti™o so˜re
se™uen™i—s de d—tosF in un entorno ™lási™o se dispone de un— ˜—se de d—tos
™omplet— y estáti™—D y el o˜jetivo es —prender un modelo que represente lo más
(elmente posi˜le di™hos d—tosF in ™—m˜ioD ™u—ndo en lug—r de disponer de todos
los d—tos —l tiempoD estos v—n lleg—ndo de t—nto en t—ntoD en un— se™uen™i— de
d—tosD — priori de longitud in(nit—D tenemos que —˜ord—r el pro˜lem— del —prenE
diz—je de diferente m—ner—F il pro˜lem— diverge —ún más ™u—ndo l— distri˜u™ión
de los d—tos que se v— re™i˜iendo v—rí— — lo l—rgo del tiempo y por t—nto se h—™e
ne™es—rio —just—r el modelo dur—nte todo el pro™esoF
€or elloD en primer lug—r será ne™es—rio ™on™ret—r este ™on™epto de d—tos que
™onstituye l— entr—d— — un nuevo sistem— de —prendiz—je que se des™ri˜e en l—
ƒe™™ión PF e ™ontinu—™iónD se est—˜le™en los requerimientos de ™u—lquier —lgoE
ritmo de ™l—si(™—™ión so˜re se™uen™i—s de d—tos y l— estru™tur— gener—l de ™ómo
se —˜ord— este pro˜lem— en l— liter—tur— @ƒe™™ión QAF v— minerí— de se™uen™i—s
de d—tos tiene un gr—n ™—mpo de —pli™—™ión ™omo se muestr— en l— ƒe™™ión RF
entes de expli™—r nuestr—s propuest—s en l— ƒe™™ión TD se h—™e un— revisión de
los tr—˜—jos más dest—™—dos en l— dete™™ión de ™—m˜ios de ™on™epto @ƒe™™ión
SAF €—r— l— p—rte experiment—l h— sido ne™es—rio est—˜le™er un m—r™o de tr—˜—jo
que puede ser referen™i— p—r— futur—s experiment—™iones y se h— utiliz—do p—r—
re—liz—r el estudio ™omp—r—tivo de los diferentes métodos sele™™ion—dos @ƒe™™ión
VAF „odo ello h— sido des—rroll—do dentro un entorno softw—re que tr—˜—j— so˜re
™l—si(™—™ión ™on se™uen™i—s de d—tosD que se expli™—rá en l— ƒe™™ión UF pin—lE
menteD de l— p—rte experiment—l se extr—en ™on™lusiones y se est—˜le™en nuevos
o˜jetivos p—r— tr—˜—jos futuros en l— ƒe™™ión WF
2. Los datos
2.1. Secuencias de datos
h—do un pro˜lem— de un dominio determin—doD un— se™uen™i— de d—tos @data
stream A está ™ompuest— por un— serie de inst—n™i—s que lleg—n —l sistem— — dis™reE
™iónD de un— en un— o en p—quetes de t—m—ño regul—r o v—ri—˜leF v—s inst—n™i—s
que ™omponen l—s se™uen™i—s de d—tos en un pro˜lem— orient—do — l— ™l—si(™—E
™iónD suelen est—r form—d—s por un ™onjunto de v—ri—˜les o˜serv—d—s x1 , ..., xn y
un— ™l—se y F in prin™ipio est—s se™uen™i—s tienen un t—m—ño ilimit—do y —demás
es posi˜le que el pro˜lem— presente ™—m˜ios en l— distri˜u™ión su˜y—™ente — lo
l—rgo del tiempo que se re)ejen en l— se™uen™i—D por lo que no se pueden us—r
los enfoques tr—di™ion—les de minerí— de d—tosF il entorno de tr—˜—jo ne™es—rio
p—r— oper—r ™on se™uen™i—s de d—tos de˜e ™umplir ™iert—s restri™™iones ‘frzIH“X
IF xo se pueden —lm—™en—r todos los d—tos en memori—F ƒolo se permite
registr—r un— pequeñ— ™—ntid—d de inst—n™i—sD mientr—s que el resto se v—n
elimin—ndo un— vez pro™es—d—sF
PF v— velo™id—d ™on l— que se re™i˜en los d—tos impli™— que el pro™es—miento
de˜e h—™erse en tiempo re—lF
S
6. QF v— distri˜u™ión de los d—tos puede v—ri—r en el tiempoD de m—ner— que los
d—tos —ntiguos se vuelven irrelev—ntes p—r— l— et—p— —™tu—lF
v— restri™™ión I impli™— limit—r el t—m—ño de l— memori— utiliz—d— dur—nte el
—prendiz—jeD mientr—s que l— P limit— el tiempo de pro™es—miento de ™—d— muesE
tr—F in —quellos entornos en los que l—s se™uen™i—s de d—tos se—n evolutiv—s
@presenten ™—m˜iosAD h—y que tener en ™uent— l— restri™™ión Q en el pro™eso de
—prendiz—je e in™orpor—r métodos de dete™™ión de ™—m˜ios que permit—n evoluE
™ion—r el modeloF
2.2. Cambios de concepto
h—do un pro˜lem— de un dominio determin—doD se denomin— ™—m˜io de ™on™epto
@concept drift A — l— situ—™ión que se produ™e ™u—ndo los d—tos de un— se™uen™i—
p—s—n de tener un— distri˜u™ión de pro˜—˜ilid—d S1 — otr— distri˜u™ión S2 D
donde S1 y S2 son de orígenes diferentes @ver pigur— IAF iste tipo de se™uen™i—s
de d—tos se suelen denomin—r evolutiv—s o dinámi™—sD frente — l—s estáti™—sD que
no present—n ™—m˜ios de ™on™eptoF
pigur— IX ‚epresent—™ión visu—l de un ™—m˜io de ™on™epto gr—du—l — lo l—rgo del
tiempo ‘liIH—“
v— n—tur—lez— del ™—m˜io de ™on™epto es imprede™i˜leD por lo que no se tr—t— de
™—m˜ios ™on periodi™id—d ™ono™id—D si no que l— suposi™ión prin™ip—l ™u—ndo se
—˜ord— este pro˜lem— es l— in™ertidum˜re so˜re el futuroF il ™—m˜io de ™on™epto
se puede d—r por tres ™—us—s ‘ureWW“X
IF g—m˜io en l—s pro˜—˜ilid—des — priori de l—s ™l—ses P (c1 ), . . . , P (ck )
PF g—m˜io en l—s distri˜u™iones de pro˜—˜ilid—d ™ondi™ion—d—s P (X|ci )D i =
1, . . . , k
T
7. QF g—m˜io en l—s pro˜—˜ilid—des — posteriori P (ci |X)D i = 1, . . . , k
gomo ejemplos de ™—m˜io de ™on™epto se pueden ™onsider—r los ™orreos ˜—sur—
@spam AD que intent—n v—ri—r su ™ontenido p—r— s—lt—rse los (ltros de ™orreoD o l—
evolu™ión de l— s—lud de un p—™iente —l in™luir un nuevo medi™—mentoF
ƒe pueden en™ontr—r en l— liter—tur— ‘frzIH“ h—st— seis tipos de ™—m˜ios so˜re
un— v—ri—˜le — lo l—rgo del tiempoD t—l y ™omo se puede o˜serv—r en l— pigur— PF
v— primer— grá(™— @Sudden A muestr— un ™—m˜io —˜ruptoD en el que ™—m˜i— el
v—lor de l— ™l—se de form— inst—ntáne—F v—s siguientes grá(™—s muestr—n ™—m˜ios
que se produ™en más lent—menteF v— diferen™i— entre in™rement—l y gr—du—l r—E
di™— en si ™—m˜i—n los v—lores de l—s v—ri—˜les o ˜ien l— distri˜u™ión de l— ™l—seD
—unque h—˜itu—lmente se us—n ™omo sinónimosF in l— (l— de —˜—jo tenemos l—
primer— grá(™— @Recurring A ™on un ™—m˜io tempor—l y que vuelve — su est—do
norm—l tr—s un interv—lo de tiempoF v— siguiente grá(™— @Blip A represent— un
evento ex™ep™ion—l y no de˜e tr—t—rse ™omo un ™—m˜io de ™on™eptoF v— últim—
grá(™— @Noise A muestr— ™—m˜ios —le—toriosD — los que ll—m—remos ruido y t—mE
po™o de˜en ™onsider—rse ™omo un ™—m˜io en l— distri˜u™iónF in l— liter—tur— lo
más fre™uente es en™ontr—rse ™on tr—˜—jos que ™onsider—n t—n solo los ™—m˜ios
—˜ruptosD gr—du—les o in™rement—lesFF
pigur— PX „ipos de ™—m˜ios
U
8. 3. Algoritmos de clasicación de secuencias de
datos
vos ™l—si(™—dores de se™uen™i—s de d—tos de˜en ser ™—p—™es de —prender de los
d—tos de form— in™rement—l en vez de por lotes @batch A y re—™™ion—r —nte los
™—m˜ios de ™on™eptoF em˜os requisitos se ™onsiguen —pli™—ndo aprendizaje
online y mecanismos para olvidar los d—tos que y— no son relev—ntesF
3.1. Aprendizaje online
il —prendiz—je onlineD t—m˜ién ll—m—do —prendiz—je in™rement—lD se ™entr— en el
pro™es—miento de inst—n™i—s de form— se™uen™i—l tr—t—ndo de que el ™l—si(™—dor
entren—do se— t—n pre™iso ™omo si se hu˜iese entren—do ™on todo el ™onjunto
de d—tos — l— vez @en batch AF …n ˜uen —lgoritmo de —prendiz—je online de˜erí—
tener est—s ™u—lid—des ‘frzIH“X
IF sn™rement—lX el —lgoritmo de˜e ser ™—p—z de leer y pro™es—r d—tos — lo l—rgo
del tiempo sin tener que disponer de todos los d—tos desde el prin™ipioF
PF „r—t—r ™—d— inst—n™i— en un— p—s—d—X el —lgoritmo solo puede re—liz—r un—
le™tur— so˜re los d—tos y luego li˜er—r el esp—™ioF
QF vimit—™ión de tiempo y memori—X ™—d— vez que se pro™ese un ejemplo de˜e
h—™erse en el menor tiempo posi˜le y l— ™—ntid—d de memori— ne™es—ri—
p—r— el pro™es—miento de˜e ser ™onst—nteF
RF il —lgoritmo de˜e propor™ion—r un modelo ™ompleto en ™u—lquier inst—nte
de tiempoF in un ™—so ide—lD el ™l—si(™—dor entren—do in™rement—lmente
h—st— un inst—nte t de˜e ser equiv—lente —l mismo entren—do de form—
tr—di™ion—l ™on tod—s l—s inst—n™i—s disponi˜les h—st— el inst—nte tF
€—r— s—tisf—™er est—s restri™™iones de po™os d—tos — l— vez y disponi˜ilid—d del
modelo en ™u—lquier inst—nteD se suelen —pli™—r té™ni™—s de resumen — los d—E
tos t—les ™omo sliding windows @vent—n—s desliz—ntesAD sampling @muestreoA o
sketching @es˜ozoAD —lgun—s de l—s ™u—les se ™onsider—rán en este tr—˜—joF
v—s prin™ip—les diferen™i—s entre el pro™eso de ™l—si(™—™ión ™on todos los d—tos
en un modo tr—di™ion—l y un pro™eso de ™l—si(™—™ión p—r— se™uen™i—s de d—tos
se pueden ver — modo de resumen en el gu—dro IF
Tradicional Secuencial
xúmero de p—s—d—s wúltiple …n—
„iempo de pro™es—miento slimit—do ‚estringido
…so de memori— slimit—do ‚estringido
„ipo de result—do €re™iso eproxim—do
gon™epto istáti™o ivolutivo
gu—dro IX gomp—r—tiv— de minerí— de d—tos tr—di™ion—l frente — l— minerí— de
se™uen™i—s de d—tos ‘qqHU“
V
9. in gener—lD el pro™eso de —prendiz—je puede verse ™omo en l— pigur— QF
pigur— QX €ro™eso de —prendiz—je in™rement—l en el inst—nte t ‘liIH˜“F
3.2. Mecanismos de olvido
sn™orpor—r me™—nismos de olvido es un —spe™to que tiene espe™i—l interés en
se™uen™i—s evolutiv—sD y— que existe un modelo —ntes y otro distinto después de
dete™t—rse el ™—m˜ioF €or t—ntoD un ™l—si(™—dor de˜e ser ™—p—z de re—™™ion—r
—nte un ™—m˜io de ™on™epto y olvid—r —quello que y— no se— relev—nteD ™omo
los d—tos que son de ™on™eptos —ntiguosF il prin™ip—l pro˜lem— es ™ómo s—˜er
qué de˜e olvid—rF v— solu™ión más sen™ill— es ir olvid—ndo p—ul—tin—mente los
d—tos —ntiguos y us—r un— ventana ™on los ejemplos más re™ientes p—r— entren—r
el ™l—si(™—dorF isto permite —demás m—ntener redu™ido el número de inst—n™i—s
ne™es—ri—s p—r— el entren—mientoF iste primer enfoque de vent—n—s de t—m—ño
™onst—nte en los d—tos más re™ientesD present— un ™ompromiso entre est—˜ilid—d
y )exi˜ilid—dD y— que si l— vent—n— es dem—si—do pequeñ— re—™™ion—rá rápido —
los ™—m˜iosD pero — l— vez ˜—j—rá l— pre™isión porque está entren—ndo ™on po™os
d—tosF in ™—m˜ioD si l— vent—n— es muy gr—ndeD el ™l—si(™—dor será más est—˜le
pero t—rd—rá más en dete™t—r los ™—m˜ios ‘uunHV“F
ytro enfoque ™onsiste en —just—r el t—m—ño de l— vent—n— de —prendiz—je ™u—ndo
se dete™te un ™—m˜io de ™on™epto p—r— tr—t—r de en™ontr—r un equili˜rio entre
pre™isión y )exi˜ilid—dF istos métodos fun™ion—n mejor ™u—ndo h—y ™—m˜ios
˜rus™osF
…n enfoque —ltern—tivo ™onsiste en ponder—r l—s muestr—s ™on un peso que irá
disminuyendo — lo l—rgo del tiempo p—r— v—ri—r l— in)uen™i— de l—s mism—s
dur—nte el pro™esoF iste enfoque se denomin— fading factor @f—™tor de olvidoAF
W
10. €—r— nuestros métodos v—mos — us—r vent—n—s de t—m—ño (jo y— que nos f—™ilit—n
l— interpret—˜ilid—d de los result—dosF
3.3. Taxonomía de métodos de aprendizaje
e ™ontinu—™ión present—mos un— posi˜le ™l—si(™—™ión de métodos de —prendiz—je
de se™uen™i—s de d—tos evolutiv—sD propuest— en ‘liIH˜“F
IF Algoritmos de aprendizaje con disparadores (Learner with triggers)X
dependen de un— señ—l que indi™— que es ne™es—rio —™tu—liz—r el modeloF
a A Detección de cambio (Change detectors) X son los más fre™uentes en
l— ˜i˜liogr—fí—F istos métodos fun™ion—n mejor en entornos ™on ™—mE
˜ios ˜rus™os en los que se suele re™onstruir el modelo por ™ompleto
en vez de —™tu—liz—rloF vo más ™omún es monitoriz—r los d—tosD los
p—rámetros del ™l—si(™—dor o l— s—lid— del —lgoritmo de —prendiz—jeF
‘ƒƒHVD qwg‚HRD fqdgep+ HT“
in el supuesto de que l—s se™uen™i—s de d—tos se—n estáti™—s @sin
™—m˜iosAD l—s té™ni™—s de dete™™ión de ™—m˜ios t—m˜ién pueden ser
utiliz—d—s p—r— dete™t—r diferen™i—s signi(™—tiv—s respe™to —l modelo
que se está entren—ndo y se tr—t—rí— de ™omplet—r el —nterior p—r—
lleg—r — un modelo mejor —just—doF
b A Ventana de entrenamiento (Training windows) X estos métodos se
˜—s—n en heurísti™—s p—r— —just—r el t—m—ño de l— vent—n— de entreE
n—mientoF ‘‡uWTD rƒhHID fwHV“
c A Muestreo adaptativo (Adaptive sampling) X ˜—sándose en l— rel—E
™ión entre l— inst—n™i— de prue˜— y unos prototipos prede(nidos o
˜ien el históri™o de inst—n™i—s entren—d—sD se sele™™ion— un ™onjunto
de entren—miento —de™u—doF ‘‰‡HVD €ruHV“
PF Algoritmos de aprendizaje evolutivos (Evolving learners)X estos méE
todos —™tu—liz—n el modelo de form— gr—du—l y no requieren de un dete™tor
de ™—m˜ios de ™on™eptoF
a A Conjuntos adaptativos (Adaptive ensembles) X son los más popul—E
resD y ˜ási™—mente ™om˜in—n l— s—lid— de distintos ™l—si(™—dores del
™onjunto p—r— d—r un— de™isión (n—lF ‘uwHUD ƒt—HQD xuHI“
b A Ponderación de instancias (Instance weighting) X estos —lgoritmos
no ™om˜in—n regl—s de de™isiónD sino que l— —d—pt—˜ilid—d se ™onsigue
modi(™—ndo el ™onjunto de entren—mientoF …tiliz— ide—s de boostingD
d—ndo más import—n™i— — —quell—s inst—n™i—s m—l ™l—si(™—d—sF ‘uoyHHD
ƒHVD gHR“
c A Espacio de características (Feature space) X estos métodosD próE
ximos — l— sele™™ión de ™—r—™terísti™—sD ™onsiguen l— —d—pt—˜ilid—d
sele™™ion—ndo de form— dinámi™— l—s ™—r—™terísti™—s emple—d—s p—r—
l— ™l—si(™—™iónF ‘porHTD ‡qgHTD eerHV“
d A Dependientes del modelo (Base model specic) X estos métodos se
—d—pt—n modi(™—ndo los p—rámetros del modelo que estén us—ndoF
‘xnpwHUD ureWWD ƒvƒWW“
IH
11. 3.4. Evaluación del proceso de aprendizaje
ƒegún v—rios —utores ‘qƒ—‚HW“D h—y tres —spe™tos import—ntes — tener en ™uent—
— l— hor— de ev—lu—r —lgoritmos de —prendiz—je de se™uen™i—s de d—tosX
Espacio o™up—do en memori— — lo l—rgo del pro™eso de —prendiz—jeF
Tiempo de pro™es—miento de un— muestr— @esto puede limit—r l— fre™uenE
™i— de re™ep™ión de los d—tosAF
€oder de generalizaciónX efe™tivid—d del modelo —l represent—r el ™onE
™epto su˜y—™ente de los d—tosF
xosotros nos v—mos — o™up—r úni™—mente de ev—lu—r y ™omp—r—r —lgoritmos
por el último ™riterioD según su efe™tivid—d dur—nte l— ™l—si(™—™iónF ƒin em˜—rgo
—unque no tr—t—mos de minimiz—r ™onsumo de memori—D ni tiempo de pro™eE
s—mientoD sí se respet—n los requerimientos de —prendiz—je onlineD de un— sol—
p—s—d— so˜re los d—tos y que l—s muestr—s no se —™umul—n tod—s en memori—F
xuestro propósito por t—nto esD ev—lu—r —lgoritmos propios y —jenos por l— efe™E
tivid—d del modelo —prendidoD p—r— poder est—˜le™er ™omp—r—™iones y r—nkings
de los mismos y extr—er ™on™lusiones so˜re los modelos —prendidosF
vos métodos de ev—lu—™ión de —lgoritmos de —prendiz—je en ˜—t™hD —prenden
so˜re un ™onjunto de entren—miento @training A y utiliz—˜—n un ™onjunto de test
independiente so˜re los que estim—r l— pro˜—˜ilid—d de error holdoutF in el ™—so
de no disponerse de —m˜osD se estim— l— pro˜—˜ilid—d de error del modelo o˜teE
nido — p—rtir del ™onjunto de tr—ining medi—nte té™ni™—s de v—lid—™ión ™ruz—d—
y sus v—ri—ntes @leaving-one-out A o bootstrapF ƒin em˜—rgoD en el ™ontexto de seE
™uen™i—s donde los d—tos son poten™i—lmente in(nitosD l— v—lid—™ión ™ruz—d— y l—s
estr—tegi—s de muestreo no son —pli™—˜lesF edemásD el he™ho de que los ™on™eptos
de l—s se™uen™i—s de d—tos pued—n ™—m˜i—r en el tiempo tiene impli™—™iones en
l—s té™ni™—s de ev—lu—™iónF
ƒe ne™esit—n por t—nto nuev—s estr—tegi—s de ev—lu—™iónF il prin™ip—l pro˜lem—
™onsiste en monitoriz—r l— evolu™ión del pro™eso de —prendiz—jeF xos en™ontr—mos
™on dos —ltern—tiv—sX
IF HoldoutX ™omo en su homólogo en ˜—t™hD se tr—t— de un ™onjunto de test
que se —pli™— —l modeloD pero en este ™—so extr—ído — interv—los regul—resD
p—r— estim—r l—s t—s—s de errorD lo que es —de™u—do p—r— se™uen™i—s dináE
mi™—sF r—y que (j—r fre™uen™i— y —n™hur— del ™onjunto de test so˜re l—
se™uen™i—F ƒe tr—t— de un estim—dor no sesg—doD pues —l moverse — lo l—rgo
de l— se™uen™i— no d— lug—r — so˜re—justeF
PF PrequentialX t—m˜ién ™ono™ido ™omo test-then-train ‘fuHW—“F il término
prequenti—l proviene de €redi™tive ƒequenti—l ‘h—wVR“F il error del modelo
n
se estim— so˜re l— se™uen™i— de d—tosX S = i=1 L(yi , yi ) donde L es
ˆ
l— fun™ión de pérdid— tr—s h—˜er predi™ho l— ™l—se de form— ™orre™t— o
in™orre™t—F ƒe ™ono™e que este estim—dor es pesimist—D es de™irD en l—s
mism—s ™ondi™ionesD l— estr—tegi— holdout v— — d—r mejores v—loresF il
error estim—do ™on prequenti—l v— — est—r in)uen™i—do por los errores que
se h—y—n podido ™ometer —l prin™ipio de l— se™uen™i— de d—tosF €or elloD se
h—n us—do me™—nismos de olvido t—les ™omoX
II
12. a A Ventanas temporales (time window): en lug—r de m—ntener un ™ál™ulo
de l—s t—s—s de éxito —™umul—do desde el ini™io de l— se™uen™i—D se
re—liz— est— estim—™ión p—r™i—l so˜re un— vent—n— de t—m—ño k D (jo
@— (j—r — prioriAD que se v— despl—z—ndoF iste me™—nismo ™onverge
más rápid—mente —l método holdoutF
b A Factores de olvido (fading factor): se introdu™e un f—™tor de olvido α
p—r— que l— in)uen™i— de ™—d— error en l— estim—™ión v—y— de™—yendo
™onforme —ument— l— dist—n™i—F he est— m—ner—D podemos ™—l™ul—r el
L +α·S
error prequenti—l ™omo Ei = Bi = nii+α·Bi−1 donde S1 = L1 y ni
S
i i−1
es el número de ejemplos us—dos p—r— ™—l™ul—r Li F in el ™—so de que
α = 1 impli™— que no h—y olvidoF iste me™—nismo tiene l— vent—j— de
que requiere po™— memori—D y— que solo requiere —lm—™en—r el v—lor
—nterior y el —™tu—lD frente —l uso de vent—n—s donde se tienen que
—lm—™en—r k v—lores de pérdid—F
em˜os me™—nismos están muy rel—™ion—dosD y por ende sus p—rámetrosF
esíD p—r— v—lores ˜—jos de k y de αD l—s estim—™iones he™h—s son más —
™orto pl—zo y ™omo ™onse™uen™i— l—s os™il—™iones de l—s estim—™iones son
m—yoresF €or otro l—doD p—r— v—lores —ltos de k @m—yor vent—n—A y de
α @™er™—nos — IAD v—n — intervenir más d—tos en l—s estim—™iones de los
erroresF
in nuestr— experiment—™ión hemos us—do l— estim—™ión prequenti—l y— que es l—
más extendid—D de˜ido — que no se ex™luye ningún d—to en el entren—mientoD y
se ev—lú— puntu—lmente ™on ™—d— muestr— de l— se™uen™i—D por lo que se o˜tiene
de un estim—dor no sesg—doF
e l— hor— de ™omp—r—r el rendimiento que present—n dos —lgoritmos @e y fA
frente — l— mism— se™uen™i— de d—tos podemos us—r el est—dísti™o Qi (A, B) =
1−S A
log 1−Si D donde Si y Si son los v—lores de l— fun™ión de pérdid— —™umuE
B
A B
i
l—dos de ™—d— —lgoritmoF il v—lor de Qi es útil p—r— ™ompro˜—r l—s diferen™i—s
entre —m˜os —lgoritmosD de m—ner— que si el —lgoritmo e present— un mejor
™omport—miento que el fD v—mos — o˜tener v—lores positivosD mientr—s que en
™—so ™ontr—rio o˜tendremos v—lores neg—tivosD y si son igu—les será ™eroF
il pro˜lem— de est—s medid—s es que evolu™ion—n — lo l—rgo del tiempo y es
posi˜le que visu—lmente no pod—mos re™ono™er qué método es mejor que otro
y— que uno se puede ™omport—r mejor en un— p—rte de l— se™uen™i—D mientr—s
que otro lo h—g— en otr— o™—siónF €or elloD p—r— d—r un v—lor (n—l en nuestr—
experiment—™ión hemos us—do ™omo medid— el áre— ˜—jo l— ™urv— @e…gA de
los v—lores o˜tenidos ™on l— estr—tegi— prequenti—l desde el ini™io de l— se™uen™i—
h—st— que (n—liz—F he est— m—ner—D si tenemos dos —lgoritmos @e y fAD de(nimos
N
AU CA = i=0 ni · (1 − Ei ) donde ni es el número de ejemplos us—dos p—r—
A
™—l™ul—r Ei y N el número de v—lores de Ei disponi˜les @ídem p—r— fAF hiremos
A A
que e es mejor que f si AU CA AU CB F
ytro —spe™to interes—nte — ev—lu—r en el ™—so de que tr—˜—jemos ™on se™uen™i—s
sintéti™—s ™on ™—m˜ios de ™on™eptos ™ono™idos es el número de drifts ™orre™t—E
mente dete™t—dosD los f—lsos positivosD los f—lsos neg—tivosD —sí ™omo l— dist—n™i—
tr—ns™urrid— desde que se produ™e un ™—m˜io h—st— que se dete™t—F il ™ál™ulo de
est— dist—n™i— v— — ser diferente dependiendo del tipo de ™—m˜io que presente l—
IP
13. se™uen™i—D y— que h—y que tener en ™uent— que los ™—m˜ios gr—du—les se produ™en
— lo l—rgo de un— vent—n— donde se entremez™l—n muestr—s de —m˜os ™on™eptosF
v— dist—n™i— se ™—l™ul— entre el punto de drift re—l y el drift dete™t—do más
™er™—no — élF in ™—so de h—˜er más de un drift dete™t—doD se ™—l™ul— l— dist—n™i—
del primero y el resto se ™onsider—n f—lsos positivosF ƒi el ™—m˜io es gr—du—lD
el punto de ™—m˜io re—l ™onsider—mos que ™orresponde ™on l— ™ot— inferior del
interv—lo de ™—m˜ioF ƒe puede ver un ejemplo en l— pigur— RF
Cambios Abruptos Cambios Graduales
0 10 20 30 40 50 0 10 20 30 40 50
Instancias Instancias
pigur— RX in l— grá(™— de l— izquierd— s—˜emos que h—y P ™—m˜ios —˜ruptos en
PH y RH @líne—s roj—s ™ontínu—sAF il método —pli™—do h— dete™t—do Q drifts en
PSD QH y RP @líne—s —zules dis™ontínu—sAF hiremos que h— dete™t—do dos drifts
™orre™t—mente @en los puntos PS y RPA y un f—lso positivo @QHAF v— dist—n™i— —l
primer drift será de 25 − 20 = 5 y —l segundo de 42 − 40 = 2F €or otro l—doD en
l— grá(™— de l— dere™h— h—y P ™—m˜ios gr—du—les que tienen lug—r en ‘ISD PS“ y
‘QSD RS“F in este ™—so diremos que h— dete™t—do dos drifts ™orre™t—mente @IS y
RPA y dos f—lsos positivos @PI y QHAF v— dist—n™i— —l primer drift será 15 − 15 = 0
y —l segundo 42 − 35 = 7F
IQ
14. 4. Aplicaciones
e ™ontinu—™ión present—mos distint—s áre—s de —pli™—™ión p—r— el —prendiz—je
o l— ™l—si(™—™ión de se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF „odos ellos
tienen en ™omún l— —)uen™i— ™onst—nte de nuevos d—tos y un— posi˜le evolu™ión
de los ™on™eptos en el tiempoF
Monitorización y controlX en l—s —pli™—™iones de monitoriz—™ión y ™onE
trol se tr—˜—j—n ™on ™—ntid—des de d—tos muy gr—ndes que ne™esit—n pro™eE
s—rse en tiempo re—lF ƒe pueden diferen™i—r dos tipos de t—re—sX preven™ión
y prote™™ión frente — —t—quesD o monitoriz—™ión ™on propósitos de gestiónF
ˆ ƒegurid—d informáti™—X dete™™ión de intrusosF ‘vfWW“
ˆ ƒe™tor (n—n™ieroX preven™ión de fr—udesF ‘honHR“
ˆ „r—nsporteX gestión del trá(™oF ‘wƒthHW“
ˆ €osi™ion—mientoX r—streo inter—™tivoF ‘v€puHU“
ˆ sndustri—X monitoriz—™ión de pro™esos de produ™™iónF ‘†yq+ HV“
Información y asistencia personalizadaX est—s —pli™—™iones org—niz—n
o person—liz—n un )ujo de inform—™iónF
ˆ esisten™i— person—lX (ltr—do de inform—™iónF ‘qƒgwHU“
ˆ €er(les de ™lientesX segment—™ión de ™lientesF ‘vrgHV“
ˆ snform—™iónX org—niz—™ión de do™umentosF ‘fvHT“
Toma de decisionesX est—s —pli™—™iones no ne™esit—n que l—s de™isiones
se—n en tiempo re—lD pero sí que su respuest— se— pre™is— y— que los ™ostes
de ™ometer un error pueden ser muy —ltosF
ˆ ƒe™tor (n—n™ieroX predi™™ión de morosid—dF ‘‚‚HU“
ˆ fiomedi™in—X efe™tos de medi™—mentos en p—™ientesF ‘„€g€HV“
Inteligencia articial y robóticaX el ™—m˜io de ™on™epto en est—s —pliE
™—™iones se suele de˜er — ™—m˜ios en el entornoF
ˆ ƒistem—s móviles y ro˜óti™osX diseño de ro˜ots ™—p—™es de —d—pt—rse
—l entornoF ‘€wqHW“
ˆ ƒistem—s inteligentesX solu™iones p—r— domóti™—F ‘‚gHW“
ˆ ‚e—lid—d virtu—lX diseño de videojuegos y simul—doresF ‘gww+ HS“
IR
15. 5. Revisión de métodos de aprendizaje con dis-
paradores
…n— vez expuesto el ™ontexto en el que se des—rroll— el tr—˜—joD v—mos — re—liz—r
un estudio det—ll—do so˜re el pro˜lem— ™on™reto del —prendiz—je ™on disp—r—E
doresD en espe™i—l los dos primeros —p—rt—dos que nom˜r—mos en l— t—xonomí—X
utiliz—ndo detección de cambio y ventanas de entrenamientoF
ƒ™hlimmer y qr—nger present—ron en IWVT el pro˜lem— del —prendiz—je in™remenE
t—l so˜re d—tos ™on ruido y pu˜li™—ron el —lgoritmo ƒ„eqqi‚ ‘ƒqVT“F hesde
que introdujeron el término ™on™ept driftD h— h—˜ido tres pi™os de interés en
l— investig—™iónX en IWWV ™on un— edi™ión espe™i—l de l— revist— Machine Lear-
ning ‘h‡uWV“D en PHHR ™on un espe™i—l en l— revist— Intelligent Data Analysis
‘ƒuHU“ y el ter™ero ™omenzó en PHHU ™omo result—do de l— ™ontinu— produ™™ión
de se™uen™i—s de d—tos en l— industri— y que ™omo se h— det—ll—do —nteriormente
prosigue —ún en l— —™tu—lid—dF
5.1. Algoritmos con detección de cambio
in el ™—so de se™uen™i—s dinámi™—s de d—tosD el propósito de estos —lgoritmos es
dete™t—r un ™—m˜io de ™on™epto en los d—tos que v—n lleg—ndo y —vis—r —l —lgoritE
mo de —prendiz—je que indu™e el modelo de que de˜e —™tu—liz—r o re™onstruir su
modelo p—r— —just—rse mejor — los nuevos d—tosF €or otro l—do si se tr—˜—j—n ™on
se™uen™i—s estáti™—s de d—tosD el o˜jetivo de estos —lgoritmos es —™tiv—r el pro™eso
de —prendiz—je p—r— —just—rse mejor —l —porte de d—tos —di™ion—lesF vo h—˜itu—l
es que los —lgoritmos de dete™™ión de ™—m˜ios —™túen — priori so˜re los d—tosD
esto esD (ltren l— se™uen™i— de d—tos y —™tiven los pro™esos de —prendiz—je @muE
™hos más pes—dos ™omput—™ion—lmenteA ™on l— lleg—d— de nuevos ™on™eptosF …n
—lgoritmo de dete™™ión de ™—m˜ios puede —fe™t—r —l rendimiento del ™l—si(™—dorF
v— form— de pro™eder de un dete™tor de ™—m˜ios es re—liz—r un test est—dístiE
™o que ™omprue˜e si el error del ™l—si(™—dor o l— distribución de l— ™l—se se
m—ntienen ™onst—ntes en el tiempoF
vos primeros tests propuestos p—r— tr—t—r ™on se™uen™i—s numéri™—s fueron g…E
ƒ…w @Cumulated Sum A ‘€—gSR“ y qwe @Geometric Moving Average A ‘‚o˜SW“F
il primero de ellos l—nz— un— señ—l de —l—rm— si l— medi— de los d—tos de enE
tr—d— es signi(™—tiv—mente distint— de ™eroD mientr—s que qwe ™omprue˜— si
l— medi— ponder—d— de los ejemplos de un— vent—n— es m—yor que un determiE
n—do um˜r—lF €—r— se™uen™i—s ™on estru™tur—s más ™omplej—s se h—n propuesto
tests ™omo el de Kolmogorov-SmirnovF e ™ontinu—™ión veremos —lgunos de los
métodos de dete™™ión de ™—m˜io más re™ientes que pueden —pli™—rse — ™u—lquier
—lgoritmo de minerí— so˜re se™uen™i—s de d—tosF
5.1.1. DDM (Drift Detection Method)
q—m— et —lF ‘qwg‚HR“ present—n el método de dete™™ión de ™—m˜io @hhwA
que monitoriz— l— t—s— de error us—ndo un Shewhart P-ChartD un— herr—mient—
IS
16. est—dísti™— de ™ontrol de ™—lid—dD ™uyos prin™ipios se ˜—s—n en l— distri˜u™ión
˜inomi—lF
ƒe di™e que un— v—ri—˜le X sigue un— distri˜u™ión ˜inomi—l si ™umple l—s siE
guientes ™ondi™ionesX
IF g—d— o˜serv—™ión es l— re—liz—™ión de un— v—ri—˜le —le—tori— de fernoulli
™on dos posi˜ilid—des @éxito o f—lloA y un p—rámetro p @pro˜—˜ilid—d de
f—lloAF
PF v—s diferentes o˜serv—™iones son independientes entre síF
QF il número de o˜serv—™iones n es (joF
he est— m—ner— podemos o˜tener l— medi— y l— desvi—™ión típi™— de l— distri˜uE
p(1−p)
™ión ™omo µ = p y σ = n F
ƒi n ≥ 30D l— distri˜u™ión se puede —semej—r — un— xorm—l y —pli™—r los límites
de ™ontrol del €Egh—rtX
CL @genter vineAX µ
UWL @…pper ‡—rning vimitAX µ + α · σD ™on 0 α 3
UCL @…pper gontrol vimitAX µ + 3 · σ @—proxim—d—menteD el WWFU 7 de l—s
o˜serv—™iones de˜erí—n est—r en este um˜r—lA
istos límitesD sirven p—r— de(nir unos niveles de ™ontrolD ™omo puede o˜serv—rse
en l— pigur— SF v— líne— ™entr—l gv represent— l— medi— de l— ™u—lid—d que se
esté midiendoF ƒi en —lgún momento se so˜rep—s— el límite …‡v se est—˜le™e un
nivel de —viso @warning AD indi™—ndo de est— m—ner— que es posi˜le que se v—y—
— produ™ir un ™—m˜io de ™on™eptoF ƒi sigue l— tenden™i— y so˜rep—s— el límite
…gvD se est—˜le™e el nivel de ™—m˜io de(nitivo @drift AF v—s inst—n™i—s re™i˜id—s
en el interv—lo que tr—ns™urre desde que se —™tiv— el nivel de —viso y h—st— el que
se —™tiv— nivel de drift se —lm—™en—n en un— memori— — ™orto pl—zoD y se us—rán
p—r— re™onstruir o —™tu—liz—r el modelo ™u—ndo se— ne™es—rioF ƒi se h— disp—r—do
el nivel de —viso y el v—lor ™ontrol—do vuelve — des™enderD situándose —lrededor
de l— líne— ™entr—l gv @l— medi—AD se di™e que se h— produ™ido un— f—ls— —l—rm—
y se reini™i— l— memori— — ™orto pl—zoF
€—r— —just—r dinámi™—mente estos v—lores ™u—ndo l— medi— no es un— ™onst—nteD
™omo en un entorno prequentialD se est—˜le™en pmin y smin ™omo l— medi— y desE
vi—™ión típi™— menores h—st— el momentoF g—d— vez que lleg— un nuevo ejemploD
se —™tu—liz—rán estos v—lores si pi + si pmin + smin F in est— situ—™iónD el nivel
de —viso @warning A se —l™—nz—rá ™u—ndo pi + si ≥ pmin + 2 · smin D mientr—s que
el nivel de ™—m˜io de(nitivo @drift A se d—rá en pi + si ≥ pmin + 3 · smin F in l—
pigur— T podemos ver un ejemplo grá(™o del —juste de estos límitesF
IT
17. 11.0
UCL
UWL
Quality characteristic
10.0 CL
LWL
LCL
9.0
3 6 9 12 15
Sample
pigur— SX vímites de ™ontrol de Shewhart P-ChartF vos puntos de l— grá(™— están
todos en los límites de lo esper—doD s—lvo el punto II que super— el límite …‡v
de —visoD pero se tr—t— de un— f—ls— —l—rm—F
pigur— TX €Egh—rt ™on —juste dinámi™oF v— ™u—lid—d que se mide —quí es l— t—s—
de errorD por lo que niveles por de˜—jo de l— medi— signi(™— que el ™l—si(™—dor
es ™orre™to @no h—y ™—m˜ios de ™on™eptoAD de m—ner— que no es ne™es—rio tener
límites de ™ontrol inferiores ™omo hemos visto —nteriormente en l— pigur— SF
‘g—sHV“
iste método se puede us—r ™on ™u—lquier ™l—si(™—dorD y los mismos —utores lo
in™orpor—ron —l AdPreqFr4SL @—d—pt—™ión dinámi™— de k-Dependence Bayesian
Classiers A ‘gqHT“F vos niveles de ™—m˜io d—n lug—r — distintos gr—dos de —jusE
te del modeloX un —viso impli™— l— —™tu—liz—™ión p—r—métri™— o de estru™tur—D
IU
18. mientr—s que un drift supone un ™—m˜io en el modelo ™on un —umento en l—
™omplejid—d del modeloF
5.1.2. EDDM (Early Drift Detection Method)
v— propuest— de f—en—Eq—r™í— et —lF ‘fqdgep+ HT“ es simil—r —l método hhwD
pero en vez de ™ontrol—r l— t—s— de errorD monitoriz— l— distancia entre errores
de clasicación @número de inst—n™i—s ™orre™t—mente ™l—si(™—d—s de form—
™onse™utiv—AF
ƒe denot— pi adist—n™i— medi— entre dos errores y si adesvi—™ión típi™—F
ƒe de(nen pmax y smax ™omo v—lores máximos y se —™tu—liz—n ™u—ndo pi +2·si
pmax + 2 · smax ™—d— vez que lleg—n nuevos d—tosF
il método ™omienz— — fun™ion—r después de que se h—y—n produ™ido QH errores
de ™l—si(™—™iónF iste es el mínimo número de v—lores ne™es—rios p—r— estim—r
l— distri˜u™ión de l—s dist—n™i—s entre errores y poder h—™er ™omp—r—™ionesF he
est— form— pmax + 2 · smax represent— el WS 7 de l— distri˜u™iónF
…s—ndo estos v—loresD se —just—n dos um˜r—les de ™ontrolX
Aviso @warning AX (pi + 2 · si )/(pmax + 2 · smax ) α donde α = 0,95F v—s
inst—n™i—s se v—n —lm—™en—ndo p—r— ser ™onsider—d—s por el —lgoritmo de
—prendiz—je en el ™—so de d—rse por de(nitivo el ™—m˜io de ™on™eptoF
Cambio denitivo @drift AX (pi + 2 · si )/(pmax + 2 · smax ) β donde
β = 0,90F ƒe re—prende un nuevo modelo us—ndo l—s inst—n™i—s que se h—n
ido —lm—™en—ndo dur—nte el nivel de —viso previoF „—m˜ién se reini™i—n los
v—lores de pmax y smax F
ƒi p—s—do el nivel de —viso se vuelve — l— norm—lid—d @esto esD l— fun™ión so˜re
l— dist—n™i— entre errores regres— — niveles inferiores —l límite de —visoAD se eliE
min—n l— se™uen™i— de inst—n™i—s —lm—™en—d— h—st— el momento y se ™ontinú—
eje™ut—ndo el métodoF
vos v—lores de α y β se (j—n —d ho™ tr—s re—liz—r diferentes experimentosF
5.1.3. Método de Kifer
il método de uifer et —lF ‘ufdqHR“ no solo tr—t— de dete™t—r el ™—m˜io de
™on™eptoD si no t—m˜ién de ™u—nti(™—rloD de m—ner— que se pued— des™ri˜ir l—
n—tur—lez— del mismoF €—r— elloD utiliz—n un— medid— de dist—n™i— entre dos
distri˜u™iones de d—tos P1 y P2 D de l—s que —l menos se dispondrá de n puntos
de ™—d— un— p—r— poder re—liz—r un— dete™™ión de ™—m˜ioF
ƒe present— un nuevo método @ver elgoritmo IAD que estim— l— distri˜u™ión de
pro˜—˜ilid—d de dos vent—n—s W1 e W2 so˜re l— se™uen™i— de d—tosD donde W1
es un— vent—n— de t—m—ño m1 ≥ n (j—d— en el inst—nte c0 D mientr—s que W2 es
un— vent—n— de t—m—ño m2 ≥ n que se despl—z—rá — lo l—rgo de l— se™uen™i—D
™omenz—ndo en c0 + m1 D de m—ner— que no se sol—pen l—s muestr—s entre —m˜—s
vent—n—sF gu—ndo l— dist—n™i— entre l— distri˜u™ión de d—tos de W1 y l— de W2
IV
19. es m—yor que un ™ierto um˜r—l αD se est—˜le c0 —l inst—nte —™tu—lD se reini™i—liz—n
l—s vent—n—s y se noti(™— que se h— produ™ido un ™—m˜io de ™on™epto en el
inst—nte c0 F
v— ele™™ión del p—rámetro α de(nirá el equili˜rio entre sensi˜ilid—d y ro˜ustez
de l— dete™™iónD por lo que v—lores pequeños serán ™—p—™es de dete™t—r ™—m˜ios
—˜ruptosD pero se tendrá más riesgo de dete™t—r f—lsos ™—m˜iosF v— fun™ión de
dist—n™i— de˜e ser —de™u—d— p—r— ™u—nti(™—r el gr—do de ™—m˜io y de un— form—
intuitiv—F in el —rtí™ulo ‘ufdqHR“ se pueden ™onsult—r l—s nuev—s propuest—s de
medid—s de dist—n™i— entre dos distri˜u™iones de d—tosF
Algorithm 1 wet—E—lgortimo de uifer p—r— dete™t—r ™—m˜ios de ™on™eptoF il
uso de l— v—ri—˜le i permite eje™ut—r h—st— k —lgoritmos ™on diferentes p—rámeE
tros de form— p—r—lel—F
I f o r i = 1...k do
P c0 ← 0
Q W indow1,i ← f i r s t m1,i p o i n t s from time c0
R W indow2,i ← next m2,i p o i n t s i n stre—m
S end f o r
T w h i l e not — t end o f stre—m do
U f o r i = 1...k do
V ƒ l i d e W indow2,i ˜y I p o i n t
W i f distance(W indow1,i , W indow2,i ) αi then
IH c0 ← ™ u r r e n t time
II ‚eport ™h—nge — t time c0
IP g l e — r — l l windows —nd qy„y s t e p I
IQ end i f
IR end f o r
IS end w h i l e
5.1.4. ADWIN (Adaptive Windowing)
eF fifet y ‚F q—v—ldà ‘fqHU“D que t—m˜ién h—˜í—n p—rti™ip—do en el des—rrollo de
ihhwD present—n el método eh‡sxD que us— un— vent—n— desliz—nte W p—r—
monitoriz—r l— t—s— de error del modelo y poder dete™t—r ™—m˜iosF e diferen™i—
del método de uiferD expli™—do —nteriormenteD est— vent—n— solo ™ontiene v—lores
˜in—rios @—™ierto o f—llo en l— predi™™ión de ™—d— inst—n™i—A y —demás se modi(™—
su t—m—ño de form— dinámi™—F wientr—s no h—y— ningún ™—m˜io de ™on™epto en
l— distri˜u™ión de los d—tosD l— vent—n— ™re™e h—st— el momento en que se dete™te
un ™—m˜ioD que disminuyeF
v— ide— de l— dete™™ión ™onsiste enX ™u—ndo dos su˜vent—n—s su(™ientemente
gr—ndes de W tienen medi—s su(™ientemente distint—sD se puede ™on™luir que
los v—lores esper—dos de ™—d— su˜vent—n— se—n diferentesF vos v—lores su(™ienE
temente se pre™is—rán ™u—ndo se es™oj— el test est—dísti™o y dependerá del nivel
de ™on(—nz— δ ∈ (0, 1)F
il test est—dísti™o utiliz—do p—r— ™omp—r—r l—s distri˜u™iones de l—s su˜vent—n—s
W0 y W1 D ™omprue˜— si l— diferen™i— de l—s medi—s de —m˜—s su˜vent—n—s es
m—yor — un determin—do um˜r—l cut @ver elgoritmo PAF
IW
20. Algorithm 2 elgoritmo eh‡sx
I s n i t i — l i z e ‡indow W
P f o r e—™h t 0
Q do W ← W ∪ xt @ i F e F D —dd xt t o t h e he—d o f ‡A
R r e p e — t hrop e l e m e n t s from t h e t — i l o f W
S u n t i l |ˆW0 − µW1 | cut h o l d s
µ ˆ
T f o r e v e r y s p l i t o f W i n t o W = W0 · W 1
U output µW ˆ
il v—lor de cut p—r— un— p—rti™ión W0 · W1 de W se ™—l™ul— de l— siguiente
form—X
ƒe—n n0 y n1 l—s longitudes de W0 y W1 respe™tiv—menteF v— longitud de
W es n = n0 + n1 F
ƒe—n µW0 y µW1 l—s medi—s de los v—lores en W0 y W1 respe™tiv—menteF ‰
ˆ ˆ
µW0 y µW1 sus v—lores esper—dosF
€—r— g—r—ntiz—r el rendimiento del método de(nimosX
ˆ m= 1
1/n0 +1/n1 @medi— —rmóni™— de n0 y n1 A
ˆ δ = δ
n @p—r— evit—r pro˜lem—s ™on múltiples hipótesisA
il um˜r—l se ™—l™urá ™omo cut = 1
2m · ln δ F
4
ƒe puede ver un ejemplo del fun™ion—miento de este método en el gu—dro PF ƒi
µt se m—ntiene ™onst—nte en W D l— pro˜—˜ilid—d de que se reduz™— l— vent—n— en
el inst—nte t es ™omo mu™ho de δ D ™on lo que se limitan los falsos positivosF
ƒuponiendo que p—r— —lgun— p—rti™ión de W en W0 y W1 D tenemos que |µW0 −
µW1 | 2 · cut F inton™esD l— vent—n— W se redu™irá —l t—m—ño de W1 D o menorD
™on pro˜—˜ilid—d 1 − δ D por lo que se limitan así los falsos negativosF
PH
21. W0 W1 µW0
ˆ µW1
ˆ |ˆW0 − µW1 |
µ ˆ m cut |ˆW0 − µW1 | ≥
µ ˆ cut
[1] [01010110111111] 1/1 10/14 0.2857 0.9333 0.8617 No
[10] [1010110111111] 1/2 10/13 0.2692 1.7333 0.6323 No
[101] [010110111111] 2/3 9/12 0.0833 2.4 0.5374 No
[1010] [10110111111] 2/4 9/11 0.3181 2.9333 0.4861 No
[10101] [0110111111] 3/5 8/10 0.2 3.3333 0.4560 No
[101010] [110111111] 3/6 8/9 0.3888 3.6 0.4387 No
[1010101] [10111111] 4/7 7/8 0.3035 3.7333 0.4308 No
[10101011] [0111111] 5/8 6/7 0.2321 3.7333 0.4308 No
[101010110] [111111] 5/9 6/6 0.4444 3.6 0.4387 Sí
[1010101101] [11111] 6/10 5/5 0.4 3.3333 0.4560 No
[10101011011] [1111] 7/11 4/4 0.3636 2.9333 0.4861 No
[101010110111] [111] 8/12 3/3 0.3333 2.4 0.5374 No
[1010101101111] [11] 9/13 2/2 0.3076 1.7333 0.6323 No
[10101011011111] [1] 10/14 1/1 0.2857 0.9333 0.8617 No
gu—dro PX ijemplo del fun™ion—miento de eh‡sxF †ent—n— —™tu—lX W =
[101010110111111]F δ = 1F el h—˜erse dete™t—do un ™—m˜ioD l— vent—n— disE
minuirá su t—m—ño p—r— el próximo inst—nte de tiempoF
il pro˜lem— de este método es que es ™omput—™ion—lmente ™ostoso porque tiene
que ™ompro˜—r tod—s los posi˜les p—res de su˜vent—n—s de W F €—r— mejor—rloD
los —utores present—ron un— nuev— versión ll—m—d— eh‡sxP más e(™iente en
tiempo y memori—F
ADWIN2 (Adaptive Windowing 2)
€—r— redu™ir el ™oste ™omput—™ion—l de eh‡sxD en vez de m—ntener un— vent—n—
W en memori—D tiene un— estru™tur— de d—tos ™ompuest— por ™u˜os @buckets A
que —lm—™en—n v—lores ˜in—riosF g—d— ™u˜o de˜e ™ontener un— poten™i— de P de
I9sF ƒe (j— un p—rámetro M ™omo el máximo número de ™u˜os ™on el mismo
t—m—ñoD p—r— ™ontrol—r —sí l— ™—ntid—d de memori—F ƒe puede ver un ejemplo en
el gu—dro QF
PI
22. ƒuponemos un— vent—n— de t—m—ño W = 14 ™on v—lores ˜in—rios @—™ierto y f—llo
de ™l—si(™—™iónA y est— serí— su estru™tur— en form— de ™u˜osX
gu˜osX IHIHIHI IHI II I I
gontenidoX R P P I I
g—p—™id—dX U Q P I I
vleg— un nuevo elementoX
gu˜osX IHIHIHI IHI II I I I
gontenidoX R P P I I I
g—p—™id—dX U Q P I I I
„eniendo en ™uent— que M = 2D es ne™es—rio ™omprimir dos de los tres últimos
™u˜osD y— que tienen el mismo ™ontenidoF
gu˜osX IHIHIHI IHI II II I
gontenidoX R P P P I
g—p—™id—dX U Q P P I
hespués de ™omprimir dos ™u˜osD nos en™ontr—mos de nuevo ™on que tenemos
tres ™u˜os ™on el mismo ™ontenidoD por lo que volvemos — ™omprimirF he est—
form— se est—rí—n form—ndo l—s su˜vent—n—sF
gu˜osX IHIHIHI IHIII II I
gontenidoX R R P I
g—p—™id—dX U S P I
ƒi se dete™t— un ™—m˜ioD se elimin— el ™u˜o más —ntiguoX
gu˜osX IHIII II I
gontenidoX R P I
g—p—™id—dX S P I
gu—dro QX ijemplo de fun™ion—miento de eh‡sxP
v— e(™ien™i— —hor— es de O(M · log(W/M )) p—l—˜r—s de memori—D y el tiempo de
pro™es—miento por ™—d— ejemplo es O(log W ) en el peor ™—so y O(1) en el mejorF
y˜tiene l— ™—ntid—d de I9s de tod—s los ™u˜os en O(1)F gon ello el número de
su˜vent—n—s — ev—lu—r disminuye y se —pli™—n los tests más rápid—mente — l—s
se™uen™i—s en los ™u˜osF
5.2. Algoritmos con ventana de entrenamiento
il uso de vent—n—s permite limit—r el número de inst—n™i—s que se —prenden
simultáne—menteD —demásD sirven p—r— elimin—r —quellos d—tos que son de ™onE
™eptos —ntiguosF il pro™edimiento ˜ási™o de vent—n— desliz—nte que se us— en
minerí— de se™uen™i—s de d—tos se puede ver en el elgoritmo QF g—d— nuev—
inst—n™i— se —ñ—de — l— vent—n—D y ™u—ndo el ™l—si(™—dor se —™tu—liz— utiliz—
l—s inst—n™i—s de di™h— vent—n— p—r— el —prendiz—jeF il —spe™to ™l—ve de estos
—lgoritmos reside en ™ómo se de(ne este tipo de vent—n—sF
il enfoque más simple es us—r un— vent—n— de t—m—ño (jo e in™luir solo los
ejemplos más re™ientes de l— se™uen™i— de d—tos y dese™h—r por l— p—rte más
—ntigu—F ehor— ˜ienD se present— un ™ompromiso — l— hor— de es™oger el t—m—ño
de l— mism—F ƒi l— vent—n— es de pequeño t—m—ñoD el ™l—si(™—dor será ™—p—z
de —just—rse rápid—mente — los ™—m˜iosD pero perderá pre™isión en periodos de
est—˜ilid—dF il pro™eso de —prendiz—je se ˜—s— en po™os d—tos y por t—ntoD est—rá
PP
23. sujeto — más os™il—™ionesF in ™—m˜ioD si se es™oge un t—m—ño gr—nde o™urrirá lo
™ontr—rioD el pro™eso de —prendiz—je es más inmune — ™—m˜ios menores o ruidoD
pero por el ™ontr—rio tiene más iner™i—D por t—nto será más lento — l— hor— de
—d—pt—rse — los ™—m˜iosF €or est— r—zónD se propusieron distintos métodos de
—juste dinámi™o de l— —n™hur— de l— vent—n—F
Algorithm 3 elgoritmo ˜ási™o ™on vent—n—
I intr—d— X S X s e ™ u e n ™ i — de d — t o s
P W X vent—n— de e j e m p l o s
Q ƒ — l i d — X C X ™ l — s i f i ™ — d o r ™ o n s t r u i d o ™on l o s d — t o s de W
R
S i n i ™ i — l i z — r vent—n— W Y
T p—r— t o d o s l o s e j e m p l o s xi en S X
U W ← W ∪ xi Y
V e l i m i n — r e j e m p l o s — n t i g u o s de W s i e s n e ™ e s — r i o Y
W r e ™ o n s t r u i r o — ™ t u — l i z — r C us—ndo W Y
5.2.1. Método de Klinkenberg
il método de ulinken˜erg et —lF ‘u‚WV“ está orient—do — l— ™l—si(™—™ión de do™uE
mentos por lotes @batch A en entornos ™—m˜i—ntes @™onsider— ™—m˜ios gr—du—les y
—˜ruptosAD y fue uno de los primeros en monitoriz—r diversos indi™—doresD ™on™reE
t—mente l— pre™isión @accuracy AD l— espe™i(™id—d @precision A y l— exh—ustivid—d
@recall AF
€—r— —just—r l— vent—n— de entren—miento en primer lug—r se ™—l™ul— l— medi— y
l— desvi—™ión típi™— p—r— ™—d— uno de los indi™—dores @e™™ a e™™ur—™yD ‚e™ a
‚e™—ll y €re™ a €re™isionA en ˜—se — los M últimos lotesD y — ™ontinu—™ión se
utiliz— l— siguiente heurísti™—X
ƒi —lguno de los indi™—dores ex™ede de su medi— α ve™es su desvi—™ión
típi™—D se di™e que se h— s—lido de su interv—lo de ™on(—nz— y h— o™urrido
un ™—m˜ioF
€—r— ™ono™er l— n—tur—lez— del ™—m˜io @˜rus™o o gr—du—lAD se ™omprue˜—
si el indi™—dor en el inst—nte t h— experiment—do un— ™—íd— β del v—lor del
mismo en el inst—nte t − 1
ˆ ƒi el ™—m˜io es ˜rus™oD se redu™e l— vent—n— de entren—miento —l
mínimo @B a I ˜—t™hAF
ˆ ƒi el ™—m˜io es gr—du—lD se redu™e l— vent—n— en ˜—se — un p—rámetro
γ de(nido — prioriF
in el elgoritmo R se det—ll— en pseudo™ódigo l— heurísti™— emple—d—F ƒi h—
o™urrido un ™—m˜io ˜rus™oD es de™irD se veri(™— l— primer— ™ondi™ión @líne—s P
— RA y se redu™e l— vent—n— —l mínimo @I ˜—t™hAF in otro ™—soD si el ™—m˜io
dete™t—do es gr—du—l @se ™umple l— segund— ™ondi™iónD que —˜—r™— l—s líne—s T —
PQ
24. VA l— vent—n— se redu™e —l t—m—ño γ · 100 %F he no dete™t—rse ningún ™—m˜ioD el
t—m—ño de l— vent—n— ™re™e un lote másF
Algorithm 4 reurísti™— de ulinken˜erg p—r— —just—r el t—m—ño de l— vent—n—
de entren—mientoF
I €ro ™edure heterminexew‡indowƒize @ |Wt | D M D α D β D γ A
P i f ((Acct AvgM (Acc) − α · StdErrM (Acc)) and (Acct β · Acct−1 )) or
Q ((Rect AvgM (Rec) − α · StdErrM (Rec)) and (Rect β · Rect−1 )) or
R ((P rect AvgM (P rec) − α · StdErrM (P rec)) and (P rect β · P rect−1 ))
S then |Wt+1 | := |B| Y
T else i f (Acct AvgM (Acc) − α · StdErrM (Acc) or
U (Rect AvgM (Rec) − α · StdErrM (Rec) or
V (P rect AvgM (P rec) − α · StdErrM (P rec)
W then |Wt+1 | := max(|B|, |Wt | − γ · |Wt |) Y
IH else |Wt+1 | := |Wt | + |B| Y
II return |Wt+1 | Y
5.2.2. FISH (uniFied Instance Selection algoritHm)
¢
sF lio˜—ité propuso un— nuev— f—mili— de —lgoritmos ll—m—d— psƒr ‘liIH—“D que
us— simil—rid—des de tiempo y esp—™io entre inst—n™i—s p—r— —just—r dinámi™—E
mente l— vent—n— de entren—mientoF €—r— expli™—rlo podemos ˜—s—rnos en el
siguiente ejemplo ilustr—tivo de l— pigur— UF ƒe tr—t— de un pro˜lem— de ™l—siE
(™—™ión ˜in—ri— @puntos ˜l—n™os y negrosA en el que l—s fuentes de gener—™ión
de d—tos v—rí—n — lo l—rgo del tiempo de form— gr—du—l ™on l— rot—™ión de un
hiperpl—noF €—r— un ™ierto áre— @™ir™unferen™i— roj—AD vemos que l— ™l—se ™orre™E
t— en ™—d— inst—nte es diferenteF iste ejemplo muestr— que l— simil—rid—d en un
dominio del pro˜lem— dinámi™o depende del tiempo y del esp—™ioF
pigur— UX ijemplo de rot—™ión de hiperpl—noF szquierd—X fuente ini™i—l ƒIF gentroX
fuente ƒP tr—s rot—r RSºF here™h—X fuente ƒQ tr—s rot—r WHºF
v— —utor— propuso sele™™ion—r los ejemplos de l— vent—n— de entren—miento ˜—E
sándose en un— medid— de dist—n™i— Dij que se de(ne de est— form—X
PR
25. (s) (t)
Dij = a1 dij + a2 dij
donde d(s) es l— dist—n™i— en el esp—™ioD d(t) l— dist—n™i— en el tiempo y a1 , a2
son los ™oe(™ientes de ponder—™iónF €—r— dos ejemplos xi , xj D l— —utor— propone
l— dist—n™i— eu™líde— ™omo dist—n™i— en el esp—™io y el número de ejemplos que
los sep—r—n ™omo dist—n™i— en el tiempoF were™e l— pen— dest—™—r que si a2 = 0D
l— medid— se ™onvierte en un— sele™™ión de inst—n™i—sD mientr—s que si a1 =
0D tenemos un— vent—n— ™uyos pesos disminuyen ™on el tiempoF ƒe es™ogerán
—quell—s inst—n™i—s ™on m—yor v—lor de dist—n™i— p—r— ™omponer l— vent—n— de
entr—mientoF
v— f—mili— de —lgoritmos está ™ompuest— porX
psƒrIX el t—m—ño de l— vent—n— de entren—miento se (j— — prioriF
psƒrPX el t—m—ño de l— vent—n— de entren—miento se —just— de form—
dinámi™—D pero los pesos a1 , a2 se (j—n — prioriF
psƒrQX idénti™o — psƒrPD s—lvo que los p—rámetros a1 , a2 se re™—l™ul—n
dinámi™—mente — lo l—rgo del tiempoF
PS
26. 6. Aportaciones
in primer lug—r v—mos — de(nir el m—r™o de nuestro tr—˜—joF gomo hemos
™oment—do —nteriormenteD est—mos en un entorno in™rement—l @ver pigur— VAF in
™—d— inst—nte t tenemos un— se™uen™i— de d—tos etiquet—dos X H = (X1 , ..., Xt )D
™on l— que se ™onstruye un ™l—si(™—dor Lt F gu—ndo lleg— un— nuev— inst—n™i—
Xt+1 h—y que prede™ir su ™l—se yt+1 F
†—mos — tr—˜—j—r ™on se™uen™i—s de d—tos que in™luyen ™—m˜ios de ™on™eptoF
g—d— inst—n™i— Xt es gener—d— por un origen St F wientr—s este origen se m—ntenE
g— ™onst—nte diremos que el ™on™epto no h— ™—m˜i—doD pero ™u—ndo St = St+1 D
nuestro propósito es dete™t—r di™ho ™—m˜io en el inst—nte más próximo —l punto
en que se produjo en l— se™uen™i—F
pigur— VX v—s inst—n™i—s de d—tos se pro™es—n de form— in™rement—l ‘liIH˜“F
€—r— nuestr—s diferentes propuest—sD nos hemos ˜—s—do en l— heurísti™— del métoE
do hhw de q—m— en el que se utiliz— l— herr—mient— Shewhart P-Chart —pli™—d—
so˜re distint—s ™u—lid—desF in primer lug—r se est—˜le™e un nivel de —viso @war-
ning A que ™u—ndo se —™tive v— — empez—r — —lm—™en—r inst—n™i—s en un— memori—
— ™orto pl—zoD —sí ™omo un nivel de ™—m˜io @drift AD que forz—rá — que se re—prend—
el ™l—si(™—dor ™on los ejemplos —lm—™en—dos en di™h— memori—F he est— m—ner—
se ™onsigue que —nte un ™—m˜io de ™on™eptoD el ™l—si(™—dor olvide inform—™ión
—nti™u—d— y —prend— ™on inst—n™i—s que pertene™en —l nuevo ™on™eptoF
e ™ontinu—™ión v—mos — present—r diferentes —ltern—tiv—s que hemos pl—nte—do
siguiendo estos supuestos de tr—˜—jo y de l—s que se llev—ron — ™—˜o su impleE
ment—™ión y experiment—™iónF
6.1. MoreErrorsMoving
€—r— nuestr— primer— propuest—D que hemos denomin—do woreirrorswovingD
se tr—t— de monitoriz—r los errores de ™l—si(™—™iónF €—r— ello ™ont—mos ™on un
históri™o Hi = {ei−n , . . . , ei } ™on los n últimos result—dos de ™l—si(™—™ión en el
inst—nte ti @ei = 0 en ™—so de —™iertoD ei = 1 en ™—so de f—lloAF †—mos — est—˜le™er
el siguiente supuestoX si se produ™e un ™—m˜io de ™on™eptoD el ™l—si(™—dor v— —
ver deterior—do su rendimiento y— que no será ™—p—z de ™l—si(™—r ™orre™t—mente
los nuevos d—tosF v— t—re— de dete™™ión que proponemos es ™ontrol—r el número
PT
27. de errores de ™l—si(™—™ión que se v—n produ™iendo — lo l—rgo del tiempoD h—™iendo
uso del históri™o Hi F
n
ej
ƒe— ci = j=0 |ej ∈ Hi l— t—s— de error del históri™o en el inst—nte de tiempo
n
ti F in ™—d— inst—nte de tiempoD se ™omprue˜— si ci−1 ci @se h— in™rement—do
el número de errores en el históri™oA y en este ™—so se di™e que h— o™urrido
un empeor—miento e in™rement—mos el ™ont—dor de empeor—mientosF in ™—so
™ontr—rioD si ci−1 ci D quiere de™ir que se h— redu™ido el número de errores en el
históri™oD por lo que se ™onsider—rá un— mejor— y se reini™i—liz— — H el ™ont—dor
de empeor—mientos ™onse™utivosF in el ™—so de que se m—nteng— el v—lor de cD
es de™irD si ci−1 = ci D el ™ont—dor de empeor—mientos se m—ntiene ™on el v—lor
—nterior que tuvieseF €odemos ver un— represent—™ión grá(™— de los v—lores que
tom— ci — lo l—rgo del tiempo en l— pigur— WF
pigur— WX ‚epresent—™ión de l— t—s— de error del históri™o @naWAF
e™tu—mos según l— siguiente heurísti™—X
ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE
so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori—
— ™orto pl—zoF @U W L = k A
ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes
™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori—
— ™orto pl—zoF @U CL = k + dA
in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— —
™orto pl—zoF @CL = 0A
…n ejemplo ilustr—tivo se puede ver en l— pigur— IH donde k = 2 y d = 2F
PU
28. 10
memoria a drift
corto plazo detectado
warning
activado
Empeoramientos
UCL=k+d
5
UWL=k
0 CL=0
10 20 30 40 50
Instancias
pigur— IHX €Egh—rt p—r— woreirrorswovingF in l— inst—n™i— QVD se h— dete™t—do
un ™—m˜io de ™on™epto porque se h— super—do el um˜r—l …gvF in l—s inst—nE
™i—s PH y SHD —l produ™irse un— mejor— del rendimiento se vuelve —l nivel de
norm—lid—d y se reini™i—liz— el ™ont—dor de empeor—mientosF
€—r— l— eje™u™ión de este método h—y que de(nir los v—lores de los p—rámetros
nD k y d — prioriF
6.2. MaxMoving
…n— nuev— propuest—D denomin—d— w—xwovingD tr—t— de monitoriz—r l—s t—s—s de
éxito del ™l—si(™—dorF istá ˜—s—d— en l— siguiente suposi™iónX mientr—s el origen
del ™on™epto se m—nteng— ™onst—nteD el ™l—si(™—dor v— — mejor—r su pre™isión —
lo l—rgo del tiempo @mientr—s sig— re™i˜iendo inst—n™i—sAD pero en el momento en
que se produz™— un ™—m˜io @drift AD l—s t—s—s de éxito empez—rán — empeor—r y—
que el modelo —™tu—l no prede™irá ™orre™t—mente l— ™l—se de l—s nuev—s inst—n™i—sF
f—sándonos en estoD m—ntenemos un históri™o Hi = {ai−n , . . . , ai } ™on l—s n
últim—s t—s—s de éxito —™umul—d—s desde el último ™—m˜ioF ƒe— ai = 1 − Nii l—e
t—s— de éxito —™umul—d— h—st— el inst—nte ti D donde ei y Ni son el número de
errores de ™l—si(™—™ión y el número de inst—n™i—s pro™es—d—s h—st— el inst—nte
ti D respe™tiv—menteF ƒe— mi = m´x{aj |aj ∈ Hi } l— mejor t—s— de éxito del históE
a
ri™o en el inst—nte ti F wientr—s se estén ™l—si(™—ndo inst—n™i—sD ™ompro˜—mos si
mi−1 mi D y si es —síD ™onsider—mos que se está mejor—ndo l— t—s— de éxito —™uE
mul—d—F in ™—so ™ontr—rioD en el que el nuevo máximo es menor que el —nteriorD
diremos que h— empeor—do e in™rement—mos un ™ont—dor de empeor—mientosF
ƒi mi−1 = mi D es de™irD el máximo en el históri™o —nterior y el —™tu—l no h—
™—m˜ioD m—ntenemos el v—lor que y— tuviese el ™ont—dor de empeor—mientosF
il uso del máximo so˜re el históri™o Hi de t—m—ño nD nos permite —mortigu—r
l—s pequeñ—s os™il—™iones del tipo ai−1 ai ai+1 D ™—so en el que l— t—s— de
éxito ™omienz— — des™enderD pero luego remont— rápid—menteF ƒe puede ver un—
represent—™ión grá(™— de los distintos v—lores que tom— mi — lo l—rgo del tiempo
en l— pigur— IIF
PV
29. Máximo del histórico de tasas de éxito
1.0
0.8
0.6
Max. Accuracy
0.4
0.2
0.0
0 10000 20000 30000 40000 50000
Instances
pigur— IIX ‚epresent—™ión de l—s mejores t—s—s de éxito —™umul—d—s en el hisE
tóri™o — lo l—rgo del tiempoF v—s ™—íd—s del rendimiento se de˜en — ™—m˜ios de
™on™eptoF
v— ™u—lid—d que v—mos — ™ontrol—r en el €Egh—rt es el número de empeor—mienE
tosD de m—ner— que pod—mos dete™t—r ™uándo el modelo y— no es —de™u—ndo
p—r— los d—tos que se están re™i˜iendo y es ne™es—rio re—prenderF gonsider—mos
l— siguiente heurísti™—X
ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE
so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori—
— ™orto pl—zoF @U W L = k A
ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes
™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori—
— ™orto pl—zoF @U CL = k + dA
in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— —
™orto pl—zoF @CL = 0A
€—r— l— eje™u™ión del dete™tor w—xwoving es ne™es—rio est—˜le™er — priori los
v—lores de los p—rámetros n, k y dF
6.3. MovingAverage
„r—s re—liz—r diversos experimentos ™on los dos métodos —nterioresD nos dimos
™uent— de que se produ™í—n mu™hos f—lsos positivosD es de™irD se dete™t—˜—n ™—mE
˜ios inexistentes en l— se™uen™i— de d—tosF isto se de˜í— — que l—s dos fun™iones
monitoriz—d—s present—˜—n mu™h—s os™il—™iones @grá(™—s en dientes de sierr—A
PW
30. que en o™—siones er—n tom—d—s erróne—mente ™omo ™—m˜iosF €—r— intent—r p—E
li—r este defe™toD —pli™—mos el método est—dísti™o de l—s medi—s móviles @moving
average A que ™onsiste en ™re—r series de promedios d—do un ™onjunto de puntosF
in nuestro ™—soD queremos promedi—r l—s t—s—s de éxito us—ndo un— vent—n— de
su—viz—do de t—m—ño m p—r— que l— grá(™— presente un ™omport—miento ™on
menos os™il—™iones @ver ejemplo de l— pigur— IPAF
Original Moving Average (100)
100
100
80
80
60
60
Accuracy
Accuracy
40
40
20
20
0
0
0 5000 10000 15000 20000 0 5000 10000 15000 20000
Instances Instances
Moving Average (500) Moving Average (1000)
100
100
80
80
60
60
Accuracy
Accuracy
40
40
20
20
0
0
0 5000 10000 15000 20000 0 5000 10000 15000 20000
Instances Instances
pigur— IPX v— primer— grá(™— @—rri˜— izquierd—A es l— origin—lD mientr—s que en
el resto se represent— en rojo l— medi— móvil simpleD ƒweD ™on su—viz—do de
maIHHD SHH y IHHHD respe™tiv—mente —pli™—do so˜re los v—lores de l— líne— gris
@origin—lAF
fási™—mente h—y dos tipos de medi—s móvilesX
IF Media móvil simple (SMA)X que se ™—l™ul— ™omo l— medi— —ritméti™— de
l—s últim—s m o˜serv—™ionesF st = m
1 m−1 xt +xt−1 +xt−2 +···+xt−(m−1)
n=0 xt−n = m =
xt −xt−m
st−1 + m
PF Media móvil ponderada (WMA)X se ™—l™ul— utiliz—ndo un ™onjunto
de m pesos @que en tot—l sum—n IA que se —pli™—n — ™—d— o˜serv—™iónF
m−1
st = n=0 wn xt−n = w0 xt + w1 xt−1 + · · · + wm−1 xt−(m−1)
in nuestro método solo hemos us—do el primer tipo @ƒweAD —unque p—r— un
tr—˜—jo futuro serí— interes—nte pro˜—r el segundo @‡weAD de m—ner— que se
—justen los pesos p—r— d—rle más import—n™i— — los o˜serv—™iones más re™ientesF
QH
31. v—s o˜serv—™iones — promedi—r en nuestro método wovingever—ge v—n — ser l—s
t—s—s de —™ierto —™umul—d—s de l—s m últim—s muestr—sF e l— hor— de dete™t—r
™—m˜ios hemos pl—nte—do dos heurísti™—s diferentes que tr—t—n de ™—r—™teriz—r
dos tipos de ™—m˜ios en los d—tosX gr—du—les y —˜ruptosF v— primera heurística
es —de™u—d— p—r— ™—m˜ios gr—du—lesD que ™onsider— que se h— produ™ido un
empeor—miento si st st−1 y fun™ion— de l— siguiente m—ner— @ver ejemplo en
gu—dro RAX
ƒi dur—nte k ve™es ™onse™utiv—s h— empeor—do l— t—s— promedi—d—D —™tiv—E
mos el nivel de —viso @warning A y ™omenz—mos — —lm—™en—r l—s inst—n™i—s
re™i˜id—s en un— memori— — ™orto pl—zoF
ƒi se produ™en k+d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
™—m˜io @drift AF
in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
m—lid—d y se elimin—n l—s inst—n™i—s de l— memori— — ™orto pl—zoF
Instancias →
Predicción 0 1 0 0 1 1 1 0 0 0 0 0 0 1 1
Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 4/12 0/1 1/2 2/3
Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 0.36 - - 0.38
Empeoramientos 0 0 0 0 1 0 0 0 1 2 3 4 0 0 0
Nivel N N N N N N N N N W W D N N N
gu—dro RX ijemplo de fun™ion—miento de l— primer— heurísti™— del método woE
vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF
v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift
dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il
nivel de w—rning @‡A se —™tiv— ™u—ndo h—y k = 2 empeor—mientos ™onse™utivos
y el de drift @hA ™u—ndo h—y R @d = 2AD en otro ™—so se en™uentr— en norm—lid—d
@xAF
in ™—so de tr—t—rse de ™—m˜ios ˜rus™os entre ™on™eptos muy distintosD l— t—s—
de —™ierto no de™—e progresiv—menteD si no de form— drásti™—D por lo que ™on
l— heurísti™— —nterior o˜tendrí—mos f—lsos neg—tivos —l no dete™t—rse medi—nte
empeor—mientos su™esivosF €or elloD implement—mos un— segunda heurística
˜—s—d— en el s—lto o diferen™i— en los v—lores de l—s t—s—s de éxito p—r— poder
dete™t—r est— ™—íd— de rendimiento @ver ejemplo en gu—dro SAF sgu—l que —ntesD se
monitoriz— l— t—s— de —™ierto —™umul—d— promedi—d— de l—s m últim—s muestr—sD
pero —demás m—ntenemos un históri™o de t—m—ño n ™on estos v—lores promediosF
ehor—D p—r— ™—d— inst—nte de tiempo t:
ƒe o˜tiene smax ™omo el mejor v—lor del históri™oD —sí ™omo l— t—s— de
—™ierto promedi—d— —™tu—l st F
ƒi l— diferen™i— entre st y smax super— un ™ierto um˜r—l uD —™tiv—remos el
nivel de —viso @warning AF wientr—s que si super— un um˜r—l v D —™tiv—remos
el nivel de ™—m˜io @drift AF ƒe de˜e ™umplir que u v F istos v—lores reE
present—n el por™ent—je de ™—íd— de rendimiento frente — smax y tom—rán
v—lores entre H y IF
QI
32. ƒi no se d— ninguno de estos dos ™—sosD se est—˜le™e el nivel de norm—lid—dF
Instancias →
Predicción 0 1 0 0 1 1 1 0 0 0 0 0 1 1
Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 0/1 1/2 2/3
Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 - - 0.38
Máx. media móvil - - - - 0.36 0.38 0.49 0.52 0.52 0.52 0.50 - - -
Diferencia - - - - 0.04 0 0 0 0.02 0.08 0.10 - - -
Nivel N N N N N N N N N W D N N N
gu—dro SX ijemplo de fun™ion—miento de l— segund— heurísti™— del método woE
vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF
v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift
dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il
históri™o ne™es—rio p—r— ™—l™ul—r el máximo está ™ompuesto por n = 3 últim—s
medi—s móvilesF il nivel de w—rning @‡A se —™tiv— ™u—ndo l— diferen™i— es m—yor
o igu—l que u = 5 % y el de drift @hA ™u—ndo es m—yor o igu—l que v = 10 %D en
otro ™—so se en™uentr— en norm—lid—d @xAF
pin—lmente ™om˜in—mos —m˜—s heurísti™—s en el método wovingever—ge p—r—
poder dete™t—r ™u—lquier— de los dos ™—m˜ios men™ion—dosF €—r— ello se de˜e
tener en ™uent— el sol—p—miento de los niveles de —viso y de ™—m˜io de ™—d— un—
de l—s heurísti™—sF ƒe—n ω1 y ω2 los niveles de —visoD δ1 y δ2 los niveles de drift
y η1 y η2 los niveles de norm—lid—d de l—s heurísti™—s I y P respe™tiv—menteF
he(nimos pues los niveles de nuestr— heurística híbrida ™omoX
IF xivel de norm—lid—dX ηH = η1 ∧ η2 ⇒!ω1 ∧!ω2 ∧!δ1 ∧!δ2 F
PF xivel de —viso @warning AX ωH = ω1 ∨ ω2 F
QF xivel de ™—m˜io @drift AX δH = δ1 ∨ δ2 F
in el elgoritmo S se puede ver el pseudo™ódigo de este métodoF
QP
33. Algorithm 5 elgoritmo woving ever—ge rí˜rido
I δ1 a δ2 a ω1 a ω2 a pevƒi Y
P — ™ ™ u r — ™ y a I − e r r o r s G numsnst—n™es Y
Q window F —dd @ — ™ ™ u r — ™ y A Y GG remove o l d e s t i f window F s i z e m
R i f window F s i z e aa mX
S ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e a window F — v e r — g e @ A
T
U GG −− ˜ e g i n f i r s t h e u r i s t i ™ −− GG
V i f ™urrente™™ur—™yever—ge ` previouse™™ur—™yever—ge X
W ™ o n s e ™ u t i v e h r o p s CCY GG worse
IH else i f ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e b p r e v i o u s e ™ ™ u r — ™ y e v e r — g e X
II ™ o n s e ™ u t i v e h r o p s a H Y GG ˜ e t t e r
IP else X
IQ ™ o n s e ™ u t i v e h r o p s a ™ o n s e ™ u t i v e h r o p s Y GG s—me
IR
IS previouse™™ur—™yever—ge a ™urrente™™ur—™yever—ge Y
IT
IU if ™ o n s e ™ u t i v e h r o p s b kCd X
IV δ1 a „‚…iY
IW else i f ™ o n s e ™ u t i v e h r o p s b k X
PH ω1 a „‚…iY
PI GG −− end o f f i r s t h e u r i s t i ™ −− GG
PP
PQ h i s t o r y F —dd @ ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e A GG remove o l d e s t i f h i s t o r y F s i z e n
PR i f h i s t o r y F s i z e aa n X
PS GG −− ˜ e g i n s e ™ o n d h e u r i s t i ™ −− GG
PT d i f f e r e n ™ e a h i s t o r y F m—x @ A − ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e Y
PU if differen™e b vX
PV δ2 a „‚…iY
PW else i f d i f f e r e n ™ e b u X
QH ω2 a „‚…iY
QI GG −− end s e ™ o n d h e u r i s t i ™ −− GG
QP
QQ if or δ2 X
δ1
QR return h‚sp„ Y
QS else i f ω1 or ω2 X
QT return ‡e‚xsxqY
QU else X
QV return xy‚wevY
el igu—l que en los métodos —nterioresD los v—lores de n, kD d, u y v h—y que
(j—rlos — prioriF
QQ
34. 7. MOA (Massive Online Analysis)
€—r— ev—lu—r nuestr—s propuest—s y re—liz—r un— ™omp—r—tiv— ™on —lgunos de los
métodos des™ritos —nteriormente se h— utiliz—do el entorno de des—rrollo wye
@w—ssive ynline en—lysisA ‘fuHW˜D fru€IH“F wye es un softw—re des—rroll—E
do en l— …niversid—d de ‡—ik—to @xuev— el—nd—A p—r— re—liz—r experimentos
de ™l—si(™—™ión y ™lustering ™on se™uen™i—s de d—tosF istá rel—™ion—do ™on el
proye™to ˜ien ™ono™ido ‡iue ‘fpr+ IH“ @de minerí— de d—tos tr—di™ion—lAF
„—m˜ién está implement—do en t—v— y tiene li™en™i— q€vF intre otr—s utiliE
d—desD propor™ion— muestr—s y se™uen™i—s de d—tos y— que ™ontiene un— ˜uen—
™ole™™ión de gener—dores de se™uen™i—s de d—tosF edemásD in™luye —lgoritmos de
™l—si(™—™ión y —grup—miento @™lusteringAD —sí ™omo v—rios métodos de ev—lu—E
™iónF in este —p—rt—do ex™lusiv—mente v—mos — det—ll—r l— p—rte de ™l—si(™—™ión
y de gener—doresD que son l—s que hemos us—do en l— se™™ión experiment—l del
tr—˜—joF
7.1. El entorno
v— form— de utiliz—r wye es medi—nte l— eje™u™ión de t—re—s @tasks AF ist—s t—E
re—s se pueden l—nz—r t—nto — tr—vés de un— interf—z grá(™—D ™omo por líne— de
™om—ndos y mu™h—s de ell—s se pueden en™—den—r @ver pigur— IQAF v—s t—re—s
prin™ip—les son de —prendiz—je y ev—lu—™iónD —unque h—y otr—s útiles ™omo geE
ner—r un— se™uen™i— de d—tos que —demás se puede gu—rd—r en e‚pp @form—to
utiliz—do por ‡iue muy ™omún en minerí— de d—tosAF
pigur— IQX plujo de tr—˜—jo en wye
v— interf—z grá(™— de wye permite utiliz—r los métodos de minerí— de d—tos
tr—di™ion—l @en modo ˜—t™hA de ‡iueF isto result— espe™i—lmente útil p—r—
™omp—r—r el —prendiz—je online ™on un —prendiz—je ˜—t™h ™omo referen™i—F edeE
másD nos permite l—nz—r v—ri—s t—re—s de form— simultáne— y ver l— evolu™ión
de ™—d— un—D pudiendo detener ™u—lquier— de ell—s en ™u—lquier momentoF in
l— pigur— IR podemos ver un ejemplo de l— vent—n— prin™ip—l de l— —pli™—™ión
dur—nte l— eje™u™ión de un— t—re— de ™l—si(™—™iónF
QR
35. pigur— IRX †ent—n— prin™ip—l de wyeF ije™u™ión de un— t—re— de ev—lu—™ión
@€requenti—lA de un método de ™l—si(™—™ión @roe'ding„reeA ™on dete™™ión de
™—m˜io @ihhwA so˜re un— se™uen™i— de d—tos gener—d— por ƒieqener—torF in
l— p—rte superior se puede ver l— t—re— eje™ut—d— y en l— p—rte inferior l— s—lid—
de l— mism— — interv—los de IHHH inst—n™i—s @de(nido previ—menteAF
7.2. Generación de secuencias de datos
gomo y— indi™—mosD un— ™—r—™terísti™— muy útil de wye es l— posi˜ilid—d de
gener—r se™uen™i—s de d—tos — p—rtir de diversos gener—dores que in™orpor— por
defe™to y que list—mos — ™ontinu—™iónF
STAGGER Concepts GeneratorX vos ™on™eptos de ƒ„eqqi‚ ‘ƒqVT“
™onform—n un estánd—r en l— ev—lu—™ión de ™l—si(™—dores en entornos ™on
se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF il pl—nte—miento origin—l
present— un— serie de ejemplos ™on tres —tri˜utosX
ˆ color ∈ {green, blue, red}
ˆ shape ∈ {triangle, circle, rectangle}
ˆ size ∈ {small, medium, large}
v— se™uen™i— de d—tos se divide en tres ™on™eptosX en los primeros RH
ejemplosD el ™on™epto es color = red ∧ size = smallY en los siguientes RH
QS
36. ejemplosD el ™on™epto es color = green shape = circleY por últimoD los
RH ejemplos (n—les se ™onstruyen ™on el ™on™epto size = medium size =
largeF istos ™on™eptos se pueden o˜serv—r de form— visu—l en l— pigur—
ISF ƒe h— us—do en ‘†xII“‘‡uWT“‘fr€+ HW“‘qwg‚HR“‘uwHU“F
pigur— ISX †isu—liz—™ión de los ™on™eptos ƒ„eqqi‚ ‘uwHU“
SEA Concepts GeneratorX iste ™onjunto de d—tos —rti(™i—l present—E
do en ‘xuHI“ está ™ompuesto por ™u—tro ˜loques de d—tos ™on diferentes
™on™eptosF vos d—tos ™onst—n de tres —tri˜utos y un— ™l—se ˜in—ri—F v—
™l—si(™—™ión se re—liz— solo ™on dos —tri˜utosD mientr—s que el ter™ero es
irrelev—nteD siguiendo est— fun™iónX f1 + f2 ≤ θD donde f1 y f2 son los
dos primeros —tri˜utos y θ es un um˜r—l que se —just— p—r— ™—d— uno
de los ˜loques de d—tos siguiendo este orden {9, 8, 7, 9,5}F he est— forE
m—D l— se™uen™i— de d—tos se de(ne ™omo l— unión ™onse™utiv— de SEA9 D
SEA8 D SEA7 y SEA9,5 D donde ™—d— ™onjunto ™onst— de IPSHH inst—n™i—sD
present—ndo un ™—m˜io ˜rus™o entre ™—d— ™on™eptoF is posi˜le —demás inE
™orpor—r un por™ent—je de ruido por medio del p—rámetro nF ƒe h— us—do
en ‘fr€+ HW“‘uwHU“‘qƒ—‚HW“F
Random RBF GeneratorX in est— se™uen™i—D se gener— un número (jo
de ™entroides @™l—sesA de form— —le—tori— y — ™ontinu—™ión se ™re—n nuevos
ejemplos eligiendo ™u—lquier— de estos ™entroides de m—ner— que ™—ig—n
™er™— de los mismosF v— dist—n™i— —l ™entroide se o˜tiene de form— —le—tori—
de un— distri˜u™ión q—usi—n— ™uy— desvi—™ión típi™— viene determin—d—
por el ™entroideF ƒolo se utiliz—n —tri˜utos numéri™osF €—r—r introdu™ir un
™—m˜io de ™on™epto se despl—z—n los ™entroides en el esp—™io indi™—ndo el
número k de ™entroides — despl—z—r y l— velo™id—d s ™on l— que lo v—n —
h—™erF ƒe h— us—do en ‘fr€+ HW“F
LED GeneratorX ist— se™uen™i— de d—tos ‘fpyƒVR“ ™onst— de PR —triE
˜utos ˜in—riosD IU de los ™u—les son irrelev—ntesF il o˜jetivo es prede™ir el
dígito mostr—do en un displ—y vih de U segmentos en el que ™—d— —tri˜uE
to tiene un IH 7 de posi˜ilid—des de est—r invertidoF ƒe puede in™luir un
QT
37. ™—m˜io de ™on™epto indi™—ndo el número d de —tri˜utos ™on ™—m˜iosF ƒe
h— us—do en ‘†xII“‘fr€+ HW“F
Waveform GeneratorX ist— se™uen™i— de d—tos —p—re™ió t—m˜ién en
‘fpyƒVR“F il o˜jetivo es diferen™i—r entre Q ™l—ses diferentes de ond—sD
donde ™—d— un— de l—s ™u—les se h— gener—do por un— ™om˜in—™ión de
P o Q ond—s ˜—sesF ixisten dos versiones de este pro˜lem—X w—vePI ™on
PI —tri˜utos numéri™os ™on ruido y w—veRH ™on IW —tri˜utos extr— irreE
lev—ntesF ixiste l— posi˜ilid—d de introdu™ir ™—m˜ios en un determin—do
número d de —tri˜utos p—r— forz—r un ™—m˜io de ™on™eptoF ƒe h— us—do en
‘†xII“‘fr€+ HW“‘qƒ—‚HW“F
Function Generator (Agrawal)X iste ™onjunto de fun™iones se presentó
en ‘esƒWQ“ y h— sido us—do p—r— ™ompro˜—r l— es™—l—˜ilid—d en —lgoritmos
de —prendiz—je ™on ár˜oles de de™isiónF v— se™uen™i— de d—tos se puede
gener—r en ˜—se — IH fun™iones diferentes ™on W —tri˜utos des™ritos en el
gu—dro T @T numéri™os y Q ™—tegóri™osA y un— ™l—se ˜in—ri—D de m—ner—
que simul— un— hipotéti™— —pli™—™ión de ™on™esión de prést—mos ˜—n™—E
riosF eunque es un— ˜uen— form— de gener—r se™uen™i—s ™on ™—m˜ios de
™on™eptos de˜ido — l— v—ried—d de sus fun™ionesD en l— ˜i˜liogr—fí— de deE
te™™ión de drifts solo hemos en™ontr—do que se h— us—do en ‘fr€+ HW“F
Atributo Descripción Valores
salary Sueldo Entre 20000 y 150000
commision Comisión Si salary ≥ 75000 ⇒ comission = 0, en otro caso, entre 10000 y 75000
age Edad Entre 20 y 80
elevel Nivel educativo Entre 0 y 4 (categórico)
car Marca del coche Entre 1 y 20 (categórico)
zipcode Código postal Entre 1 y 9 (categórico)
hvalue Valor de la vivienda Entre 0.5k100000 y 1.5k100000 donde k depende de zipcode
hyears Edad de la vivienda Entre 1 y 30
loan Valor del préstamo Entre 0 y 500000
gu—dro TX hes™rip™ión de los —tri˜utos de egr—w—l
Rotating HyperplaneX v—s se™uen™i—s de d—tos gener—d—s por medio de
un hiperpl—no rot—torio se us—ron ini™i—lmente en ‘rƒhHI“F …n hiperpl—no
en un esp—™io dEdimension—l es el ™onjunto de puntos en x que s—tisf—™e
d d
i=1 wi xi = w0 = i=1 wi donde xi es l— iEésim— ™oorden—d— de xF vos
ejemplos m—yores o igu—les que w0 son etiquet—dos ™omo positivosD y el
resto ™omo neg—tivosF €—r— introdu™ir un ™—m˜ioD ˜—st—rá ™on ™—m˜i—r el
peso de un —tri˜uto wi = wi + dσ D donde d es el ™—m˜io que se —pli™— y
σ l— pro˜—˜ilid—d de que se produz™— di™ho ™—m˜ioF vos hiperpl—nos son
útiles p—r— simul—r ™—m˜ios de ™on™eptosD porque permiten modi(™—r l—
orient—™ión y l— posi™ión del hiperpl—no de un— m—ner— su—ve —just—ndo
el peso de ™—d— —tri˜utoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘fqHU“F
in l— pigur— IT se puede o˜serv—r l— interf—z de wye p—r— gener—r se™uen™i—s
de d—tos y —lm—™en—rl—s en (™heros e‚ppF
QU
38. pigur— ITX snterf—z p—r— gener—r un— se™uen™i— de IHHH d—tos us—ndo el gener—dor
ƒ„eqqi‚F
ƒi nuestro propósito es disponer de se™uen™i—s ™on ™—m˜io de ™on™eptoD un —sE
pe™to interes—nte es l— posi˜ilid—d de in™orpor—r ™—m˜ios ™ontrol—dos1 F €—r— ello
se pueden utiliz—r los gener—dores ™oment—dos —nteriormente y ™om˜in—rlos meE
di—nte un— fun™ión sigmoide @ver pigur— IUA que determin— el ™—m˜io de un
origen de d—tos — otroF gomo p—rámetros de l— fun™ión podemos de(nir el moE
mento t0 en el que su™ede el ™—m˜ioD —sí ™omo —just—r l— ˜rusqued—d ™on l— que
se produ™e por medio de αD o ˜ienD l— longitud del mismo us—ndo W F hur—nte
este interv—lo se v—n — mez™l—r en l— se™uen™i— de d—tos inst—n™i—s de —m˜os
™on™eptosF ytr— posi˜ilid—d es gener—r v—ri—s se™uen™i—s de d—tos de form— inE
dependiente y luego junt—rl—s de form— ™onse™utiv— en un— sol— se™uen™i—F
1 De cara a la experimentación es fundamental saber cuántos cambios, en qué momento y
el tiempo de cambio producido en la secuencia de datos, para luego llevar a cabo evaluaciones
y comparaciones entre métodos.
QV
39. pigur— IUX pun™ión sigmoide f (t) = 1/(1 + e−s(t−t0 ) ) F gu—nto m—yor se— αD
menor será W y el ™—m˜io será más ˜rus™oF‘fuHW—“
7.3. Métodos de clasicación
vos prin™ip—les métodos de ™l—si(™—™ión online que se en™uentr—n y— impleE
ment—dos en wye sonX x—ive f—yesD x—ive f—yes wultinomi—l ‘wxWV“D heE
™ision ƒtumpD roe'ding „ree ‘rƒhHI“D roe'ding yption „ree ‘€ruHU“D f—gE
ging ‘yz—HS“D foosting ‘yz—HS“D f—gging using eh‡sx ‘fqHU“D f—gging using
ed—ptiveEƒize roe'ding „rees ‘fr€+ HW“D €er™eptronD ƒqhX ƒto™h—sti™ qr—dient
hes™entD €eg—sos ‘ƒƒƒƒgHU“D €er™eptron ƒt—™king of ‚estri™ted roe'ding „rees
‘fpr€IH“ y vever—ging f—gging ‘fr€IH“F edemás de estosD t—m˜ién nos perE
mite in™orpor—r los —lgoritmos desde ‡iue —sí ™omo ™om˜in—r ™u—lquier— de
ellos ™on un método de dete™™ión de ™—m˜ioF
7.4. Métodos de evaluación
7.4.1. Holdout
in el —prendiz—je en ˜—t™hD lo h—˜itu—l es utiliz—r v—lid—™ión ™ruz—d—D pero ™omo
y— se h— indi™—do en l— ƒe™™ión QFR es invi—˜le us—r este método p—r— el —prendiE
z—je por se™uen™i—s de d—tos y— que se vuelve muy ™ostosoF €or elloD en ‘fuHW—“
propusieron us—r el método holdout que us— un ™onjunto de entren—miento y
otro de testF
in wye podemos de(nir ™—d— ™uánto se ev—lú— el modelo entren—doF €—r—
se™uen™i—s de d—tos sin ™—m˜io de ™on™eptoD podemos us—r siempre el mismo
™onjunto de testD pero en ™—so de que se— un— se™uen™i— ™on drift es ne™es—rio
que el ™onjunto de test se —™tu—li™e ™on el tiempo y— que si no podrí—mos est—r
ev—lu—ndo ™on inst—n™i—s que pertene™en — un— distri˜u™ión de d—tos distint— —
l— entren—d—F v— implement—™ión de wye solo ™ontempl— —™tu—lmente el uso
de ™onjuntos de test estáti™osD por lo que no es indi™—do p—r— ev—lu—r se™uen™i—s
™on ™—m˜iosF
QW
40. 7.4.2. Interleaved Test-Then-Train (o Prequential)
ytro método diferente ™onsiste en ev—lu—r el modelo ™on ™—d— nuev— inst—n™i—
y luego us—rlo p—r— el entren—mientoF ist— té™ni™— se puede us—r t—nto p—r—
se™uen™i—s de d—tos ™on ™—m˜ios y sin ™—m˜ios de ™on™eptoF il in™onveniente de
este método es que —l ™omienzo de l— ev—lu—™ión es pro˜—˜le que o˜teng—mos
peores result—dos de˜ido — que el modelo no está tod—ví— ˜ien entren—doF in l—
pigur— IV podemos ver un ejemplo de un— vent—n— de ™on(gur—™ión de wye
p—r— est—˜le™er l— ev—lu—™iónF
ƒegún el estudio re—liz—do por q—m— et —lF ‘qƒ—‚HW“ este método es más indi™—do
p—r— se™uen™i—s de d—tosF
pigur— IVX †ent—n— de ™on(gur—™ión p—r— un— t—re— de ev—lu—™iónF il método de
—prendiz—je es roe'ding„ree ™on dete™™ión de ™—m˜io ihhwF v— se™uen™i— de
d—tos de IHHFHHH inst—n™i—s se gener— medi—nte ƒie qener—torF v— ev—lu—™ión
se re—liz— en un entorno prequenti—l y se v—n — mostr—r l—s t—s—s de éxito —™uE
mul—d—s ™—d— IFHHH inst—n™i—s pro™es—d—sF …n ejemplo de l— s—lid— por p—nt—ll—
de l— eje™u™ión puede verse en l— pigur— IRF
RH
41. 8. Experimentación
€—r— ™ompro˜—r l— e(™—™i— de los métodos propuestosD hemos re—liz—do un— expeE
riment—™ión so˜re diferentes se™uen™i—s de d—tosF gomo el propósito es ev—lu—r
los diferentes métodos de dete™™ión de ™—m˜iosD se h—n prep—r—do se™uen™i—s
t—nto ™on ™—m˜ios ˜rus™os ™omo ™on ™—m˜ios gr—du—lesD —demás de v—ri—s seE
™uen™i—s ™on d—tos re—les disponi˜les en httpXGGmo—F™sFw—ik—toF—™FnzGd—t—setsG
y que se h—n utiliz—do en l— liter—tur—F
v— ev—lu—™ión se h— re—liz—do medi—nte l— estr—tegi— prequenti—lD en l— que se
™l—si(™—n y luego se entren—n ™—d— un— de l—s inst—n™i—s de l— se™uen™i— ™onforme
se v—n re™i˜iendoF €—r— poder h—™er un— ™omp—r—tiv— entre los distintos métoE
dosD se h— (j—do ™omo —lgoritmo de ™l—si(™—™ión el x—ivef—yes y se h— ™—l™ul—do
el e…gD áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s desde el prin™ipio de
l— eje™u™iónF ytros d—tos ™—l™ul—dos h—n sido el número de ™—m˜ios dete™t—dos
™orre™t—mente e in™orre™t—mente @f—lsos positivos y f—lsos neg—tivosAD —sí ™omo
l— dist—n™i— medid— en número de inst—n™i—s desde que s—˜emos que se produ™e
el ™—m˜io de ™on™epto h—st— que (n—lmente se dete™t—F in el ™—so de l—s se™uenE
™i—s de d—tos re—lesD no podemos ™—l™ul—r est— dist—n™i—D y— que des™ono™emos
™uántos ™—m˜ios present—n y ™uándo se produ™enF
8.1. Conjuntos de datos reales
Electricity Market (ELEC)
iste es uno de los ™onjuntos de d—tos re—les más utiliz—dos en dete™™ión de
driftsF ƒe tr—t— de un— se™uen™i— de d—tos (nit— ™ompuest— por RSFQIP inst—n™i—sD
donde ™—d— muestr— represent— un periodo de QH minutos ™on v—lores de l—
ofert— y dem—nd— de l— energí— elé™tri™— de un— ™iud—d eustr—li—n—D donde los
pre™ios v—rí—n según l— dem—nd—F il v—lor de l— ™l—se se re(ere — l— v—ri—™ión
del pre™io ™on respe™to — l— medi— de l—s últim—s PR hor—sF ƒe h— us—do en
‘fr€+ HW“‘qwg‚HR“‘fqHU“‘fqdgep+ HT“‘uwHU“F
Forest Covertype (Forest)
iste ™onjunto de d—tos ™ontiene v—lores so˜re el tipo de suelo forest—l en regiones
de ist—dos …nidosF istá ™ompuesto por SVIFHIP inst—n™i—s ™on SR —tri˜utos y U
™l—sesF ƒe h— us—do en ‘†xII“‘fr€+ HW“F
Poker-Hand (Poker)
iste ™onjunto está ™ompuesto por IFHPSFHIH inst—n™i—sD donde ™—d— muestr—
represent— un— m—no de S ™—rt—s es™ogid—s de un— ˜—r—j— ™on SP ™—rt—sF g—d—
™—rt— se des™ri˜e ™on dos —tri˜utos @p—lo y v—lorAD por lo que en tot—l h—˜rá IH
—tri˜utosF v— ™l—se des™ri˜e l— m—no de póker y ™onst— de IH posi˜les v—loresF
r—y que tener en ™uent— que el orden de l—s ™—rt—s es import—nteF ƒe h— us—do
en ‘fqHU“ ‘fr€+ HW“F €—r— nuestr— experiment—™ión hemos utiliz—do l— versión
norm—liz—d— disponi˜le en l— we˜ de wyeD de m—ner— que no import— el orden
RI