SlideShare una empresa de Scribd logo
1 de 64
Descargar para leer sin conexión
Minería de secuencias de datos
    Autor: Manuel Martín Salvador

         9 de diciembre de 2011



  „utoresX vuis wF de g—mpos y ƒilvi— e™id




                     I
P
Índice
1. Introducción                                                                   5

2. Los datos                                                                       5
  PFIF ƒe™uen™i—s de d—tos F F F F F F F F F F F F F F F F F F F F F F F F F F     S
  PFPF g—m˜ios de ™on™epto F F F F F F F F F F F F F F F F F F F F F F F F F       T

3. Algoritmos de clasicación de secuencias de datos                               8
  QFIF eprendiz—je online F F F F F F F F F F F F F F F F F F F F F F F F F F      V
  QFPF we™—nismos de olvido F F F F F F F F F F F F F F F F F F F F F F F F        W
  QFQF „—xonomí— de métodos de —prendiz—je F F F F F F F F F F F F F F F          IH
  QFRF iv—lu—™ión del pro™eso de —prendiz—je F F F F F F F F F F F F F F F        II

4. Aplicaciones                                                                   14

5. Revisión de métodos de aprendizaje con disparadores                            15
  SFIF elgoritmos ™on dete™™ión de ™—m˜io F F F F F F F F F F F F F F F F         IS
       SFIFIF hhw @hrift hete™tion wethodA F F F F F F F F F F F F F F F          IS
       SFIFPF ihhw @i—rly hrift hete™tion wethodA F F F F F F F F F F             IV
       SFIFQF wétodo de uifer F F F F F F F F F F F F F F F F F F F F F F F       IV
       SFIFRF eh‡sx @ed—ptive ‡indowingA F F F F F F F F F F F F F F F            IW
  SFPF elgoritmos ™on vent—n— de entren—miento F F F F F F F F F F F F F          PP
       SFPFIF wétodo de ulinken˜erg F F F F F F F F F F F F F F F F F F F         PQ
       SFPFPF psƒr @unipied snst—n™e ƒele™tion —lgoritrmA F F F F F F F           PR

6. Aportaciones                                                                   26
  TFIF woreirrorswoving F F F F F F F F F F F F F F F F F F F F F F F F F F       PT
  TFPF w—xwoving F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F      PV
  TFQF wovingever—ge F F F F F F F F F F F F F F F F F F F F F F F F F F F F      PW

7. MOA (Massive Online Analysis)                                                  34
  UFIF il entorno F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F   QR
  UFPF qener—™ión de se™uen™i—s de d—tos F F F F F F F F F F F F F F F F F        QS
  UFQF wétodos de ™l—si(™—™ión F F F F F F F F F F F F F F F F F F F F F F F      QW
  UFRF wétodos de ev—lu—™ión F F F F F F F F F F F F F F F F F F F F F F F F      QW
       UFRFIF roldout F F F F F F F F F F F F F F F F F F F F F F F F F F F F     QW
       UFRFPF snterle—ved „estE„henE„r—in @o €requenti—lA F F F F F F F F         RH


                                        Q
8. Experimentación                                                                 41
   VFIF gonjuntos de d—tos re—les F F F F F F F F F F F F F F F F F F F F F F      RI
   VFPF f—terí— de prue˜—s F F F F F F F F F F F F F F F F F F F F F F F F F F     RP
   VFQF ‚esult—dos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F   RQ

9. Conclusión y trabajo futuro                                                     57

10.Bibliografía                                                                    59




                                         R
1. Introducción
in este tr—˜—jo v—mos — tr—t—r el pro˜lem— del —prendiz—je —utomáti™o so˜re
se™uen™i—s de d—tosF in un entorno ™lási™o se dispone de un— ˜—se de d—tos
™omplet— y estáti™—D y el o˜jetivo es —prender un modelo que represente lo más
(elmente posi˜le di™hos d—tosF in ™—m˜ioD ™u—ndo en lug—r de disponer de todos
los d—tos —l tiempoD estos v—n lleg—ndo de t—nto en t—ntoD en un— se™uen™i— de
d—tosD — priori de longitud in(nit—D tenemos que —˜ord—r el pro˜lem— del —prenE
diz—je de diferente m—ner—F il pro˜lem— diverge —ún más ™u—ndo l— distri˜u™ión
de los d—tos que se v— re™i˜iendo v—rí— — lo l—rgo del tiempo y por t—nto se h—™e
ne™es—rio —just—r el modelo dur—nte todo el pro™esoF
€or elloD en primer lug—r será ne™es—rio ™on™ret—r este ™on™epto de d—tos que
™onstituye l— entr—d— — un nuevo sistem— de —prendiz—je que se des™ri˜e en l—
ƒe™™ión PF e ™ontinu—™iónD se est—˜le™en los requerimientos de ™u—lquier —lgoE
ritmo de ™l—si(™—™ión so˜re se™uen™i—s de d—tos y l— estru™tur— gener—l de ™ómo
se —˜ord— este pro˜lem— en l— liter—tur— @ƒe™™ión QAF v— minerí— de se™uen™i—s
de d—tos tiene un gr—n ™—mpo de —pli™—™ión ™omo se muestr— en l— ƒe™™ión RF
entes de expli™—r nuestr—s propuest—s en l— ƒe™™ión TD se h—™e un— revisión de
los tr—˜—jos más dest—™—dos en l— dete™™ión de ™—m˜ios de ™on™epto @ƒe™™ión
SAF €—r— l— p—rte experiment—l h— sido ne™es—rio est—˜le™er un m—r™o de tr—˜—jo
que puede ser referen™i— p—r— futur—s experiment—™iones y se h— utiliz—do p—r—
re—liz—r el estudio ™omp—r—tivo de los diferentes métodos sele™™ion—dos @ƒe™™ión
VAF „odo ello h— sido des—rroll—do dentro un entorno softw—re que tr—˜—j— so˜re
™l—si(™—™ión ™on se™uen™i—s de d—tosD que se expli™—rá en l— ƒe™™ión UF pin—lE
menteD de l— p—rte experiment—l se extr—en ™on™lusiones y se est—˜le™en nuevos
o˜jetivos p—r— tr—˜—jos futuros en l— ƒe™™ión WF


2. Los datos
2.1. Secuencias de datos
h—do un pro˜lem— de un dominio determin—doD un— se™uen™i— de d—tos @data
stream A está ™ompuest— por un— serie de inst—n™i—s que lleg—n —l sistem— — dis™reE
™iónD de un— en un— o en p—quetes de t—m—ño regul—r o v—ri—˜leF v—s inst—n™i—s
que ™omponen l—s se™uen™i—s de d—tos en un pro˜lem— orient—do — l— ™l—si(™—E
™iónD suelen est—r form—d—s por un ™onjunto de v—ri—˜les o˜serv—d—s x1 , ..., xn y
un— ™l—se y F in prin™ipio est—s se™uen™i—s tienen un t—m—ño ilimit—do y —demás
es posi˜le que el pro˜lem— presente ™—m˜ios en l— distri˜u™ión su˜y—™ente — lo
l—rgo del tiempo que se re)ejen en l— se™uen™i—D por lo que no se pueden us—r
los enfoques tr—di™ion—les de minerí— de d—tosF il entorno de tr—˜—jo ne™es—rio
p—r— oper—r ™on se™uen™i—s de d—tos de˜e ™umplir ™iert—s restri™™iones ‘frzIH“X

  IF xo se pueden —lm—™en—r todos los d—tos en memori—F ƒolo se permite
     registr—r un— pequeñ— ™—ntid—d de inst—n™i—sD mientr—s que el resto se v—n
     elimin—ndo un— vez pro™es—d—sF
  PF v— velo™id—d ™on l— que se re™i˜en los d—tos impli™— que el pro™es—miento
     de˜e h—™erse en tiempo re—lF


                                        S
QF v— distri˜u™ión de los d—tos puede v—ri—r en el tiempoD de m—ner— que los
     d—tos —ntiguos se vuelven irrelev—ntes p—r— l— et—p— —™tu—lF

v— restri™™ión I impli™— limit—r el t—m—ño de l— memori— utiliz—d— dur—nte el
—prendiz—jeD mientr—s que l— P limit— el tiempo de pro™es—miento de ™—d— muesE
tr—F in —quellos entornos en los que l—s se™uen™i—s de d—tos se—n evolutiv—s
@presenten ™—m˜iosAD h—y que tener en ™uent— l— restri™™ión Q en el pro™eso de
—prendiz—je e in™orpor—r métodos de dete™™ión de ™—m˜ios que permit—n evoluE
™ion—r el modeloF


2.2. Cambios de concepto
h—do un pro˜lem— de un dominio determin—doD se denomin— ™—m˜io de ™on™epto
@concept drift A — l— situ—™ión que se produ™e ™u—ndo los d—tos de un— se™uen™i—
p—s—n de tener un— distri˜u™ión de pro˜—˜ilid—d S1 — otr— distri˜u™ión S2 D
donde S1 y S2 son de orígenes diferentes @ver pigur— IAF iste tipo de se™uen™i—s
de d—tos se suelen denomin—r evolutiv—s o dinámi™—sD frente — l—s estáti™—sD que
no present—n ™—m˜ios de ™on™eptoF




pigur— IX ‚epresent—™ión visu—l de un ™—m˜io de ™on™epto gr—du—l — lo l—rgo del
tiempo ‘liIH—“


v— n—tur—lez— del ™—m˜io de ™on™epto es imprede™i˜leD por lo que no se tr—t— de
™—m˜ios ™on periodi™id—d ™ono™id—D si no que l— suposi™ión prin™ip—l ™u—ndo se
—˜ord— este pro˜lem— es l— in™ertidum˜re so˜re el futuroF il ™—m˜io de ™on™epto
se puede d—r por tres ™—us—s ‘ureWW“X

  IF g—m˜io en l—s pro˜—˜ilid—des — priori de l—s ™l—ses P (c1 ), . . . , P (ck )

  PF g—m˜io en l—s distri˜u™iones de pro˜—˜ilid—d ™ondi™ion—d—s P (X|ci )D i =
     1, . . . , k


                                          T
QF g—m˜io en l—s pro˜—˜ilid—des — posteriori P (ci |X)D i = 1, . . . , k

gomo ejemplos de ™—m˜io de ™on™epto se pueden ™onsider—r los ™orreos ˜—sur—
@spam AD que intent—n v—ri—r su ™ontenido p—r— s—lt—rse los (ltros de ™orreoD o l—
evolu™ión de l— s—lud de un p—™iente —l in™luir un nuevo medi™—mentoF
ƒe pueden en™ontr—r en l— liter—tur— ‘frzIH“ h—st— seis tipos de ™—m˜ios so˜re
un— v—ri—˜le — lo l—rgo del tiempoD t—l y ™omo se puede o˜serv—r en l— pigur— PF
v— primer— grá(™— @Sudden A muestr— un ™—m˜io —˜ruptoD en el que ™—m˜i— el
v—lor de l— ™l—se de form— inst—ntáne—F v—s siguientes grá(™—s muestr—n ™—m˜ios
que se produ™en más lent—menteF v— diferen™i— entre in™rement—l y gr—du—l r—E
di™— en si ™—m˜i—n los v—lores de l—s v—ri—˜les o ˜ien l— distri˜u™ión de l— ™l—seD
—unque h—˜itu—lmente se us—n ™omo sinónimosF in l— (l— de —˜—jo tenemos l—
primer— grá(™— @Recurring A ™on un ™—m˜io tempor—l y que vuelve — su est—do
norm—l tr—s un interv—lo de tiempoF v— siguiente grá(™— @Blip A represent— un
evento ex™ep™ion—l y no de˜e tr—t—rse ™omo un ™—m˜io de ™on™eptoF v— últim—
grá(™— @Noise A muestr— ™—m˜ios —le—toriosD — los que ll—m—remos ruido y t—mE
po™o de˜en ™onsider—rse ™omo un ™—m˜io en l— distri˜u™iónF in l— liter—tur— lo
más fre™uente es en™ontr—rse ™on tr—˜—jos que ™onsider—n t—n solo los ™—m˜ios
—˜ruptosD gr—du—les o in™rement—lesFF




                          pigur— PX „ipos de ™—m˜ios




                                         U
3. Algoritmos de clasicación de secuencias de
   datos
vos ™l—si(™—dores de se™uen™i—s de d—tos de˜en ser ™—p—™es de —prender de los
d—tos de form— in™rement—l en vez de por lotes @batch A y re—™™ion—r —nte los
™—m˜ios de ™on™eptoF em˜os requisitos se ™onsiguen —pli™—ndo aprendizaje
online y mecanismos para olvidar los d—tos que y— no son relev—ntesF

3.1. Aprendizaje online
il —prendiz—je onlineD t—m˜ién ll—m—do —prendiz—je in™rement—lD se ™entr— en el
pro™es—miento de inst—n™i—s de form— se™uen™i—l tr—t—ndo de que el ™l—si(™—dor
entren—do se— t—n pre™iso ™omo si se hu˜iese entren—do ™on todo el ™onjunto
de d—tos — l— vez @en batch AF …n ˜uen —lgoritmo de —prendiz—je online de˜erí—
tener est—s ™u—lid—des ‘frzIH“X

  IF sn™rement—lX el —lgoritmo de˜e ser ™—p—z de leer y pro™es—r d—tos — lo l—rgo
     del tiempo sin tener que disponer de todos los d—tos desde el prin™ipioF

  PF „r—t—r ™—d— inst—n™i— en un— p—s—d—X el —lgoritmo solo puede re—liz—r un—
     le™tur— so˜re los d—tos y luego li˜er—r el esp—™ioF

  QF vimit—™ión de tiempo y memori—X ™—d— vez que se pro™ese un ejemplo de˜e
     h—™erse en el menor tiempo posi˜le y l— ™—ntid—d de memori— ne™es—ri—
     p—r— el pro™es—miento de˜e ser ™onst—nteF

  RF il —lgoritmo de˜e propor™ion—r un modelo ™ompleto en ™u—lquier inst—nte
     de tiempoF in un ™—so ide—lD el ™l—si(™—dor entren—do in™rement—lmente
     h—st— un inst—nte t de˜e ser equiv—lente —l mismo entren—do de form—
     tr—di™ion—l ™on tod—s l—s inst—n™i—s disponi˜les h—st— el inst—nte tF

€—r— s—tisf—™er est—s restri™™iones de po™os d—tos — l— vez y disponi˜ilid—d del
modelo en ™u—lquier inst—nteD se suelen —pli™—r té™ni™—s de resumen — los d—E
tos t—les ™omo sliding windows @vent—n—s desliz—ntesAD sampling @muestreoA o
sketching @es˜ozoAD —lgun—s de l—s ™u—les se ™onsider—rán en este tr—˜—joF
v—s prin™ip—les diferen™i—s entre el pro™eso de ™l—si(™—™ión ™on todos los d—tos
en un modo tr—di™ion—l y un pro™eso de ™l—si(™—™ión p—r— se™uen™i—s de d—tos
se pueden ver — modo de resumen en el gu—dro IF

                                           Tradicional   Secuencial
              xúmero de p—s—d—s             wúltiple        …n—
           „iempo de pro™es—miento          slimit—do    ‚estringido
               …so de memori—               slimit—do    ‚estringido
               „ipo de result—do             €re™iso     eproxim—do
                  gon™epto                   istáti™o     ivolutivo

gu—dro IX gomp—r—tiv— de minerí— de d—tos tr—di™ion—l frente — l— minerí— de
se™uen™i—s de d—tos ‘qqHU“


                                       V
in gener—lD el pro™eso de —prendiz—je puede verse ™omo en l— pigur— QF




    pigur— QX €ro™eso de —prendiz—je in™rement—l en el inst—nte t ‘liIH˜“F


3.2. Mecanismos de olvido
sn™orpor—r me™—nismos de olvido es un —spe™to que tiene espe™i—l interés en
se™uen™i—s evolutiv—sD y— que existe un modelo —ntes y otro distinto después de
dete™t—rse el ™—m˜ioF €or t—ntoD un ™l—si(™—dor de˜e ser ™—p—z de re—™™ion—r
—nte un ™—m˜io de ™on™epto y olvid—r —quello que y— no se— relev—nteD ™omo
los d—tos que son de ™on™eptos —ntiguosF il prin™ip—l pro˜lem— es ™ómo s—˜er
qué de˜e olvid—rF v— solu™ión más sen™ill— es ir olvid—ndo p—ul—tin—mente los
d—tos —ntiguos y us—r un— ventana ™on los ejemplos más re™ientes p—r— entren—r
el ™l—si(™—dorF isto permite —demás m—ntener redu™ido el número de inst—n™i—s
ne™es—ri—s p—r— el entren—mientoF iste primer enfoque de vent—n—s de t—m—ño
™onst—nte en los d—tos más re™ientesD present— un ™ompromiso entre est—˜ilid—d
y )exi˜ilid—dD y— que si l— vent—n— es dem—si—do pequeñ— re—™™ion—rá rápido —
los ™—m˜iosD pero — l— vez ˜—j—rá l— pre™isión porque está entren—ndo ™on po™os
d—tosF in ™—m˜ioD si l— vent—n— es muy gr—ndeD el ™l—si(™—dor será más est—˜le
pero t—rd—rá más en dete™t—r los ™—m˜ios ‘uunHV“F
ytro enfoque ™onsiste en —just—r el t—m—ño de l— vent—n— de —prendiz—je ™u—ndo
se dete™te un ™—m˜io de ™on™epto p—r— tr—t—r de en™ontr—r un equili˜rio entre
pre™isión y )exi˜ilid—dF istos métodos fun™ion—n mejor ™u—ndo h—y ™—m˜ios
˜rus™osF
…n enfoque —ltern—tivo ™onsiste en ponder—r l—s muestr—s ™on un peso que irá
disminuyendo — lo l—rgo del tiempo p—r— v—ri—r l— in)uen™i— de l—s mism—s
dur—nte el pro™esoF iste enfoque se denomin— fading factor @f—™tor de olvidoAF



                                       W
€—r— nuestros métodos v—mos — us—r vent—n—s de t—m—ño (jo y— que nos f—™ilit—n
l— interpret—˜ilid—d de los result—dosF


3.3. Taxonomía de métodos de aprendizaje
e ™ontinu—™ión present—mos un— posi˜le ™l—si(™—™ión de métodos de —prendiz—je
de se™uen™i—s de d—tos evolutiv—sD propuest— en ‘liIH˜“F

  IF   Algoritmos de aprendizaje con disparadores (Learner with triggers)X
       dependen de un— señ—l que indi™— que es ne™es—rio —™tu—liz—r el modeloF

        a A Detección de cambio (Change detectors) X son los más fre™uentes en
            l— ˜i˜liogr—fí—F istos métodos fun™ion—n mejor en entornos ™on ™—mE
            ˜ios ˜rus™os en los que se suele re™onstruir el modelo por ™ompleto
            en vez de —™tu—liz—rloF vo más ™omún es monitoriz—r los d—tosD los
            p—rámetros del ™l—si(™—dor o l— s—lid— del —lgoritmo de —prendiz—jeF
            ‘ƒƒHVD qwg‚HRD fqdgep+ HT“
            in el supuesto de que l—s se™uen™i—s de d—tos se—n estáti™—s @sin
            ™—m˜iosAD l—s té™ni™—s de dete™™ión de ™—m˜ios t—m˜ién pueden ser
            utiliz—d—s p—r— dete™t—r diferen™i—s signi(™—tiv—s respe™to —l modelo
            que se está entren—ndo y se tr—t—rí— de ™omplet—r el —nterior p—r—
            lleg—r — un modelo mejor —just—doF
        b A Ventana de entrenamiento (Training windows) X estos métodos se
            ˜—s—n en heurísti™—s p—r— —just—r el t—m—ño de l— vent—n— de entreE
            n—mientoF ‘‡uWTD rƒhHID fwHV“
        c A Muestreo adaptativo (Adaptive sampling) X ˜—sándose en l— rel—E
            ™ión entre l— inst—n™i— de prue˜— y unos prototipos prede(nidos o
            ˜ien el históri™o de inst—n™i—s entren—d—sD se sele™™ion— un ™onjunto
            de entren—miento —de™u—doF ‘‰‡HVD €ruHV“

  PF   Algoritmos de aprendizaje evolutivos (Evolving learners)X estos méE
       todos —™tu—liz—n el modelo de form— gr—du—l y no requieren de un dete™tor
       de ™—m˜ios de ™on™eptoF

        a A Conjuntos adaptativos (Adaptive ensembles) X son los más popul—E
            resD y ˜ási™—mente ™om˜in—n l— s—lid— de distintos ™l—si(™—dores del
            ™onjunto p—r— d—r un— de™isión (n—lF ‘uwHUD ƒt—HQD xuHI“
        b A Ponderación de instancias (Instance weighting) X estos —lgoritmos
            no ™om˜in—n regl—s de de™isiónD sino que l— —d—pt—˜ilid—d se ™onsigue
            modi(™—ndo el ™onjunto de entren—mientoF …tiliz— ide—s de boostingD
            d—ndo más import—n™i— — —quell—s inst—n™i—s m—l ™l—si(™—d—sF ‘uoyHHD
            ƒHVD gHR“
        c A Espacio de características (Feature space) X estos métodosD próE
            ximos — l— sele™™ión de ™—r—™terísti™—sD ™onsiguen l— —d—pt—˜ilid—d
            sele™™ion—ndo de form— dinámi™— l—s ™—r—™terísti™—s emple—d—s p—r—
            l— ™l—si(™—™iónF ‘porHTD ‡qgHTD eerHV“
        d A Dependientes del modelo (Base model specic) X estos métodos se
            —d—pt—n modi(™—ndo los p—rámetros del modelo que estén us—ndoF
            ‘xnpwHUD ureWWD ƒvƒWW“


                                       IH
3.4. Evaluación del proceso de aprendizaje
ƒegún v—rios —utores ‘qƒ—‚HW“D h—y tres —spe™tos import—ntes — tener en ™uent—
— l— hor— de ev—lu—r —lgoritmos de —prendiz—je de se™uen™i—s de d—tosX

       Espacio o™up—do en memori— — lo l—rgo del pro™eso de —prendiz—jeF
       Tiempo de pro™es—miento de un— muestr— @esto puede limit—r l— fre™uenE
       ™i— de re™ep™ión de los d—tosAF
       €oder de generalizaciónX efe™tivid—d del modelo —l represent—r el ™onE
       ™epto su˜y—™ente de los d—tosF

xosotros nos v—mos — o™up—r úni™—mente de ev—lu—r y ™omp—r—r —lgoritmos
por el último ™riterioD según su efe™tivid—d dur—nte l— ™l—si(™—™iónF ƒin em˜—rgo
—unque no tr—t—mos de minimiz—r ™onsumo de memori—D ni tiempo de pro™eE
s—mientoD sí se respet—n los requerimientos de —prendiz—je onlineD de un— sol—
p—s—d— so˜re los d—tos y que l—s muestr—s no se —™umul—n tod—s en memori—F
xuestro propósito por t—nto esD ev—lu—r —lgoritmos propios y —jenos por l— efe™E
tivid—d del modelo —prendidoD p—r— poder est—˜le™er ™omp—r—™iones y r—nkings
de los mismos y extr—er ™on™lusiones so˜re los modelos —prendidosF
vos métodos de ev—lu—™ión de —lgoritmos de —prendiz—je en ˜—t™hD —prenden
so˜re un ™onjunto de entren—miento @training A y utiliz—˜—n un ™onjunto de test
independiente so˜re los que estim—r l— pro˜—˜ilid—d de error holdoutF in el ™—so
de no disponerse de —m˜osD se estim— l— pro˜—˜ilid—d de error del modelo o˜teE
nido — p—rtir del ™onjunto de tr—ining medi—nte té™ni™—s de v—lid—™ión ™ruz—d—
y sus v—ri—ntes @leaving-one-out A o bootstrapF ƒin em˜—rgoD en el ™ontexto de seE
™uen™i—s donde los d—tos son poten™i—lmente in(nitosD l— v—lid—™ión ™ruz—d— y l—s
estr—tegi—s de muestreo no son —pli™—˜lesF edemásD el he™ho de que los ™on™eptos
de l—s se™uen™i—s de d—tos pued—n ™—m˜i—r en el tiempo tiene impli™—™iones en
l—s té™ni™—s de ev—lu—™iónF
ƒe ne™esit—n por t—nto nuev—s estr—tegi—s de ev—lu—™iónF il prin™ip—l pro˜lem—
™onsiste en monitoriz—r l— evolu™ión del pro™eso de —prendiz—jeF xos en™ontr—mos
™on dos —ltern—tiv—sX

  IF   HoldoutX ™omo en su homólogo en ˜—t™hD se tr—t— de un ™onjunto de test
       que se —pli™— —l modeloD pero en este ™—so extr—ído — interv—los regul—resD
       p—r— estim—r l—s t—s—s de errorD lo que es —de™u—do p—r— se™uen™i—s dináE
       mi™—sF r—y que (j—r fre™uen™i— y —n™hur— del ™onjunto de test so˜re l—
       se™uen™i—F ƒe tr—t— de un estim—dor no sesg—doD pues —l moverse — lo l—rgo
       de l— se™uen™i— no d— lug—r — so˜re—justeF
  PF   PrequentialX t—m˜ién ™ono™ido ™omo test-then-train ‘fuHW—“F il término
       prequenti—l proviene de €redi™tive ƒequenti—l ‘h—wVR“F il error del modelo
                                                        n
       se estim— so˜re l— se™uen™i— de d—tosX S =       i=1 L(yi , yi ) donde L es
                                                                   ˆ
       l— fun™ión de pérdid— tr—s h—˜er predi™ho l— ™l—se de form— ™orre™t— o
       in™orre™t—F ƒe ™ono™e que este estim—dor es pesimist—D es de™irD en l—s
       mism—s ™ondi™ionesD l— estr—tegi— holdout v— — d—r mejores v—loresF il
       error estim—do ™on prequenti—l v— — est—r in)uen™i—do por los errores que
       se h—y—n podido ™ometer —l prin™ipio de l— se™uen™i— de d—tosF €or elloD se
       h—n us—do me™—nismos de olvido t—les ™omoX


                                         II
a A Ventanas temporales (time window): en lug—r de m—ntener un ™ál™ulo
             de l—s t—s—s de éxito —™umul—do desde el ini™io de l— se™uen™i—D se
             re—liz— est— estim—™ión p—r™i—l so˜re un— vent—n— de t—m—ño k D (jo
             @— (j—r — prioriAD que se v— despl—z—ndoF iste me™—nismo ™onverge
             más rápid—mente —l método holdoutF
       b A Factores de olvido (fading factor): se introdu™e un f—™tor de olvido α
             p—r— que l— in)uen™i— de ™—d— error en l— estim—™ión v—y— de™—yendo
             ™onforme —ument— l— dist—n™i—F he est— m—ner—D podemos ™—l™ul—r el
                                                   L +α·S
             error prequenti—l ™omo Ei = Bi = nii+α·Bi−1 donde S1 = L1 y ni
                                             S
                                               i          i−1
             es el número de ejemplos us—dos p—r— ™—l™ul—r Li F in el ™—so de que
             α = 1 impli™— que no h—y olvidoF iste me™—nismo tiene l— vent—j— de
             que requiere po™— memori—D y— que solo requiere —lm—™en—r el v—lor
             —nterior y el —™tu—lD frente —l uso de vent—n—s donde se tienen que
             —lm—™en—r k v—lores de pérdid—F

      em˜os me™—nismos están muy rel—™ion—dosD y por ende sus p—rámetrosF
      esíD p—r— v—lores ˜—jos de k y de αD l—s estim—™iones he™h—s son más —
      ™orto pl—zo y ™omo ™onse™uen™i— l—s os™il—™iones de l—s estim—™iones son
      m—yoresF €or otro l—doD p—r— v—lores —ltos de k @m—yor vent—n—A y de
      α @™er™—nos — IAD v—n — intervenir más d—tos en l—s estim—™iones de los
      erroresF

in nuestr— experiment—™ión hemos us—do l— estim—™ión prequenti—l y— que es l—
más extendid—D de˜ido — que no se ex™luye ningún d—to en el entren—mientoD y
se ev—lú— puntu—lmente ™on ™—d— muestr— de l— se™uen™i—D por lo que se o˜tiene
de un estim—dor no sesg—doF
e l— hor— de ™omp—r—r el rendimiento que present—n dos —lgoritmos @e y fA
frente — l— mism— se™uen™i— de d—tos podemos us—r el est—dísti™o Qi (A, B) =
     1−S A
log 1−Si D donde Si y Si son los v—lores de l— fun™ión de pérdid— —™umuE
        B
                     A     B
        i
l—dos de ™—d— —lgoritmoF il v—lor de Qi es útil p—r— ™ompro˜—r l—s diferen™i—s
entre —m˜os —lgoritmosD de m—ner— que si el —lgoritmo e present— un mejor
™omport—miento que el fD v—mos — o˜tener v—lores positivosD mientr—s que en
™—so ™ontr—rio o˜tendremos v—lores neg—tivosD y si son igu—les será ™eroF
il pro˜lem— de est—s medid—s es que evolu™ion—n — lo l—rgo del tiempo y es
posi˜le que visu—lmente no pod—mos re™ono™er qué método es mejor que otro
y— que uno se puede ™omport—r mejor en un— p—rte de l— se™uen™i—D mientr—s
que otro lo h—g— en otr— o™—siónF €or elloD p—r— d—r un v—lor (n—l en nuestr—
experiment—™ión hemos us—do ™omo medid— el áre— ˜—jo l— ™urv— @e…gA de
los v—lores o˜tenidos ™on l— estr—tegi— prequenti—l desde el ini™io de l— se™uen™i—
h—st— que (n—liz—F he est— m—ner—D si tenemos dos —lgoritmos @e y fAD de(nimos
              N
AU CA = i=0 ni · (1 − Ei ) donde ni es el número de ejemplos us—dos p—r—
                            A

™—l™ul—r Ei y N el número de v—lores de Ei disponi˜les @ídem p—r— fAF hiremos
           A                                A

que e es mejor que f si AU CA  AU CB F
ytro —spe™to interes—nte — ev—lu—r en el ™—so de que tr—˜—jemos ™on se™uen™i—s
sintéti™—s ™on ™—m˜ios de ™on™eptos ™ono™idos es el número de drifts ™orre™t—E
mente dete™t—dosD los f—lsos positivosD los f—lsos neg—tivosD —sí ™omo l— dist—n™i—
tr—ns™urrid— desde que se produ™e un ™—m˜io h—st— que se dete™t—F il ™ál™ulo de
est— dist—n™i— v— — ser diferente dependiendo del tipo de ™—m˜io que presente l—


                                        IP
se™uen™i—D y— que h—y que tener en ™uent— que los ™—m˜ios gr—du—les se produ™en
— lo l—rgo de un— vent—n— donde se entremez™l—n muestr—s de —m˜os ™on™eptosF
v— dist—n™i— se ™—l™ul— entre el punto de drift re—l y el drift dete™t—do más
™er™—no — élF in ™—so de h—˜er más de un drift dete™t—doD se ™—l™ul— l— dist—n™i—
del primero y el resto se ™onsider—n f—lsos positivosF ƒi el ™—m˜io es gr—du—lD
el punto de ™—m˜io re—l ™onsider—mos que ™orresponde ™on l— ™ot— inferior del
interv—lo de ™—m˜ioF ƒe puede ver un ejemplo en l— pigur— RF

        Cambios Abruptos                           Cambios Graduales




0       10      20     30     40     50        0   10     20      30     40     50
                 Instancias                                 Instancias


pigur— RX in l— grá(™— de l— izquierd— s—˜emos que h—y P ™—m˜ios —˜ruptos en
PH y RH @líne—s roj—s ™ontínu—sAF il método —pli™—do h— dete™t—do Q drifts en
PSD QH y RP @líne—s —zules dis™ontínu—sAF hiremos que h— dete™t—do dos drifts
™orre™t—mente @en los puntos PS y RPA y un f—lso positivo @QHAF v— dist—n™i— —l
primer drift será de 25 − 20 = 5 y —l segundo de 42 − 40 = 2F €or otro l—doD en
l— grá(™— de l— dere™h— h—y P ™—m˜ios gr—du—les que tienen lug—r en ‘ISD PS“ y
‘QSD RS“F in este ™—so diremos que h— dete™t—do dos drifts ™orre™t—mente @IS y
RPA y dos f—lsos positivos @PI y QHAF v— dist—n™i— —l primer drift será 15 − 15 = 0
y —l segundo 42 − 35 = 7F




                                          IQ
4. Aplicaciones
e ™ontinu—™ión present—mos distint—s áre—s de —pli™—™ión p—r— el —prendiz—je
o l— ™l—si(™—™ión de se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF „odos ellos
tienen en ™omún l— —)uen™i— ™onst—nte de nuevos d—tos y un— posi˜le evolu™ión
de los ™on™eptos en el tiempoF

     Monitorización y controlX en l—s —pli™—™iones de monitoriz—™ión y ™onE
     trol se tr—˜—j—n ™on ™—ntid—des de d—tos muy gr—ndes que ne™esit—n pro™eE
     s—rse en tiempo re—lF ƒe pueden diferen™i—r dos tipos de t—re—sX preven™ión
     y prote™™ión frente — —t—quesD o monitoriz—™ión ™on propósitos de gestiónF

        ˆ ƒegurid—d informáti™—X dete™™ión de intrusosF ‘vfWW“
        ˆ ƒe™tor (n—n™ieroX preven™ión de fr—udesF ‘honHR“
        ˆ „r—nsporteX gestión del trá(™oF ‘wƒthHW“
        ˆ €osi™ion—mientoX r—streo inter—™tivoF ‘v€puHU“
        ˆ sndustri—X monitoriz—™ión de pro™esos de produ™™iónF ‘†yq+ HV“

     Información y asistencia personalizadaX est—s —pli™—™iones org—niz—n
     o person—liz—n un )ujo de inform—™iónF

        ˆ esisten™i— person—lX (ltr—do de inform—™iónF ‘qƒgwHU“
        ˆ €er(les de ™lientesX segment—™ión de ™lientesF ‘vrgHV“
        ˆ snform—™iónX org—niz—™ión de do™umentosF ‘fvHT“

     Toma de decisionesX est—s —pli™—™iones no ne™esit—n que l—s de™isiones
     se—n en tiempo re—lD pero sí que su respuest— se— pre™is— y— que los ™ostes
     de ™ometer un error pueden ser muy —ltosF

        ˆ ƒe™tor (n—n™ieroX predi™™ión de morosid—dF ‘‚‚HU“
        ˆ fiomedi™in—X efe™tos de medi™—mentos en p—™ientesF ‘„€g€HV“

     Inteligencia articial y robóticaX el ™—m˜io de ™on™epto en est—s —pliE
     ™—™iones se suele de˜er — ™—m˜ios en el entornoF

        ˆ ƒistem—s móviles y ro˜óti™osX diseño de ro˜ots ™—p—™es de —d—pt—rse
          —l entornoF ‘€wqHW“
        ˆ ƒistem—s inteligentesX solu™iones p—r— domóti™—F ‘‚gHW“
        ˆ ‚e—lid—d virtu—lX diseño de videojuegos y simul—doresF ‘gww+ HS“




                                      IR
5. Revisión de métodos de aprendizaje con dis-
   paradores
…n— vez expuesto el ™ontexto en el que se des—rroll— el tr—˜—joD v—mos — re—liz—r
un estudio det—ll—do so˜re el pro˜lem— ™on™reto del —prendiz—je ™on disp—r—E
doresD en espe™i—l los dos primeros —p—rt—dos que nom˜r—mos en l— t—xonomí—X
utiliz—ndo detección de cambio y ventanas de entrenamientoF
ƒ™hlimmer y qr—nger present—ron en IWVT el pro˜lem— del —prendiz—je in™remenE
t—l so˜re d—tos ™on ruido y pu˜li™—ron el —lgoritmo ƒ„eqqi‚ ‘ƒqVT“F hesde
que introdujeron el término ™on™ept driftD h— h—˜ido tres pi™os de interés en
l— investig—™iónX en IWWV ™on un— edi™ión espe™i—l de l— revist— Machine Lear-
ning ‘h‡uWV“D en PHHR ™on un espe™i—l en l— revist— Intelligent Data Analysis
‘ƒuHU“ y el ter™ero ™omenzó en PHHU ™omo result—do de l— ™ontinu— produ™™ión
de se™uen™i—s de d—tos en l— industri— y que ™omo se h— det—ll—do —nteriormente
prosigue —ún en l— —™tu—lid—dF


5.1. Algoritmos con detección de cambio
in el ™—so de se™uen™i—s dinámi™—s de d—tosD el propósito de estos —lgoritmos es
dete™t—r un ™—m˜io de ™on™epto en los d—tos que v—n lleg—ndo y —vis—r —l —lgoritE
mo de —prendiz—je que indu™e el modelo de que de˜e —™tu—liz—r o re™onstruir su
modelo p—r— —just—rse mejor — los nuevos d—tosF €or otro l—do si se tr—˜—j—n ™on
se™uen™i—s estáti™—s de d—tosD el o˜jetivo de estos —lgoritmos es —™tiv—r el pro™eso
de —prendiz—je p—r— —just—rse mejor —l —porte de d—tos —di™ion—lesF vo h—˜itu—l
es que los —lgoritmos de dete™™ión de ™—m˜ios —™túen — priori so˜re los d—tosD
esto esD (ltren l— se™uen™i— de d—tos y —™tiven los pro™esos de —prendiz—je @muE
™hos más pes—dos ™omput—™ion—lmenteA ™on l— lleg—d— de nuevos ™on™eptosF …n
—lgoritmo de dete™™ión de ™—m˜ios puede —fe™t—r —l rendimiento del ™l—si(™—dorF
v— form— de pro™eder de un dete™tor de ™—m˜ios es re—liz—r un test est—dístiE
™o que ™omprue˜e si el error del ™l—si(™—dor o l— distribución de l— ™l—se se
m—ntienen ™onst—ntes en el tiempoF
vos primeros tests propuestos p—r— tr—t—r ™on se™uen™i—s numéri™—s fueron g…E
ƒ…w @Cumulated Sum A ‘€—gSR“ y qwe @Geometric Moving Average A ‘‚o˜SW“F
il primero de ellos l—nz— un— señ—l de —l—rm— si l— medi— de los d—tos de enE
tr—d— es signi(™—tiv—mente distint— de ™eroD mientr—s que qwe ™omprue˜— si
l— medi— ponder—d— de los ejemplos de un— vent—n— es m—yor que un determiE
n—do um˜r—lF €—r— se™uen™i—s ™on estru™tur—s más ™omplej—s se h—n propuesto
tests ™omo el de Kolmogorov-SmirnovF e ™ontinu—™ión veremos —lgunos de los
métodos de dete™™ión de ™—m˜io más re™ientes que pueden —pli™—rse — ™u—lquier
—lgoritmo de minerí— so˜re se™uen™i—s de d—tosF


5.1.1. DDM (Drift Detection Method)
q—m— et —lF ‘qwg‚HR“ present—n el método de dete™™ión de ™—m˜io @hhwA
que monitoriz— l— t—s— de error us—ndo un Shewhart P-ChartD un— herr—mient—



                                        IS
est—dísti™— de ™ontrol de ™—lid—dD ™uyos prin™ipios se ˜—s—n en l— distri˜u™ión
˜inomi—lF
ƒe di™e que un— v—ri—˜le X sigue un— distri˜u™ión ˜inomi—l si ™umple l—s siE
guientes ™ondi™ionesX

  IF g—d— o˜serv—™ión es l— re—liz—™ión de un— v—ri—˜le —le—tori— de fernoulli
     ™on dos posi˜ilid—des @éxito o f—lloA y un p—rámetro p @pro˜—˜ilid—d de
     f—lloAF

  PF v—s diferentes o˜serv—™iones son independientes entre síF

  QF il número de o˜serv—™iones n es (joF

he est— m—ner— podemos o˜tener l— medi— y l— desvi—™ión típi™— de l— distri˜uE
                           p(1−p)
™ión ™omo µ = p y σ =         n   F
ƒi n ≥ 30D l— distri˜u™ión se puede —semej—r — un— xorm—l y —pli™—r los límites
de ™ontrol del €Egh—rtX

      CL @genter vineAX µ
      UWL @…pper ‡—rning vimitAX µ + α · σD ™on 0  α  3
      UCL @…pper gontrol vimitAX µ + 3 · σ @—proxim—d—menteD el WWFU 7 de l—s
      o˜serv—™iones de˜erí—n est—r en este um˜r—lA

istos límitesD sirven p—r— de(nir unos niveles de ™ontrolD ™omo puede o˜serv—rse
en l— pigur— SF v— líne— ™entr—l gv represent— l— medi— de l— ™u—lid—d que se
esté midiendoF ƒi en —lgún momento se so˜rep—s— el límite …‡v se est—˜le™e un
nivel de —viso @warning AD indi™—ndo de est— m—ner— que es posi˜le que se v—y—
— produ™ir un ™—m˜io de ™on™eptoF ƒi sigue l— tenden™i— y so˜rep—s— el límite
…gvD se est—˜le™e el nivel de ™—m˜io de(nitivo @drift AF v—s inst—n™i—s re™i˜id—s
en el interv—lo que tr—ns™urre desde que se —™tiv— el nivel de —viso y h—st— el que
se —™tiv— nivel de drift se —lm—™en—n en un— memori— — ™orto pl—zoD y se us—rán
p—r— re™onstruir o —™tu—liz—r el modelo ™u—ndo se— ne™es—rioF ƒi se h— disp—r—do
el nivel de —viso y el v—lor ™ontrol—do vuelve — des™enderD situándose —lrededor
de l— líne— ™entr—l gv @l— medi—AD se di™e que se h— produ™ido un— f—ls— —l—rm—
y se reini™i— l— memori— — ™orto pl—zoF
€—r— —just—r dinámi™—mente estos v—lores ™u—ndo l— medi— no es un— ™onst—nteD
™omo en un entorno prequentialD se est—˜le™en pmin y smin ™omo l— medi— y desE
vi—™ión típi™— menores h—st— el momentoF g—d— vez que lleg— un nuevo ejemploD
se —™tu—liz—rán estos v—lores si pi + si  pmin + smin F in est— situ—™iónD el nivel
de —viso @warning A se —l™—nz—rá ™u—ndo pi + si ≥ pmin + 2 · smin D mientr—s que
el nivel de ™—m˜io de(nitivo @drift A se d—rá en pi + si ≥ pmin + 3 · smin F in l—
pigur— T podemos ver un ejemplo grá(™o del —juste de estos límitesF




                                        IT
11.0
                                                                    UCL

                                                                    UWL
       Quality characteristic

                                10.0                                CL



                                                                   LWL
                                                                    LCL
                                 9.0
                                       3   6        9   12    15
                                               Sample

pigur— SX vímites de ™ontrol de Shewhart P-ChartF vos puntos de l— grá(™— están
todos en los límites de lo esper—doD s—lvo el punto II que super— el límite …‡v
de —visoD pero se tr—t— de un— f—ls— —l—rm—F




pigur— TX €Egh—rt ™on —juste dinámi™oF v— ™u—lid—d que se mide —quí es l— t—s—
de errorD por lo que niveles por de˜—jo de l— medi— signi(™— que el ™l—si(™—dor
es ™orre™to @no h—y ™—m˜ios de ™on™eptoAD de m—ner— que no es ne™es—rio tener
límites de ™ontrol inferiores ™omo hemos visto —nteriormente en l— pigur— SF
‘g—sHV“


iste método se puede us—r ™on ™u—lquier ™l—si(™—dorD y los mismos —utores lo
in™orpor—ron —l AdPreqFr4SL @—d—pt—™ión dinámi™— de k-Dependence Bayesian
Classiers A ‘gqHT“F vos niveles de ™—m˜io d—n lug—r — distintos gr—dos de —jusE
te del modeloX un —viso impli™— l— —™tu—liz—™ión p—r—métri™— o de estru™tur—D


                                               IU
mientr—s que un drift supone un ™—m˜io en el modelo ™on un —umento en l—
™omplejid—d del modeloF


5.1.2. EDDM (Early Drift Detection Method)
v— propuest— de f—en—Eq—r™í— et —lF ‘fqdgep+ HT“ es simil—r —l método hhwD
pero en vez de ™ontrol—r l— t—s— de errorD monitoriz— l— distancia entre errores
de clasicación @número de inst—n™i—s ™orre™t—mente ™l—si(™—d—s de form—
™onse™utiv—AF
ƒe denot— pi adist—n™i— medi— entre dos errores y si adesvi—™ión típi™—F
ƒe de(nen pmax y smax ™omo v—lores máximos y se —™tu—liz—n ™u—ndo pi +2·si 
pmax + 2 · smax ™—d— vez que lleg—n nuevos d—tosF
il método ™omienz— — fun™ion—r después de que se h—y—n produ™ido QH errores
de ™l—si(™—™iónF iste es el mínimo número de v—lores ne™es—rios p—r— estim—r
l— distri˜u™ión de l—s dist—n™i—s entre errores y poder h—™er ™omp—r—™ionesF he
est— form— pmax + 2 · smax represent— el WS 7 de l— distri˜u™iónF
…s—ndo estos v—loresD se —just—n dos um˜r—les de ™ontrolX

      Aviso @warning AX (pi + 2 · si )/(pmax + 2 · smax )  α donde α = 0,95F v—s
      inst—n™i—s se v—n —lm—™en—ndo p—r— ser ™onsider—d—s por el —lgoritmo de
      —prendiz—je en el ™—so de d—rse por de(nitivo el ™—m˜io de ™on™eptoF
      Cambio denitivo @drift AX   (pi + 2 · si )/(pmax + 2 · smax )  β donde
      β = 0,90F ƒe re—prende un nuevo modelo us—ndo l—s inst—n™i—s que se h—n
      ido —lm—™en—ndo dur—nte el nivel de —viso previoF „—m˜ién se reini™i—n los
      v—lores de pmax y smax F

ƒi p—s—do el nivel de —viso se vuelve — l— norm—lid—d @esto esD l— fun™ión so˜re
l— dist—n™i— entre errores regres— — niveles inferiores —l límite de —visoAD se eliE
min—n l— se™uen™i— de inst—n™i—s —lm—™en—d— h—st— el momento y se ™ontinú—
eje™ut—ndo el métodoF
vos v—lores de α y β se (j—n —d ho™ tr—s re—liz—r diferentes experimentosF


5.1.3. Método de Kifer
il método de uifer et —lF ‘ufdqHR“ no solo tr—t— de dete™t—r el ™—m˜io de
™on™eptoD si no t—m˜ién de ™u—nti(™—rloD de m—ner— que se pued— des™ri˜ir l—
n—tur—lez— del mismoF €—r— elloD utiliz—n un— medid— de dist—n™i— entre dos
distri˜u™iones de d—tos P1 y P2 D de l—s que —l menos se dispondrá de n puntos
de ™—d— un— p—r— poder re—liz—r un— dete™™ión de ™—m˜ioF
ƒe present— un nuevo método @ver elgoritmo IAD que estim— l— distri˜u™ión de
pro˜—˜ilid—d de dos vent—n—s W1 e W2 so˜re l— se™uen™i— de d—tosD donde W1
es un— vent—n— de t—m—ño m1 ≥ n (j—d— en el inst—nte c0 D mientr—s que W2 es
un— vent—n— de t—m—ño m2 ≥ n que se despl—z—rá — lo l—rgo de l— se™uen™i—D
™omenz—ndo en c0 + m1 D de m—ner— que no se sol—pen l—s muestr—s entre —m˜—s
vent—n—sF gu—ndo l— dist—n™i— entre l— distri˜u™ión de d—tos de W1 y l— de W2


                                        IV
es m—yor que un ™ierto um˜r—l αD se est—˜le c0 —l inst—nte —™tu—lD se reini™i—liz—n
     l—s vent—n—s y se noti(™— que se h— produ™ido un ™—m˜io de ™on™epto en el
     inst—nte c0 F
     v— ele™™ión del p—rámetro α de(nirá el equili˜rio entre sensi˜ilid—d y ro˜ustez
     de l— dete™™iónD por lo que v—lores pequeños serán ™—p—™es de dete™t—r ™—m˜ios
     —˜ruptosD pero se tendrá más riesgo de dete™t—r f—lsos ™—m˜iosF v— fun™ión de
     dist—n™i— de˜e ser —de™u—d— p—r— ™u—nti(™—r el gr—do de ™—m˜io y de un— form—
     intuitiv—F in el —rtí™ulo ‘ufdqHR“ se pueden ™onsult—r l—s nuev—s propuest—s de
     medid—s de dist—n™i— entre dos distri˜u™iones de d—tosF

     Algorithm 1 wet—E—lgortimo de uifer p—r— dete™t—r ™—m˜ios de ™on™eptoF il
     uso de l— v—ri—˜le i permite eje™ut—r h—st— k —lgoritmos ™on diferentes p—rámeE
     tros de form— p—r—lel—F

 I   f o r i = 1...k do
 P       c0 ← 0
 Q       W indow1,i ← f i r s t m1,i p o i n t s from time c0
 R       W indow2,i ← next m2,i p o i n t s i n stre—m
 S   end f o r
 T   w h i l e not — t end o f stre—m do
 U       f o r i = 1...k do
 V           ƒ l i d e W indow2,i ˜y I p o i n t
 W           i f distance(W indow1,i , W indow2,i )  αi then
IH              c0 ← ™ u r r e n t time
II               ‚eport ™h—nge — t time c0
IP               g l e — r — l l windows —nd qy„y s t e p I
IQ           end i f
IR       end f o r
IS   end w h i l e



     5.1.4. ADWIN (Adaptive Windowing)
     eF fifet y ‚F q—v—ldà ‘fqHU“D que t—m˜ién h—˜í—n p—rti™ip—do en el des—rrollo de
     ihhwD present—n el método eh‡sxD que us— un— vent—n— desliz—nte W p—r—
     monitoriz—r l— t—s— de error del modelo y poder dete™t—r ™—m˜iosF e diferen™i—
     del método de uiferD expli™—do —nteriormenteD est— vent—n— solo ™ontiene v—lores
     ˜in—rios @—™ierto o f—llo en l— predi™™ión de ™—d— inst—n™i—A y —demás se modi(™—
     su t—m—ño de form— dinámi™—F wientr—s no h—y— ningún ™—m˜io de ™on™epto en
     l— distri˜u™ión de los d—tosD l— vent—n— ™re™e h—st— el momento en que se dete™te
     un ™—m˜ioD que disminuyeF
     v— ide— de l— dete™™ión ™onsiste enX ™u—ndo dos su˜vent—n—s su(™ientemente
     gr—ndes de W tienen medi—s su(™ientemente distint—sD se puede ™on™luir que
     los v—lores esper—dos de ™—d— su˜vent—n— se—n diferentesF vos v—lores su(™ienE
     temente se pre™is—rán ™u—ndo se es™oj— el test est—dísti™o y dependerá del nivel
     de ™on(—nz— δ ∈ (0, 1)F
     il test est—dísti™o utiliz—do p—r— ™omp—r—r l—s distri˜u™iones de l—s su˜vent—n—s
     W0 y W1 D ™omprue˜— si l— diferen™i— de l—s medi—s de —m˜—s su˜vent—n—s es
     m—yor — un determin—do um˜r—l cut @ver elgoritmo PAF


                                             IW
Algorithm 2 elgoritmo eh‡sx
I   s n i t i — l i z e ‡indow W
P   f o r e—™h t  0
Q       do W ← W ∪ xt @ i F e F D —dd xt t o t h e he—d o f ‡A
R           r e p e — t hrop e l e m e n t s from t h e t — i l o f W
S               u n t i l |ˆW0 − µW1 |  cut h o l d s
                            µ        ˆ
T                    f o r e v e r y s p l i t o f W i n t o W = W0 · W 1
U           output µW     ˆ



    il v—lor de   cut    p—r— un— p—rti™ión W0 · W1 de W se ™—l™ul— de l— siguiente
    form—X

         ƒe—n n0 y n1 l—s longitudes de W0 y W1 respe™tiv—menteF v— longitud de
         W es n = n0 + n1 F
         ƒe—n µW0 y µW1 l—s medi—s de los v—lores en W0 y W1 respe™tiv—menteF ‰
              ˆ     ˆ
         µW0 y µW1 sus v—lores esper—dosF
         €—r— g—r—ntiz—r el rendimiento del método de(nimosX

            ˆ m=             1
                        1/n0 +1/n1   @medi— —rmóni™— de n0 y n1 A
            ˆ δ =    δ
                     n    @p—r— evit—r pro˜lem—s ™on múltiples hipótesisA

         il um˜r—l se ™—l™urá ™omo          cut   =     1
                                                       2m   · ln δ F
                                                                 4



    ƒe puede ver un ejemplo del fun™ion—miento de este método en el gu—dro PF ƒi
    µt se m—ntiene ™onst—nte en W D l— pro˜—˜ilid—d de que se reduz™— l— vent—n— en
    el inst—nte t es ™omo mu™ho de δ D ™on lo que se limitan los falsos positivosF
    ƒuponiendo que p—r— —lgun— p—rti™ión de W en W0 y W1 D tenemos que |µW0 −
    µW1 |  2 · cut F inton™esD l— vent—n— W se redu™irá —l t—m—ño de W1 D o menorD
    ™on pro˜—˜ilid—d 1 − δ D por lo que se limitan así los falsos negativosF




                                                  PH
W0                 W1         µW0
                                   ˆ       µW1
                                           ˆ          |ˆW0 − µW1 |
                                                       µ     ˆ         m        cut    |ˆW0 − µW1 | ≥
                                                                                        µ     ˆ         cut
             [1] [01010110111111] 1/1 10/14              0.2857      0.9333   0.8617          No
            [10]  [1010110111111] 1/2 10/13              0.2692      1.7333   0.6323          No
           [101]   [010110111111] 2/3 9/12               0.0833        2.4    0.5374          No
          [1010]    [10110111111]  2/4 9/11              0.3181      2.9333   0.4861          No
         [10101]     [0110111111]  3/5 8/10                0.2       3.3333   0.4560          No
        [101010]      [110111111]  3/6 8/9               0.3888        3.6    0.4387          No
       [1010101]       [10111111]  4/7 7/8               0.3035      3.7333   0.4308          No
      [10101011]        [0111111]  5/8 6/7               0.2321      3.7333   0.4308          No
     [101010110]         [111111]  5/9 6/6               0.4444        3.6    0.4387          Sí
    [1010101101]          [11111]  6/10 5/5                0.4       3.3333   0.4560          No
   [10101011011]           [1111]  7/11 4/4              0.3636      2.9333   0.4861          No
  [101010110111]            [111]  8/12 3/3              0.3333        2.4    0.5374          No
 [1010101101111]             [11]  9/13 2/2              0.3076      1.7333   0.6323          No
[10101011011111]              [1] 10/14 1/1              0.2857      0.9333   0.8617          No
          gu—dro PX ijemplo del fun™ion—miento de eh‡sxF †ent—n— —™tu—lX W =
          [101010110111111]F δ = 1F el h—˜erse dete™t—do un ™—m˜ioD l— vent—n— disE
          minuirá su t—m—ño p—r— el próximo inst—nte de tiempoF


          il pro˜lem— de este método es que es ™omput—™ion—lmente ™ostoso porque tiene
          que ™ompro˜—r tod—s los posi˜les p—res de su˜vent—n—s de W F €—r— mejor—rloD
          los —utores present—ron un— nuev— versión ll—m—d— eh‡sxP más e(™iente en
          tiempo y memori—F


          ADWIN2 (Adaptive Windowing 2)
          €—r— redu™ir el ™oste ™omput—™ion—l de eh‡sxD en vez de m—ntener un— vent—n—
          W en memori—D tiene un— estru™tur— de d—tos ™ompuest— por ™u˜os @buckets A
          que —lm—™en—n v—lores ˜in—riosF g—d— ™u˜o de˜e ™ontener un— poten™i— de P de
          I9sF ƒe (j— un p—rámetro M ™omo el máximo número de ™u˜os ™on el mismo
          t—m—ñoD p—r— ™ontrol—r —sí l— ™—ntid—d de memori—F ƒe puede ver un ejemplo en
          el gu—dro QF




                                                 PI
ƒuponemos un— vent—n— de t—m—ño W = 14 ™on v—lores ˜in—rios @—™ierto y f—llo
de ™l—si(™—™iónA y est— serí— su estru™tur— en form— de ™u˜osX
    gu˜osX      IHIHIHI IHI II I I
  gontenidoX       R         P     P I I
  g—p—™id—dX       U         Q     P I I
vleg— un nuevo elementoX
    gu˜osX      IHIHIHI IHI II I I I
  gontenidoX       R         P     P I I I
  g—p—™id—dX       U         Q     P I I I
„eniendo en ™uent— que M = 2D es ne™es—rio ™omprimir dos de los tres últimos
™u˜osD y— que tienen el mismo ™ontenidoF
    gu˜osX      IHIHIHI IHI II II I
  gontenidoX       R         P     P    P I
  g—p—™id—dX       U         Q     P    P I
hespués de ™omprimir dos ™u˜osD nos en™ontr—mos de nuevo ™on que tenemos
tres ™u˜os ™on el mismo ™ontenidoD por lo que volvemos — ™omprimirF he est—
form— se est—rí—n form—ndo l—s su˜vent—n—sF
    gu˜osX      IHIHIHI IHIII II I
  gontenidoX       R          R      P I
  g—p—™id—dX       U          S      P I
ƒi se dete™t— un ™—m˜ioD se elimin— el ™u˜o más —ntiguoX
    gu˜osX      IHIII II I
  gontenidoX      R      P I
  g—p—™id—dX      S      P I

             gu—dro QX ijemplo de fun™ion—miento de eh‡sxP


v— e(™ien™i— —hor— es de O(M · log(W/M )) p—l—˜r—s de memori—D y el tiempo de
pro™es—miento por ™—d— ejemplo es O(log W ) en el peor ™—so y O(1) en el mejorF
y˜tiene l— ™—ntid—d de I9s de tod—s los ™u˜os en O(1)F gon ello el número de
su˜vent—n—s — ev—lu—r disminuye y se —pli™—n los tests más rápid—mente — l—s
se™uen™i—s en los ™u˜osF


5.2. Algoritmos con ventana de entrenamiento
il uso de vent—n—s permite limit—r el número de inst—n™i—s que se —prenden
simultáne—menteD —demásD sirven p—r— elimin—r —quellos d—tos que son de ™onE
™eptos —ntiguosF il pro™edimiento ˜ási™o de vent—n— desliz—nte que se us— en
minerí— de se™uen™i—s de d—tos se puede ver en el elgoritmo QF g—d— nuev—
inst—n™i— se —ñ—de — l— vent—n—D y ™u—ndo el ™l—si(™—dor se —™tu—liz— utiliz—
l—s inst—n™i—s de di™h— vent—n— p—r— el —prendiz—jeF il —spe™to ™l—ve de estos
—lgoritmos reside en ™ómo se de(ne este tipo de vent—n—sF
il enfoque más simple es us—r un— vent—n— de t—m—ño (jo e in™luir solo los
ejemplos más re™ientes de l— se™uen™i— de d—tos y dese™h—r por l— p—rte más
—ntigu—F ehor— ˜ienD se present— un ™ompromiso — l— hor— de es™oger el t—m—ño
de l— mism—F ƒi l— vent—n— es de pequeño t—m—ñoD el ™l—si(™—dor será ™—p—z
de —just—rse rápid—mente — los ™—m˜iosD pero perderá pre™isión en periodos de
est—˜ilid—dF il pro™eso de —prendiz—je se ˜—s— en po™os d—tos y por t—ntoD est—rá


                                       PP
sujeto — más os™il—™ionesF in ™—m˜ioD si se es™oge un t—m—ño gr—nde o™urrirá lo
    ™ontr—rioD el pro™eso de —prendiz—je es más inmune — ™—m˜ios menores o ruidoD
    pero por el ™ontr—rio tiene más iner™i—D por t—nto será más lento — l— hor— de
    —d—pt—rse — los ™—m˜iosF €or est— r—zónD se propusieron distintos métodos de
    —juste dinámi™o de l— —n™hur— de l— vent—n—F

    Algorithm 3 elgoritmo ˜ási™o ™on vent—n—
I   intr—d— X S X s e ™ u e n ™ i — de d — t o s
P                  W X vent—n— de e j e m p l o s
Q   ƒ — l i d — X C X ™ l — s i f i ™ — d o r ™ o n s t r u i d o ™on l o s d — t o s de W
R
S   i n i ™ i — l i z — r vent—n— W Y
T   p—r— t o d o s l o s e j e m p l o s xi en S X
U          W ← W ∪ xi Y
V           e l i m i n — r e j e m p l o s — n t i g u o s de W s i e s n e ™ e s — r i o Y
W           r e ™ o n s t r u i r o — ™ t u — l i z — r C us—ndo W Y



    5.2.1. Método de Klinkenberg
    il método de ulinken˜erg et —lF ‘u‚WV“ está orient—do — l— ™l—si(™—™ión de do™uE
    mentos por lotes @batch A en entornos ™—m˜i—ntes @™onsider— ™—m˜ios gr—du—les y
    —˜ruptosAD y fue uno de los primeros en monitoriz—r diversos indi™—doresD ™on™reE
    t—mente l— pre™isión @accuracy AD l— espe™i(™id—d @precision A y l— exh—ustivid—d
    @recall AF
    €—r— —just—r l— vent—n— de entren—miento en primer lug—r se ™—l™ul— l— medi— y
    l— desvi—™ión típi™— p—r— ™—d— uno de los indi™—dores @e™™ a e™™ur—™yD ‚e™ a
    ‚e™—ll y €re™ a €re™isionA en ˜—se — los M últimos lotesD y — ™ontinu—™ión se
    utiliz— l— siguiente heurísti™—X

          ƒi —lguno de los indi™—dores ex™ede de su medi— α ve™es su desvi—™ión
          típi™—D se di™e que se h— s—lido de su interv—lo de ™on(—nz— y h— o™urrido
          un ™—m˜ioF

          €—r— ™ono™er l— n—tur—lez— del ™—m˜io @˜rus™o o gr—du—lAD se ™omprue˜—
          si el indi™—dor en el inst—nte t h— experiment—do un— ™—íd— β del v—lor del
          mismo en el inst—nte t − 1

              ˆ ƒi el ™—m˜io es ˜rus™oD se redu™e l— vent—n— de entren—miento —l
                mínimo @B a I ˜—t™hAF
              ˆ ƒi el ™—m˜io es gr—du—lD se redu™e l— vent—n— en ˜—se — un p—rámetro
                γ de(nido — prioriF

    in el elgoritmo R se det—ll— en pseudo™ódigo l— heurísti™— emple—d—F ƒi h—
    o™urrido un ™—m˜io ˜rus™oD es de™irD se veri(™— l— primer— ™ondi™ión @líne—s P
    — RA y se redu™e l— vent—n— —l mínimo @I ˜—t™hAF in otro ™—soD si el ™—m˜io
    dete™t—do es gr—du—l @se ™umple l— segund— ™ondi™iónD que —˜—r™— l—s líne—s T —



                                                  PQ
VA l— vent—n— se redu™e —l t—m—ño γ · 100 %F he no dete™t—rse ningún ™—m˜ioD el
     t—m—ño de l— vent—n— ™re™e un lote másF

     Algorithm 4 reurísti™— de ulinken˜erg p—r— —just—r el t—m—ño de l— vent—n—
     de entren—mientoF
 I   €ro ™edure heterminexew‡indowƒize @ |Wt | D M D α D β D γ A
 P     i f ((Acct  AvgM (Acc) − α · StdErrM (Acc)) and (Acct  β · Acct−1 )) or
 Q         ((Rect  AvgM (Rec) − α · StdErrM (Rec)) and (Rect  β · Rect−1 )) or
 R         ((P rect  AvgM (P rec) − α · StdErrM (P rec)) and (P rect  β · P rect−1 ))
 S        then |Wt+1 | := |B| Y
 T     else i f (Acct  AvgM (Acc) − α · StdErrM (Acc) or
 U                (Rect  AvgM (Rec) − α · StdErrM (Rec) or
 V                (P rect  AvgM (P rec) − α · StdErrM (P rec)
 W        then |Wt+1 | := max(|B|, |Wt | − γ · |Wt |) Y
IH       else |Wt+1 | := |Wt | + |B| Y
II       return |Wt+1 | Y


     5.2.2. FISH (uniFied Instance Selection algoritHm)
        ¢
     sF lio˜—ité propuso un— nuev— f—mili— de —lgoritmos ll—m—d— psƒr ‘liIH—“D que
     us— simil—rid—des de tiempo y esp—™io entre inst—n™i—s p—r— —just—r dinámi™—E
     mente l— vent—n— de entren—mientoF €—r— expli™—rlo podemos ˜—s—rnos en el
     siguiente ejemplo ilustr—tivo de l— pigur— UF ƒe tr—t— de un pro˜lem— de ™l—siE
     (™—™ión ˜in—ri— @puntos ˜l—n™os y negrosA en el que l—s fuentes de gener—™ión
     de d—tos v—rí—n — lo l—rgo del tiempo de form— gr—du—l ™on l— rot—™ión de un
     hiperpl—noF €—r— un ™ierto áre— @™ir™unferen™i— roj—AD vemos que l— ™l—se ™orre™E
     t— en ™—d— inst—nte es diferenteF iste ejemplo muestr— que l— simil—rid—d en un
     dominio del pro˜lem— dinámi™o depende del tiempo y del esp—™ioF




     pigur— UX ijemplo de rot—™ión de hiperpl—noF szquierd—X fuente ini™i—l ƒIF gentroX
     fuente ƒP tr—s rot—r RSºF here™h—X fuente ƒQ tr—s rot—r WHºF


     v— —utor— propuso sele™™ion—r los ejemplos de l— vent—n— de entren—miento ˜—E
     sándose en un— medid— de dist—n™i— Dij que se de(ne de est— form—X



                                            PR
(s)      (t)
                              Dij = a1 dij + a2 dij

donde d(s) es l— dist—n™i— en el esp—™ioD d(t) l— dist—n™i— en el tiempo y a1 , a2
son los ™oe(™ientes de ponder—™iónF €—r— dos ejemplos xi , xj D l— —utor— propone
l— dist—n™i— eu™líde— ™omo dist—n™i— en el esp—™io y el número de ejemplos que
los sep—r—n ™omo dist—n™i— en el tiempoF were™e l— pen— dest—™—r que si a2 = 0D
l— medid— se ™onvierte en un— sele™™ión de inst—n™i—sD mientr—s que si a1 =
0D tenemos un— vent—n— ™uyos pesos disminuyen ™on el tiempoF ƒe es™ogerán
—quell—s inst—n™i—s ™on m—yor v—lor de dist—n™i— p—r— ™omponer l— vent—n— de
entr—mientoF
v— f—mili— de —lgoritmos está ™ompuest— porX

     psƒrIX el t—m—ño de l— vent—n— de entren—miento se (j— — prioriF

     psƒrPX el t—m—ño de l— vent—n— de entren—miento se —just— de form—
     dinámi™—D pero los pesos a1 , a2 se (j—n — prioriF

     psƒrQX idénti™o — psƒrPD s—lvo que los p—rámetros a1 , a2 se re™—l™ul—n
     dinámi™—mente — lo l—rgo del tiempoF




                                       PS
6. Aportaciones
in primer lug—r v—mos — de(nir el m—r™o de nuestro tr—˜—joF gomo hemos
™oment—do —nteriormenteD est—mos en un entorno in™rement—l @ver pigur— VAF in
™—d— inst—nte t tenemos un— se™uen™i— de d—tos etiquet—dos X H = (X1 , ..., Xt )D
™on l— que se ™onstruye un ™l—si(™—dor Lt F gu—ndo lleg— un— nuev— inst—n™i—
Xt+1 h—y que prede™ir su ™l—se yt+1 F
†—mos — tr—˜—j—r ™on se™uen™i—s de d—tos que in™luyen ™—m˜ios de ™on™eptoF
g—d— inst—n™i— Xt es gener—d— por un origen St F wientr—s este origen se m—ntenE
g— ™onst—nte diremos que el ™on™epto no h— ™—m˜i—doD pero ™u—ndo St = St+1 D
nuestro propósito es dete™t—r di™ho ™—m˜io en el inst—nte más próximo —l punto
en que se produjo en l— se™uen™i—F




 pigur— VX v—s inst—n™i—s de d—tos se pro™es—n de form— in™rement—l ‘liIH˜“F


€—r— nuestr—s diferentes propuest—sD nos hemos ˜—s—do en l— heurísti™— del métoE
do hhw de q—m— en el que se utiliz— l— herr—mient— Shewhart P-Chart —pli™—d—
so˜re distint—s ™u—lid—desF in primer lug—r se est—˜le™e un nivel de —viso @war-
ning A que ™u—ndo se —™tive v— — empez—r — —lm—™en—r inst—n™i—s en un— memori—
— ™orto pl—zoD —sí ™omo un nivel de ™—m˜io @drift AD que forz—rá — que se re—prend—
el ™l—si(™—dor ™on los ejemplos —lm—™en—dos en di™h— memori—F he est— m—ner—
se ™onsigue que —nte un ™—m˜io de ™on™eptoD el ™l—si(™—dor olvide inform—™ión
—nti™u—d— y —prend— ™on inst—n™i—s que pertene™en —l nuevo ™on™eptoF
e ™ontinu—™ión v—mos — present—r diferentes —ltern—tiv—s que hemos pl—nte—do
siguiendo estos supuestos de tr—˜—jo y de l—s que se llev—ron — ™—˜o su impleE
ment—™ión y experiment—™iónF


6.1. MoreErrorsMoving
€—r— nuestr— primer— propuest—D que hemos denomin—do woreirrorswovingD
se tr—t— de monitoriz—r los errores de ™l—si(™—™iónF €—r— ello ™ont—mos ™on un
históri™o Hi = {ei−n , . . . , ei } ™on los n últimos result—dos de ™l—si(™—™ión en el
inst—nte ti @ei = 0 en ™—so de —™iertoD ei = 1 en ™—so de f—lloAF †—mos — est—˜le™er
el siguiente supuestoX si se produ™e un ™—m˜io de ™on™eptoD el ™l—si(™—dor v— —
ver deterior—do su rendimiento y— que no será ™—p—z de ™l—si(™—r ™orre™t—mente
los nuevos d—tosF v— t—re— de dete™™ión que proponemos es ™ontrol—r el número


                                         PT
de errores de ™l—si(™—™ión que se v—n produ™iendo — lo l—rgo del tiempoD h—™iendo
uso del históri™o Hi F
            n
                ej
ƒe— ci = j=0 |ej ∈ Hi l— t—s— de error del históri™o en el inst—nte de tiempo
              n
ti F in ™—d— inst—nte de tiempoD se ™omprue˜— si ci−1  ci @se h— in™rement—do
el número de errores en el históri™oA y en este ™—so se di™e que h— o™urrido
un empeor—miento e in™rement—mos el ™ont—dor de empeor—mientosF in ™—so
™ontr—rioD si ci−1  ci D quiere de™ir que se h— redu™ido el número de errores en el
históri™oD por lo que se ™onsider—rá un— mejor— y se reini™i—liz— — H el ™ont—dor
de empeor—mientos ™onse™utivosF in el ™—so de que se m—nteng— el v—lor de cD
es de™irD si ci−1 = ci D el ™ont—dor de empeor—mientos se m—ntiene ™on el v—lor
—nterior que tuvieseF €odemos ver un— represent—™ión grá(™— de los v—lores que
tom— ci — lo l—rgo del tiempo en l— pigur— WF




       pigur— WX ‚epresent—™ión de l— t—s— de error del históri™o @naWAF


e™tu—mos según l— siguiente heurísti™—X

      ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE
      so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori—
      — ™orto pl—zoF @U W L = k A
      ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
      ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes
      ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori—
      — ™orto pl—zoF @U CL = k + dA
      in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
      m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— —
      ™orto pl—zoF @CL = 0A

…n ejemplo ilustr—tivo se puede ver en l— pigur— IH donde k = 2 y d = 2F


                                        PU
10
                                          memoria a                   drift
                                          corto plazo                 detectado
                      warning
                      activado
Empeoramientos




                                                                    UCL=k+d
                  5


                                                                     UWL=k


                  0                                                 CL=0
                             10   20     30             40    50
                                   Instancias

  pigur— IHX €Egh—rt p—r— woreirrorswovingF in l— inst—n™i— QVD se h— dete™t—do
  un ™—m˜io de ™on™epto porque se h— super—do el um˜r—l …gvF in l—s inst—nE
  ™i—s PH y SHD —l produ™irse un— mejor— del rendimiento se vuelve —l nivel de
  norm—lid—d y se reini™i—liz— el ™ont—dor de empeor—mientosF


  €—r— l— eje™u™ión de este método h—y que de(nir los v—lores de los p—rámetros
  nD k y d — prioriF


  6.2. MaxMoving
  …n— nuev— propuest—D denomin—d— w—xwovingD tr—t— de monitoriz—r l—s t—s—s de
  éxito del ™l—si(™—dorF istá ˜—s—d— en l— siguiente suposi™iónX mientr—s el origen
  del ™on™epto se m—nteng— ™onst—nteD el ™l—si(™—dor v— — mejor—r su pre™isión —
  lo l—rgo del tiempo @mientr—s sig— re™i˜iendo inst—n™i—sAD pero en el momento en
  que se produz™— un ™—m˜io @drift AD l—s t—s—s de éxito empez—rán — empeor—r y—
  que el modelo —™tu—l no prede™irá ™orre™t—mente l— ™l—se de l—s nuev—s inst—n™i—sF
  f—sándonos en estoD m—ntenemos un históri™o Hi = {ai−n , . . . , ai } ™on l—s n
  últim—s t—s—s de éxito —™umul—d—s desde el último ™—m˜ioF ƒe— ai = 1 − Nii l—e

  t—s— de éxito —™umul—d— h—st— el inst—nte ti D donde ei y Ni son el número de
  errores de ™l—si(™—™ión y el número de inst—n™i—s pro™es—d—s h—st— el inst—nte
  ti D respe™tiv—menteF ƒe— mi = m´x{aj |aj ∈ Hi } l— mejor t—s— de éxito del históE
                                     a
  ri™o en el inst—nte ti F wientr—s se estén ™l—si(™—ndo inst—n™i—sD ™ompro˜—mos si
  mi−1  mi D y si es —síD ™onsider—mos que se está mejor—ndo l— t—s— de éxito —™uE
  mul—d—F in ™—so ™ontr—rioD en el que el nuevo máximo es menor que el —nteriorD
  diremos que h— empeor—do e in™rement—mos un ™ont—dor de empeor—mientosF
  ƒi mi−1 = mi D es de™irD el máximo en el históri™o —nterior y el —™tu—l no h—
  ™—m˜ioD m—ntenemos el v—lor que y— tuviese el ™ont—dor de empeor—mientosF
  il uso del máximo so˜re el históri™o Hi de t—m—ño nD nos permite —mortigu—r
  l—s pequeñ—s os™il—™iones del tipo ai−1  ai  ai+1 D ™—so en el que l— t—s— de
  éxito ™omienz— — des™enderD pero luego remont— rápid—menteF ƒe puede ver un—
  represent—™ión grá(™— de los distintos v—lores que tom— mi — lo l—rgo del tiempo
  en l— pigur— IIF


                                         PV
Máximo del histórico de tasas de éxito




                            1.0
                            0.8
                            0.6
            Max. Accuracy
                            0.4
                            0.2
                            0.0




                                  0   10000             20000               30000      40000   50000
                                                                Instances




pigur— IIX ‚epresent—™ión de l—s mejores t—s—s de éxito —™umul—d—s en el hisE
tóri™o — lo l—rgo del tiempoF v—s ™—íd—s del rendimiento se de˜en — ™—m˜ios de
™on™eptoF


v— ™u—lid—d que v—mos — ™ontrol—r en el €Egh—rt es el número de empeor—mienE
tosD de m—ner— que pod—mos dete™t—r ™uándo el modelo y— no es —de™u—ndo
p—r— los d—tos que se están re™i˜iendo y es ne™es—rio re—prenderF gonsider—mos
l— siguiente heurísti™—X

     ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE
     so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori—
     — ™orto pl—zoF @U W L = k A
     ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
     ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes
     ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori—
     — ™orto pl—zoF @U CL = k + dA
     in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
     m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— —
     ™orto pl—zoF @CL = 0A

€—r— l— eje™u™ión del dete™tor w—xwoving es ne™es—rio est—˜le™er — priori los
v—lores de los p—rámetros n, k y dF


6.3. MovingAverage
„r—s re—liz—r diversos experimentos ™on los dos métodos —nterioresD nos dimos
™uent— de que se produ™í—n mu™hos f—lsos positivosD es de™irD se dete™t—˜—n ™—mE
˜ios inexistentes en l— se™uen™i— de d—tosF isto se de˜í— — que l—s dos fun™iones
monitoriz—d—s present—˜—n mu™h—s os™il—™iones @grá(™—s en dientes de sierr—A


                                                                PW
que en o™—siones er—n tom—d—s erróne—mente ™omo ™—m˜iosF €—r— intent—r p—E
li—r este defe™toD —pli™—mos el método est—dísti™o de l—s medi—s móviles @moving
average A que ™onsiste en ™re—r series de promedios d—do un ™onjunto de puntosF
in nuestro ™—soD queremos promedi—r l—s t—s—s de éxito us—ndo un— vent—n— de
su—viz—do de t—m—ño m p—r— que l— grá(™— presente un ™omport—miento ™on
menos os™il—™iones @ver ejemplo de l— pigur— IPAF

                                      Original                                                      Moving Average (100)
              100




                                                                                   100
              80




                                                                                   80
              60




                                                                                   60
   Accuracy




                                                                        Accuracy
              40




                                                                                   40
              20




                                                                                   20
              0




                                                                                   0



                    0      5000         10000      15000   20000                         0   5000         10000      15000   20000
                                       Instances                                                         Instances



                                  Moving Average (500)                                              Moving Average (1000)
              100




                                                                                   100
              80




                                                                                   80
              60




                                                                                   60
   Accuracy




                                                                        Accuracy
              40




                                                                                   40
              20




                                                                                   20
              0




                                                                                   0




                    0      5000         10000      15000   20000                         0   5000         10000      15000   20000
                                       Instances                                                         Instances




pigur— IPX v— primer— grá(™— @—rri˜— izquierd—A es l— origin—lD mientr—s que en
el resto se represent— en rojo l— medi— móvil simpleD ƒweD ™on su—viz—do de
maIHHD SHH y IHHHD respe™tiv—mente —pli™—do so˜re los v—lores de l— líne— gris
@origin—lAF


fási™—mente h—y dos tipos de medi—s móvilesX

  IF                Media móvil simple (SMA)X que se ™—l™ul— ™omo l— medi— —ritméti™— de
                    l—s últim—s m o˜serv—™ionesF st = m
                                                      1 m−1        xt +xt−1 +xt−2 +···+xt−(m−1)
                                                        n=0 xt−n =              m               =
                            xt −xt−m
                    st−1 +      m

  PF                Media móvil ponderada (WMA)X        se ™—l™ul— utiliz—ndo un ™onjunto
                    de m pesos @que en tot—l sum—n IA que se —pli™—n — ™—d— o˜serv—™iónF
                          m−1
                    st = n=0 wn xt−n = w0 xt + w1 xt−1 + · · · + wm−1 xt−(m−1)

in nuestro método solo hemos us—do el primer tipo @ƒweAD —unque p—r— un
tr—˜—jo futuro serí— interes—nte pro˜—r el segundo @‡weAD de m—ner— que se
—justen los pesos p—r— d—rle más import—n™i— — los o˜serv—™iones más re™ientesF



                                                                   QH
v—s o˜serv—™iones — promedi—r en nuestro método wovingever—ge v—n — ser l—s
             t—s—s de —™ierto —™umul—d—s de l—s m últim—s muestr—sF e l— hor— de dete™t—r
             ™—m˜ios hemos pl—nte—do dos heurísti™—s diferentes que tr—t—n de ™—r—™teriz—r
             dos tipos de ™—m˜ios en los d—tosX gr—du—les y —˜ruptosF v— primera heurística
             es —de™u—d— p—r— ™—m˜ios gr—du—lesD que ™onsider— que se h— produ™ido un
             empeor—miento si st  st−1 y fun™ion— de l— siguiente m—ner— @ver ejemplo en
             gu—dro RAX

                  ƒi dur—nte k ve™es ™onse™utiv—s h— empeor—do l— t—s— promedi—d—D —™tiv—E
                  mos el nivel de —viso @warning A y ™omenz—mos — —lm—™en—r l—s inst—n™i—s
                  re™i˜id—s en un— memori— — ™orto pl—zoF
                  ƒi se produ™en k+d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de
                  ™—m˜io @drift AF
                  in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE
                  m—lid—d y se elimin—n l—s inst—n™i—s de l— memori— — ™orto pl—zoF

                                                                     Instancias →

Predicción           0     1     0      0      1      1          1        0     0      0      0      0      0     1     1

Tasa de acierto     0/1   1/2   1/3    1/4    2/5    3/6     4/7         4/8   4/9    4/10   4/11   4/12   0/1   1/2   2/3

Media móvil          -     -    0.27   0.36   0.32   0.38    0.49       0.52   0.50   0.44   0.40   0.36    -     -    0.38

Empeoramientos       0     0     0      0      1      0          0        0     1      2      3      4      0     0     0

Nivel                N    N      N      N      N      N          N       N      N      W      W      D     N     N      N




             gu—dro RX ijemplo de fun™ion—miento de l— primer— heurísti™— del método woE
             vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF
             v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift
             dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il
             nivel de w—rning @‡A se —™tiv— ™u—ndo h—y k = 2 empeor—mientos ™onse™utivos
             y el de drift @hA ™u—ndo h—y R @d = 2AD en otro ™—so se en™uentr— en norm—lid—d
             @xAF

             in ™—so de tr—t—rse de ™—m˜ios ˜rus™os entre ™on™eptos muy distintosD l— t—s—
             de —™ierto no de™—e progresiv—menteD si no de form— drásti™—D por lo que ™on
             l— heurísti™— —nterior o˜tendrí—mos f—lsos neg—tivos —l no dete™t—rse medi—nte
             empeor—mientos su™esivosF €or elloD implement—mos un— segunda heurística
             ˜—s—d— en el s—lto o diferen™i— en los v—lores de l—s t—s—s de éxito p—r— poder
             dete™t—r est— ™—íd— de rendimiento @ver ejemplo en gu—dro SAF sgu—l que —ntesD se
             monitoriz— l— t—s— de —™ierto —™umul—d— promedi—d— de l—s m últim—s muestr—sD
             pero —demás m—ntenemos un históri™o de t—m—ño n ™on estos v—lores promediosF
             ehor—D p—r— ™—d— inst—nte de tiempo t:

                  ƒe o˜tiene smax ™omo el mejor v—lor del históri™oD —sí ™omo l— t—s— de
                  —™ierto promedi—d— —™tu—l st F
                  ƒi l— diferen™i— entre st y smax super— un ™ierto um˜r—l uD —™tiv—remos el
                  nivel de —viso @warning AF wientr—s que si super— un um˜r—l v D —™tiv—remos
                  el nivel de ™—m˜io @drift AF ƒe de˜e ™umplir que u  v F istos v—lores reE
                  present—n el por™ent—je de ™—íd— de rendimiento frente — smax y tom—rán
                  v—lores entre H y IF


                                                            QI
ƒi no se d— ninguno de estos dos ™—sosD se est—˜le™e el nivel de norm—lid—dF


                                                               Instancias →

Predicción              0     1     0      0      1      1      1      0       0      0      0      0     1     1

Tasa de acierto        0/1   1/2   1/3    1/4    2/5    3/6    4/7    4/8     4/9    4/10   4/11   0/1   1/2   2/3

Media móvil             -     -    0.27   0.36   0.32   0.38   0.49   0.52    0.50   0.44   0.40    -     -    0.38

Máx. media móvil        -     -     -      -     0.36   0.38   0.49   0.52    0.52   0.52   0.50    -     -     -

Diferencia              -     -     -      -     0.04    0      0      0      0.02   0.08   0.10    -     -     -

Nivel                  N     N      N      N      N      N      N      N       N      W      D     N     N      N




        gu—dro SX ijemplo de fun™ion—miento de l— segund— heurísti™— del método woE
        vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF
        v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift
        dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il
        históri™o ne™es—rio p—r— ™—l™ul—r el máximo está ™ompuesto por n = 3 últim—s
        medi—s móvilesF il nivel de w—rning @‡A se —™tiv— ™u—ndo l— diferen™i— es m—yor
        o igu—l que u = 5 % y el de drift @hA ™u—ndo es m—yor o igu—l que v = 10 %D en
        otro ™—so se en™uentr— en norm—lid—d @xAF


        pin—lmente ™om˜in—mos —m˜—s heurísti™—s en el método wovingever—ge p—r—
        poder dete™t—r ™u—lquier— de los dos ™—m˜ios men™ion—dosF €—r— ello se de˜e
        tener en ™uent— el sol—p—miento de los niveles de —viso y de ™—m˜io de ™—d— un—
        de l—s heurísti™—sF ƒe—n ω1 y ω2 los niveles de —visoD δ1 y δ2 los niveles de drift
        y η1 y η2 los niveles de norm—lid—d de l—s heurísti™—s I y P respe™tiv—menteF
        he(nimos pues los niveles de nuestr— heurística híbrida ™omoX

             IF xivel de norm—lid—dX ηH = η1 ∧ η2 ⇒!ω1 ∧!ω2 ∧!δ1 ∧!δ2 F

             PF xivel de —viso @warning AX ωH = ω1 ∨ ω2 F

             QF xivel de ™—m˜io @drift AX δH = δ1 ∨ δ2 F

        in el elgoritmo S se puede ver el pseudo™ódigo de este métodoF




                                                        QP
Algorithm 5 elgoritmo woving ever—ge rí˜rido
 I   δ1 a δ2 a ω1 a ω2 a pevƒi Y
 P   — ™ ™ u r — ™ y a I − e r r o r s G numsnst—n™es Y
 Q   window F —dd @ — ™ ™ u r — ™ y A Y GG remove o l d e s t i f window F s i z e m
 R   i f window F s i z e aa mX
 S           ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e a window F — v e r — g e @ A
 T
 U         GG −− ˜ e g i n f i r s t h e u r i s t i ™ −− GG
 V         i f ™urrente™™ur—™yever—ge ` previouse™™ur—™yever—ge X
 W              ™ o n s e ™ u t i v e h r o p s CCY GG worse
IH         else i f ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e b p r e v i o u s e ™ ™ u r — ™ y e v e r — g e X
II              ™ o n s e ™ u t i v e h r o p s a H Y GG ˜ e t t e r
IP         else X
IQ              ™ o n s e ™ u t i v e h r o p s a ™ o n s e ™ u t i v e h r o p s Y GG s—me
IR
IS         previouse™™ur—™yever—ge a ™urrente™™ur—™yever—ge Y
IT
IU         if ™ o n s e ™ u t i v e h r o p s b kCd X
IV             δ1 a „‚…iY
IW         else i f ™ o n s e ™ u t i v e h r o p s b k X
PH             ω1 a „‚…iY
PI         GG −− end o f f i r s t h e u r i s t i ™ −− GG
PP
PQ         h i s t o r y F —dd @ ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e A GG remove o l d e s t i f h i s t o r y F s i z e n
PR         i f h i s t o r y F s i z e aa n X
PS                 GG −− ˜ e g i n s e ™ o n d h e u r i s t i ™ −− GG
PT                 d i f f e r e n ™ e a h i s t o r y F m—x @ A − ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e Y
PU                 if differen™e b vX
PV                         δ2 a „‚…iY
PW                 else i f d i f f e r e n ™ e b u X
QH                         ω2 a „‚…iY
QI                 GG −− end s e ™ o n d h e u r i s t i ™ −− GG
QP
QQ         if     or δ2 X
                 δ1
QR              return h‚sp„ Y
QS         else i f ω1 or ω2 X
QT              return ‡e‚xsxqY
QU         else X
QV              return xy‚wevY


                el igu—l que en los métodos —nterioresD los v—lores de n, kD d, u y v h—y que
                (j—rlos — prioriF




                                                                QQ
7. MOA (Massive Online Analysis)
€—r— ev—lu—r nuestr—s propuest—s y re—liz—r un— ™omp—r—tiv— ™on —lgunos de los
métodos des™ritos —nteriormente se h— utiliz—do el entorno de des—rrollo wye
@w—ssive ynline en—lysisA ‘fuHW˜D fru€IH“F wye es un softw—re des—rroll—E
do en l— …niversid—d de ‡—ik—to @xuev— el—nd—A p—r— re—liz—r experimentos
de ™l—si(™—™ión y ™lustering ™on se™uen™i—s de d—tosF istá rel—™ion—do ™on el
proye™to ˜ien ™ono™ido ‡iue ‘fpr+ IH“ @de minerí— de d—tos tr—di™ion—lAF
„—m˜ién está implement—do en t—v— y tiene li™en™i— q€vF intre otr—s utiliE
d—desD propor™ion— muestr—s y se™uen™i—s de d—tos y— que ™ontiene un— ˜uen—
™ole™™ión de gener—dores de se™uen™i—s de d—tosF edemásD in™luye —lgoritmos de
™l—si(™—™ión y —grup—miento @™lusteringAD —sí ™omo v—rios métodos de ev—lu—E
™iónF in este —p—rt—do ex™lusiv—mente v—mos — det—ll—r l— p—rte de ™l—si(™—™ión
y de gener—doresD que son l—s que hemos us—do en l— se™™ión experiment—l del
tr—˜—joF


7.1. El entorno
v— form— de utiliz—r wye es medi—nte l— eje™u™ión de t—re—s @tasks AF ist—s t—E
re—s se pueden l—nz—r t—nto — tr—vés de un— interf—z grá(™—D ™omo por líne— de
™om—ndos y mu™h—s de ell—s se pueden en™—den—r @ver pigur— IQAF v—s t—re—s
prin™ip—les son de —prendiz—je y ev—lu—™iónD —unque h—y otr—s útiles ™omo geE
ner—r un— se™uen™i— de d—tos que —demás se puede gu—rd—r en e‚pp @form—to
utiliz—do por ‡iue muy ™omún en minerí— de d—tosAF




                    pigur— IQX plujo de tr—˜—jo en wye


v— interf—z grá(™— de wye permite utiliz—r los métodos de minerí— de d—tos
tr—di™ion—l @en modo ˜—t™hA de ‡iueF isto result— espe™i—lmente útil p—r—
™omp—r—r el —prendiz—je online ™on un —prendiz—je ˜—t™h ™omo referen™i—F edeE
másD nos permite l—nz—r v—ri—s t—re—s de form— simultáne— y ver l— evolu™ión
de ™—d— un—D pudiendo detener ™u—lquier— de ell—s en ™u—lquier momentoF in
l— pigur— IR podemos ver un ejemplo de l— vent—n— prin™ip—l de l— —pli™—™ión
dur—nte l— eje™u™ión de un— t—re— de ™l—si(™—™iónF




                                      QR
pigur— IRX †ent—n— prin™ip—l de wyeF ije™u™ión de un— t—re— de ev—lu—™ión
@€requenti—lA de un método de ™l—si(™—™ión @roe'ding„reeA ™on dete™™ión de
™—m˜io @ihhwA so˜re un— se™uen™i— de d—tos gener—d— por ƒieqener—torF in
l— p—rte superior se puede ver l— t—re— eje™ut—d— y en l— p—rte inferior l— s—lid—
de l— mism— — interv—los de IHHH inst—n™i—s @de(nido previ—menteAF


7.2. Generación de secuencias de datos
gomo y— indi™—mosD un— ™—r—™terísti™— muy útil de wye es l— posi˜ilid—d de
gener—r se™uen™i—s de d—tos — p—rtir de diversos gener—dores que in™orpor— por
defe™to y que list—mos — ™ontinu—™iónF

     STAGGER Concepts GeneratorX vos ™on™eptos de ƒ„eqqi‚ ‘ƒqVT“
     ™onform—n un estánd—r en l— ev—lu—™ión de ™l—si(™—dores en entornos ™on
     se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF il pl—nte—miento origin—l
     present— un— serie de ejemplos ™on tres —tri˜utosX

        ˆ color ∈ {green, blue, red}
        ˆ shape ∈ {triangle, circle, rectangle}
        ˆ size ∈ {small, medium, large}

     v— se™uen™i— de d—tos se divide en tres ™on™eptosX en los primeros RH
     ejemplosD el ™on™epto es color = red ∧ size = smallY en los siguientes RH


                                       QS
ejemplosD el ™on™epto es color = green shape = circleY por últimoD los
RH ejemplos (n—les se ™onstruyen ™on el ™on™epto size = medium size =
largeF istos ™on™eptos se pueden o˜serv—r de form— visu—l en l— pigur—
ISF ƒe h— us—do en ‘†xII“‘‡uWT“‘fr€+ HW“‘qwg‚HR“‘uwHU“F




  pigur— ISX †isu—liz—™ión de los ™on™eptos ƒ„eqqi‚ ‘uwHU“

SEA Concepts GeneratorX iste ™onjunto de d—tos —rti(™i—l present—E
do en ‘xuHI“ está ™ompuesto por ™u—tro ˜loques de d—tos ™on diferentes
™on™eptosF vos d—tos ™onst—n de tres —tri˜utos y un— ™l—se ˜in—ri—F v—
™l—si(™—™ión se re—liz— solo ™on dos —tri˜utosD mientr—s que el ter™ero es
irrelev—nteD siguiendo est— fun™iónX f1 + f2 ≤ θD donde f1 y f2 son los
dos primeros —tri˜utos y θ es un um˜r—l que se —just— p—r— ™—d— uno
de los ˜loques de d—tos siguiendo este orden {9, 8, 7, 9,5}F he est— forE
m—D l— se™uen™i— de d—tos se de(ne ™omo l— unión ™onse™utiv— de SEA9 D
SEA8 D SEA7 y SEA9,5 D donde ™—d— ™onjunto ™onst— de IPSHH inst—n™i—sD
present—ndo un ™—m˜io ˜rus™o entre ™—d— ™on™eptoF is posi˜le —demás inE
™orpor—r un por™ent—je de ruido por medio del p—rámetro nF ƒe h— us—do
en ‘fr€+ HW“‘uwHU“‘qƒ—‚HW“F
Random RBF GeneratorX in est— se™uen™i—D se gener— un número (jo
de ™entroides @™l—sesA de form— —le—tori— y — ™ontinu—™ión se ™re—n nuevos
ejemplos eligiendo ™u—lquier— de estos ™entroides de m—ner— que ™—ig—n
™er™— de los mismosF v— dist—n™i— —l ™entroide se o˜tiene de form— —le—tori—
de un— distri˜u™ión q—usi—n— ™uy— desvi—™ión típi™— viene determin—d—
por el ™entroideF ƒolo se utiliz—n —tri˜utos numéri™osF €—r—r introdu™ir un
™—m˜io de ™on™epto se despl—z—n los ™entroides en el esp—™io indi™—ndo el
número k de ™entroides — despl—z—r y l— velo™id—d s ™on l— que lo v—n —
h—™erF ƒe h— us—do en ‘fr€+ HW“F
LED GeneratorX      ist— se™uen™i— de d—tos ‘fpyƒVR“ ™onst— de PR —triE
˜utos ˜in—riosD IU de los ™u—les son irrelev—ntesF il o˜jetivo es prede™ir el
dígito mostr—do en un displ—y vih de U segmentos en el que ™—d— —tri˜uE
to tiene un IH 7 de posi˜ilid—des de est—r invertidoF ƒe puede in™luir un


                                  QT
™—m˜io de ™on™epto indi™—ndo el número d de —tri˜utos ™on ™—m˜iosF ƒe
            h— us—do en ‘†xII“‘fr€+ HW“F

            Waveform GeneratorX ist— se™uen™i— de d—tos —p—re™ió t—m˜ién en
            ‘fpyƒVR“F il o˜jetivo es diferen™i—r entre Q ™l—ses diferentes de ond—sD
            donde ™—d— un— de l—s ™u—les se h— gener—do por un— ™om˜in—™ión de
            P o Q ond—s ˜—sesF ixisten dos versiones de este pro˜lem—X w—vePI ™on
            PI —tri˜utos numéri™os ™on ruido y w—veRH ™on IW —tri˜utos extr— irreE
            lev—ntesF ixiste l— posi˜ilid—d de introdu™ir ™—m˜ios en un determin—do
            número d de —tri˜utos p—r— forz—r un ™—m˜io de ™on™eptoF ƒe h— us—do en
            ‘†xII“‘fr€+ HW“‘qƒ—‚HW“F

            Function Generator (Agrawal)X iste ™onjunto de fun™iones se presentó
            en ‘esƒWQ“ y h— sido us—do p—r— ™ompro˜—r l— es™—l—˜ilid—d en —lgoritmos
            de —prendiz—je ™on ár˜oles de de™isiónF v— se™uen™i— de d—tos se puede
            gener—r en ˜—se — IH fun™iones diferentes ™on W —tri˜utos des™ritos en el
            gu—dro T @T numéri™os y Q ™—tegóri™osA y un— ™l—se ˜in—ri—D de m—ner—
            que simul— un— hipotéti™— —pli™—™ión de ™on™esión de prést—mos ˜—n™—E
            riosF eunque es un— ˜uen— form— de gener—r se™uen™i—s ™on ™—m˜ios de
            ™on™eptos de˜ido — l— v—ried—d de sus fun™ionesD en l— ˜i˜liogr—fí— de deE
            te™™ión de drifts solo hemos en™ontr—do que se h— us—do en ‘fr€+ HW“F

Atributo       Descripción                                    Valores
  salary        Sueldo                                Entre 20000 y 150000
commision     Comisión        Si salary ≥ 75000 ⇒ comission = 0, en otro caso, entre 10000 y 75000
    age          Edad                                     Entre 20 y 80
  elevel   Nivel educativo                           Entre 0 y 4 (categórico)
    car    Marca del coche                          Entre 1 y 20 (categórico)
 zipcode    Código postal                            Entre 1 y 9 (categórico)
  hvalue Valor de la vivienda       Entre 0.5k100000 y 1.5k100000 donde k depende de zipcode
  hyears Edad de la vivienda                               Entre 1 y 30
   loan   Valor del préstamo                            Entre 0 y 500000
                     gu—dro TX hes™rip™ión de los —tri˜utos de egr—w—l

            Rotating HyperplaneX v—s se™uen™i—s de d—tos gener—d—s por medio de
            un hiperpl—no rot—torio se us—ron ini™i—lmente en ‘rƒhHI“F …n hiperpl—no
            en un esp—™io dEdimension—l es el ™onjunto de puntos en x que s—tisf—™e
               d                  d
               i=1 wi xi = w0 =   i=1 wi donde xi es l— iEésim— ™oorden—d— de xF vos
            ejemplos m—yores o igu—les que w0 son etiquet—dos ™omo positivosD y el
            resto ™omo neg—tivosF €—r— introdu™ir un ™—m˜ioD ˜—st—rá ™on ™—m˜i—r el
            peso de un —tri˜uto wi = wi + dσ D donde d es el ™—m˜io que se —pli™— y
            σ l— pro˜—˜ilid—d de que se produz™— di™ho ™—m˜ioF vos hiperpl—nos son
            útiles p—r— simul—r ™—m˜ios de ™on™eptosD porque permiten modi(™—r l—
            orient—™ión y l— posi™ión del hiperpl—no de un— m—ner— su—ve —just—ndo
            el peso de ™—d— —tri˜utoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘fqHU“F

      in l— pigur— IT se puede o˜serv—r l— interf—z de wye p—r— gener—r se™uen™i—s
      de d—tos y —lm—™en—rl—s en (™heros e‚ppF


                                               QU
pigur— ITX snterf—z p—r— gener—r un— se™uen™i— de IHHH d—tos us—ndo el gener—dor
ƒ„eqqi‚F


ƒi nuestro propósito es disponer de se™uen™i—s ™on ™—m˜io de ™on™eptoD un —sE
pe™to interes—nte es l— posi˜ilid—d de in™orpor—r ™—m˜ios ™ontrol—dos1 F €—r— ello
se pueden utiliz—r los gener—dores ™oment—dos —nteriormente y ™om˜in—rlos meE
di—nte un— fun™ión sigmoide @ver pigur— IUA que determin— el ™—m˜io de un
origen de d—tos — otroF gomo p—rámetros de l— fun™ión podemos de(nir el moE
mento t0 en el que su™ede el ™—m˜ioD —sí ™omo —just—r l— ˜rusqued—d ™on l— que
se produ™e por medio de αD o ˜ienD l— longitud del mismo us—ndo W F hur—nte
este interv—lo se v—n — mez™l—r en l— se™uen™i— de d—tos inst—n™i—s de —m˜os
™on™eptosF ytr— posi˜ilid—d es gener—r v—ri—s se™uen™i—s de d—tos de form— inE
dependiente y luego junt—rl—s de form— ™onse™utiv— en un— sol— se™uen™i—F
    1 De cara a la experimentación es fundamental saber cuántos cambios, en qué momento y
el tiempo de cambio producido en la secuencia de datos, para luego llevar a cabo evaluaciones
y comparaciones entre métodos.




                                             QV
pigur— IUX pun™ión sigmoide f (t) = 1/(1 + e−s(t−t0 ) ) F gu—nto m—yor se— αD
menor será W y el ™—m˜io será más ˜rus™oF‘fuHW—“


7.3. Métodos de clasicación
vos prin™ip—les métodos de ™l—si(™—™ión online que se en™uentr—n y— impleE
ment—dos en wye sonX x—ive f—yesD x—ive f—yes wultinomi—l ‘wxWV“D heE
™ision ƒtumpD roe'ding „ree ‘rƒhHI“D roe'ding yption „ree ‘€ruHU“D f—gE
ging ‘yz—HS“D foosting ‘yz—HS“D f—gging using eh‡sx ‘fqHU“D f—gging using
ed—ptiveEƒize roe'ding „rees ‘fr€+ HW“D €er™eptronD ƒqhX ƒto™h—sti™ qr—dient
hes™entD €eg—sos ‘ƒƒƒƒgHU“D €er™eptron ƒt—™king of ‚estri™ted roe'ding „rees
‘fpr€IH“ y vever—ging f—gging ‘fr€IH“F edemás de estosD t—m˜ién nos perE
mite in™orpor—r los —lgoritmos desde ‡iue —sí ™omo ™om˜in—r ™u—lquier— de
ellos ™on un método de dete™™ión de ™—m˜ioF


7.4. Métodos de evaluación
7.4.1. Holdout
in el —prendiz—je en ˜—t™hD lo h—˜itu—l es utiliz—r v—lid—™ión ™ruz—d—D pero ™omo
y— se h— indi™—do en l— ƒe™™ión QFR es invi—˜le us—r este método p—r— el —prendiE
z—je por se™uen™i—s de d—tos y— que se vuelve muy ™ostosoF €or elloD en ‘fuHW—“
propusieron us—r el método holdout que us— un ™onjunto de entren—miento y
otro de testF
in wye podemos de(nir ™—d— ™uánto se ev—lú— el modelo entren—doF €—r—
se™uen™i—s de d—tos sin ™—m˜io de ™on™eptoD podemos us—r siempre el mismo
™onjunto de testD pero en ™—so de que se— un— se™uen™i— ™on drift es ne™es—rio
que el ™onjunto de test se —™tu—li™e ™on el tiempo y— que si no podrí—mos est—r
ev—lu—ndo ™on inst—n™i—s que pertene™en — un— distri˜u™ión de d—tos distint— —
l— entren—d—F v— implement—™ión de wye solo ™ontempl— —™tu—lmente el uso
de ™onjuntos de test estáti™osD por lo que no es indi™—do p—r— ev—lu—r se™uen™i—s
™on ™—m˜iosF


                                       QW
7.4.2. Interleaved Test-Then-Train (o Prequential)
ytro método diferente ™onsiste en ev—lu—r el modelo ™on ™—d— nuev— inst—n™i—
y luego us—rlo p—r— el entren—mientoF ist— té™ni™— se puede us—r t—nto p—r—
se™uen™i—s de d—tos ™on ™—m˜ios y sin ™—m˜ios de ™on™eptoF il in™onveniente de
este método es que —l ™omienzo de l— ev—lu—™ión es pro˜—˜le que o˜teng—mos
peores result—dos de˜ido — que el modelo no está tod—ví— ˜ien entren—doF in l—
pigur— IV podemos ver un ejemplo de un— vent—n— de ™on(gur—™ión de wye
p—r— est—˜le™er l— ev—lu—™iónF
ƒegún el estudio re—liz—do por q—m— et —lF ‘qƒ—‚HW“ este método es más indi™—do
p—r— se™uen™i—s de d—tosF




pigur— IVX †ent—n— de ™on(gur—™ión p—r— un— t—re— de ev—lu—™iónF il método de
—prendiz—je es roe'ding„ree ™on dete™™ión de ™—m˜io ihhwF v— se™uen™i— de
d—tos de IHHFHHH inst—n™i—s se gener— medi—nte ƒie qener—torF v— ev—lu—™ión
se re—liz— en un entorno prequenti—l y se v—n — mostr—r l—s t—s—s de éxito —™uE
mul—d—s ™—d— IFHHH inst—n™i—s pro™es—d—sF …n ejemplo de l— s—lid— por p—nt—ll—
de l— eje™u™ión puede verse en l— pigur— IRF




                                      RH
8. Experimentación
€—r— ™ompro˜—r l— e(™—™i— de los métodos propuestosD hemos re—liz—do un— expeE
riment—™ión so˜re diferentes se™uen™i—s de d—tosF gomo el propósito es ev—lu—r
los diferentes métodos de dete™™ión de ™—m˜iosD se h—n prep—r—do se™uen™i—s
t—nto ™on ™—m˜ios ˜rus™os ™omo ™on ™—m˜ios gr—du—lesD —demás de v—ri—s seE
™uen™i—s ™on d—tos re—les disponi˜les en httpXGGmo—F™sFw—ik—toF—™FnzGd—t—setsG
y que se h—n utiliz—do en l— liter—tur—F
v— ev—lu—™ión se h— re—liz—do medi—nte l— estr—tegi— prequenti—lD en l— que se
™l—si(™—n y luego se entren—n ™—d— un— de l—s inst—n™i—s de l— se™uen™i— ™onforme
se v—n re™i˜iendoF €—r— poder h—™er un— ™omp—r—tiv— entre los distintos métoE
dosD se h— (j—do ™omo —lgoritmo de ™l—si(™—™ión el x—ivef—yes y se h— ™—l™ul—do
el e…gD áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s desde el prin™ipio de
l— eje™u™iónF ytros d—tos ™—l™ul—dos h—n sido el número de ™—m˜ios dete™t—dos
™orre™t—mente e in™orre™t—mente @f—lsos positivos y f—lsos neg—tivosAD —sí ™omo
l— dist—n™i— medid— en número de inst—n™i—s desde que s—˜emos que se produ™e
el ™—m˜io de ™on™epto h—st— que (n—lmente se dete™t—F in el ™—so de l—s se™uenE
™i—s de d—tos re—lesD no podemos ™—l™ul—r est— dist—n™i—D y— que des™ono™emos
™uántos ™—m˜ios present—n y ™uándo se produ™enF


8.1. Conjuntos de datos reales
Electricity Market (ELEC)
iste es uno de los ™onjuntos de d—tos re—les más utiliz—dos en dete™™ión de
driftsF ƒe tr—t— de un— se™uen™i— de d—tos (nit— ™ompuest— por RSFQIP inst—n™i—sD
donde ™—d— muestr— represent— un periodo de QH minutos ™on v—lores de l—
ofert— y dem—nd— de l— energí— elé™tri™— de un— ™iud—d eustr—li—n—D donde los
pre™ios v—rí—n según l— dem—nd—F il v—lor de l— ™l—se se re(ere — l— v—ri—™ión
del pre™io ™on respe™to — l— medi— de l—s últim—s PR hor—sF ƒe h— us—do en
‘fr€+ HW“‘qwg‚HR“‘fqHU“‘fqdgep+ HT“‘uwHU“F


Forest Covertype (Forest)
iste ™onjunto de d—tos ™ontiene v—lores so˜re el tipo de suelo forest—l en regiones
de ist—dos …nidosF istá ™ompuesto por SVIFHIP inst—n™i—s ™on SR —tri˜utos y U
™l—sesF ƒe h— us—do en ‘†xII“‘fr€+ HW“F


Poker-Hand (Poker)
iste ™onjunto está ™ompuesto por IFHPSFHIH inst—n™i—sD donde ™—d— muestr—
represent— un— m—no de S ™—rt—s es™ogid—s de un— ˜—r—j— ™on SP ™—rt—sF g—d—
™—rt— se des™ri˜e ™on dos —tri˜utos @p—lo y v—lorAD por lo que en tot—l h—˜rá IH
—tri˜utosF v— ™l—se des™ri˜e l— m—no de póker y ™onst— de IH posi˜les v—loresF
r—y que tener en ™uent— que el orden de l—s ™—rt—s es import—nteF ƒe h— us—do
en ‘fqHU“ ‘fr€+ HW“F €—r— nuestr— experiment—™ión hemos utiliz—do l— versión
norm—liz—d— disponi˜le en l— we˜ de wyeD de m—ner— que no import— el orden


                                        RI
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos
Minería de secuencias de datos

Más contenido relacionado

Destacado

Minería de secuencias de datos
Minería de secuencias de datosMinería de secuencias de datos
Minería de secuencias de datosManuel Martín
 
Artificial Intelligence for Automating Data Analysis
Artificial Intelligence for Automating Data AnalysisArtificial Intelligence for Automating Data Analysis
Artificial Intelligence for Automating Data AnalysisManuel Martín
 
Quick presentation for the OpenML workshop in Eindhoven 2014
Quick presentation for the OpenML workshop in Eindhoven 2014Quick presentation for the OpenML workshop in Eindhoven 2014
Quick presentation for the OpenML workshop in Eindhoven 2014Manuel Martín
 
2012-07-03 Fisser Voogt Bom IFIP Taaltreffers
2012-07-03 Fisser Voogt Bom IFIP Taaltreffers2012-07-03 Fisser Voogt Bom IFIP Taaltreffers
2012-07-03 Fisser Voogt Bom IFIP TaaltreffersPetra Fisser
 
From sensor readings to prediction: on the process of developing practical so...
From sensor readings to prediction: on the process of developing practical so...From sensor readings to prediction: on the process of developing practical so...
From sensor readings to prediction: on the process of developing practical so...Manuel Martín
 

Destacado (6)

Minería de secuencias de datos
Minería de secuencias de datosMinería de secuencias de datos
Minería de secuencias de datos
 
Artificial Intelligence for Automating Data Analysis
Artificial Intelligence for Automating Data AnalysisArtificial Intelligence for Automating Data Analysis
Artificial Intelligence for Automating Data Analysis
 
Quick presentation for the OpenML workshop in Eindhoven 2014
Quick presentation for the OpenML workshop in Eindhoven 2014Quick presentation for the OpenML workshop in Eindhoven 2014
Quick presentation for the OpenML workshop in Eindhoven 2014
 
Decompiladores
DecompiladoresDecompiladores
Decompiladores
 
2012-07-03 Fisser Voogt Bom IFIP Taaltreffers
2012-07-03 Fisser Voogt Bom IFIP Taaltreffers2012-07-03 Fisser Voogt Bom IFIP Taaltreffers
2012-07-03 Fisser Voogt Bom IFIP Taaltreffers
 
From sensor readings to prediction: on the process of developing practical so...
From sensor readings to prediction: on the process of developing practical so...From sensor readings to prediction: on the process of developing practical so...
From sensor readings to prediction: on the process of developing practical so...
 

Más de Manuel Martín

Automatizando el aprendizaje basado en datos
Automatizando el aprendizaje basado en datosAutomatizando el aprendizaje basado en datos
Automatizando el aprendizaje basado en datosManuel Martín
 
Modelling Multi-Component Predictive Systems as Petri Nets
Modelling Multi-Component Predictive Systems as Petri NetsModelling Multi-Component Predictive Systems as Petri Nets
Modelling Multi-Component Predictive Systems as Petri NetsManuel Martín
 
Brand engagement with mobile gamification apps from a developer perspective
Brand engagement with mobile gamification apps from a developer perspectiveBrand engagement with mobile gamification apps from a developer perspective
Brand engagement with mobile gamification apps from a developer perspectiveManuel Martín
 
Effects of change propagation resulting from adaptive preprocessing in multic...
Effects of change propagation resulting from adaptive preprocessing in multic...Effects of change propagation resulting from adaptive preprocessing in multic...
Effects of change propagation resulting from adaptive preprocessing in multic...Manuel Martín
 
Improving transport timetables usability for mobile devices
Improving transport timetables usability for mobile devicesImproving transport timetables usability for mobile devices
Improving transport timetables usability for mobile devicesManuel Martín
 
Automating Machine Learning - Is it feasible?
Automating Machine Learning - Is it feasible?Automating Machine Learning - Is it feasible?
Automating Machine Learning - Is it feasible?Manuel Martín
 
Towards Automatic Composition of Multicomponent Predictive Systems
Towards Automatic Composition of Multicomponent Predictive SystemsTowards Automatic Composition of Multicomponent Predictive Systems
Towards Automatic Composition of Multicomponent Predictive SystemsManuel Martín
 
Online Detection of Shutdown Periods in Chemical Plants: A Case Study
Online Detection of Shutdown Periods in Chemical Plants: A Case StudyOnline Detection of Shutdown Periods in Chemical Plants: A Case Study
Online Detection of Shutdown Periods in Chemical Plants: A Case StudyManuel Martín
 
Handling concept drift in data stream mining
Handling concept drift in data stream miningHandling concept drift in data stream mining
Handling concept drift in data stream miningManuel Martín
 
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de AndalucíaAndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de AndalucíaManuel Martín
 
Presentacion Taller de Introducción a Linux SFD2010
Presentacion Taller de Introducción a Linux SFD2010Presentacion Taller de Introducción a Linux SFD2010
Presentacion Taller de Introducción a Linux SFD2010Manuel Martín
 
Presentación Gnome 3.0 en Granada
Presentación Gnome 3.0 en GranadaPresentación Gnome 3.0 en Granada
Presentación Gnome 3.0 en GranadaManuel Martín
 
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de AndalucíaAndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de AndalucíaManuel Martín
 
Pintando gráficas con Python
Pintando gráficas con PythonPintando gráficas con Python
Pintando gráficas con PythonManuel Martín
 
Charla de Introducción a Git
Charla de Introducción a GitCharla de Introducción a Git
Charla de Introducción a GitManuel Martín
 
Taller de introducción a Google App Engine
Taller de introducción a Google App EngineTaller de introducción a Google App Engine
Taller de introducción a Google App EngineManuel Martín
 
Presentación AndalucíaPeople en las BYMC6
Presentación AndalucíaPeople en las BYMC6Presentación AndalucíaPeople en las BYMC6
Presentación AndalucíaPeople en las BYMC6Manuel Martín
 
Taller de introducción al sistema operativo GNU/Linux
Taller de introducción al sistema operativo GNU/LinuxTaller de introducción al sistema operativo GNU/Linux
Taller de introducción al sistema operativo GNU/LinuxManuel Martín
 

Más de Manuel Martín (20)

Hogar (Des)Conectado
Hogar (Des)ConectadoHogar (Des)Conectado
Hogar (Des)Conectado
 
Automatizando el aprendizaje basado en datos
Automatizando el aprendizaje basado en datosAutomatizando el aprendizaje basado en datos
Automatizando el aprendizaje basado en datos
 
Modelling Multi-Component Predictive Systems as Petri Nets
Modelling Multi-Component Predictive Systems as Petri NetsModelling Multi-Component Predictive Systems as Petri Nets
Modelling Multi-Component Predictive Systems as Petri Nets
 
Brand engagement with mobile gamification apps from a developer perspective
Brand engagement with mobile gamification apps from a developer perspectiveBrand engagement with mobile gamification apps from a developer perspective
Brand engagement with mobile gamification apps from a developer perspective
 
Effects of change propagation resulting from adaptive preprocessing in multic...
Effects of change propagation resulting from adaptive preprocessing in multic...Effects of change propagation resulting from adaptive preprocessing in multic...
Effects of change propagation resulting from adaptive preprocessing in multic...
 
Improving transport timetables usability for mobile devices
Improving transport timetables usability for mobile devicesImproving transport timetables usability for mobile devices
Improving transport timetables usability for mobile devices
 
Automating Machine Learning - Is it feasible?
Automating Machine Learning - Is it feasible?Automating Machine Learning - Is it feasible?
Automating Machine Learning - Is it feasible?
 
Towards Automatic Composition of Multicomponent Predictive Systems
Towards Automatic Composition of Multicomponent Predictive SystemsTowards Automatic Composition of Multicomponent Predictive Systems
Towards Automatic Composition of Multicomponent Predictive Systems
 
Online Detection of Shutdown Periods in Chemical Plants: A Case Study
Online Detection of Shutdown Periods in Chemical Plants: A Case StudyOnline Detection of Shutdown Periods in Chemical Plants: A Case Study
Online Detection of Shutdown Periods in Chemical Plants: A Case Study
 
Handling concept drift in data stream mining
Handling concept drift in data stream miningHandling concept drift in data stream mining
Handling concept drift in data stream mining
 
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de AndalucíaAndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
 
Presentacion Taller de Introducción a Linux SFD2010
Presentacion Taller de Introducción a Linux SFD2010Presentacion Taller de Introducción a Linux SFD2010
Presentacion Taller de Introducción a Linux SFD2010
 
Presentación Gnome 3.0 en Granada
Presentación Gnome 3.0 en GranadaPresentación Gnome 3.0 en Granada
Presentación Gnome 3.0 en Granada
 
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de AndalucíaAndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
AndalucíaPeople: Un sistema de recomendación para sitios de ocio de Andalucía
 
Pintando gráficas con Python
Pintando gráficas con PythonPintando gráficas con Python
Pintando gráficas con Python
 
Charla de Introducción a Git
Charla de Introducción a GitCharla de Introducción a Git
Charla de Introducción a Git
 
Taller de introducción a Google App Engine
Taller de introducción a Google App EngineTaller de introducción a Google App Engine
Taller de introducción a Google App Engine
 
Presentación AndalucíaPeople en las BYMC6
Presentación AndalucíaPeople en las BYMC6Presentación AndalucíaPeople en las BYMC6
Presentación AndalucíaPeople en las BYMC6
 
Web 2.0 y Empresa 2.0
Web 2.0 y Empresa 2.0Web 2.0 y Empresa 2.0
Web 2.0 y Empresa 2.0
 
Taller de introducción al sistema operativo GNU/Linux
Taller de introducción al sistema operativo GNU/LinuxTaller de introducción al sistema operativo GNU/Linux
Taller de introducción al sistema operativo GNU/Linux
 

Minería de secuencias de datos

  • 1. Minería de secuencias de datos Autor: Manuel Martín Salvador 9 de diciembre de 2011 „utoresX vuis wF de g—mpos y ƒilvi— e™id I
  • 2. P
  • 3. Índice 1. Introducción 5 2. Los datos 5 PFIF ƒe™uen™i—s de d—tos F F F F F F F F F F F F F F F F F F F F F F F F F F S PFPF g—m˜ios de ™on™epto F F F F F F F F F F F F F F F F F F F F F F F F F T 3. Algoritmos de clasicación de secuencias de datos 8 QFIF eprendiz—je online F F F F F F F F F F F F F F F F F F F F F F F F F F V QFPF we™—nismos de olvido F F F F F F F F F F F F F F F F F F F F F F F F W QFQF „—xonomí— de métodos de —prendiz—je F F F F F F F F F F F F F F F IH QFRF iv—lu—™ión del pro™eso de —prendiz—je F F F F F F F F F F F F F F F II 4. Aplicaciones 14 5. Revisión de métodos de aprendizaje con disparadores 15 SFIF elgoritmos ™on dete™™ión de ™—m˜io F F F F F F F F F F F F F F F F IS SFIFIF hhw @hrift hete™tion wethodA F F F F F F F F F F F F F F F IS SFIFPF ihhw @i—rly hrift hete™tion wethodA F F F F F F F F F F IV SFIFQF wétodo de uifer F F F F F F F F F F F F F F F F F F F F F F F IV SFIFRF eh‡sx @ed—ptive ‡indowingA F F F F F F F F F F F F F F F IW SFPF elgoritmos ™on vent—n— de entren—miento F F F F F F F F F F F F F PP SFPFIF wétodo de ulinken˜erg F F F F F F F F F F F F F F F F F F F PQ SFPFPF psƒr @unipied snst—n™e ƒele™tion —lgoritrmA F F F F F F F PR 6. Aportaciones 26 TFIF woreirrorswoving F F F F F F F F F F F F F F F F F F F F F F F F F F PT TFPF w—xwoving F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PV TFQF wovingever—ge F F F F F F F F F F F F F F F F F F F F F F F F F F F F PW 7. MOA (Massive Online Analysis) 34 UFIF il entorno F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QR UFPF qener—™ión de se™uen™i—s de d—tos F F F F F F F F F F F F F F F F F QS UFQF wétodos de ™l—si(™—™ión F F F F F F F F F F F F F F F F F F F F F F F QW UFRF wétodos de ev—lu—™ión F F F F F F F F F F F F F F F F F F F F F F F F QW UFRFIF roldout F F F F F F F F F F F F F F F F F F F F F F F F F F F F QW UFRFPF snterle—ved „estE„henE„r—in @o €requenti—lA F F F F F F F F RH Q
  • 4. 8. Experimentación 41 VFIF gonjuntos de d—tos re—les F F F F F F F F F F F F F F F F F F F F F F RI VFPF f—terí— de prue˜—s F F F F F F F F F F F F F F F F F F F F F F F F F F RP VFQF ‚esult—dos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RQ 9. Conclusión y trabajo futuro 57 10.Bibliografía 59 R
  • 5. 1. Introducción in este tr—˜—jo v—mos — tr—t—r el pro˜lem— del —prendiz—je —utomáti™o so˜re se™uen™i—s de d—tosF in un entorno ™lási™o se dispone de un— ˜—se de d—tos ™omplet— y estáti™—D y el o˜jetivo es —prender un modelo que represente lo más (elmente posi˜le di™hos d—tosF in ™—m˜ioD ™u—ndo en lug—r de disponer de todos los d—tos —l tiempoD estos v—n lleg—ndo de t—nto en t—ntoD en un— se™uen™i— de d—tosD — priori de longitud in(nit—D tenemos que —˜ord—r el pro˜lem— del —prenE diz—je de diferente m—ner—F il pro˜lem— diverge —ún más ™u—ndo l— distri˜u™ión de los d—tos que se v— re™i˜iendo v—rí— — lo l—rgo del tiempo y por t—nto se h—™e ne™es—rio —just—r el modelo dur—nte todo el pro™esoF €or elloD en primer lug—r será ne™es—rio ™on™ret—r este ™on™epto de d—tos que ™onstituye l— entr—d— — un nuevo sistem— de —prendiz—je que se des™ri˜e en l— ƒe™™ión PF e ™ontinu—™iónD se est—˜le™en los requerimientos de ™u—lquier —lgoE ritmo de ™l—si(™—™ión so˜re se™uen™i—s de d—tos y l— estru™tur— gener—l de ™ómo se —˜ord— este pro˜lem— en l— liter—tur— @ƒe™™ión QAF v— minerí— de se™uen™i—s de d—tos tiene un gr—n ™—mpo de —pli™—™ión ™omo se muestr— en l— ƒe™™ión RF entes de expli™—r nuestr—s propuest—s en l— ƒe™™ión TD se h—™e un— revisión de los tr—˜—jos más dest—™—dos en l— dete™™ión de ™—m˜ios de ™on™epto @ƒe™™ión SAF €—r— l— p—rte experiment—l h— sido ne™es—rio est—˜le™er un m—r™o de tr—˜—jo que puede ser referen™i— p—r— futur—s experiment—™iones y se h— utiliz—do p—r— re—liz—r el estudio ™omp—r—tivo de los diferentes métodos sele™™ion—dos @ƒe™™ión VAF „odo ello h— sido des—rroll—do dentro un entorno softw—re que tr—˜—j— so˜re ™l—si(™—™ión ™on se™uen™i—s de d—tosD que se expli™—rá en l— ƒe™™ión UF pin—lE menteD de l— p—rte experiment—l se extr—en ™on™lusiones y se est—˜le™en nuevos o˜jetivos p—r— tr—˜—jos futuros en l— ƒe™™ión WF 2. Los datos 2.1. Secuencias de datos h—do un pro˜lem— de un dominio determin—doD un— se™uen™i— de d—tos @data stream A está ™ompuest— por un— serie de inst—n™i—s que lleg—n —l sistem— — dis™reE ™iónD de un— en un— o en p—quetes de t—m—ño regul—r o v—ri—˜leF v—s inst—n™i—s que ™omponen l—s se™uen™i—s de d—tos en un pro˜lem— orient—do — l— ™l—si(™—E ™iónD suelen est—r form—d—s por un ™onjunto de v—ri—˜les o˜serv—d—s x1 , ..., xn y un— ™l—se y F in prin™ipio est—s se™uen™i—s tienen un t—m—ño ilimit—do y —demás es posi˜le que el pro˜lem— presente ™—m˜ios en l— distri˜u™ión su˜y—™ente — lo l—rgo del tiempo que se re)ejen en l— se™uen™i—D por lo que no se pueden us—r los enfoques tr—di™ion—les de minerí— de d—tosF il entorno de tr—˜—jo ne™es—rio p—r— oper—r ™on se™uen™i—s de d—tos de˜e ™umplir ™iert—s restri™™iones ‘frzIH“X IF xo se pueden —lm—™en—r todos los d—tos en memori—F ƒolo se permite registr—r un— pequeñ— ™—ntid—d de inst—n™i—sD mientr—s que el resto se v—n elimin—ndo un— vez pro™es—d—sF PF v— velo™id—d ™on l— que se re™i˜en los d—tos impli™— que el pro™es—miento de˜e h—™erse en tiempo re—lF S
  • 6. QF v— distri˜u™ión de los d—tos puede v—ri—r en el tiempoD de m—ner— que los d—tos —ntiguos se vuelven irrelev—ntes p—r— l— et—p— —™tu—lF v— restri™™ión I impli™— limit—r el t—m—ño de l— memori— utiliz—d— dur—nte el —prendiz—jeD mientr—s que l— P limit— el tiempo de pro™es—miento de ™—d— muesE tr—F in —quellos entornos en los que l—s se™uen™i—s de d—tos se—n evolutiv—s @presenten ™—m˜iosAD h—y que tener en ™uent— l— restri™™ión Q en el pro™eso de —prendiz—je e in™orpor—r métodos de dete™™ión de ™—m˜ios que permit—n evoluE ™ion—r el modeloF 2.2. Cambios de concepto h—do un pro˜lem— de un dominio determin—doD se denomin— ™—m˜io de ™on™epto @concept drift A — l— situ—™ión que se produ™e ™u—ndo los d—tos de un— se™uen™i— p—s—n de tener un— distri˜u™ión de pro˜—˜ilid—d S1 — otr— distri˜u™ión S2 D donde S1 y S2 son de orígenes diferentes @ver pigur— IAF iste tipo de se™uen™i—s de d—tos se suelen denomin—r evolutiv—s o dinámi™—sD frente — l—s estáti™—sD que no present—n ™—m˜ios de ™on™eptoF pigur— IX ‚epresent—™ión visu—l de un ™—m˜io de ™on™epto gr—du—l — lo l—rgo del tiempo ‘liIH—“ v— n—tur—lez— del ™—m˜io de ™on™epto es imprede™i˜leD por lo que no se tr—t— de ™—m˜ios ™on periodi™id—d ™ono™id—D si no que l— suposi™ión prin™ip—l ™u—ndo se —˜ord— este pro˜lem— es l— in™ertidum˜re so˜re el futuroF il ™—m˜io de ™on™epto se puede d—r por tres ™—us—s ‘ureWW“X IF g—m˜io en l—s pro˜—˜ilid—des — priori de l—s ™l—ses P (c1 ), . . . , P (ck ) PF g—m˜io en l—s distri˜u™iones de pro˜—˜ilid—d ™ondi™ion—d—s P (X|ci )D i = 1, . . . , k T
  • 7. QF g—m˜io en l—s pro˜—˜ilid—des — posteriori P (ci |X)D i = 1, . . . , k gomo ejemplos de ™—m˜io de ™on™epto se pueden ™onsider—r los ™orreos ˜—sur— @spam AD que intent—n v—ri—r su ™ontenido p—r— s—lt—rse los (ltros de ™orreoD o l— evolu™ión de l— s—lud de un p—™iente —l in™luir un nuevo medi™—mentoF ƒe pueden en™ontr—r en l— liter—tur— ‘frzIH“ h—st— seis tipos de ™—m˜ios so˜re un— v—ri—˜le — lo l—rgo del tiempoD t—l y ™omo se puede o˜serv—r en l— pigur— PF v— primer— grá(™— @Sudden A muestr— un ™—m˜io —˜ruptoD en el que ™—m˜i— el v—lor de l— ™l—se de form— inst—ntáne—F v—s siguientes grá(™—s muestr—n ™—m˜ios que se produ™en más lent—menteF v— diferen™i— entre in™rement—l y gr—du—l r—E di™— en si ™—m˜i—n los v—lores de l—s v—ri—˜les o ˜ien l— distri˜u™ión de l— ™l—seD —unque h—˜itu—lmente se us—n ™omo sinónimosF in l— (l— de —˜—jo tenemos l— primer— grá(™— @Recurring A ™on un ™—m˜io tempor—l y que vuelve — su est—do norm—l tr—s un interv—lo de tiempoF v— siguiente grá(™— @Blip A represent— un evento ex™ep™ion—l y no de˜e tr—t—rse ™omo un ™—m˜io de ™on™eptoF v— últim— grá(™— @Noise A muestr— ™—m˜ios —le—toriosD — los que ll—m—remos ruido y t—mE po™o de˜en ™onsider—rse ™omo un ™—m˜io en l— distri˜u™iónF in l— liter—tur— lo más fre™uente es en™ontr—rse ™on tr—˜—jos que ™onsider—n t—n solo los ™—m˜ios —˜ruptosD gr—du—les o in™rement—lesFF pigur— PX „ipos de ™—m˜ios U
  • 8. 3. Algoritmos de clasicación de secuencias de datos vos ™l—si(™—dores de se™uen™i—s de d—tos de˜en ser ™—p—™es de —prender de los d—tos de form— in™rement—l en vez de por lotes @batch A y re—™™ion—r —nte los ™—m˜ios de ™on™eptoF em˜os requisitos se ™onsiguen —pli™—ndo aprendizaje online y mecanismos para olvidar los d—tos que y— no son relev—ntesF 3.1. Aprendizaje online il —prendiz—je onlineD t—m˜ién ll—m—do —prendiz—je in™rement—lD se ™entr— en el pro™es—miento de inst—n™i—s de form— se™uen™i—l tr—t—ndo de que el ™l—si(™—dor entren—do se— t—n pre™iso ™omo si se hu˜iese entren—do ™on todo el ™onjunto de d—tos — l— vez @en batch AF …n ˜uen —lgoritmo de —prendiz—je online de˜erí— tener est—s ™u—lid—des ‘frzIH“X IF sn™rement—lX el —lgoritmo de˜e ser ™—p—z de leer y pro™es—r d—tos — lo l—rgo del tiempo sin tener que disponer de todos los d—tos desde el prin™ipioF PF „r—t—r ™—d— inst—n™i— en un— p—s—d—X el —lgoritmo solo puede re—liz—r un— le™tur— so˜re los d—tos y luego li˜er—r el esp—™ioF QF vimit—™ión de tiempo y memori—X ™—d— vez que se pro™ese un ejemplo de˜e h—™erse en el menor tiempo posi˜le y l— ™—ntid—d de memori— ne™es—ri— p—r— el pro™es—miento de˜e ser ™onst—nteF RF il —lgoritmo de˜e propor™ion—r un modelo ™ompleto en ™u—lquier inst—nte de tiempoF in un ™—so ide—lD el ™l—si(™—dor entren—do in™rement—lmente h—st— un inst—nte t de˜e ser equiv—lente —l mismo entren—do de form— tr—di™ion—l ™on tod—s l—s inst—n™i—s disponi˜les h—st— el inst—nte tF €—r— s—tisf—™er est—s restri™™iones de po™os d—tos — l— vez y disponi˜ilid—d del modelo en ™u—lquier inst—nteD se suelen —pli™—r té™ni™—s de resumen — los d—E tos t—les ™omo sliding windows @vent—n—s desliz—ntesAD sampling @muestreoA o sketching @es˜ozoAD —lgun—s de l—s ™u—les se ™onsider—rán en este tr—˜—joF v—s prin™ip—les diferen™i—s entre el pro™eso de ™l—si(™—™ión ™on todos los d—tos en un modo tr—di™ion—l y un pro™eso de ™l—si(™—™ión p—r— se™uen™i—s de d—tos se pueden ver — modo de resumen en el gu—dro IF Tradicional Secuencial xúmero de p—s—d—s wúltiple …n— „iempo de pro™es—miento slimit—do ‚estringido …so de memori— slimit—do ‚estringido „ipo de result—do €re™iso eproxim—do gon™epto istáti™o ivolutivo gu—dro IX gomp—r—tiv— de minerí— de d—tos tr—di™ion—l frente — l— minerí— de se™uen™i—s de d—tos ‘qqHU“ V
  • 9. in gener—lD el pro™eso de —prendiz—je puede verse ™omo en l— pigur— QF pigur— QX €ro™eso de —prendiz—je in™rement—l en el inst—nte t ‘liIH˜“F 3.2. Mecanismos de olvido sn™orpor—r me™—nismos de olvido es un —spe™to que tiene espe™i—l interés en se™uen™i—s evolutiv—sD y— que existe un modelo —ntes y otro distinto después de dete™t—rse el ™—m˜ioF €or t—ntoD un ™l—si(™—dor de˜e ser ™—p—z de re—™™ion—r —nte un ™—m˜io de ™on™epto y olvid—r —quello que y— no se— relev—nteD ™omo los d—tos que son de ™on™eptos —ntiguosF il prin™ip—l pro˜lem— es ™ómo s—˜er qué de˜e olvid—rF v— solu™ión más sen™ill— es ir olvid—ndo p—ul—tin—mente los d—tos —ntiguos y us—r un— ventana ™on los ejemplos más re™ientes p—r— entren—r el ™l—si(™—dorF isto permite —demás m—ntener redu™ido el número de inst—n™i—s ne™es—ri—s p—r— el entren—mientoF iste primer enfoque de vent—n—s de t—m—ño ™onst—nte en los d—tos más re™ientesD present— un ™ompromiso entre est—˜ilid—d y )exi˜ilid—dD y— que si l— vent—n— es dem—si—do pequeñ— re—™™ion—rá rápido — los ™—m˜iosD pero — l— vez ˜—j—rá l— pre™isión porque está entren—ndo ™on po™os d—tosF in ™—m˜ioD si l— vent—n— es muy gr—ndeD el ™l—si(™—dor será más est—˜le pero t—rd—rá más en dete™t—r los ™—m˜ios ‘uunHV“F ytro enfoque ™onsiste en —just—r el t—m—ño de l— vent—n— de —prendiz—je ™u—ndo se dete™te un ™—m˜io de ™on™epto p—r— tr—t—r de en™ontr—r un equili˜rio entre pre™isión y )exi˜ilid—dF istos métodos fun™ion—n mejor ™u—ndo h—y ™—m˜ios ˜rus™osF …n enfoque —ltern—tivo ™onsiste en ponder—r l—s muestr—s ™on un peso que irá disminuyendo — lo l—rgo del tiempo p—r— v—ri—r l— in)uen™i— de l—s mism—s dur—nte el pro™esoF iste enfoque se denomin— fading factor @f—™tor de olvidoAF W
  • 10. €—r— nuestros métodos v—mos — us—r vent—n—s de t—m—ño (jo y— que nos f—™ilit—n l— interpret—˜ilid—d de los result—dosF 3.3. Taxonomía de métodos de aprendizaje e ™ontinu—™ión present—mos un— posi˜le ™l—si(™—™ión de métodos de —prendiz—je de se™uen™i—s de d—tos evolutiv—sD propuest— en ‘liIH˜“F IF Algoritmos de aprendizaje con disparadores (Learner with triggers)X dependen de un— señ—l que indi™— que es ne™es—rio —™tu—liz—r el modeloF a A Detección de cambio (Change detectors) X son los más fre™uentes en l— ˜i˜liogr—fí—F istos métodos fun™ion—n mejor en entornos ™on ™—mE ˜ios ˜rus™os en los que se suele re™onstruir el modelo por ™ompleto en vez de —™tu—liz—rloF vo más ™omún es monitoriz—r los d—tosD los p—rámetros del ™l—si(™—dor o l— s—lid— del —lgoritmo de —prendiz—jeF ‘ƒƒHVD qwg‚HRD fqdgep+ HT“ in el supuesto de que l—s se™uen™i—s de d—tos se—n estáti™—s @sin ™—m˜iosAD l—s té™ni™—s de dete™™ión de ™—m˜ios t—m˜ién pueden ser utiliz—d—s p—r— dete™t—r diferen™i—s signi(™—tiv—s respe™to —l modelo que se está entren—ndo y se tr—t—rí— de ™omplet—r el —nterior p—r— lleg—r — un modelo mejor —just—doF b A Ventana de entrenamiento (Training windows) X estos métodos se ˜—s—n en heurísti™—s p—r— —just—r el t—m—ño de l— vent—n— de entreE n—mientoF ‘‡uWTD rƒhHID fwHV“ c A Muestreo adaptativo (Adaptive sampling) X ˜—sándose en l— rel—E ™ión entre l— inst—n™i— de prue˜— y unos prototipos prede(nidos o ˜ien el históri™o de inst—n™i—s entren—d—sD se sele™™ion— un ™onjunto de entren—miento —de™u—doF ‘‰‡HVD €ruHV“ PF Algoritmos de aprendizaje evolutivos (Evolving learners)X estos méE todos —™tu—liz—n el modelo de form— gr—du—l y no requieren de un dete™tor de ™—m˜ios de ™on™eptoF a A Conjuntos adaptativos (Adaptive ensembles) X son los más popul—E resD y ˜ási™—mente ™om˜in—n l— s—lid— de distintos ™l—si(™—dores del ™onjunto p—r— d—r un— de™isión (n—lF ‘uwHUD ƒt—HQD xuHI“ b A Ponderación de instancias (Instance weighting) X estos —lgoritmos no ™om˜in—n regl—s de de™isiónD sino que l— —d—pt—˜ilid—d se ™onsigue modi(™—ndo el ™onjunto de entren—mientoF …tiliz— ide—s de boostingD d—ndo más import—n™i— — —quell—s inst—n™i—s m—l ™l—si(™—d—sF ‘uoyHHD ƒHVD gHR“ c A Espacio de características (Feature space) X estos métodosD próE ximos — l— sele™™ión de ™—r—™terísti™—sD ™onsiguen l— —d—pt—˜ilid—d sele™™ion—ndo de form— dinámi™— l—s ™—r—™terísti™—s emple—d—s p—r— l— ™l—si(™—™iónF ‘porHTD ‡qgHTD eerHV“ d A Dependientes del modelo (Base model specic) X estos métodos se —d—pt—n modi(™—ndo los p—rámetros del modelo que estén us—ndoF ‘xnpwHUD ureWWD ƒvƒWW“ IH
  • 11. 3.4. Evaluación del proceso de aprendizaje ƒegún v—rios —utores ‘qƒ—‚HW“D h—y tres —spe™tos import—ntes — tener en ™uent— — l— hor— de ev—lu—r —lgoritmos de —prendiz—je de se™uen™i—s de d—tosX Espacio o™up—do en memori— — lo l—rgo del pro™eso de —prendiz—jeF Tiempo de pro™es—miento de un— muestr— @esto puede limit—r l— fre™uenE ™i— de re™ep™ión de los d—tosAF €oder de generalizaciónX efe™tivid—d del modelo —l represent—r el ™onE ™epto su˜y—™ente de los d—tosF xosotros nos v—mos — o™up—r úni™—mente de ev—lu—r y ™omp—r—r —lgoritmos por el último ™riterioD según su efe™tivid—d dur—nte l— ™l—si(™—™iónF ƒin em˜—rgo —unque no tr—t—mos de minimiz—r ™onsumo de memori—D ni tiempo de pro™eE s—mientoD sí se respet—n los requerimientos de —prendiz—je onlineD de un— sol— p—s—d— so˜re los d—tos y que l—s muestr—s no se —™umul—n tod—s en memori—F xuestro propósito por t—nto esD ev—lu—r —lgoritmos propios y —jenos por l— efe™E tivid—d del modelo —prendidoD p—r— poder est—˜le™er ™omp—r—™iones y r—nkings de los mismos y extr—er ™on™lusiones so˜re los modelos —prendidosF vos métodos de ev—lu—™ión de —lgoritmos de —prendiz—je en ˜—t™hD —prenden so˜re un ™onjunto de entren—miento @training A y utiliz—˜—n un ™onjunto de test independiente so˜re los que estim—r l— pro˜—˜ilid—d de error holdoutF in el ™—so de no disponerse de —m˜osD se estim— l— pro˜—˜ilid—d de error del modelo o˜teE nido — p—rtir del ™onjunto de tr—ining medi—nte té™ni™—s de v—lid—™ión ™ruz—d— y sus v—ri—ntes @leaving-one-out A o bootstrapF ƒin em˜—rgoD en el ™ontexto de seE ™uen™i—s donde los d—tos son poten™i—lmente in(nitosD l— v—lid—™ión ™ruz—d— y l—s estr—tegi—s de muestreo no son —pli™—˜lesF edemásD el he™ho de que los ™on™eptos de l—s se™uen™i—s de d—tos pued—n ™—m˜i—r en el tiempo tiene impli™—™iones en l—s té™ni™—s de ev—lu—™iónF ƒe ne™esit—n por t—nto nuev—s estr—tegi—s de ev—lu—™iónF il prin™ip—l pro˜lem— ™onsiste en monitoriz—r l— evolu™ión del pro™eso de —prendiz—jeF xos en™ontr—mos ™on dos —ltern—tiv—sX IF HoldoutX ™omo en su homólogo en ˜—t™hD se tr—t— de un ™onjunto de test que se —pli™— —l modeloD pero en este ™—so extr—ído — interv—los regul—resD p—r— estim—r l—s t—s—s de errorD lo que es —de™u—do p—r— se™uen™i—s dináE mi™—sF r—y que (j—r fre™uen™i— y —n™hur— del ™onjunto de test so˜re l— se™uen™i—F ƒe tr—t— de un estim—dor no sesg—doD pues —l moverse — lo l—rgo de l— se™uen™i— no d— lug—r — so˜re—justeF PF PrequentialX t—m˜ién ™ono™ido ™omo test-then-train ‘fuHW—“F il término prequenti—l proviene de €redi™tive ƒequenti—l ‘h—wVR“F il error del modelo n se estim— so˜re l— se™uen™i— de d—tosX S = i=1 L(yi , yi ) donde L es ˆ l— fun™ión de pérdid— tr—s h—˜er predi™ho l— ™l—se de form— ™orre™t— o in™orre™t—F ƒe ™ono™e que este estim—dor es pesimist—D es de™irD en l—s mism—s ™ondi™ionesD l— estr—tegi— holdout v— — d—r mejores v—loresF il error estim—do ™on prequenti—l v— — est—r in)uen™i—do por los errores que se h—y—n podido ™ometer —l prin™ipio de l— se™uen™i— de d—tosF €or elloD se h—n us—do me™—nismos de olvido t—les ™omoX II
  • 12. a A Ventanas temporales (time window): en lug—r de m—ntener un ™ál™ulo de l—s t—s—s de éxito —™umul—do desde el ini™io de l— se™uen™i—D se re—liz— est— estim—™ión p—r™i—l so˜re un— vent—n— de t—m—ño k D (jo @— (j—r — prioriAD que se v— despl—z—ndoF iste me™—nismo ™onverge más rápid—mente —l método holdoutF b A Factores de olvido (fading factor): se introdu™e un f—™tor de olvido α p—r— que l— in)uen™i— de ™—d— error en l— estim—™ión v—y— de™—yendo ™onforme —ument— l— dist—n™i—F he est— m—ner—D podemos ™—l™ul—r el L +α·S error prequenti—l ™omo Ei = Bi = nii+α·Bi−1 donde S1 = L1 y ni S i i−1 es el número de ejemplos us—dos p—r— ™—l™ul—r Li F in el ™—so de que α = 1 impli™— que no h—y olvidoF iste me™—nismo tiene l— vent—j— de que requiere po™— memori—D y— que solo requiere —lm—™en—r el v—lor —nterior y el —™tu—lD frente —l uso de vent—n—s donde se tienen que —lm—™en—r k v—lores de pérdid—F em˜os me™—nismos están muy rel—™ion—dosD y por ende sus p—rámetrosF esíD p—r— v—lores ˜—jos de k y de αD l—s estim—™iones he™h—s son más — ™orto pl—zo y ™omo ™onse™uen™i— l—s os™il—™iones de l—s estim—™iones son m—yoresF €or otro l—doD p—r— v—lores —ltos de k @m—yor vent—n—A y de α @™er™—nos — IAD v—n — intervenir más d—tos en l—s estim—™iones de los erroresF in nuestr— experiment—™ión hemos us—do l— estim—™ión prequenti—l y— que es l— más extendid—D de˜ido — que no se ex™luye ningún d—to en el entren—mientoD y se ev—lú— puntu—lmente ™on ™—d— muestr— de l— se™uen™i—D por lo que se o˜tiene de un estim—dor no sesg—doF e l— hor— de ™omp—r—r el rendimiento que present—n dos —lgoritmos @e y fA frente — l— mism— se™uen™i— de d—tos podemos us—r el est—dísti™o Qi (A, B) = 1−S A log 1−Si D donde Si y Si son los v—lores de l— fun™ión de pérdid— —™umuE B A B i l—dos de ™—d— —lgoritmoF il v—lor de Qi es útil p—r— ™ompro˜—r l—s diferen™i—s entre —m˜os —lgoritmosD de m—ner— que si el —lgoritmo e present— un mejor ™omport—miento que el fD v—mos — o˜tener v—lores positivosD mientr—s que en ™—so ™ontr—rio o˜tendremos v—lores neg—tivosD y si son igu—les será ™eroF il pro˜lem— de est—s medid—s es que evolu™ion—n — lo l—rgo del tiempo y es posi˜le que visu—lmente no pod—mos re™ono™er qué método es mejor que otro y— que uno se puede ™omport—r mejor en un— p—rte de l— se™uen™i—D mientr—s que otro lo h—g— en otr— o™—siónF €or elloD p—r— d—r un v—lor (n—l en nuestr— experiment—™ión hemos us—do ™omo medid— el áre— ˜—jo l— ™urv— @e…gA de los v—lores o˜tenidos ™on l— estr—tegi— prequenti—l desde el ini™io de l— se™uen™i— h—st— que (n—liz—F he est— m—ner—D si tenemos dos —lgoritmos @e y fAD de(nimos N AU CA = i=0 ni · (1 − Ei ) donde ni es el número de ejemplos us—dos p—r— A ™—l™ul—r Ei y N el número de v—lores de Ei disponi˜les @ídem p—r— fAF hiremos A A que e es mejor que f si AU CA AU CB F ytro —spe™to interes—nte — ev—lu—r en el ™—so de que tr—˜—jemos ™on se™uen™i—s sintéti™—s ™on ™—m˜ios de ™on™eptos ™ono™idos es el número de drifts ™orre™t—E mente dete™t—dosD los f—lsos positivosD los f—lsos neg—tivosD —sí ™omo l— dist—n™i— tr—ns™urrid— desde que se produ™e un ™—m˜io h—st— que se dete™t—F il ™ál™ulo de est— dist—n™i— v— — ser diferente dependiendo del tipo de ™—m˜io que presente l— IP
  • 13. se™uen™i—D y— que h—y que tener en ™uent— que los ™—m˜ios gr—du—les se produ™en — lo l—rgo de un— vent—n— donde se entremez™l—n muestr—s de —m˜os ™on™eptosF v— dist—n™i— se ™—l™ul— entre el punto de drift re—l y el drift dete™t—do más ™er™—no — élF in ™—so de h—˜er más de un drift dete™t—doD se ™—l™ul— l— dist—n™i— del primero y el resto se ™onsider—n f—lsos positivosF ƒi el ™—m˜io es gr—du—lD el punto de ™—m˜io re—l ™onsider—mos que ™orresponde ™on l— ™ot— inferior del interv—lo de ™—m˜ioF ƒe puede ver un ejemplo en l— pigur— RF Cambios Abruptos Cambios Graduales 0 10 20 30 40 50 0 10 20 30 40 50 Instancias Instancias pigur— RX in l— grá(™— de l— izquierd— s—˜emos que h—y P ™—m˜ios —˜ruptos en PH y RH @líne—s roj—s ™ontínu—sAF il método —pli™—do h— dete™t—do Q drifts en PSD QH y RP @líne—s —zules dis™ontínu—sAF hiremos que h— dete™t—do dos drifts ™orre™t—mente @en los puntos PS y RPA y un f—lso positivo @QHAF v— dist—n™i— —l primer drift será de 25 − 20 = 5 y —l segundo de 42 − 40 = 2F €or otro l—doD en l— grá(™— de l— dere™h— h—y P ™—m˜ios gr—du—les que tienen lug—r en ‘ISD PS“ y ‘QSD RS“F in este ™—so diremos que h— dete™t—do dos drifts ™orre™t—mente @IS y RPA y dos f—lsos positivos @PI y QHAF v— dist—n™i— —l primer drift será 15 − 15 = 0 y —l segundo 42 − 35 = 7F IQ
  • 14. 4. Aplicaciones e ™ontinu—™ión present—mos distint—s áre—s de —pli™—™ión p—r— el —prendiz—je o l— ™l—si(™—™ión de se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF „odos ellos tienen en ™omún l— —)uen™i— ™onst—nte de nuevos d—tos y un— posi˜le evolu™ión de los ™on™eptos en el tiempoF Monitorización y controlX en l—s —pli™—™iones de monitoriz—™ión y ™onE trol se tr—˜—j—n ™on ™—ntid—des de d—tos muy gr—ndes que ne™esit—n pro™eE s—rse en tiempo re—lF ƒe pueden diferen™i—r dos tipos de t—re—sX preven™ión y prote™™ión frente — —t—quesD o monitoriz—™ión ™on propósitos de gestiónF ˆ ƒegurid—d informáti™—X dete™™ión de intrusosF ‘vfWW“ ˆ ƒe™tor (n—n™ieroX preven™ión de fr—udesF ‘honHR“ ˆ „r—nsporteX gestión del trá(™oF ‘wƒthHW“ ˆ €osi™ion—mientoX r—streo inter—™tivoF ‘v€puHU“ ˆ sndustri—X monitoriz—™ión de pro™esos de produ™™iónF ‘†yq+ HV“ Información y asistencia personalizadaX est—s —pli™—™iones org—niz—n o person—liz—n un )ujo de inform—™iónF ˆ esisten™i— person—lX (ltr—do de inform—™iónF ‘qƒgwHU“ ˆ €er(les de ™lientesX segment—™ión de ™lientesF ‘vrgHV“ ˆ snform—™iónX org—niz—™ión de do™umentosF ‘fvHT“ Toma de decisionesX est—s —pli™—™iones no ne™esit—n que l—s de™isiones se—n en tiempo re—lD pero sí que su respuest— se— pre™is— y— que los ™ostes de ™ometer un error pueden ser muy —ltosF ˆ ƒe™tor (n—n™ieroX predi™™ión de morosid—dF ‘‚‚HU“ ˆ fiomedi™in—X efe™tos de medi™—mentos en p—™ientesF ‘„€g€HV“ Inteligencia articial y robóticaX el ™—m˜io de ™on™epto en est—s —pliE ™—™iones se suele de˜er — ™—m˜ios en el entornoF ˆ ƒistem—s móviles y ro˜óti™osX diseño de ro˜ots ™—p—™es de —d—pt—rse —l entornoF ‘€wqHW“ ˆ ƒistem—s inteligentesX solu™iones p—r— domóti™—F ‘‚gHW“ ˆ ‚e—lid—d virtu—lX diseño de videojuegos y simul—doresF ‘gww+ HS“ IR
  • 15. 5. Revisión de métodos de aprendizaje con dis- paradores …n— vez expuesto el ™ontexto en el que se des—rroll— el tr—˜—joD v—mos — re—liz—r un estudio det—ll—do so˜re el pro˜lem— ™on™reto del —prendiz—je ™on disp—r—E doresD en espe™i—l los dos primeros —p—rt—dos que nom˜r—mos en l— t—xonomí—X utiliz—ndo detección de cambio y ventanas de entrenamientoF ƒ™hlimmer y qr—nger present—ron en IWVT el pro˜lem— del —prendiz—je in™remenE t—l so˜re d—tos ™on ruido y pu˜li™—ron el —lgoritmo ƒ„eqqi‚ ‘ƒqVT“F hesde que introdujeron el término ™on™ept driftD h— h—˜ido tres pi™os de interés en l— investig—™iónX en IWWV ™on un— edi™ión espe™i—l de l— revist— Machine Lear- ning ‘h‡uWV“D en PHHR ™on un espe™i—l en l— revist— Intelligent Data Analysis ‘ƒuHU“ y el ter™ero ™omenzó en PHHU ™omo result—do de l— ™ontinu— produ™™ión de se™uen™i—s de d—tos en l— industri— y que ™omo se h— det—ll—do —nteriormente prosigue —ún en l— —™tu—lid—dF 5.1. Algoritmos con detección de cambio in el ™—so de se™uen™i—s dinámi™—s de d—tosD el propósito de estos —lgoritmos es dete™t—r un ™—m˜io de ™on™epto en los d—tos que v—n lleg—ndo y —vis—r —l —lgoritE mo de —prendiz—je que indu™e el modelo de que de˜e —™tu—liz—r o re™onstruir su modelo p—r— —just—rse mejor — los nuevos d—tosF €or otro l—do si se tr—˜—j—n ™on se™uen™i—s estáti™—s de d—tosD el o˜jetivo de estos —lgoritmos es —™tiv—r el pro™eso de —prendiz—je p—r— —just—rse mejor —l —porte de d—tos —di™ion—lesF vo h—˜itu—l es que los —lgoritmos de dete™™ión de ™—m˜ios —™túen — priori so˜re los d—tosD esto esD (ltren l— se™uen™i— de d—tos y —™tiven los pro™esos de —prendiz—je @muE ™hos más pes—dos ™omput—™ion—lmenteA ™on l— lleg—d— de nuevos ™on™eptosF …n —lgoritmo de dete™™ión de ™—m˜ios puede —fe™t—r —l rendimiento del ™l—si(™—dorF v— form— de pro™eder de un dete™tor de ™—m˜ios es re—liz—r un test est—dístiE ™o que ™omprue˜e si el error del ™l—si(™—dor o l— distribución de l— ™l—se se m—ntienen ™onst—ntes en el tiempoF vos primeros tests propuestos p—r— tr—t—r ™on se™uen™i—s numéri™—s fueron g…E ƒ…w @Cumulated Sum A ‘€—gSR“ y qwe @Geometric Moving Average A ‘‚o˜SW“F il primero de ellos l—nz— un— señ—l de —l—rm— si l— medi— de los d—tos de enE tr—d— es signi(™—tiv—mente distint— de ™eroD mientr—s que qwe ™omprue˜— si l— medi— ponder—d— de los ejemplos de un— vent—n— es m—yor que un determiE n—do um˜r—lF €—r— se™uen™i—s ™on estru™tur—s más ™omplej—s se h—n propuesto tests ™omo el de Kolmogorov-SmirnovF e ™ontinu—™ión veremos —lgunos de los métodos de dete™™ión de ™—m˜io más re™ientes que pueden —pli™—rse — ™u—lquier —lgoritmo de minerí— so˜re se™uen™i—s de d—tosF 5.1.1. DDM (Drift Detection Method) q—m— et —lF ‘qwg‚HR“ present—n el método de dete™™ión de ™—m˜io @hhwA que monitoriz— l— t—s— de error us—ndo un Shewhart P-ChartD un— herr—mient— IS
  • 16. est—dísti™— de ™ontrol de ™—lid—dD ™uyos prin™ipios se ˜—s—n en l— distri˜u™ión ˜inomi—lF ƒe di™e que un— v—ri—˜le X sigue un— distri˜u™ión ˜inomi—l si ™umple l—s siE guientes ™ondi™ionesX IF g—d— o˜serv—™ión es l— re—liz—™ión de un— v—ri—˜le —le—tori— de fernoulli ™on dos posi˜ilid—des @éxito o f—lloA y un p—rámetro p @pro˜—˜ilid—d de f—lloAF PF v—s diferentes o˜serv—™iones son independientes entre síF QF il número de o˜serv—™iones n es (joF he est— m—ner— podemos o˜tener l— medi— y l— desvi—™ión típi™— de l— distri˜uE p(1−p) ™ión ™omo µ = p y σ = n F ƒi n ≥ 30D l— distri˜u™ión se puede —semej—r — un— xorm—l y —pli™—r los límites de ™ontrol del €Egh—rtX CL @genter vineAX µ UWL @…pper ‡—rning vimitAX µ + α · σD ™on 0 α 3 UCL @…pper gontrol vimitAX µ + 3 · σ @—proxim—d—menteD el WWFU 7 de l—s o˜serv—™iones de˜erí—n est—r en este um˜r—lA istos límitesD sirven p—r— de(nir unos niveles de ™ontrolD ™omo puede o˜serv—rse en l— pigur— SF v— líne— ™entr—l gv represent— l— medi— de l— ™u—lid—d que se esté midiendoF ƒi en —lgún momento se so˜rep—s— el límite …‡v se est—˜le™e un nivel de —viso @warning AD indi™—ndo de est— m—ner— que es posi˜le que se v—y— — produ™ir un ™—m˜io de ™on™eptoF ƒi sigue l— tenden™i— y so˜rep—s— el límite …gvD se est—˜le™e el nivel de ™—m˜io de(nitivo @drift AF v—s inst—n™i—s re™i˜id—s en el interv—lo que tr—ns™urre desde que se —™tiv— el nivel de —viso y h—st— el que se —™tiv— nivel de drift se —lm—™en—n en un— memori— — ™orto pl—zoD y se us—rán p—r— re™onstruir o —™tu—liz—r el modelo ™u—ndo se— ne™es—rioF ƒi se h— disp—r—do el nivel de —viso y el v—lor ™ontrol—do vuelve — des™enderD situándose —lrededor de l— líne— ™entr—l gv @l— medi—AD se di™e que se h— produ™ido un— f—ls— —l—rm— y se reini™i— l— memori— — ™orto pl—zoF €—r— —just—r dinámi™—mente estos v—lores ™u—ndo l— medi— no es un— ™onst—nteD ™omo en un entorno prequentialD se est—˜le™en pmin y smin ™omo l— medi— y desE vi—™ión típi™— menores h—st— el momentoF g—d— vez que lleg— un nuevo ejemploD se —™tu—liz—rán estos v—lores si pi + si pmin + smin F in est— situ—™iónD el nivel de —viso @warning A se —l™—nz—rá ™u—ndo pi + si ≥ pmin + 2 · smin D mientr—s que el nivel de ™—m˜io de(nitivo @drift A se d—rá en pi + si ≥ pmin + 3 · smin F in l— pigur— T podemos ver un ejemplo grá(™o del —juste de estos límitesF IT
  • 17. 11.0 UCL UWL Quality characteristic 10.0 CL LWL LCL 9.0 3 6 9 12 15 Sample pigur— SX vímites de ™ontrol de Shewhart P-ChartF vos puntos de l— grá(™— están todos en los límites de lo esper—doD s—lvo el punto II que super— el límite …‡v de —visoD pero se tr—t— de un— f—ls— —l—rm—F pigur— TX €Egh—rt ™on —juste dinámi™oF v— ™u—lid—d que se mide —quí es l— t—s— de errorD por lo que niveles por de˜—jo de l— medi— signi(™— que el ™l—si(™—dor es ™orre™to @no h—y ™—m˜ios de ™on™eptoAD de m—ner— que no es ne™es—rio tener límites de ™ontrol inferiores ™omo hemos visto —nteriormente en l— pigur— SF ‘g—sHV“ iste método se puede us—r ™on ™u—lquier ™l—si(™—dorD y los mismos —utores lo in™orpor—ron —l AdPreqFr4SL @—d—pt—™ión dinámi™— de k-Dependence Bayesian Classiers A ‘gqHT“F vos niveles de ™—m˜io d—n lug—r — distintos gr—dos de —jusE te del modeloX un —viso impli™— l— —™tu—liz—™ión p—r—métri™— o de estru™tur—D IU
  • 18. mientr—s que un drift supone un ™—m˜io en el modelo ™on un —umento en l— ™omplejid—d del modeloF 5.1.2. EDDM (Early Drift Detection Method) v— propuest— de f—en—Eq—r™í— et —lF ‘fqdgep+ HT“ es simil—r —l método hhwD pero en vez de ™ontrol—r l— t—s— de errorD monitoriz— l— distancia entre errores de clasicación @número de inst—n™i—s ™orre™t—mente ™l—si(™—d—s de form— ™onse™utiv—AF ƒe denot— pi adist—n™i— medi— entre dos errores y si adesvi—™ión típi™—F ƒe de(nen pmax y smax ™omo v—lores máximos y se —™tu—liz—n ™u—ndo pi +2·si pmax + 2 · smax ™—d— vez que lleg—n nuevos d—tosF il método ™omienz— — fun™ion—r después de que se h—y—n produ™ido QH errores de ™l—si(™—™iónF iste es el mínimo número de v—lores ne™es—rios p—r— estim—r l— distri˜u™ión de l—s dist—n™i—s entre errores y poder h—™er ™omp—r—™ionesF he est— form— pmax + 2 · smax represent— el WS 7 de l— distri˜u™iónF …s—ndo estos v—loresD se —just—n dos um˜r—les de ™ontrolX Aviso @warning AX (pi + 2 · si )/(pmax + 2 · smax ) α donde α = 0,95F v—s inst—n™i—s se v—n —lm—™en—ndo p—r— ser ™onsider—d—s por el —lgoritmo de —prendiz—je en el ™—so de d—rse por de(nitivo el ™—m˜io de ™on™eptoF Cambio denitivo @drift AX (pi + 2 · si )/(pmax + 2 · smax ) β donde β = 0,90F ƒe re—prende un nuevo modelo us—ndo l—s inst—n™i—s que se h—n ido —lm—™en—ndo dur—nte el nivel de —viso previoF „—m˜ién se reini™i—n los v—lores de pmax y smax F ƒi p—s—do el nivel de —viso se vuelve — l— norm—lid—d @esto esD l— fun™ión so˜re l— dist—n™i— entre errores regres— — niveles inferiores —l límite de —visoAD se eliE min—n l— se™uen™i— de inst—n™i—s —lm—™en—d— h—st— el momento y se ™ontinú— eje™ut—ndo el métodoF vos v—lores de α y β se (j—n —d ho™ tr—s re—liz—r diferentes experimentosF 5.1.3. Método de Kifer il método de uifer et —lF ‘ufdqHR“ no solo tr—t— de dete™t—r el ™—m˜io de ™on™eptoD si no t—m˜ién de ™u—nti(™—rloD de m—ner— que se pued— des™ri˜ir l— n—tur—lez— del mismoF €—r— elloD utiliz—n un— medid— de dist—n™i— entre dos distri˜u™iones de d—tos P1 y P2 D de l—s que —l menos se dispondrá de n puntos de ™—d— un— p—r— poder re—liz—r un— dete™™ión de ™—m˜ioF ƒe present— un nuevo método @ver elgoritmo IAD que estim— l— distri˜u™ión de pro˜—˜ilid—d de dos vent—n—s W1 e W2 so˜re l— se™uen™i— de d—tosD donde W1 es un— vent—n— de t—m—ño m1 ≥ n (j—d— en el inst—nte c0 D mientr—s que W2 es un— vent—n— de t—m—ño m2 ≥ n que se despl—z—rá — lo l—rgo de l— se™uen™i—D ™omenz—ndo en c0 + m1 D de m—ner— que no se sol—pen l—s muestr—s entre —m˜—s vent—n—sF gu—ndo l— dist—n™i— entre l— distri˜u™ión de d—tos de W1 y l— de W2 IV
  • 19. es m—yor que un ™ierto um˜r—l αD se est—˜le c0 —l inst—nte —™tu—lD se reini™i—liz—n l—s vent—n—s y se noti(™— que se h— produ™ido un ™—m˜io de ™on™epto en el inst—nte c0 F v— ele™™ión del p—rámetro α de(nirá el equili˜rio entre sensi˜ilid—d y ro˜ustez de l— dete™™iónD por lo que v—lores pequeños serán ™—p—™es de dete™t—r ™—m˜ios —˜ruptosD pero se tendrá más riesgo de dete™t—r f—lsos ™—m˜iosF v— fun™ión de dist—n™i— de˜e ser —de™u—d— p—r— ™u—nti(™—r el gr—do de ™—m˜io y de un— form— intuitiv—F in el —rtí™ulo ‘ufdqHR“ se pueden ™onsult—r l—s nuev—s propuest—s de medid—s de dist—n™i— entre dos distri˜u™iones de d—tosF Algorithm 1 wet—E—lgortimo de uifer p—r— dete™t—r ™—m˜ios de ™on™eptoF il uso de l— v—ri—˜le i permite eje™ut—r h—st— k —lgoritmos ™on diferentes p—rámeE tros de form— p—r—lel—F I f o r i = 1...k do P c0 ← 0 Q W indow1,i ← f i r s t m1,i p o i n t s from time c0 R W indow2,i ← next m2,i p o i n t s i n stre—m S end f o r T w h i l e not — t end o f stre—m do U f o r i = 1...k do V ƒ l i d e W indow2,i ˜y I p o i n t W i f distance(W indow1,i , W indow2,i ) αi then IH c0 ← ™ u r r e n t time II ‚eport ™h—nge — t time c0 IP g l e — r — l l windows —nd qy„y s t e p I IQ end i f IR end f o r IS end w h i l e 5.1.4. ADWIN (Adaptive Windowing) eF fifet y ‚F q—v—ldà ‘fqHU“D que t—m˜ién h—˜í—n p—rti™ip—do en el des—rrollo de ihhwD present—n el método eh‡sxD que us— un— vent—n— desliz—nte W p—r— monitoriz—r l— t—s— de error del modelo y poder dete™t—r ™—m˜iosF e diferen™i— del método de uiferD expli™—do —nteriormenteD est— vent—n— solo ™ontiene v—lores ˜in—rios @—™ierto o f—llo en l— predi™™ión de ™—d— inst—n™i—A y —demás se modi(™— su t—m—ño de form— dinámi™—F wientr—s no h—y— ningún ™—m˜io de ™on™epto en l— distri˜u™ión de los d—tosD l— vent—n— ™re™e h—st— el momento en que se dete™te un ™—m˜ioD que disminuyeF v— ide— de l— dete™™ión ™onsiste enX ™u—ndo dos su˜vent—n—s su(™ientemente gr—ndes de W tienen medi—s su(™ientemente distint—sD se puede ™on™luir que los v—lores esper—dos de ™—d— su˜vent—n— se—n diferentesF vos v—lores su(™ienE temente se pre™is—rán ™u—ndo se es™oj— el test est—dísti™o y dependerá del nivel de ™on(—nz— δ ∈ (0, 1)F il test est—dísti™o utiliz—do p—r— ™omp—r—r l—s distri˜u™iones de l—s su˜vent—n—s W0 y W1 D ™omprue˜— si l— diferen™i— de l—s medi—s de —m˜—s su˜vent—n—s es m—yor — un determin—do um˜r—l cut @ver elgoritmo PAF IW
  • 20. Algorithm 2 elgoritmo eh‡sx I s n i t i — l i z e ‡indow W P f o r e—™h t 0 Q do W ← W ∪ xt @ i F e F D —dd xt t o t h e he—d o f ‡A R r e p e — t hrop e l e m e n t s from t h e t — i l o f W S u n t i l |ˆW0 − µW1 | cut h o l d s µ ˆ T f o r e v e r y s p l i t o f W i n t o W = W0 · W 1 U output µW ˆ il v—lor de cut p—r— un— p—rti™ión W0 · W1 de W se ™—l™ul— de l— siguiente form—X ƒe—n n0 y n1 l—s longitudes de W0 y W1 respe™tiv—menteF v— longitud de W es n = n0 + n1 F ƒe—n µW0 y µW1 l—s medi—s de los v—lores en W0 y W1 respe™tiv—menteF ‰ ˆ ˆ µW0 y µW1 sus v—lores esper—dosF €—r— g—r—ntiz—r el rendimiento del método de(nimosX ˆ m= 1 1/n0 +1/n1 @medi— —rmóni™— de n0 y n1 A ˆ δ = δ n @p—r— evit—r pro˜lem—s ™on múltiples hipótesisA il um˜r—l se ™—l™urá ™omo cut = 1 2m · ln δ F 4 ƒe puede ver un ejemplo del fun™ion—miento de este método en el gu—dro PF ƒi µt se m—ntiene ™onst—nte en W D l— pro˜—˜ilid—d de que se reduz™— l— vent—n— en el inst—nte t es ™omo mu™ho de δ D ™on lo que se limitan los falsos positivosF ƒuponiendo que p—r— —lgun— p—rti™ión de W en W0 y W1 D tenemos que |µW0 − µW1 | 2 · cut F inton™esD l— vent—n— W se redu™irá —l t—m—ño de W1 D o menorD ™on pro˜—˜ilid—d 1 − δ D por lo que se limitan así los falsos negativosF PH
  • 21. W0 W1 µW0 ˆ µW1 ˆ |ˆW0 − µW1 | µ ˆ m cut |ˆW0 − µW1 | ≥ µ ˆ cut [1] [01010110111111] 1/1 10/14 0.2857 0.9333 0.8617 No [10] [1010110111111] 1/2 10/13 0.2692 1.7333 0.6323 No [101] [010110111111] 2/3 9/12 0.0833 2.4 0.5374 No [1010] [10110111111] 2/4 9/11 0.3181 2.9333 0.4861 No [10101] [0110111111] 3/5 8/10 0.2 3.3333 0.4560 No [101010] [110111111] 3/6 8/9 0.3888 3.6 0.4387 No [1010101] [10111111] 4/7 7/8 0.3035 3.7333 0.4308 No [10101011] [0111111] 5/8 6/7 0.2321 3.7333 0.4308 No [101010110] [111111] 5/9 6/6 0.4444 3.6 0.4387 Sí [1010101101] [11111] 6/10 5/5 0.4 3.3333 0.4560 No [10101011011] [1111] 7/11 4/4 0.3636 2.9333 0.4861 No [101010110111] [111] 8/12 3/3 0.3333 2.4 0.5374 No [1010101101111] [11] 9/13 2/2 0.3076 1.7333 0.6323 No [10101011011111] [1] 10/14 1/1 0.2857 0.9333 0.8617 No gu—dro PX ijemplo del fun™ion—miento de eh‡sxF †ent—n— —™tu—lX W = [101010110111111]F δ = 1F el h—˜erse dete™t—do un ™—m˜ioD l— vent—n— disE minuirá su t—m—ño p—r— el próximo inst—nte de tiempoF il pro˜lem— de este método es que es ™omput—™ion—lmente ™ostoso porque tiene que ™ompro˜—r tod—s los posi˜les p—res de su˜vent—n—s de W F €—r— mejor—rloD los —utores present—ron un— nuev— versión ll—m—d— eh‡sxP más e(™iente en tiempo y memori—F ADWIN2 (Adaptive Windowing 2) €—r— redu™ir el ™oste ™omput—™ion—l de eh‡sxD en vez de m—ntener un— vent—n— W en memori—D tiene un— estru™tur— de d—tos ™ompuest— por ™u˜os @buckets A que —lm—™en—n v—lores ˜in—riosF g—d— ™u˜o de˜e ™ontener un— poten™i— de P de I9sF ƒe (j— un p—rámetro M ™omo el máximo número de ™u˜os ™on el mismo t—m—ñoD p—r— ™ontrol—r —sí l— ™—ntid—d de memori—F ƒe puede ver un ejemplo en el gu—dro QF PI
  • 22. ƒuponemos un— vent—n— de t—m—ño W = 14 ™on v—lores ˜in—rios @—™ierto y f—llo de ™l—si(™—™iónA y est— serí— su estru™tur— en form— de ™u˜osX gu˜osX IHIHIHI IHI II I I gontenidoX R P P I I g—p—™id—dX U Q P I I vleg— un nuevo elementoX gu˜osX IHIHIHI IHI II I I I gontenidoX R P P I I I g—p—™id—dX U Q P I I I „eniendo en ™uent— que M = 2D es ne™es—rio ™omprimir dos de los tres últimos ™u˜osD y— que tienen el mismo ™ontenidoF gu˜osX IHIHIHI IHI II II I gontenidoX R P P P I g—p—™id—dX U Q P P I hespués de ™omprimir dos ™u˜osD nos en™ontr—mos de nuevo ™on que tenemos tres ™u˜os ™on el mismo ™ontenidoD por lo que volvemos — ™omprimirF he est— form— se est—rí—n form—ndo l—s su˜vent—n—sF gu˜osX IHIHIHI IHIII II I gontenidoX R R P I g—p—™id—dX U S P I ƒi se dete™t— un ™—m˜ioD se elimin— el ™u˜o más —ntiguoX gu˜osX IHIII II I gontenidoX R P I g—p—™id—dX S P I gu—dro QX ijemplo de fun™ion—miento de eh‡sxP v— e(™ien™i— —hor— es de O(M · log(W/M )) p—l—˜r—s de memori—D y el tiempo de pro™es—miento por ™—d— ejemplo es O(log W ) en el peor ™—so y O(1) en el mejorF y˜tiene l— ™—ntid—d de I9s de tod—s los ™u˜os en O(1)F gon ello el número de su˜vent—n—s — ev—lu—r disminuye y se —pli™—n los tests más rápid—mente — l—s se™uen™i—s en los ™u˜osF 5.2. Algoritmos con ventana de entrenamiento il uso de vent—n—s permite limit—r el número de inst—n™i—s que se —prenden simultáne—menteD —demásD sirven p—r— elimin—r —quellos d—tos que son de ™onE ™eptos —ntiguosF il pro™edimiento ˜ási™o de vent—n— desliz—nte que se us— en minerí— de se™uen™i—s de d—tos se puede ver en el elgoritmo QF g—d— nuev— inst—n™i— se —ñ—de — l— vent—n—D y ™u—ndo el ™l—si(™—dor se —™tu—liz— utiliz— l—s inst—n™i—s de di™h— vent—n— p—r— el —prendiz—jeF il —spe™to ™l—ve de estos —lgoritmos reside en ™ómo se de(ne este tipo de vent—n—sF il enfoque más simple es us—r un— vent—n— de t—m—ño (jo e in™luir solo los ejemplos más re™ientes de l— se™uen™i— de d—tos y dese™h—r por l— p—rte más —ntigu—F ehor— ˜ienD se present— un ™ompromiso — l— hor— de es™oger el t—m—ño de l— mism—F ƒi l— vent—n— es de pequeño t—m—ñoD el ™l—si(™—dor será ™—p—z de —just—rse rápid—mente — los ™—m˜iosD pero perderá pre™isión en periodos de est—˜ilid—dF il pro™eso de —prendiz—je se ˜—s— en po™os d—tos y por t—ntoD est—rá PP
  • 23. sujeto — más os™il—™ionesF in ™—m˜ioD si se es™oge un t—m—ño gr—nde o™urrirá lo ™ontr—rioD el pro™eso de —prendiz—je es más inmune — ™—m˜ios menores o ruidoD pero por el ™ontr—rio tiene más iner™i—D por t—nto será más lento — l— hor— de —d—pt—rse — los ™—m˜iosF €or est— r—zónD se propusieron distintos métodos de —juste dinámi™o de l— —n™hur— de l— vent—n—F Algorithm 3 elgoritmo ˜ási™o ™on vent—n— I intr—d— X S X s e ™ u e n ™ i — de d — t o s P W X vent—n— de e j e m p l o s Q ƒ — l i d — X C X ™ l — s i f i ™ — d o r ™ o n s t r u i d o ™on l o s d — t o s de W R S i n i ™ i — l i z — r vent—n— W Y T p—r— t o d o s l o s e j e m p l o s xi en S X U W ← W ∪ xi Y V e l i m i n — r e j e m p l o s — n t i g u o s de W s i e s n e ™ e s — r i o Y W r e ™ o n s t r u i r o — ™ t u — l i z — r C us—ndo W Y 5.2.1. Método de Klinkenberg il método de ulinken˜erg et —lF ‘u‚WV“ está orient—do — l— ™l—si(™—™ión de do™uE mentos por lotes @batch A en entornos ™—m˜i—ntes @™onsider— ™—m˜ios gr—du—les y —˜ruptosAD y fue uno de los primeros en monitoriz—r diversos indi™—doresD ™on™reE t—mente l— pre™isión @accuracy AD l— espe™i(™id—d @precision A y l— exh—ustivid—d @recall AF €—r— —just—r l— vent—n— de entren—miento en primer lug—r se ™—l™ul— l— medi— y l— desvi—™ión típi™— p—r— ™—d— uno de los indi™—dores @e™™ a e™™ur—™yD ‚e™ a ‚e™—ll y €re™ a €re™isionA en ˜—se — los M últimos lotesD y — ™ontinu—™ión se utiliz— l— siguiente heurísti™—X ƒi —lguno de los indi™—dores ex™ede de su medi— α ve™es su desvi—™ión típi™—D se di™e que se h— s—lido de su interv—lo de ™on(—nz— y h— o™urrido un ™—m˜ioF €—r— ™ono™er l— n—tur—lez— del ™—m˜io @˜rus™o o gr—du—lAD se ™omprue˜— si el indi™—dor en el inst—nte t h— experiment—do un— ™—íd— β del v—lor del mismo en el inst—nte t − 1 ˆ ƒi el ™—m˜io es ˜rus™oD se redu™e l— vent—n— de entren—miento —l mínimo @B a I ˜—t™hAF ˆ ƒi el ™—m˜io es gr—du—lD se redu™e l— vent—n— en ˜—se — un p—rámetro γ de(nido — prioriF in el elgoritmo R se det—ll— en pseudo™ódigo l— heurísti™— emple—d—F ƒi h— o™urrido un ™—m˜io ˜rus™oD es de™irD se veri(™— l— primer— ™ondi™ión @líne—s P — RA y se redu™e l— vent—n— —l mínimo @I ˜—t™hAF in otro ™—soD si el ™—m˜io dete™t—do es gr—du—l @se ™umple l— segund— ™ondi™iónD que —˜—r™— l—s líne—s T — PQ
  • 24. VA l— vent—n— se redu™e —l t—m—ño γ · 100 %F he no dete™t—rse ningún ™—m˜ioD el t—m—ño de l— vent—n— ™re™e un lote másF Algorithm 4 reurísti™— de ulinken˜erg p—r— —just—r el t—m—ño de l— vent—n— de entren—mientoF I €ro ™edure heterminexew‡indowƒize @ |Wt | D M D α D β D γ A P i f ((Acct AvgM (Acc) − α · StdErrM (Acc)) and (Acct β · Acct−1 )) or Q ((Rect AvgM (Rec) − α · StdErrM (Rec)) and (Rect β · Rect−1 )) or R ((P rect AvgM (P rec) − α · StdErrM (P rec)) and (P rect β · P rect−1 )) S then |Wt+1 | := |B| Y T else i f (Acct AvgM (Acc) − α · StdErrM (Acc) or U (Rect AvgM (Rec) − α · StdErrM (Rec) or V (P rect AvgM (P rec) − α · StdErrM (P rec) W then |Wt+1 | := max(|B|, |Wt | − γ · |Wt |) Y IH else |Wt+1 | := |Wt | + |B| Y II return |Wt+1 | Y 5.2.2. FISH (uniFied Instance Selection algoritHm) ¢ sF lio˜—ité propuso un— nuev— f—mili— de —lgoritmos ll—m—d— psƒr ‘liIH—“D que us— simil—rid—des de tiempo y esp—™io entre inst—n™i—s p—r— —just—r dinámi™—E mente l— vent—n— de entren—mientoF €—r— expli™—rlo podemos ˜—s—rnos en el siguiente ejemplo ilustr—tivo de l— pigur— UF ƒe tr—t— de un pro˜lem— de ™l—siE (™—™ión ˜in—ri— @puntos ˜l—n™os y negrosA en el que l—s fuentes de gener—™ión de d—tos v—rí—n — lo l—rgo del tiempo de form— gr—du—l ™on l— rot—™ión de un hiperpl—noF €—r— un ™ierto áre— @™ir™unferen™i— roj—AD vemos que l— ™l—se ™orre™E t— en ™—d— inst—nte es diferenteF iste ejemplo muestr— que l— simil—rid—d en un dominio del pro˜lem— dinámi™o depende del tiempo y del esp—™ioF pigur— UX ijemplo de rot—™ión de hiperpl—noF szquierd—X fuente ini™i—l ƒIF gentroX fuente ƒP tr—s rot—r RSºF here™h—X fuente ƒQ tr—s rot—r WHºF v— —utor— propuso sele™™ion—r los ejemplos de l— vent—n— de entren—miento ˜—E sándose en un— medid— de dist—n™i— Dij que se de(ne de est— form—X PR
  • 25. (s) (t) Dij = a1 dij + a2 dij donde d(s) es l— dist—n™i— en el esp—™ioD d(t) l— dist—n™i— en el tiempo y a1 , a2 son los ™oe(™ientes de ponder—™iónF €—r— dos ejemplos xi , xj D l— —utor— propone l— dist—n™i— eu™líde— ™omo dist—n™i— en el esp—™io y el número de ejemplos que los sep—r—n ™omo dist—n™i— en el tiempoF were™e l— pen— dest—™—r que si a2 = 0D l— medid— se ™onvierte en un— sele™™ión de inst—n™i—sD mientr—s que si a1 = 0D tenemos un— vent—n— ™uyos pesos disminuyen ™on el tiempoF ƒe es™ogerán —quell—s inst—n™i—s ™on m—yor v—lor de dist—n™i— p—r— ™omponer l— vent—n— de entr—mientoF v— f—mili— de —lgoritmos está ™ompuest— porX psƒrIX el t—m—ño de l— vent—n— de entren—miento se (j— — prioriF psƒrPX el t—m—ño de l— vent—n— de entren—miento se —just— de form— dinámi™—D pero los pesos a1 , a2 se (j—n — prioriF psƒrQX idénti™o — psƒrPD s—lvo que los p—rámetros a1 , a2 se re™—l™ul—n dinámi™—mente — lo l—rgo del tiempoF PS
  • 26. 6. Aportaciones in primer lug—r v—mos — de(nir el m—r™o de nuestro tr—˜—joF gomo hemos ™oment—do —nteriormenteD est—mos en un entorno in™rement—l @ver pigur— VAF in ™—d— inst—nte t tenemos un— se™uen™i— de d—tos etiquet—dos X H = (X1 , ..., Xt )D ™on l— que se ™onstruye un ™l—si(™—dor Lt F gu—ndo lleg— un— nuev— inst—n™i— Xt+1 h—y que prede™ir su ™l—se yt+1 F †—mos — tr—˜—j—r ™on se™uen™i—s de d—tos que in™luyen ™—m˜ios de ™on™eptoF g—d— inst—n™i— Xt es gener—d— por un origen St F wientr—s este origen se m—ntenE g— ™onst—nte diremos que el ™on™epto no h— ™—m˜i—doD pero ™u—ndo St = St+1 D nuestro propósito es dete™t—r di™ho ™—m˜io en el inst—nte más próximo —l punto en que se produjo en l— se™uen™i—F pigur— VX v—s inst—n™i—s de d—tos se pro™es—n de form— in™rement—l ‘liIH˜“F €—r— nuestr—s diferentes propuest—sD nos hemos ˜—s—do en l— heurísti™— del métoE do hhw de q—m— en el que se utiliz— l— herr—mient— Shewhart P-Chart —pli™—d— so˜re distint—s ™u—lid—desF in primer lug—r se est—˜le™e un nivel de —viso @war- ning A que ™u—ndo se —™tive v— — empez—r — —lm—™en—r inst—n™i—s en un— memori— — ™orto pl—zoD —sí ™omo un nivel de ™—m˜io @drift AD que forz—rá — que se re—prend— el ™l—si(™—dor ™on los ejemplos —lm—™en—dos en di™h— memori—F he est— m—ner— se ™onsigue que —nte un ™—m˜io de ™on™eptoD el ™l—si(™—dor olvide inform—™ión —nti™u—d— y —prend— ™on inst—n™i—s que pertene™en —l nuevo ™on™eptoF e ™ontinu—™ión v—mos — present—r diferentes —ltern—tiv—s que hemos pl—nte—do siguiendo estos supuestos de tr—˜—jo y de l—s que se llev—ron — ™—˜o su impleE ment—™ión y experiment—™iónF 6.1. MoreErrorsMoving €—r— nuestr— primer— propuest—D que hemos denomin—do woreirrorswovingD se tr—t— de monitoriz—r los errores de ™l—si(™—™iónF €—r— ello ™ont—mos ™on un históri™o Hi = {ei−n , . . . , ei } ™on los n últimos result—dos de ™l—si(™—™ión en el inst—nte ti @ei = 0 en ™—so de —™iertoD ei = 1 en ™—so de f—lloAF †—mos — est—˜le™er el siguiente supuestoX si se produ™e un ™—m˜io de ™on™eptoD el ™l—si(™—dor v— — ver deterior—do su rendimiento y— que no será ™—p—z de ™l—si(™—r ™orre™t—mente los nuevos d—tosF v— t—re— de dete™™ión que proponemos es ™ontrol—r el número PT
  • 27. de errores de ™l—si(™—™ión que se v—n produ™iendo — lo l—rgo del tiempoD h—™iendo uso del históri™o Hi F n ej ƒe— ci = j=0 |ej ∈ Hi l— t—s— de error del históri™o en el inst—nte de tiempo n ti F in ™—d— inst—nte de tiempoD se ™omprue˜— si ci−1 ci @se h— in™rement—do el número de errores en el históri™oA y en este ™—so se di™e que h— o™urrido un empeor—miento e in™rement—mos el ™ont—dor de empeor—mientosF in ™—so ™ontr—rioD si ci−1 ci D quiere de™ir que se h— redu™ido el número de errores en el históri™oD por lo que se ™onsider—rá un— mejor— y se reini™i—liz— — H el ™ont—dor de empeor—mientos ™onse™utivosF in el ™—so de que se m—nteng— el v—lor de cD es de™irD si ci−1 = ci D el ™ont—dor de empeor—mientos se m—ntiene ™on el v—lor —nterior que tuvieseF €odemos ver un— represent—™ión grá(™— de los v—lores que tom— ci — lo l—rgo del tiempo en l— pigur— WF pigur— WX ‚epresent—™ión de l— t—s— de error del históri™o @naWAF e™tu—mos según l— siguiente heurísti™—X ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori— — ™orto pl—zoF @U W L = k A ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori— — ™orto pl—zoF @U CL = k + dA in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— — ™orto pl—zoF @CL = 0A …n ejemplo ilustr—tivo se puede ver en l— pigur— IH donde k = 2 y d = 2F PU
  • 28. 10 memoria a drift corto plazo detectado warning activado Empeoramientos UCL=k+d 5 UWL=k 0 CL=0 10 20 30 40 50 Instancias pigur— IHX €Egh—rt p—r— woreirrorswovingF in l— inst—n™i— QVD se h— dete™t—do un ™—m˜io de ™on™epto porque se h— super—do el um˜r—l …gvF in l—s inst—nE ™i—s PH y SHD —l produ™irse un— mejor— del rendimiento se vuelve —l nivel de norm—lid—d y se reini™i—liz— el ™ont—dor de empeor—mientosF €—r— l— eje™u™ión de este método h—y que de(nir los v—lores de los p—rámetros nD k y d — prioriF 6.2. MaxMoving …n— nuev— propuest—D denomin—d— w—xwovingD tr—t— de monitoriz—r l—s t—s—s de éxito del ™l—si(™—dorF istá ˜—s—d— en l— siguiente suposi™iónX mientr—s el origen del ™on™epto se m—nteng— ™onst—nteD el ™l—si(™—dor v— — mejor—r su pre™isión — lo l—rgo del tiempo @mientr—s sig— re™i˜iendo inst—n™i—sAD pero en el momento en que se produz™— un ™—m˜io @drift AD l—s t—s—s de éxito empez—rán — empeor—r y— que el modelo —™tu—l no prede™irá ™orre™t—mente l— ™l—se de l—s nuev—s inst—n™i—sF f—sándonos en estoD m—ntenemos un históri™o Hi = {ai−n , . . . , ai } ™on l—s n últim—s t—s—s de éxito —™umul—d—s desde el último ™—m˜ioF ƒe— ai = 1 − Nii l—e t—s— de éxito —™umul—d— h—st— el inst—nte ti D donde ei y Ni son el número de errores de ™l—si(™—™ión y el número de inst—n™i—s pro™es—d—s h—st— el inst—nte ti D respe™tiv—menteF ƒe— mi = m´x{aj |aj ∈ Hi } l— mejor t—s— de éxito del históE a ri™o en el inst—nte ti F wientr—s se estén ™l—si(™—ndo inst—n™i—sD ™ompro˜—mos si mi−1 mi D y si es —síD ™onsider—mos que se está mejor—ndo l— t—s— de éxito —™uE mul—d—F in ™—so ™ontr—rioD en el que el nuevo máximo es menor que el —nteriorD diremos que h— empeor—do e in™rement—mos un ™ont—dor de empeor—mientosF ƒi mi−1 = mi D es de™irD el máximo en el históri™o —nterior y el —™tu—l no h— ™—m˜ioD m—ntenemos el v—lor que y— tuviese el ™ont—dor de empeor—mientosF il uso del máximo so˜re el históri™o Hi de t—m—ño nD nos permite —mortigu—r l—s pequeñ—s os™il—™iones del tipo ai−1 ai ai+1 D ™—so en el que l— t—s— de éxito ™omienz— — des™enderD pero luego remont— rápid—menteF ƒe puede ver un— represent—™ión grá(™— de los distintos v—lores que tom— mi — lo l—rgo del tiempo en l— pigur— IIF PV
  • 29. Máximo del histórico de tasas de éxito 1.0 0.8 0.6 Max. Accuracy 0.4 0.2 0.0 0 10000 20000 30000 40000 50000 Instances pigur— IIX ‚epresent—™ión de l—s mejores t—s—s de éxito —™umul—d—s en el hisE tóri™o — lo l—rgo del tiempoF v—s ™—íd—s del rendimiento se de˜en — ™—m˜ios de ™on™eptoF v— ™u—lid—d que v—mos — ™ontrol—r en el €Egh—rt es el número de empeor—mienE tosD de m—ner— que pod—mos dete™t—r ™uándo el modelo y— no es —de™u—ndo p—r— los d—tos que se están re™i˜iendo y es ne™es—rio re—prenderF gonsider—mos l— siguiente heurísti™—X ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori— — ™orto pl—zoF @U W L = k A ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori— — ™orto pl—zoF @U CL = k + dA in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— — ™orto pl—zoF @CL = 0A €—r— l— eje™u™ión del dete™tor w—xwoving es ne™es—rio est—˜le™er — priori los v—lores de los p—rámetros n, k y dF 6.3. MovingAverage „r—s re—liz—r diversos experimentos ™on los dos métodos —nterioresD nos dimos ™uent— de que se produ™í—n mu™hos f—lsos positivosD es de™irD se dete™t—˜—n ™—mE ˜ios inexistentes en l— se™uen™i— de d—tosF isto se de˜í— — que l—s dos fun™iones monitoriz—d—s present—˜—n mu™h—s os™il—™iones @grá(™—s en dientes de sierr—A PW
  • 30. que en o™—siones er—n tom—d—s erróne—mente ™omo ™—m˜iosF €—r— intent—r p—E li—r este defe™toD —pli™—mos el método est—dísti™o de l—s medi—s móviles @moving average A que ™onsiste en ™re—r series de promedios d—do un ™onjunto de puntosF in nuestro ™—soD queremos promedi—r l—s t—s—s de éxito us—ndo un— vent—n— de su—viz—do de t—m—ño m p—r— que l— grá(™— presente un ™omport—miento ™on menos os™il—™iones @ver ejemplo de l— pigur— IPAF Original Moving Average (100) 100 100 80 80 60 60 Accuracy Accuracy 40 40 20 20 0 0 0 5000 10000 15000 20000 0 5000 10000 15000 20000 Instances Instances Moving Average (500) Moving Average (1000) 100 100 80 80 60 60 Accuracy Accuracy 40 40 20 20 0 0 0 5000 10000 15000 20000 0 5000 10000 15000 20000 Instances Instances pigur— IPX v— primer— grá(™— @—rri˜— izquierd—A es l— origin—lD mientr—s que en el resto se represent— en rojo l— medi— móvil simpleD ƒweD ™on su—viz—do de maIHHD SHH y IHHHD respe™tiv—mente —pli™—do so˜re los v—lores de l— líne— gris @origin—lAF fási™—mente h—y dos tipos de medi—s móvilesX IF Media móvil simple (SMA)X que se ™—l™ul— ™omo l— medi— —ritméti™— de l—s últim—s m o˜serv—™ionesF st = m 1 m−1 xt +xt−1 +xt−2 +···+xt−(m−1) n=0 xt−n = m = xt −xt−m st−1 + m PF Media móvil ponderada (WMA)X se ™—l™ul— utiliz—ndo un ™onjunto de m pesos @que en tot—l sum—n IA que se —pli™—n — ™—d— o˜serv—™iónF m−1 st = n=0 wn xt−n = w0 xt + w1 xt−1 + · · · + wm−1 xt−(m−1) in nuestro método solo hemos us—do el primer tipo @ƒweAD —unque p—r— un tr—˜—jo futuro serí— interes—nte pro˜—r el segundo @‡weAD de m—ner— que se —justen los pesos p—r— d—rle más import—n™i— — los o˜serv—™iones más re™ientesF QH
  • 31. v—s o˜serv—™iones — promedi—r en nuestro método wovingever—ge v—n — ser l—s t—s—s de —™ierto —™umul—d—s de l—s m últim—s muestr—sF e l— hor— de dete™t—r ™—m˜ios hemos pl—nte—do dos heurísti™—s diferentes que tr—t—n de ™—r—™teriz—r dos tipos de ™—m˜ios en los d—tosX gr—du—les y —˜ruptosF v— primera heurística es —de™u—d— p—r— ™—m˜ios gr—du—lesD que ™onsider— que se h— produ™ido un empeor—miento si st st−1 y fun™ion— de l— siguiente m—ner— @ver ejemplo en gu—dro RAX ƒi dur—nte k ve™es ™onse™utiv—s h— empeor—do l— t—s— promedi—d—D —™tiv—E mos el nivel de —viso @warning A y ™omenz—mos — —lm—™en—r l—s inst—n™i—s re™i˜id—s en un— memori— — ™orto pl—zoF ƒi se produ™en k+d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—d y se elimin—n l—s inst—n™i—s de l— memori— — ™orto pl—zoF Instancias → Predicción 0 1 0 0 1 1 1 0 0 0 0 0 0 1 1 Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 4/12 0/1 1/2 2/3 Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 0.36 - - 0.38 Empeoramientos 0 0 0 0 1 0 0 0 1 2 3 4 0 0 0 Nivel N N N N N N N N N W W D N N N gu—dro RX ijemplo de fun™ion—miento de l— primer— heurísti™— del método woE vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il nivel de w—rning @‡A se —™tiv— ™u—ndo h—y k = 2 empeor—mientos ™onse™utivos y el de drift @hA ™u—ndo h—y R @d = 2AD en otro ™—so se en™uentr— en norm—lid—d @xAF in ™—so de tr—t—rse de ™—m˜ios ˜rus™os entre ™on™eptos muy distintosD l— t—s— de —™ierto no de™—e progresiv—menteD si no de form— drásti™—D por lo que ™on l— heurísti™— —nterior o˜tendrí—mos f—lsos neg—tivos —l no dete™t—rse medi—nte empeor—mientos su™esivosF €or elloD implement—mos un— segunda heurística ˜—s—d— en el s—lto o diferen™i— en los v—lores de l—s t—s—s de éxito p—r— poder dete™t—r est— ™—íd— de rendimiento @ver ejemplo en gu—dro SAF sgu—l que —ntesD se monitoriz— l— t—s— de —™ierto —™umul—d— promedi—d— de l—s m últim—s muestr—sD pero —demás m—ntenemos un históri™o de t—m—ño n ™on estos v—lores promediosF ehor—D p—r— ™—d— inst—nte de tiempo t: ƒe o˜tiene smax ™omo el mejor v—lor del históri™oD —sí ™omo l— t—s— de —™ierto promedi—d— —™tu—l st F ƒi l— diferen™i— entre st y smax super— un ™ierto um˜r—l uD —™tiv—remos el nivel de —viso @warning AF wientr—s que si super— un um˜r—l v D —™tiv—remos el nivel de ™—m˜io @drift AF ƒe de˜e ™umplir que u v F istos v—lores reE present—n el por™ent—je de ™—íd— de rendimiento frente — smax y tom—rán v—lores entre H y IF QI
  • 32. ƒi no se d— ninguno de estos dos ™—sosD se est—˜le™e el nivel de norm—lid—dF Instancias → Predicción 0 1 0 0 1 1 1 0 0 0 0 0 1 1 Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 0/1 1/2 2/3 Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 - - 0.38 Máx. media móvil - - - - 0.36 0.38 0.49 0.52 0.52 0.52 0.50 - - - Diferencia - - - - 0.04 0 0 0 0.02 0.08 0.10 - - - Nivel N N N N N N N N N W D N N N gu—dro SX ijemplo de fun™ion—miento de l— segund— heurísti™— del método woE vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il históri™o ne™es—rio p—r— ™—l™ul—r el máximo está ™ompuesto por n = 3 últim—s medi—s móvilesF il nivel de w—rning @‡A se —™tiv— ™u—ndo l— diferen™i— es m—yor o igu—l que u = 5 % y el de drift @hA ™u—ndo es m—yor o igu—l que v = 10 %D en otro ™—so se en™uentr— en norm—lid—d @xAF pin—lmente ™om˜in—mos —m˜—s heurísti™—s en el método wovingever—ge p—r— poder dete™t—r ™u—lquier— de los dos ™—m˜ios men™ion—dosF €—r— ello se de˜e tener en ™uent— el sol—p—miento de los niveles de —viso y de ™—m˜io de ™—d— un— de l—s heurísti™—sF ƒe—n ω1 y ω2 los niveles de —visoD δ1 y δ2 los niveles de drift y η1 y η2 los niveles de norm—lid—d de l—s heurísti™—s I y P respe™tiv—menteF he(nimos pues los niveles de nuestr— heurística híbrida ™omoX IF xivel de norm—lid—dX ηH = η1 ∧ η2 ⇒!ω1 ∧!ω2 ∧!δ1 ∧!δ2 F PF xivel de —viso @warning AX ωH = ω1 ∨ ω2 F QF xivel de ™—m˜io @drift AX δH = δ1 ∨ δ2 F in el elgoritmo S se puede ver el pseudo™ódigo de este métodoF QP
  • 33. Algorithm 5 elgoritmo woving ever—ge rí˜rido I δ1 a δ2 a ω1 a ω2 a pevƒi Y P — ™ ™ u r — ™ y a I − e r r o r s G numsnst—n™es Y Q window F —dd @ — ™ ™ u r — ™ y A Y GG remove o l d e s t i f window F s i z e m R i f window F s i z e aa mX S ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e a window F — v e r — g e @ A T U GG −− ˜ e g i n f i r s t h e u r i s t i ™ −− GG V i f ™urrente™™ur—™yever—ge ` previouse™™ur—™yever—ge X W ™ o n s e ™ u t i v e h r o p s CCY GG worse IH else i f ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e b p r e v i o u s e ™ ™ u r — ™ y e v e r — g e X II ™ o n s e ™ u t i v e h r o p s a H Y GG ˜ e t t e r IP else X IQ ™ o n s e ™ u t i v e h r o p s a ™ o n s e ™ u t i v e h r o p s Y GG s—me IR IS previouse™™ur—™yever—ge a ™urrente™™ur—™yever—ge Y IT IU if ™ o n s e ™ u t i v e h r o p s b kCd X IV δ1 a „‚…iY IW else i f ™ o n s e ™ u t i v e h r o p s b k X PH ω1 a „‚…iY PI GG −− end o f f i r s t h e u r i s t i ™ −− GG PP PQ h i s t o r y F —dd @ ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e A GG remove o l d e s t i f h i s t o r y F s i z e n PR i f h i s t o r y F s i z e aa n X PS GG −− ˜ e g i n s e ™ o n d h e u r i s t i ™ −− GG PT d i f f e r e n ™ e a h i s t o r y F m—x @ A − ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e Y PU if differen™e b vX PV δ2 a „‚…iY PW else i f d i f f e r e n ™ e b u X QH ω2 a „‚…iY QI GG −− end s e ™ o n d h e u r i s t i ™ −− GG QP QQ if or δ2 X δ1 QR return h‚sp„ Y QS else i f ω1 or ω2 X QT return ‡e‚xsxqY QU else X QV return xy‚wevY el igu—l que en los métodos —nterioresD los v—lores de n, kD d, u y v h—y que (j—rlos — prioriF QQ
  • 34. 7. MOA (Massive Online Analysis) €—r— ev—lu—r nuestr—s propuest—s y re—liz—r un— ™omp—r—tiv— ™on —lgunos de los métodos des™ritos —nteriormente se h— utiliz—do el entorno de des—rrollo wye @w—ssive ynline en—lysisA ‘fuHW˜D fru€IH“F wye es un softw—re des—rroll—E do en l— …niversid—d de ‡—ik—to @xuev— el—nd—A p—r— re—liz—r experimentos de ™l—si(™—™ión y ™lustering ™on se™uen™i—s de d—tosF istá rel—™ion—do ™on el proye™to ˜ien ™ono™ido ‡iue ‘fpr+ IH“ @de minerí— de d—tos tr—di™ion—lAF „—m˜ién está implement—do en t—v— y tiene li™en™i— q€vF intre otr—s utiliE d—desD propor™ion— muestr—s y se™uen™i—s de d—tos y— que ™ontiene un— ˜uen— ™ole™™ión de gener—dores de se™uen™i—s de d—tosF edemásD in™luye —lgoritmos de ™l—si(™—™ión y —grup—miento @™lusteringAD —sí ™omo v—rios métodos de ev—lu—E ™iónF in este —p—rt—do ex™lusiv—mente v—mos — det—ll—r l— p—rte de ™l—si(™—™ión y de gener—doresD que son l—s que hemos us—do en l— se™™ión experiment—l del tr—˜—joF 7.1. El entorno v— form— de utiliz—r wye es medi—nte l— eje™u™ión de t—re—s @tasks AF ist—s t—E re—s se pueden l—nz—r t—nto — tr—vés de un— interf—z grá(™—D ™omo por líne— de ™om—ndos y mu™h—s de ell—s se pueden en™—den—r @ver pigur— IQAF v—s t—re—s prin™ip—les son de —prendiz—je y ev—lu—™iónD —unque h—y otr—s útiles ™omo geE ner—r un— se™uen™i— de d—tos que —demás se puede gu—rd—r en e‚pp @form—to utiliz—do por ‡iue muy ™omún en minerí— de d—tosAF pigur— IQX plujo de tr—˜—jo en wye v— interf—z grá(™— de wye permite utiliz—r los métodos de minerí— de d—tos tr—di™ion—l @en modo ˜—t™hA de ‡iueF isto result— espe™i—lmente útil p—r— ™omp—r—r el —prendiz—je online ™on un —prendiz—je ˜—t™h ™omo referen™i—F edeE másD nos permite l—nz—r v—ri—s t—re—s de form— simultáne— y ver l— evolu™ión de ™—d— un—D pudiendo detener ™u—lquier— de ell—s en ™u—lquier momentoF in l— pigur— IR podemos ver un ejemplo de l— vent—n— prin™ip—l de l— —pli™—™ión dur—nte l— eje™u™ión de un— t—re— de ™l—si(™—™iónF QR
  • 35. pigur— IRX †ent—n— prin™ip—l de wyeF ije™u™ión de un— t—re— de ev—lu—™ión @€requenti—lA de un método de ™l—si(™—™ión @roe'ding„reeA ™on dete™™ión de ™—m˜io @ihhwA so˜re un— se™uen™i— de d—tos gener—d— por ƒieqener—torF in l— p—rte superior se puede ver l— t—re— eje™ut—d— y en l— p—rte inferior l— s—lid— de l— mism— — interv—los de IHHH inst—n™i—s @de(nido previ—menteAF 7.2. Generación de secuencias de datos gomo y— indi™—mosD un— ™—r—™terísti™— muy útil de wye es l— posi˜ilid—d de gener—r se™uen™i—s de d—tos — p—rtir de diversos gener—dores que in™orpor— por defe™to y que list—mos — ™ontinu—™iónF STAGGER Concepts GeneratorX vos ™on™eptos de ƒ„eqqi‚ ‘ƒqVT“ ™onform—n un estánd—r en l— ev—lu—™ión de ™l—si(™—dores en entornos ™on se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF il pl—nte—miento origin—l present— un— serie de ejemplos ™on tres —tri˜utosX ˆ color ∈ {green, blue, red} ˆ shape ∈ {triangle, circle, rectangle} ˆ size ∈ {small, medium, large} v— se™uen™i— de d—tos se divide en tres ™on™eptosX en los primeros RH ejemplosD el ™on™epto es color = red ∧ size = smallY en los siguientes RH QS
  • 36. ejemplosD el ™on™epto es color = green shape = circleY por últimoD los RH ejemplos (n—les se ™onstruyen ™on el ™on™epto size = medium size = largeF istos ™on™eptos se pueden o˜serv—r de form— visu—l en l— pigur— ISF ƒe h— us—do en ‘†xII“‘‡uWT“‘fr€+ HW“‘qwg‚HR“‘uwHU“F pigur— ISX †isu—liz—™ión de los ™on™eptos ƒ„eqqi‚ ‘uwHU“ SEA Concepts GeneratorX iste ™onjunto de d—tos —rti(™i—l present—E do en ‘xuHI“ está ™ompuesto por ™u—tro ˜loques de d—tos ™on diferentes ™on™eptosF vos d—tos ™onst—n de tres —tri˜utos y un— ™l—se ˜in—ri—F v— ™l—si(™—™ión se re—liz— solo ™on dos —tri˜utosD mientr—s que el ter™ero es irrelev—nteD siguiendo est— fun™iónX f1 + f2 ≤ θD donde f1 y f2 son los dos primeros —tri˜utos y θ es un um˜r—l que se —just— p—r— ™—d— uno de los ˜loques de d—tos siguiendo este orden {9, 8, 7, 9,5}F he est— forE m—D l— se™uen™i— de d—tos se de(ne ™omo l— unión ™onse™utiv— de SEA9 D SEA8 D SEA7 y SEA9,5 D donde ™—d— ™onjunto ™onst— de IPSHH inst—n™i—sD present—ndo un ™—m˜io ˜rus™o entre ™—d— ™on™eptoF is posi˜le —demás inE ™orpor—r un por™ent—je de ruido por medio del p—rámetro nF ƒe h— us—do en ‘fr€+ HW“‘uwHU“‘qƒ—‚HW“F Random RBF GeneratorX in est— se™uen™i—D se gener— un número (jo de ™entroides @™l—sesA de form— —le—tori— y — ™ontinu—™ión se ™re—n nuevos ejemplos eligiendo ™u—lquier— de estos ™entroides de m—ner— que ™—ig—n ™er™— de los mismosF v— dist—n™i— —l ™entroide se o˜tiene de form— —le—tori— de un— distri˜u™ión q—usi—n— ™uy— desvi—™ión típi™— viene determin—d— por el ™entroideF ƒolo se utiliz—n —tri˜utos numéri™osF €—r—r introdu™ir un ™—m˜io de ™on™epto se despl—z—n los ™entroides en el esp—™io indi™—ndo el número k de ™entroides — despl—z—r y l— velo™id—d s ™on l— que lo v—n — h—™erF ƒe h— us—do en ‘fr€+ HW“F LED GeneratorX ist— se™uen™i— de d—tos ‘fpyƒVR“ ™onst— de PR —triE ˜utos ˜in—riosD IU de los ™u—les son irrelev—ntesF il o˜jetivo es prede™ir el dígito mostr—do en un displ—y vih de U segmentos en el que ™—d— —tri˜uE to tiene un IH 7 de posi˜ilid—des de est—r invertidoF ƒe puede in™luir un QT
  • 37. ™—m˜io de ™on™epto indi™—ndo el número d de —tri˜utos ™on ™—m˜iosF ƒe h— us—do en ‘†xII“‘fr€+ HW“F Waveform GeneratorX ist— se™uen™i— de d—tos —p—re™ió t—m˜ién en ‘fpyƒVR“F il o˜jetivo es diferen™i—r entre Q ™l—ses diferentes de ond—sD donde ™—d— un— de l—s ™u—les se h— gener—do por un— ™om˜in—™ión de P o Q ond—s ˜—sesF ixisten dos versiones de este pro˜lem—X w—vePI ™on PI —tri˜utos numéri™os ™on ruido y w—veRH ™on IW —tri˜utos extr— irreE lev—ntesF ixiste l— posi˜ilid—d de introdu™ir ™—m˜ios en un determin—do número d de —tri˜utos p—r— forz—r un ™—m˜io de ™on™eptoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘qƒ—‚HW“F Function Generator (Agrawal)X iste ™onjunto de fun™iones se presentó en ‘esƒWQ“ y h— sido us—do p—r— ™ompro˜—r l— es™—l—˜ilid—d en —lgoritmos de —prendiz—je ™on ár˜oles de de™isiónF v— se™uen™i— de d—tos se puede gener—r en ˜—se — IH fun™iones diferentes ™on W —tri˜utos des™ritos en el gu—dro T @T numéri™os y Q ™—tegóri™osA y un— ™l—se ˜in—ri—D de m—ner— que simul— un— hipotéti™— —pli™—™ión de ™on™esión de prést—mos ˜—n™—E riosF eunque es un— ˜uen— form— de gener—r se™uen™i—s ™on ™—m˜ios de ™on™eptos de˜ido — l— v—ried—d de sus fun™ionesD en l— ˜i˜liogr—fí— de deE te™™ión de drifts solo hemos en™ontr—do que se h— us—do en ‘fr€+ HW“F Atributo Descripción Valores salary Sueldo Entre 20000 y 150000 commision Comisión Si salary ≥ 75000 ⇒ comission = 0, en otro caso, entre 10000 y 75000 age Edad Entre 20 y 80 elevel Nivel educativo Entre 0 y 4 (categórico) car Marca del coche Entre 1 y 20 (categórico) zipcode Código postal Entre 1 y 9 (categórico) hvalue Valor de la vivienda Entre 0.5k100000 y 1.5k100000 donde k depende de zipcode hyears Edad de la vivienda Entre 1 y 30 loan Valor del préstamo Entre 0 y 500000 gu—dro TX hes™rip™ión de los —tri˜utos de egr—w—l Rotating HyperplaneX v—s se™uen™i—s de d—tos gener—d—s por medio de un hiperpl—no rot—torio se us—ron ini™i—lmente en ‘rƒhHI“F …n hiperpl—no en un esp—™io dEdimension—l es el ™onjunto de puntos en x que s—tisf—™e d d i=1 wi xi = w0 = i=1 wi donde xi es l— iEésim— ™oorden—d— de xF vos ejemplos m—yores o igu—les que w0 son etiquet—dos ™omo positivosD y el resto ™omo neg—tivosF €—r— introdu™ir un ™—m˜ioD ˜—st—rá ™on ™—m˜i—r el peso de un —tri˜uto wi = wi + dσ D donde d es el ™—m˜io que se —pli™— y σ l— pro˜—˜ilid—d de que se produz™— di™ho ™—m˜ioF vos hiperpl—nos son útiles p—r— simul—r ™—m˜ios de ™on™eptosD porque permiten modi(™—r l— orient—™ión y l— posi™ión del hiperpl—no de un— m—ner— su—ve —just—ndo el peso de ™—d— —tri˜utoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘fqHU“F in l— pigur— IT se puede o˜serv—r l— interf—z de wye p—r— gener—r se™uen™i—s de d—tos y —lm—™en—rl—s en (™heros e‚ppF QU
  • 38. pigur— ITX snterf—z p—r— gener—r un— se™uen™i— de IHHH d—tos us—ndo el gener—dor ƒ„eqqi‚F ƒi nuestro propósito es disponer de se™uen™i—s ™on ™—m˜io de ™on™eptoD un —sE pe™to interes—nte es l— posi˜ilid—d de in™orpor—r ™—m˜ios ™ontrol—dos1 F €—r— ello se pueden utiliz—r los gener—dores ™oment—dos —nteriormente y ™om˜in—rlos meE di—nte un— fun™ión sigmoide @ver pigur— IUA que determin— el ™—m˜io de un origen de d—tos — otroF gomo p—rámetros de l— fun™ión podemos de(nir el moE mento t0 en el que su™ede el ™—m˜ioD —sí ™omo —just—r l— ˜rusqued—d ™on l— que se produ™e por medio de αD o ˜ienD l— longitud del mismo us—ndo W F hur—nte este interv—lo se v—n — mez™l—r en l— se™uen™i— de d—tos inst—n™i—s de —m˜os ™on™eptosF ytr— posi˜ilid—d es gener—r v—ri—s se™uen™i—s de d—tos de form— inE dependiente y luego junt—rl—s de form— ™onse™utiv— en un— sol— se™uen™i—F 1 De cara a la experimentación es fundamental saber cuántos cambios, en qué momento y el tiempo de cambio producido en la secuencia de datos, para luego llevar a cabo evaluaciones y comparaciones entre métodos. QV
  • 39. pigur— IUX pun™ión sigmoide f (t) = 1/(1 + e−s(t−t0 ) ) F gu—nto m—yor se— αD menor será W y el ™—m˜io será más ˜rus™oF‘fuHW—“ 7.3. Métodos de clasicación vos prin™ip—les métodos de ™l—si(™—™ión online que se en™uentr—n y— impleE ment—dos en wye sonX x—ive f—yesD x—ive f—yes wultinomi—l ‘wxWV“D heE ™ision ƒtumpD roe'ding „ree ‘rƒhHI“D roe'ding yption „ree ‘€ruHU“D f—gE ging ‘yz—HS“D foosting ‘yz—HS“D f—gging using eh‡sx ‘fqHU“D f—gging using ed—ptiveEƒize roe'ding „rees ‘fr€+ HW“D €er™eptronD ƒqhX ƒto™h—sti™ qr—dient hes™entD €eg—sos ‘ƒƒƒƒgHU“D €er™eptron ƒt—™king of ‚estri™ted roe'ding „rees ‘fpr€IH“ y vever—ging f—gging ‘fr€IH“F edemás de estosD t—m˜ién nos perE mite in™orpor—r los —lgoritmos desde ‡iue —sí ™omo ™om˜in—r ™u—lquier— de ellos ™on un método de dete™™ión de ™—m˜ioF 7.4. Métodos de evaluación 7.4.1. Holdout in el —prendiz—je en ˜—t™hD lo h—˜itu—l es utiliz—r v—lid—™ión ™ruz—d—D pero ™omo y— se h— indi™—do en l— ƒe™™ión QFR es invi—˜le us—r este método p—r— el —prendiE z—je por se™uen™i—s de d—tos y— que se vuelve muy ™ostosoF €or elloD en ‘fuHW—“ propusieron us—r el método holdout que us— un ™onjunto de entren—miento y otro de testF in wye podemos de(nir ™—d— ™uánto se ev—lú— el modelo entren—doF €—r— se™uen™i—s de d—tos sin ™—m˜io de ™on™eptoD podemos us—r siempre el mismo ™onjunto de testD pero en ™—so de que se— un— se™uen™i— ™on drift es ne™es—rio que el ™onjunto de test se —™tu—li™e ™on el tiempo y— que si no podrí—mos est—r ev—lu—ndo ™on inst—n™i—s que pertene™en — un— distri˜u™ión de d—tos distint— — l— entren—d—F v— implement—™ión de wye solo ™ontempl— —™tu—lmente el uso de ™onjuntos de test estáti™osD por lo que no es indi™—do p—r— ev—lu—r se™uen™i—s ™on ™—m˜iosF QW
  • 40. 7.4.2. Interleaved Test-Then-Train (o Prequential) ytro método diferente ™onsiste en ev—lu—r el modelo ™on ™—d— nuev— inst—n™i— y luego us—rlo p—r— el entren—mientoF ist— té™ni™— se puede us—r t—nto p—r— se™uen™i—s de d—tos ™on ™—m˜ios y sin ™—m˜ios de ™on™eptoF il in™onveniente de este método es que —l ™omienzo de l— ev—lu—™ión es pro˜—˜le que o˜teng—mos peores result—dos de˜ido — que el modelo no está tod—ví— ˜ien entren—doF in l— pigur— IV podemos ver un ejemplo de un— vent—n— de ™on(gur—™ión de wye p—r— est—˜le™er l— ev—lu—™iónF ƒegún el estudio re—liz—do por q—m— et —lF ‘qƒ—‚HW“ este método es más indi™—do p—r— se™uen™i—s de d—tosF pigur— IVX †ent—n— de ™on(gur—™ión p—r— un— t—re— de ev—lu—™iónF il método de —prendiz—je es roe'ding„ree ™on dete™™ión de ™—m˜io ihhwF v— se™uen™i— de d—tos de IHHFHHH inst—n™i—s se gener— medi—nte ƒie qener—torF v— ev—lu—™ión se re—liz— en un entorno prequenti—l y se v—n — mostr—r l—s t—s—s de éxito —™uE mul—d—s ™—d— IFHHH inst—n™i—s pro™es—d—sF …n ejemplo de l— s—lid— por p—nt—ll— de l— eje™u™ión puede verse en l— pigur— IRF RH
  • 41. 8. Experimentación €—r— ™ompro˜—r l— e(™—™i— de los métodos propuestosD hemos re—liz—do un— expeE riment—™ión so˜re diferentes se™uen™i—s de d—tosF gomo el propósito es ev—lu—r los diferentes métodos de dete™™ión de ™—m˜iosD se h—n prep—r—do se™uen™i—s t—nto ™on ™—m˜ios ˜rus™os ™omo ™on ™—m˜ios gr—du—lesD —demás de v—ri—s seE ™uen™i—s ™on d—tos re—les disponi˜les en httpXGGmo—F™sFw—ik—toF—™FnzGd—t—setsG y que se h—n utiliz—do en l— liter—tur—F v— ev—lu—™ión se h— re—liz—do medi—nte l— estr—tegi— prequenti—lD en l— que se ™l—si(™—n y luego se entren—n ™—d— un— de l—s inst—n™i—s de l— se™uen™i— ™onforme se v—n re™i˜iendoF €—r— poder h—™er un— ™omp—r—tiv— entre los distintos métoE dosD se h— (j—do ™omo —lgoritmo de ™l—si(™—™ión el x—ivef—yes y se h— ™—l™ul—do el e…gD áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s desde el prin™ipio de l— eje™u™iónF ytros d—tos ™—l™ul—dos h—n sido el número de ™—m˜ios dete™t—dos ™orre™t—mente e in™orre™t—mente @f—lsos positivos y f—lsos neg—tivosAD —sí ™omo l— dist—n™i— medid— en número de inst—n™i—s desde que s—˜emos que se produ™e el ™—m˜io de ™on™epto h—st— que (n—lmente se dete™t—F in el ™—so de l—s se™uenE ™i—s de d—tos re—lesD no podemos ™—l™ul—r est— dist—n™i—D y— que des™ono™emos ™uántos ™—m˜ios present—n y ™uándo se produ™enF 8.1. Conjuntos de datos reales Electricity Market (ELEC) iste es uno de los ™onjuntos de d—tos re—les más utiliz—dos en dete™™ión de driftsF ƒe tr—t— de un— se™uen™i— de d—tos (nit— ™ompuest— por RSFQIP inst—n™i—sD donde ™—d— muestr— represent— un periodo de QH minutos ™on v—lores de l— ofert— y dem—nd— de l— energí— elé™tri™— de un— ™iud—d eustr—li—n—D donde los pre™ios v—rí—n según l— dem—nd—F il v—lor de l— ™l—se se re(ere — l— v—ri—™ión del pre™io ™on respe™to — l— medi— de l—s últim—s PR hor—sF ƒe h— us—do en ‘fr€+ HW“‘qwg‚HR“‘fqHU“‘fqdgep+ HT“‘uwHU“F Forest Covertype (Forest) iste ™onjunto de d—tos ™ontiene v—lores so˜re el tipo de suelo forest—l en regiones de ist—dos …nidosF istá ™ompuesto por SVIFHIP inst—n™i—s ™on SR —tri˜utos y U ™l—sesF ƒe h— us—do en ‘†xII“‘fr€+ HW“F Poker-Hand (Poker) iste ™onjunto está ™ompuesto por IFHPSFHIH inst—n™i—sD donde ™—d— muestr— represent— un— m—no de S ™—rt—s es™ogid—s de un— ˜—r—j— ™on SP ™—rt—sF g—d— ™—rt— se des™ri˜e ™on dos —tri˜utos @p—lo y v—lorAD por lo que en tot—l h—˜rá IH —tri˜utosF v— ™l—se des™ri˜e l— m—no de póker y ™onst— de IH posi˜les v—loresF r—y que tener en ™uent— que el orden de l—s ™—rt—s es import—nteF ƒe h— us—do en ‘fqHU“ ‘fr€+ HW“F €—r— nuestr— experiment—™ión hemos utiliz—do l— versión norm—liz—d— disponi˜le en l— we˜ de wyeD de m—ner— que no import— el orden RI