SlideShare a Scribd company logo
1 of 13
Projecte de tesis: UN MODEL GENEALÒGIC BASAT EN ONTOLOGIES Alumne: Joan Campanyà Artés Direcció: Enric Mayol (UPC) i Jordi Conesa (UOC) Novembre 2011
Introducció ,[object Object]
Inconvenients : dades distribuïdes en sistemes d'informació tancats (no es facilita l'exportació massiva de dades). Tant l'estructura com els formats de les dades segueixen sovint patrons particulars als diferents serveis
La proposta : dissenyar el model conceptual així com l'arquitectura d'un sistema d'informació que permeti utilitzar aquesta informació dispersa com una única font de coneixement
Models de referencia ,[object Object]
GENTECH  (2000) [2]. Model conceptual que, malgrat sense continuïtat en desenvolupament/implementació, ha estat una referència reconeguda. Interessant com es modelen els esdeveniments genealògics, que recorda el triplet ontològic  <subject, predicate, object> . Pensat per ser implementat en una base de dades relacional, està sobrecarregat de tipus d'entitat especialitzats que el fan poc flexible.
Estat de l'art: articles científics ,[object Object]
Automatic extraction from and reasoning about genealogical records,  Charla Woodbury (BYU, 8/2010) [4]. Es proposa un model basat en ontologies especialitzades. S'incorpora un conjunt d'etiquetes en SWRL que defineixen les regles i restriccions d'integritat pròpies de les entitats de l'àmbit genealògic. L'estudi es completa amb la simulació i avaluació de resultats, partint d'una mostra significativa de dades primàries.
Particularitats del domini ,[object Object]
Els esdeveniments ,[object Object],[object Object]
Dates sovint imprecises o errònies
Dades incompletes o amb referències implícites ,[object Object],[object Object]
Els models relacionals: limitacions ,[object Object]

More Related Content

Similar to Presentacio projecte de tesi doctoral

Multimedia V Magisteri
Multimedia V MagisteriMultimedia V Magisteri
Multimedia V Magisteripalsa
 
Preservació de recursos digitals
Preservació de recursos digitalsPreservació de recursos digitals
Preservació de recursos digitalsNúria Gallart
 
Pac plagi cat
Pac plagi catPac plagi cat
Pac plagi catsdocencia
 
Implicacions TIC del Pla Estratègic
Implicacions TIC del Pla EstratègicImplicacions TIC del Pla Estratègic
Implicacions TIC del Pla Estratègicsebaixllobregat7
 
Org i visual
Org i visualOrg i visual
Org i visualiMona06
 
El treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturals
El treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturalsEl treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturals
El treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturalsMargalida Castells
 
Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...
Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...
Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...ARGET URV
 
Lectura de la tesi de doctorat
Lectura de la tesi de doctoratLectura de la tesi de doctorat
Lectura de la tesi de doctoratOriol Miralbell
 
Copia de blogger
Copia de bloggerCopia de blogger
Copia de bloggerLuna luna
 
Dissenyar i aplicar projectes a Secundària. Tipus i estratègies
Dissenyar i aplicar projectes a Secundària. Tipus i estratègiesDissenyar i aplicar projectes a Secundària. Tipus i estratègies
Dissenyar i aplicar projectes a Secundària. Tipus i estratègiesjdomen44
 

Similar to Presentacio projecte de tesi doctoral (20)

Història de les bases de dades
Història de les bases de dadesHistòria de les bases de dades
Història de les bases de dades
 
24a sessió web. L'obertura de dades (open data) a Catalunya. José Manuel Alonso
24a sessió web. L'obertura de dades (open data) a Catalunya. José Manuel Alonso24a sessió web. L'obertura de dades (open data) a Catalunya. José Manuel Alonso
24a sessió web. L'obertura de dades (open data) a Catalunya. José Manuel Alonso
 
Ple, Entorns Personals d´Aprenentatge
Ple, Entorns Personals d´AprenentatgePle, Entorns Personals d´Aprenentatge
Ple, Entorns Personals d´Aprenentatge
 
Multimedia V Magisteri
Multimedia V MagisteriMultimedia V Magisteri
Multimedia V Magisteri
 
Ple Pln Compartim
Ple Pln CompartimPle Pln Compartim
Ple Pln Compartim
 
Preservació de recursos digitals
Preservació de recursos digitalsPreservació de recursos digitals
Preservació de recursos digitals
 
Pac plagi cat
Pac plagi catPac plagi cat
Pac plagi cat
 
Web semantica
Web semanticaWeb semantica
Web semantica
 
Aprenentatge social i obert a les administracions públiques (Dolors Reig). Re...
Aprenentatge social i obert a les administracions públiques (Dolors Reig). Re...Aprenentatge social i obert a les administracions públiques (Dolors Reig). Re...
Aprenentatge social i obert a les administracions públiques (Dolors Reig). Re...
 
Implicacions TIC del Pla Estratègic
Implicacions TIC del Pla EstratègicImplicacions TIC del Pla Estratègic
Implicacions TIC del Pla Estratègic
 
Org i visual
Org i visualOrg i visual
Org i visual
 
El treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturals
El treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturalsEl treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturals
El treball col·laboratiu en xarxa. Eines 2.0 per a projectes culturals
 
VII Seminari especialitzat: Entorns personals d'aprenentatge (Dolors Reig)
VII Seminari especialitzat: Entorns personals d'aprenentatge (Dolors Reig)VII Seminari especialitzat: Entorns personals d'aprenentatge (Dolors Reig)
VII Seminari especialitzat: Entorns personals d'aprenentatge (Dolors Reig)
 
24a sessió web: Open Data. José Manuel Alonso
24a sessió web: Open Data. José Manuel Alonso24a sessió web: Open Data. José Manuel Alonso
24a sessió web: Open Data. José Manuel Alonso
 
Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...
Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...
Seminari II - Tractament de dades qualitatives en la recerca educativa. Indic...
 
Situació i reptes de la gestió del Big Data en ciències de la vida
Situació i reptes de la gestió del Big Data en ciències de la vidaSituació i reptes de la gestió del Big Data en ciències de la vida
Situació i reptes de la gestió del Big Data en ciències de la vida
 
Blog grup 2
Blog grup 2Blog grup 2
Blog grup 2
 
Lectura de la tesi de doctorat
Lectura de la tesi de doctoratLectura de la tesi de doctorat
Lectura de la tesi de doctorat
 
Copia de blogger
Copia de bloggerCopia de blogger
Copia de blogger
 
Dissenyar i aplicar projectes a Secundària. Tipus i estratègies
Dissenyar i aplicar projectes a Secundària. Tipus i estratègiesDissenyar i aplicar projectes a Secundària. Tipus i estratègies
Dissenyar i aplicar projectes a Secundària. Tipus i estratègies
 

Presentacio projecte de tesi doctoral

  • 1. Projecte de tesis: UN MODEL GENEALÒGIC BASAT EN ONTOLOGIES Alumne: Joan Campanyà Artés Direcció: Enric Mayol (UPC) i Jordi Conesa (UOC) Novembre 2011
  • 2.
  • 3. Inconvenients : dades distribuïdes en sistemes d'informació tancats (no es facilita l'exportació massiva de dades). Tant l'estructura com els formats de les dades segueixen sovint patrons particulars als diferents serveis
  • 4. La proposta : dissenyar el model conceptual així com l'arquitectura d'un sistema d'informació que permeti utilitzar aquesta informació dispersa com una única font de coneixement
  • 5.
  • 6. GENTECH (2000) [2]. Model conceptual que, malgrat sense continuïtat en desenvolupament/implementació, ha estat una referència reconeguda. Interessant com es modelen els esdeveniments genealògics, que recorda el triplet ontològic <subject, predicate, object> . Pensat per ser implementat en una base de dades relacional, està sobrecarregat de tipus d'entitat especialitzats que el fan poc flexible.
  • 7.
  • 8. Automatic extraction from and reasoning about genealogical records, Charla Woodbury (BYU, 8/2010) [4]. Es proposa un model basat en ontologies especialitzades. S'incorpora un conjunt d'etiquetes en SWRL que defineixen les regles i restriccions d'integritat pròpies de les entitats de l'àmbit genealògic. L'estudi es completa amb la simulació i avaluació de resultats, partint d'una mostra significativa de dades primàries.
  • 9.
  • 10.
  • 11. Dates sovint imprecises o errònies
  • 12.
  • 13.
  • 14. Impossibilitat de definir una estructura de la informació compatible amb els tipus emprats al llarg del temps o de diferents contextos geogràfics
  • 15. No sempre és possible definir identificadors unívocs per les classes d'entitat (claus primàries)
  • 16. Inferència de coneixement limitada a l'existència de registres referenciats en l'extensió de la BBDD
  • 17. Dificultat d'integrar recursos d'informació provinents de diferents models (el mapeig no és sempre possible)
  • 18.
  • 19. Capacitat d'inferir coneixement a partir de dades no connectades directament per relacions predefinides
  • 20. Possibilitat de registrar instàncies d'entitat (“fets”) sense declarar un identificador. La posterior inferència de coneixement podria establir relacions amb altres instàncies ja reconegudes.
  • 21. Facilitat d'integrar el model amb altres ontologies, tesaurus, sinònims, etc., augmentant la capacitat de raonament
  • 22.
  • 23. Utilitzar les noves possibilitats que ofereix la revisió OWL-2 [6]
  • 24.
  • 25. Entre ells s'interposa l' Event , dificultant d'inferir directament els vincles entre les entitats d'interès genealògic ( Person i Group )
  • 26.
  • 27.
  • 28. Tanmateix, alguns atributs que podrien ajudar a la identificació no són completament fiables (per exemple, el nom d'una persona pot aparèixer en diferents formes segons la font)
  • 29.
  • 30.
  • 31. La tendència previsible és de que les entitats genealògiques facilitin serveis web semàntics, proporcionant una descripció dels seus serveis i del model conceptual mitjançant una ontologia pròpia.
  • 32. La integració de diferents aplicacions requereix d'una arquitectura i uns llenguatges de modelat comuns, el que es coneix com coreografia de serveis . És el camp dels meta-models, Meta Object Facility (MOF) [7]
  • 33.
  • 34. L'elecció d'una arquitectura basada en ontologies pel suport del coneixement és fruit d'una acurada reflexió sobre els avantatges que ens pot proporcionar respecte altres dissenys. Tanmateix dins el model podran cooperar diverses ontologies especialitzades.
  • 35. El model haurà de ser viable amb els medis i tecnologies actuals. Es a dir, l'extracció d'informació i la inferència de nou coneixement s'hauria d'aconseguir en temps computacionalment acceptable.
  • 36. No obstant no formar part dels objectius d'aquest projecte la seva posterior implementació, implícitament s'està pensant en la web semàntica, amb la intervenció d'agents intel·ligents gestionant les actualitzacions de dades.
  • 37. Notes bibliogràfiques [1] GEDCOM http://homepages.rootsweb.ancestry.com/%7Epmcbride/gedcom/ [2] Gentech-GDM Reference Model Autor: Stanley Mitchell. Publicació: 2003 http://freepages.history.rootsweb.com/~mitchellsharp/gdmref/gdmref-01.pdf [3] Enabling the Distributed Family Tree Autor: Hilton Campbel. Publicació: Department of Computer Science - BYU . Nov 2006 http://www.dftproject.org/blog/thesis-proposal/ [4] A utomatic extraction from and reasoning about genealogical records Autor: Charla Woodbury. Publicació: Brigham Young University (BYU, Utah – EEUU). Agost 2010 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.167.8352&rep=rep1&type=pdf [5] SWRL: A Semantic Web Rule Language Combining OWL and RuleML Autor: Ian Horrocks i altres. Publicació: W3C Member Submission 21 May 2004 http://www.w3.org/Submission/SWRL/ [6] OWL 2 Web Ontology Language - Profiles Autor: Boris Motik i altres. Publicació: W3C Recommendation 27 October 2009 http://www.w3.org/TR/2009/REC-owl2-profiles/ [7] OMG's MetaObject Facility http://www.omg.org/mof/