1. Un Método Incremental para la Clasificación Automática y Semántica de Recursos en Sistema de Etiquetado Colaborativo Directores: Jesús Villadangos y Alberto Córdoba Francisco Echarte Ayerra Defensa de Tesis Doctoral – 3 de mayo de 2011
2. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones
8. Naturaleza de las folcsonomías Análisis de co-ocurrencias y representaciones vectoriales Cattuto, C., Benz, D., Hotho, A., y Stumme, G. (2008). Semantic grounding of tag relatedness in social bookmarking systems. r 1 r 2 r 3 r 4 r 1 r 2 r 3 r 4 Usuario 1 Usuario 2 Usuario 3 0 2 3 0 2 2 0 1 0 1 3 1 0 0 1 0 0 0 0 2 2 1 1 2 0 Etiqueta- Etiqueta 1 3 0 0 1 1 0 0 0 3 0 0 0 0 2 1 1 1 1 1 Etiqueta- Recurso 2 1 1 1 1 0 1 1 1 1 1 1 1 1 2 Etiqueta– Usuario Usuario 1 Usuario 2 Usuario 3
9. Naturaleza de las folcsonomías Coseno de similaridad r 1 r 2 r 3 r 4 1 3 0 0 1 1 0 0 0 3 0 0 0 0 2 1 1 1 1 1 Etiqueta- Recurso
10.
11.
12.
13. Principales aproximaciones Ranking de resultados Enriquecimiento semántico Navegación y búsquedas Variaciones sintácticas Agrupación de etiquetas Nubes de etiquetas Sugerencias y expansión de consultas Basado en análisis estadístico Basado en alineamiento con fuentes externas
14.
15. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones
16.
17. Objetivos e hipótesis Recursos Etiquetas Arte y Cultura Blogs y Web 2.0 Informática ACoAR Cocina
18. Posicionamiento Objetivos en comparación con otras propuestas Abbasi, R., Staab, S., y Cimiano, P. (2007). Organizing resources on tagging systems using t-org. Yin, Z., Li, R., Mei, Q., y Han, J. (2009). Exploring social tagging graph for web object classification. Clasificación automática Recursos Recursos Etiquetas Centrado en Técnica incremental Sin intervención manual usuario Independencia fuentes externas Categorías evolución Categorías automáticas Categorías predefinidas Análisis Co-ocurrencias ACoAR TagModel T-Org
19. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones
20. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
23. Diccionario 21 1 6 1 10 4 36 27 11 2 1 0 4 4 0 0 0 0 0 0 r 8 70 19 3 3 15 0 5 4 Opensource t 20 13 5 2 0 0 0 4 1 ror t 19 30 1 4 12 2 3 1 1 ajax t 18 51 0 41 0 0 4 4 1 ruby t 17 24 0 7 0 7 0 0 0 database t 16 1 3 1 2 0 6 0 0 0 mysql t 15 63 13 0 13 0 0 0 1 python t 14 173 18 29 21 75 3 0 0 programming t 13 58 0 3 24 18 1 1 0 java t 12 73 21 0 7 0 6 33 4 architecture t 11 13 0 2 0 0 9 1 0 history t 10 101 0 4 0 0 15 81 1 picasso t 9 43 1 0 0 4 11 23 0 warhol t 8 124 0 0 0 0 75 41 4 musuem t 7 136 0 0 0 1 37 98 0 art t 6 17 5 0 0 0 3 2 7 blogging t 5 47 7 5 0 3 0 1 31 socialweb t 4 46 0 4 9 2 5 0 26 twitter t 3 18 0 3 0 0 0 4 11 blogs t 2 85 21 1 6 4 3 3 47 blog t 1 r 7 r 6 r 5 r 4 r 3 r 2 r 1
24. Conceptos de clasificación <U,R,T,A,D, C ,Z,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios Blogs y Web 2.0 Arte y Cultura Informática
26. Clasificación Blogs y Web 2.0 r 1 r 2 r 3 r 4 r 5 r 6 r 7 r 8 Clasificados Convergidos Pendientes <U,R,T,A,D,C, Z ,V,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios Arte y Cultura Informática
27. Vectores de representación <U,R,T,A,D,C,Z, V ,S> Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios 0 5 opensource t 20 0 4 ror t 19 3 1 ajax t 18 4 4 ruby t 17 0 0 database t 16 0 0 mysql t 15 0 0 python t 14 3 0 programming t 13 1 1 java t 12 6 33 architecture t 11 9 1 history t 10 15 81 picasso t 9 11 23 warhol t 8 75 41 musuem t 7 37 98 art t6 3 2 blogging t5 0 1 socialweb t 4 5 0 twitter t 3 0 4 blogs t 2 3 3 blog t 1 r 3 r 2 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,8 ,4 ,4 ,0 ,135 ,37 ,98 ,0 ,116 ,75 ,41 ,0 ,34 ,11 ,23 ,0 ,96 ,15 ,81 ,0 ,39 ,6 ,33 ,0 ,2 ,1 ,1 ,0 ,3 ,3 ,0 ,0 ,4 ,3 ,1 ,0 ,1 ,0 ,1 ,0) ,0 (1 V(t 1 ) = ,5) ,5 (6 V( Arte y Cultura ) = ,0) ,5 (3 V(r 3 ) = + ,5) ,0 (3 V(r 2 ) =
28. Similaridades S RR S CC S CD S CR <U,R,T,A,D,C,Z,V, S > Etiquetas Diccionario Clasifícación Similaridades Vectores Conceptos Anotaciones Recursos Usuarios vs vs vs vs Medida de similaridad Diccionario Conceptos Recursos Conceptos Recursos Conceptos Conceptos Recursos Conceptos Diccionario Recursos
29. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
50. Implementación de los componentes Mensualmente Se almacenan mayores a 0,25 Entre recursos si pertenecen al mismo concepto Etiquetas más relevantes Levenshtein para evitar variaciones sintácticas Unión si similaridad mayor a 0.75 K-means distribuido Modo delta con threshold=0.1 Se reintenta cada 50 anotaciones Coseno de similaridad 100 anotaciones Etiquetas con un mínimo de 1.000 anotaciones Condición de recálculo Cálculo de similaridades Asignación de nombres Unión o división de clusters Clustering Clasificador Medida de similaridad Criterio de convergencia Diccionario
52. Evolución etiquetas y diccionario Número de etiquetas en la folcsonomía Número de etiquetas en el diccionario Ratio etiquetas diccionario / folcsonomía
53. Evolución de los recursos Estado de los recursos tras cada recálculo Número de recursos
54. Evolución de los conceptos Finance & Money ds 9 Psychology ds 8 Rss ds 7 Design & Logo ds 6 Generator & Fun & Tools ds 5 ds 4 Posters & Design & Art Usability & Design & Webdesign Origami Conceptos creados ds 3 ds 2 ds 1 Origami Art & Design Howto & Diy 13 Howto & Diy 82 189 Art & Design 70 16 190 1 69 188 Business & Finance & Money Finance & Money Business 110 115 215 118 119 6
55. Conceptos creados Templates & Webdesign Politics Jobs & Career Flash & Animation & Fun Storage & Tools & Backup Php Javascript Firefox Wordpress Software & Windows & Tools Photoshop Java Finance & Money Windows Shopping Photos & Photography & Images Iphone Fashion Wiki Seo & Tools Photography Humor & Funny Environment & Green & Sustainability Webdesign & Design Security Origami & Paper & Papercraft Html & Webdesign & Web Education & Resources Web2.0 & Social & Socialnetworking Search Opensource & Software Howto & Diy Django & Python Wallpaper Science News Health Design & Logo Video Ruby & Rails Music Hardware & Electronics Design Usability & Webdesign & Design Rss Mobile Google Css Ubuntu & Linux Reference & Research Math Git & Database & Mysql Cocoa & Programming & Mac Twitter Python Mac & Software & Osx Generator & Tools & Fun Cms Tv & Video Psychology Linux & Unix & Reference Games Business Travel Programming Linux Food & Recipes & Cooking Books Torrent & Bittorrent Programming & .net & Development Latex & Wow Fonts & Typography & Design Blog Tools & Web2.0 Productivity & Gtd & Lifehacks Language & English & Writing Flex Audio Testing & Tools Posters & Design & Art Jquery Flash Art
56.
57. Extensión de la folcsonomía Clasificador Diccionarios Creación y evolución del modelo Prototipo de navegación 3 Método automático de clasificación
64. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones
65.
66.
67. Agenda 1 2 3 4 5 Introducción Hipótesis y objetivos principales Método automático de clasificación Conclusiones y líneas futuras Publicaciones
68. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
69. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
70. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
71. Social Web Evolution : Integrating Semantic Applications and Web 2.0 Technologies eHealth : Ubiquitous Health and Medical Informatics: Advancements in Web 2.0, Health 2.0 and Medicine 2.0 SAAKM-KCAP : Workshop on Semantic Authoring, Annotation and Knowledge Markup (SAAKM 2007) at KCAP ’07 WSKS : World Summit on the Knowledge Society WASET : World Academy of Science, Engineering and Technology IEEE Latina: Latin America Transactions, IEEE SAC : Symposium on Applied Computing ICWE : International Conference on Web Engineering ITA : International Conference on Internet Techonologies K-CAP : Conference on Knowledge Capture SDOW : Social Data on the Web Workshop (SDoW’09) at ISWC’10 SEMAPRO : Conference on Advances in Semantic Processing 2007 2008 2009 2010 2011 K-CAP WASET Diciembre Noviembre SEMAPRO SDOW (ISWC) Octubre ITA WSKS SAAKM (K-CAP) Septiembre Agosto Julio K-CAP ICWE Junio Mayo Abril Marzo Febrero Enero eHealth SAC IEEE Latina SAC Social Web Evolution
72.
73.
74. Un Método Incremental para la Clasificación Automática y Semántica de Recursos en Sistema de Etiquetado Colaborativo Directores: Jesús Villadangos y Alberto Córdoba Francisco Echarte Ayerra Defensa de Tesis Doctoral – 3 de mayo de 2011