1. INNOVA DIINF
AYLLU (Inteligencia Colectiva)
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Plataforma de Apoyo a la Gestión de Emergencias y Aplicaciones
Proyecto Fondef Idea ID15I-10560
2. Descripción
El siguiente proyecto es parte del Portafolio de Innovación del Departamento de
Ingeniería en informática de la Universidad de Santiago de Chile (USACH).
Esta área está dirigida por el Dr. Mauricio Marín, profesor titular del Departamento
de Ingeniería Informática de la Universidad de Santiago de Chile, e investigador
senior en los laboratorios de Yahoo! Latinoamérica gracias al apoyo de la
Universidad de Chile.
Sus líneas de investigación se centran en computación paralela y sistemas
distribuidos con aplicaciones en motores de búsqueda web. Ha obtenido becas
de investigación para profundizar sus estudios en el ámbito del procesamiento de
consultas en paralelo sobre las bases de datos distribuidas en espacio métrico y
sobre algoritmos paralelos escalables. Además, trabaja en estructuras de datos
para la búsqueda de texto e indexación.
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
3. Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
● En los últimos años las redes sociales se han utilizado como poderosas herramientas para la comunicación
durante desastres naturales.
● Sistemas de Microblogging como Twitter son útiles en este contexto ya que provee APIs públicas de Streaming y
del tipo REST.
● Problemática: ¿Cómo organizar y categorizar la información proveniente de redes sociales i.e Twitter?
○Clasificar información en distintas categorías (por ejemplo: asertiva, informativa y/o contingente) es inmanejable
por humanos debido a su volumen y velocidad de generación.
○Por lo tanto el uso de herramientas de crowdsourcing para construir conjuntos de entrenamiento es
indispensable para construir clasificadores de forma oportuna.
Contexto y Necesidad
4. Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Modelo Conceptual
5. Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
● Ayllu es un herramienta de Crowdsourcing basada en Pybossa que permite recolectar, analizar y enriquecer datos.
Para este caso particular se utiliza para proporcionar diferentes etiquetas a tweets generados durante un desastre.
● Es importante notar que el proceso de etiquetado puede ser en base a múltiples taxonomías.
Aprendizaje supervisado con Ayllu
6. Pantalla principal
mostrando los
proyectos de
etiquetado
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
7. Inicio de sesión con
distintos servicios
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
8. Vista de proyectos
destacados por el
administrador,
indicando
información de
creación, progreso y
actualización
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
9. Consentimiento
informado de los
voluntarios digitales
clasificadores de
tweets
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
10. Clasificación de un
tweet según tipo de
información durante
un desastre
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Una vez etiquetado el tweet/imagen/texto, el
sistema espera que existan al menos 3
etiquetas por cada elemento y la tarea de
etiquetado se da por completada.
11. Exportación de tareas
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Cuando todas las tareas del proyecto se encuentran
completadas se pueden exportar en formato json/csv
para ser procesadas y construir un conjunto de
entrenamiento que es el insumo para diseñar e
implementar clasificadores de texto.
12. Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
● El tiempo utilizado por humanos para etiquetar es muy costoso.
● Utilizar técnicas como Active Learning para mejorar la calidad de los clasificadores con pocas instancias
etiquetadas.
● Diferencias culturales entre cada desastre disminuyen la calidad de los clasificadores cuando son cambiados de
contexto.
● Transfer learning: esto se refiere al problema de utilizar datos de un desastre para generar un clasificador para otro
desastre.
● Mejorar métodos de aprendizaje semi-supervisado para mejorar modelos, sin la necesidad de tantas etiquetas
humanas.
Inteligencias y Desafíos I+D
13. Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Arquitectura del Sistema
14. Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Twitter:
Carlos Castillo, Marcelo Mendoza, and Barbara Poblete. Information credibility on twitter. InWWW ’11 Proceedings of the 20th international conference on World wide web, New York,
USA,October 25-29, 2011, pages 675–684, 2011
Aditi Gupta and Ponnurangam Kumaraguru. Credibility ranking of tweets during high impactevents. InPSOSM ’12 Proceedings of the 1st Workshop on Privacy and Security in Online
SocialMedia, NY, USA, 2012, 2012
Combinacion de humanos + AI:
Muhammad Imran, Carlos Castillo, Ji Lucas, Patrick Meier, and Jakob Rogstadius. Coordinatinghuman and machine intelligence to classify microblog communications in crises. InProceedings ofthe
11th International ISCRAM Conference, Atlanta, USA, May, 2014, 2014.
Muhammad Imran, Carlos Castillo, Ji Lucas, Patrick Meier, and Sarah Vieweg. Aidr: Artificialintelligence for disaster response. In23rd International Conference on World Wide Web
(2014),Seoul, Korea, April 7-11, 2014, page 159–162, 2014
Muhammad Imran, Shady Elbassuoni, Carlos Castillo, Fernando Diaz, and Patrick Meier. Extractinginformation nuggets from disaster- related messages in social media. InProceedings of the
10thInternational ISCRAM Conference, Baden-Baden, Germany, May 13-17, 2013, pages 26–33, 2013.
Referencias
15. INNOVA DIINF
AYLLU (Inteligencia Colectiva)
Innova DIINF (Departamento de Ingeniería Informática)
www.innovadiinf.usach.cl · Universidad de Santiago de Chile
Plataforma de Apoyo a la Gestión de Emergencias y Aplicaciones
Proyecto Fondef Idea ID15I-10560