Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.
Analítica	visual	de	datos	para	representación	de
la	interacción	en	una	red	social	privada	y	con
restricciones	de	privacida...
Introducción
• Este	trabajo	se	desarrolla	dentro	del	proyecto	WYRED[1],	el	cual	está	financiado	por	la	Unión	Europea	
bajo...
Introducción
Plataforma	
social
Usuarios	con	
distinto	rol
Requisitos	de	
privacidad
Interacciones
Proyectos	de	
investiga...
Objetivos
• Utilizar	la	Analítica	Visual	para	explorar	las	interacciones	en	el	proyecto	WYRED
• Realizar	una	propuesta	de	...
Metodología	utilizada
• En	primer	lugar	se	ha	realizado	una	detección	de	necesidades	con	el	fin	de	dar	respuesta	a	
aquell...
Estado	del	arte
• Redes	sociales:	evolución,	características	y	principales	métricas
• Foros	de	discusión:	estructura,	técn...
Estado	del	arte
• ¿Quiénes	son	los	autores	más	importantes?
• ¿Cuál	ha	sido	la	evolución	temporal	de	este	campo?
• ¿En	qué...
Propuesta	de	arquitectura
• Los	principales	requisitos	que	con	los	que	tiene	que	lidiar	son:
• La	capacidad	de	trabajar	co...
Propuesta	de	arquitectura
Propuesta	de	arquitectura
• El	módulo	para	el	análisis	de	los	temas	más	frecuentes	se	encarga	de	extraer	los	temas	que	se	...
Propuesta	de	arquitectura
• La	detección	de	comunidades	es	otra	de	las	principales	tareas	que	se	quiere	realizar,	para	con...
Propuesta	de	arquitectura
• La	exploración	de	los	usuarios	es	otra	de	las	cuestiones	más	demandadas,	debido	a	la	
heteroge...
Propuesta	de	arquitectura
• Otro	aspecto	clave	del	proyecto	es	medir	las	diferencias	culturales	entre	usuarios	de	distinto...
Generación	del	conjunto	de	datos
• Para	probar	la	propuesta	de	arquitectura	es	necesario	contar	con	un	conjunto	de	datos,	...
Generación	del	conjunto	de	datos
Resultados
Resultados
Conclusiones
• Se	ha	propuesto	una	arquitectura	que	sirva	como	base	para	el	desarrollo	de	distintos	módulos	
que	permitan	...
Bibliografía
• [1]	García-Peñalvo,	F.J.,	Kearney,	N.A.:	Networked	youth	research	for	empowerment	in	digital	society.	
The	...
Agradecimientos
With	the	support	of	the	EU	Horizon	2020	Programme in	its	“Europe	in	a	changing	world	– inclusive,	
innovat...
Analítica	visual	de	datos	para	representación	de
la	interacción	en	una	red	social	privada	y	con
restricciones	de	privacida...
Próxima SlideShare
Cargando en…5
×

Analítica visual de datos para representación de la interacción en una red social privada y con restricciones de privacidad

73 visualizaciones

Publicado el

TFM - Máster en Sistemas Inteligentes de la Universidad de Salamanca

Publicado en: Educación
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Analítica visual de datos para representación de la interacción en una red social privada y con restricciones de privacidad

  1. 1. Analítica visual de datos para representación de la interacción en una red social privada y con restricciones de privacidad Jorge Durán Escudero
  2. 2. Introducción • Este trabajo se desarrolla dentro del proyecto WYRED[1], el cual está financiado por la Unión Europea bajo el programa Horizonte 2020 (Referencia 727066) • Su duración comprende desde el 1/11/2016 al 31/10/2019 • Su presupuesto es de 993.662,50€ • El consorcio que lo desarrolla está formado por: • Universidad de Salamanca (España) • OXFAM Italia Onlus (Italia) • PYE global (Reino Unido) • Asist Ogretim Kurumlari A.S. (Turquía) • Early Years (Reino Unido) • Youth for Exchange and Understanding International (Bélgica) • Zauchner-Studnicka Sabine (Austria) • The Boundaries Observatory (Reino Unido) • Tel Aviv University (Israel) • Está accesible en https://wyredproject.eu
  3. 3. Introducción Plataforma social Usuarios con distinto rol Requisitos de privacidad Interacciones Proyectos de investigación • El objetivo es permitir que los tengan voz sobre la sociedad actual, para influir en la toma de decisiones • Para ello cuenta con un ecosistema tecnológico, cuyo componente principal es el siguiente[2]:
  4. 4. Objetivos • Utilizar la Analítica Visual para explorar las interacciones en el proyecto WYRED • Realizar una propuesta de arquitectura que permita desarrollar las visualizaciones interactivas • Los principales requisitos de esta arquitectura es que debe ser flexible para poder adaptarse a los cambios del proyecto y que tiene que ayudar a los investigadores a: • Conocer cómo evoluciona la comunidad • Tomar decisiones basadas en las respuestas de los jóvenes • Los objetivos secundarios de este trabajo son: • La validación de esta propuesta • El estudio de distintos mecanismos para representar grandes volúmenes de datos
  5. 5. Metodología utilizada • En primer lugar se ha realizado una detección de necesidades con el fin de dar respuesta a aquellas preguntas de investigación más relevantes: • ¿Cómo se relacionan los usuarios? • ¿Cuáles son los temas más frecuentes? • ¿Hay un comportamiento distinto según el género de los usuarios? • ¿La participación es igual en cualquier instante temporal? • En segundo lugar se ha realizado una revisión sistemática de la literatura (SLR) con el fin de recopilar, analizar y conocer los trabajos más importantes que se han realizado para explorar datos de comunidades mediante la analítica visual
  6. 6. Estado del arte • Redes sociales: evolución, características y principales métricas • Foros de discusión: estructura, técnicas de análisis y características de sus usuarios • Privacidad: necesidad de la misma y maneras de respetarla • La creación de un conjunto de datos: qué técnicas se han utilizado para generar un conjunto de datos artificial • Analítica Visual: qué es, qué ventajas plantea, dónde se ha aplicado y cómo es posible aplicarla
  7. 7. Estado del arte • ¿Quiénes son los autores más importantes? • ¿Cuál ha sido la evolución temporal de este campo? • ¿En qué medios están publicados los documentos más relevantes de este campo? • ¿Cuáles son las principales técnicas de visualización utilizadas? • ¿Qué soluciones ofrece la visualización interactiva de datos para explorar el contenido y los datos de uso de una plataforma?
  8. 8. Propuesta de arquitectura • Los principales requisitos que con los que tiene que lidiar son: • La capacidad de trabajar con distintas fuentes de datos • El soporte para gestionar la privacidad de los mismos • El análisis automático de los datos • La capacidad de representar la información mediante visualizaciones interactivas • Para soportarlos se va a utilizar una arquitectura de micronúcleo, que se basa en ofrecer una funcionalidad mínima en el núcleo y una serie de componentes que realizan las tareas requeridas • Siendo el núcleo el encargado de la obtención y anonimización de los datos, y los componentes los que construirán cada una de las visualizaciones • La principal ventaja de este sistema es que es muy flexible, permitiendo añadir y quitar módulos, desarrollarlos por separado y adaptarlos a las necesidades futuras
  9. 9. Propuesta de arquitectura
  10. 10. Propuesta de arquitectura • El módulo para el análisis de los temas más frecuentes se encarga de extraer los temas que se incluyen en cada mensaje y establecer un conteo estadístico de los mismos • Para extraer de manera automática el tema a partir de un mensaje se propone utilizar LDA[3] • Respecto a la visualización, se ha combinado el concepto de Theme River[4], con la disposición de un gráfico de áreas sobre líneas horizontales paralelas, con el fin de poder representar más elementos
  11. 11. Propuesta de arquitectura • La detección de comunidades es otra de las principales tareas que se quiere realizar, para conocer cómo interaccionan los usuarios • Para poder representar este tipo de datos se ha elegido la visualización en forma de grafo ya que es la que mejor se adapta y permite ver las distintas comunidades que forman los mismos • Para ello se ha definido una métrica que dota a los arcos entre dos nodos de una longitud menor, cuanto más interacción han tenido
  12. 12. Propuesta de arquitectura • La exploración de los usuarios es otra de las cuestiones más demandadas, debido a la heterogeneidad de los mismos • El tipo de visualización propuesta son las coordenadas paralelas[5], ya que permiten representar multitud de características, de manera sencilla, en un contexto bidimensional • Además este sistema permite explorar los datos fácilmente mediante el filtrado múltiple
  13. 13. Propuesta de arquitectura • Otro aspecto clave del proyecto es medir las diferencias culturales entre usuarios de distintos países y cómo es la participación en cada uno de ellos • Para ello se plantea el uso de un mapa donde se pueda identificar por el color a aquellas regiones más activas. Aunque proyecciones para un mapa hay muchas, se propone usar la proyección Mercator al ser la más utilizada en Internet
  14. 14. Generación del conjunto de datos • Para probar la propuesta de arquitectura es necesario contar con un conjunto de datos, sin embargo, el proyecto todavía no tiene los suficientes usuarios para generarlo • La generación de los datos es un proceso complejo, donde se pueden utilizar múltiples enfoques: • Usar los datos de una comunidad similar • Utilizar otras fuentes de datos con características comunes • Generar los datos de manera artificial • El principal proyecto que genera un conjunto de datos de forma artificial es LDBC-SNB Data Generator[6], sin embargo, no se puede modificar y adaptar los datos que genera. Por ello se ha decido generar el conjunto de datos desde cero, siguiendo estos pasos: • Analizar las entidades a simular • Identificar sus principales atributos • Crear el grafo de dependencia entre los mismos siguiendo el modelo de S3G2[7] • Asignar valores a cada atributo de manera lógica
  15. 15. Generación del conjunto de datos
  16. 16. Resultados
  17. 17. Resultados
  18. 18. Conclusiones • Se ha propuesto una arquitectura que sirva como base para el desarrollo de distintos módulos que permitan crear visualizaciones interactivas • Se ha conseguido explorar los datos del proyecto WYRED mediante la analítica visual, de una manera sencilla y efectiva • Esta propuesta ha permitido solventar los problemas surgidos al trabajar en un entorno multicultural, respetando la privacidad de cada usuario • Este trabajo podría ser ampliado mediante: • La realización de un estudio de usabilidad con un número reducido de usuarios • El soporte al trabajo colaborativo • La integración del mismo con otros sistemas
  19. 19. Bibliografía • [1] García-Peñalvo, F.J., Kearney, N.A.: Networked youth research for empowerment in digital society. The WYRED project. In: García-Peñalvo, F.J. (ed.) Proceedings of the Fourth International Conference on Technological Ecosystems for Enhancing Multiculturality (TEEM’16) (Salamanca, Spain, November 2-4, 2016), pp. 3-9. ACM, New York, NY, USA (2016) • [2] García-Peñalvo, F.J., Durán-Escudero, J.: Interaction design principles in WYRED platform. In: Zaphiris, P., Ioannou, A. (eds.) Learning and Collaboration Technologies. Technology in Education. 4th International Conference, LCT 2017. Held as Part of HCI International 2017, Vancouver, BC, Canada, July 9–14, 2017. Proceedings, Part II, pp. 371-381. Springer International Publishing, Switzerland (2017) • [3] Blei, D. M., Ng, A. Y. and Jordan, M. I. Latent dirichlet allocation. Journal of machine Learning research, 3, Jan (2003), 993-1022. • [4] Havre, S., Hetzler, E., Whitney, P. and Nowell, L. ThemeRiver: visualizing thematic changes in large document collections. IEEE Trans Visual Comput Graphics, 8, 1 (2002), 9-20. • [5] Inselberg, A. and Dimsdale, B. Parallel Coordinates for Visualizing Multi-Dimensional Geometry. Springer Japan, City, 1987. • [6] Sanchez, A. P. X. LDBC-SNB Data Generator. 2017. • [7] Pham, M.-D., Boncz, P. and Erling, O. S3g2: A scalable structure-correlated social graph generator. Springer, City, 2012.
  20. 20. Agradecimientos With the support of the EU Horizon 2020 Programme in its “Europe in a changing world – inclusive, innovative and reflective Societies (HORIZON 2020: REV-INEQUAL-10-2016: Multi-stakeholder platform for enhancing youth digital opportunities)” Call. Project WYRED (netWorked Youth Research for Empowerment in the Digital society) (Grant agreement No 727066). The sole responsibility for the content of this webpage lies with the authors. It does not necessarily reflect the opinion of the European Union. The European Commission is not responsible for any use that may be made of the information contained therein.
  21. 21. Analítica visual de datos para representación de la interacción en una red social privada y con restricciones de privacidad Jorge Durán Escudero

×