El documento presenta una arquitectura propuesta para Big Data que incluye bloques funcionales para adquisición masiva de datos, almacenamiento en Data Lake, análisis de demografía, lenguaje natural, métricas sociales y redes ego, y presentación de visualizaciones. El objetivo es analizar grandes cantidades de datos para segmentar audiencias y tomar decisiones en RTVE.
6. 24/11/2017 6
The White Rabbit put on his
spectacles.
“Where shall I begin, please
your Majesty?” he asked.
“Begin at the beginning,” the
King said gravely, “and go on till
you come to the end: then stop.”
"Think Big,
Start Small,
Learn Fast”
Source: Devil's Advocate Group
7. 24/11/2017 7
Plataforma de
adquisición y
computación continua
de métricas para el
análisis del
grafo social y de
contenidos de los
perfiles de RTVE para
su segmentación y
toma de decisiones.
13. 24/11/2017 13
Adquisición de datos
Tipología
•Documentos
•Imágenes
•Vídeos
•Posts en redes sociales
•Datos científicos, geográficos, etc.
•Estadísticos
•…
Formato
•Estructurado
•Semi-estructurado
•No estructurado
Acceso
•Ficheros
•Lenguajes de consulta
•Servicio web
•Streams
•BBDD
•...
14. 24/11/2017 14
Adquisición de datos
Tipología
• Noticias medios digitales
• Imágenes y Vídeos de redes sociales
• Textos en redes sociales
• Estadística INE (nombres, lugares, etc.)
• Audiencias RTVE
Formato
• RSS (XML)
• CSV
• JSON
• Texto
Acceso
• Hojas de cálculo
• APIs de servicios web
• Stream de redes sociales
• Enlaces Web
31. NIST Big Data Interoperability Framework: Volume 6, Reference Architecture
https://bigdatawg.nist.gov/
Versión 2-Septiembre 2017
32. 24/11/2017 32
"Think Big,
Start Small,
Learn Fast”
“Sistema Big Data”
Business case
y
Entorno
Datos y
Procesa-
miento
AlmacénAnálisis
Arquitectura e
Infraestructura
Integración y
Explotación
33. ¡Muchas gracias por
su atención!
Dr. Jose María Alvarez-Rodríguez
E-mail: josemaria.alvarez@uc3m.es
WWW: www.josemalvarez.es
@chema_ar
34. Cátedra RTVE-UC3M
Big Data: tecnología al servicio
del mundo audiovisual 4.0
Dr. Jose María Alvarez-Rodríguez
Noviembre 2017
Notas del editor
Qué datos/información necesito
Cómo la obtengo
Cada cuánto la obtengo
Adquisición
Qué datos/información necesito
Cómo la obtengo
Cada cuánto la obtengo
Adquisición
Cómo integro la información
Cómo represento la información
…
Estructura de Data Lake