SlideShare una empresa de Scribd logo
1 de 16
Gestión de servicio
usando Twitter
Presentación
Octubre 2016 – Campus Google Madrid
Íñigo González
Product Owner Data & Machine Learning
Mobile One2One
MOBILE BUSINESS
ÍNDICE
¿Quién soy yo?
Problema a resolver
Planteamiento
Solución
Postmortem
1
2
3
4
5
1 MO2O Quién soy
¿Quién soy yo?
• No me gustaban las bases de datos, ni la
estadística
• Probablemente la persona más crítica que
conozcas con el stack de big data actual
• Vengo del área de sistemas y seguridad
• Product owner de Data & Machine
Learning en Mobile One2One
Íñigo González
@exocert
2 MO2O QUÉ HACEMOS
Problema a resolver
Monitorizar en tiempo real el estado de un servicio de streaming
de video usando los twits que los usuarios envían a la cuenta de
twitter #netflixhelps y / o otras cuentas de susceptibles de
recibir mensajes similares.
Restricciones
Sólo podemos usar soluciones Open Source
Limitación de cores (16), memoria (24GB), y disco
3 MO2O PLANTEAMIENTO
Primera idea
Twitter
SAP
HANA
Frontal
3 MO2O PLANTEAMIENTO
Primera idea: INVIABLE
3 MO2O PLANTEAMIENTO
Requisitos (I): Software Empresarial
Operativa
Sencilla
Cumplimiento
legal
Evolución
Sencilla
Pocos componentes
Configuración vs Código
Responder a una petición ARCO
en menos de 10 días
Componentes fácilmente
reemplazables
3 MO2O PLANTEAMIENTO
Requisitos (ii): Software para PERSONAS
Tiempo Real Novedoso Sentimiento
Tiempo real “soft”
Para personas,
no para máquinas
Nuevos usos a
herramientas que funcionan
Sentimiento positivo refleja
buen servicio (salvo Trolls)
3 MO2O PLANTEAMIENTO
Restricciones
Sin APIS ML Offline Base de datos
Latencia API impiden tiempo real
Clasificador de sentimiento propio
La máquina no aprende
en tiempo real
No columnar, blockchain…
Debe soportar muchas escrituras,
modificaciones, y borrados
4 MO2O SOLUCIÓN
Arquitectura desde 15.000 pies de altura
Cliente
Twitter
BBDD Frontal
4 MO2O SOLUCIÓN
Arquitectura desde 10.000 pies de altura
Cliente Twitter
Keshif
4 MO2O SOLUCIÓN
Restricciones
Keshif
Cliente Twitter
4 MO2O SOLUCIÓN
IN_netflixhelps
Legal_blacklist
Stemming
Geocode
Sentiment
Classiffier
OUT_Tweet_sentiment
Twitter
Streaming
reader
Twitter
Batch
Reader
Table_group
Tweets
Table_group
Sentiment_aggr
Streams Topics
Cassandra
Writer
Kafka reader
Arquitectura final
4 MO2O SOLUCIÓN
Reflexiones: Aciertos
Protección de datos
Contemplado en fase de diseño (nueva directiva protección datos)
Mensajes twitter están especialmente protegidos en LOPD (religión, política, orientación sexual)
Lista de oposición a tratamiento de datos está en Kafka
Kafka Streaming
Vale la pena para tareas “ligeras”
Redundancia mejor de la esperada
Talend (ETL)
Facilita mucho comunicar y documentar
movimiento de datos twitter -> Kafka -> Cassandra
4 MO2O SOLUCIÓN
Reflexiones: Dificultades
Kafka streaming
Windows es un ciudadano de segunda clase: DLL HELL!
No distribuido 
Muchos componentes (Maven, Kstreams, Java, Cassandra, Python…)
Curva de aprendizaje dura
Cassandra: Documentación
Cassandra cambió la interfaz a CQL y no es fácil encontrar
documentación buena para un paso crítico.
Íñigo González
Product Owner, Data & Machine Learning
Inigo.gonzalez@mo2o.com
@exocert
___________________________________________________
MO2O
Avda. De Burgos 8 – Pl. 16 – Edif. Bronce . Madrid 28036

Más contenido relacionado

Similar a Data Science Awards 2016 - Best Data Engineer

2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigDataKEEDIO
 
Microsoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de planta
Microsoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de plantaMicrosoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de planta
Microsoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de plantaAlberto Diaz Martin
 
Machine Learning ¿A TODO GAS? con GraalVM
Machine Learning ¿A TODO GAS? con GraalVMMachine Learning ¿A TODO GAS? con GraalVM
Machine Learning ¿A TODO GAS? con GraalVMFrancisco Javier Barrena
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningStratebi
 
Trabajo de tecnología grupo 7
Trabajo de tecnología grupo 7Trabajo de tecnología grupo 7
Trabajo de tecnología grupo 7nataliagiraldo72
 
Tecnologia grupo 7 2021
Tecnologia grupo 7 2021Tecnologia grupo 7 2021
Tecnologia grupo 7 2021KrystalGiraldo
 
Meta-modelos y lenguajes de dominio específico en Internet de las cosas
Meta-modelos y lenguajes de dominio específico en Internet de las cosasMeta-modelos y lenguajes de dominio específico en Internet de las cosas
Meta-modelos y lenguajes de dominio específico en Internet de las cosasFacultad de Informática UCM
 
Soluciones de búsqueda corporativa
Soluciones de búsqueda corporativaSoluciones de búsqueda corporativa
Soluciones de búsqueda corporativaraulpri
 
Stratebi Services
Stratebi ServicesStratebi Services
Stratebi ServicesStratebi
 
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...Socialmetrix
 
Power Platform 2020
Power Platform 2020Power Platform 2020
Power Platform 2020Raona
 
Seminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con AtlasSeminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con AtlasMongoDB
 
Data Day 2018 panorama de contenidos y un vistazo a Data Quality
Data Day 2018 panorama de contenidos y un vistazo a Data QualityData Day 2018 panorama de contenidos y un vistazo a Data Quality
Data Day 2018 panorama de contenidos y un vistazo a Data QualitySoftware Guru
 
Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open SourceStratebi
 
IBM Domino 9/IBM Notes 9 - La mejor de todas las versiones
IBM Domino 9/IBM Notes 9 - La mejor de todas las versionesIBM Domino 9/IBM Notes 9 - La mejor de todas las versiones
IBM Domino 9/IBM Notes 9 - La mejor de todas las versionesLuis Roberto Canelo Maza
 

Similar a Data Science Awards 2016 - Best Data Engineer (20)

2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Microsoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de planta
Microsoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de plantaMicrosoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de planta
Microsoft IoT Connect 2017 - Cómo integrar el poder de la nube a ras de planta
 
Machine Learning ¿A TODO GAS? con GraalVM
Machine Learning ¿A TODO GAS? con GraalVMMachine Learning ¿A TODO GAS? con GraalVM
Machine Learning ¿A TODO GAS? con GraalVM
 
Blockchain, tenemos una solución busquemos el problema
Blockchain, tenemos una solución busquemos el problemaBlockchain, tenemos una solución busquemos el problema
Blockchain, tenemos una solución busquemos el problema
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine Learning
 
Trabajo de tecnología grupo 7
Trabajo de tecnología grupo 7Trabajo de tecnología grupo 7
Trabajo de tecnología grupo 7
 
Tecnologia grupo 7 2021
Tecnologia grupo 7 2021Tecnologia grupo 7 2021
Tecnologia grupo 7 2021
 
1. Introducción Big Data
1.  Introducción Big Data1.  Introducción Big Data
1. Introducción Big Data
 
Meta-modelos y lenguajes de dominio específico en Internet de las cosas
Meta-modelos y lenguajes de dominio específico en Internet de las cosasMeta-modelos y lenguajes de dominio específico en Internet de las cosas
Meta-modelos y lenguajes de dominio específico en Internet de las cosas
 
2016 cloud summit_iot
2016 cloud summit_iot2016 cloud summit_iot
2016 cloud summit_iot
 
Soluciones de búsqueda corporativa
Soluciones de búsqueda corporativaSoluciones de búsqueda corporativa
Soluciones de búsqueda corporativa
 
Stratebi Services
Stratebi ServicesStratebi Services
Stratebi Services
 
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
Conferencia MySQL, NoSQL & Cloud: Construyendo una infraestructura de big dat...
 
Power Platform 2020
Power Platform 2020Power Platform 2020
Power Platform 2020
 
AWS Summit Mexico 2015 Key Note Raul Frias
AWS Summit Mexico 2015 Key Note Raul Frias AWS Summit Mexico 2015 Key Note Raul Frias
AWS Summit Mexico 2015 Key Note Raul Frias
 
Seminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con AtlasSeminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con Atlas
 
Data Day 2018 panorama de contenidos y un vistazo a Data Quality
Data Day 2018 panorama de contenidos y un vistazo a Data QualityData Day 2018 panorama de contenidos y un vistazo a Data Quality
Data Day 2018 panorama de contenidos y un vistazo a Data Quality
 
Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open Source
 
IBM Domino 9/IBM Notes 9 - La mejor de todas las versiones
IBM Domino 9/IBM Notes 9 - La mejor de todas las versionesIBM Domino 9/IBM Notes 9 - La mejor de todas las versiones
IBM Domino 9/IBM Notes 9 - La mejor de todas las versiones
 
Codemotion 2016
Codemotion 2016Codemotion 2016
Codemotion 2016
 

Último

Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfJC Díaz Herrera
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...JC Díaz Herrera
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosMarycarmenNuez4
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 

Último (20)

Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
Familias sionistas dentro de los 10 clanes familiares más ricos por regiones ...
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicos
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 

Data Science Awards 2016 - Best Data Engineer

  • 1. Gestión de servicio usando Twitter Presentación Octubre 2016 – Campus Google Madrid Íñigo González Product Owner Data & Machine Learning Mobile One2One
  • 2. MOBILE BUSINESS ÍNDICE ¿Quién soy yo? Problema a resolver Planteamiento Solución Postmortem 1 2 3 4 5
  • 3. 1 MO2O Quién soy ¿Quién soy yo? • No me gustaban las bases de datos, ni la estadística • Probablemente la persona más crítica que conozcas con el stack de big data actual • Vengo del área de sistemas y seguridad • Product owner de Data & Machine Learning en Mobile One2One Íñigo González @exocert
  • 4. 2 MO2O QUÉ HACEMOS Problema a resolver Monitorizar en tiempo real el estado de un servicio de streaming de video usando los twits que los usuarios envían a la cuenta de twitter #netflixhelps y / o otras cuentas de susceptibles de recibir mensajes similares. Restricciones Sólo podemos usar soluciones Open Source Limitación de cores (16), memoria (24GB), y disco
  • 5. 3 MO2O PLANTEAMIENTO Primera idea Twitter SAP HANA Frontal
  • 7. 3 MO2O PLANTEAMIENTO Requisitos (I): Software Empresarial Operativa Sencilla Cumplimiento legal Evolución Sencilla Pocos componentes Configuración vs Código Responder a una petición ARCO en menos de 10 días Componentes fácilmente reemplazables
  • 8. 3 MO2O PLANTEAMIENTO Requisitos (ii): Software para PERSONAS Tiempo Real Novedoso Sentimiento Tiempo real “soft” Para personas, no para máquinas Nuevos usos a herramientas que funcionan Sentimiento positivo refleja buen servicio (salvo Trolls)
  • 9. 3 MO2O PLANTEAMIENTO Restricciones Sin APIS ML Offline Base de datos Latencia API impiden tiempo real Clasificador de sentimiento propio La máquina no aprende en tiempo real No columnar, blockchain… Debe soportar muchas escrituras, modificaciones, y borrados
  • 10. 4 MO2O SOLUCIÓN Arquitectura desde 15.000 pies de altura Cliente Twitter BBDD Frontal
  • 11. 4 MO2O SOLUCIÓN Arquitectura desde 10.000 pies de altura Cliente Twitter Keshif
  • 14. 4 MO2O SOLUCIÓN Reflexiones: Aciertos Protección de datos Contemplado en fase de diseño (nueva directiva protección datos) Mensajes twitter están especialmente protegidos en LOPD (religión, política, orientación sexual) Lista de oposición a tratamiento de datos está en Kafka Kafka Streaming Vale la pena para tareas “ligeras” Redundancia mejor de la esperada Talend (ETL) Facilita mucho comunicar y documentar movimiento de datos twitter -> Kafka -> Cassandra
  • 15. 4 MO2O SOLUCIÓN Reflexiones: Dificultades Kafka streaming Windows es un ciudadano de segunda clase: DLL HELL! No distribuido  Muchos componentes (Maven, Kstreams, Java, Cassandra, Python…) Curva de aprendizaje dura Cassandra: Documentación Cassandra cambió la interfaz a CQL y no es fácil encontrar documentación buena para un paso crítico.
  • 16. Íñigo González Product Owner, Data & Machine Learning Inigo.gonzalez@mo2o.com @exocert ___________________________________________________ MO2O Avda. De Burgos 8 – Pl. 16 – Edif. Bronce . Madrid 28036