SlideShare una empresa de Scribd logo
1 de 13
Descargar para leer sin conexión
BIG DATA: Extraer y visualizar grandes volúmenes de datos



                        Visualizaciones en tiempo real
                                 sobre Twitter
                              Fernando Zunino                  Pauline Morrison Fell
                              @fzunino                         @polinmf


Thursday, June 21, 12
Acerca de Zauber
                        •    Somos una boutique de software y lab con base en Argentina y
                             Estados Unidos que provee servicios a una alta gama de líderes
                             de la industria y startups de internet en América Latina y Silicon
                             Valley.

                        •    Nos especializamos en proyectos de Consumer Web, Social
                             Analytics y Big Data. Combinamos nuestros servicios de
                             desarrollo boutique con un laboratorio de I+D para desarrollar
                             nuevos emprendimientos y productos.



                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Nuestra experiencia con Twitter APIs


     Al Jazeera - Twitter Dashboard                        CABA - Elecciones legislativas 2011          JSConfAr - Visualizing Tweets




     Coca Cola - Social World Cup                          La Nacion - Elecciones presidenciales 2011   Zauberlabs - Tweet Discover



                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Análisis de
                                                                                     audiencias
                                                                                       online

                             Value insights on social audiences and conversations

         Plataforma online que:
              •         Procesa social media data a gran escala para entregar
                        reportes en tiempo real

              •         Identifica patrones demográficos y de comportamiento
                        de seguidores y conversaciones en Twitter

              •         Usa ML y NLP para entregar perfiles sociales aumentados
                        con información nueva respecto de APIs existentes o
                        perfiles de usuarios.
         Diseñada para:
              •         Investigación de mercado online
              •         Monitoreo de marcas en tiempo real
              •         ROI en Social Media
              •         Estrategias en Social Media



                         Visualizaciones en tiempo real sobre Twitter
                         Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Visualizacio-
                                                                                     nes animadas
                                                                                      de Twitter

                          Build your own Twitter real-time visualizations

        Plataforma online que permite:

              •         Construir infografías animadas sobre temas
                        en Twitter

              •         Enriquecer noticias con contenido social

              •         Ofrecer una segunda pantalla para un programa de TV

              •         Aumentar la participación en un evento

              •         Cubrir el buzz en eventos grandes o internacionales

         Diseñada para:

              •         Periodistas, Bloggers, Directores de Contenido,
                        Marketeers, Organizadores de Eventos, Emisoras



                         Visualizaciones en tiempo real sobre Twitter
                         Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Cómo lo construimos
      FRONTEND                                                                       BACKEND

                                                                                                     Storm

                                                                                                               Oozie



      INFRAESTRUCTURA                                                                TWITTER API


                                                                                                   Rest API
                             ELB, EC2, S3                                                           Streaming API
                         Elastic Map Reduce
                        Route53, CloudWatch




                         Visualizaciones en tiempo real sobre Twitter
                         Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Desafíos tecnológicos

                        •    Límites API Twitter

                        •    Big Data

                        •    Manejo de datos no estructurados

                        •    Inferencia de atributos ocultos




                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Límites API Twitter

                        •    Rest API limitada a 350 requests por ahora por IP

                        •    Streaming API (statuses/filter) está limitada si tweets exceden el
                             1% del Firehose
                            •    Partners de Twitter (Gnip, DataSift) pueden ser una opción para
                                 obtener un acceso mayor




                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Big Data
                            •    Twitter en #
                                     •    400M tweets por dia (http://www.theverge.com/
                                          2012/6/6/3069424/twitter-400-million-total-daily-tweets)
                                     •    140M usuarios activos (http://blog.twitter.com/2012/03/twitter-
                                          turns-six.html)

                            •    Generación de estadísticas en tiempo real
                                     •    Stream Processing => Storm

                            •    Generación de estadísticas sobre los usuarios
                                     •    Batch Processing => Hadoop (Map Reduce, Pig)


                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Manejo de datos no estructurados
                           •    Ubicación

                               •     5% de tweets utilizan GeoLocation API

                               •     72% Ingresan datos de ubicación en forma no
                                     estructurada

                               •     Utilizamos técnicas de NLP e Information Retrieval
                                     para detectar ubicación




                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Inferencia de atributos ocultos
                                •     Datos demográficos de usuarios no están presentes

                                       •     Tipo de Usuario

                                           •    Hombre/Mujer/Compañia

                                       •     Rango etario

                                •     Machine Learning al rescate!

                                       •     Se utilizan técnicas de aprendizaje supervisado para
                                             detectar dichos atributos


                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Demos


                 Rio+20                                                             Malvinas




                  Boca vs Universidad de Chile                                      Elecciones en Mexico

                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Gracias!




                                                             Preguntas?
                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12

Más contenido relacionado

Similar a Big Data : Extraer y visualizar grandes volúmenes de datos

Big data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigaciónBig data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigación
Mariché Navío Navarro
 
Empresas con BDOO
Empresas con BDOOEmpresas con BDOO
Empresas con BDOO
tec lerdo
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
Eduardo Castro
 
DataSift: Controlando el poder del Big Data en Social Media
DataSift: Controlando el poder del Big Data en Social Media DataSift: Controlando el poder del Big Data en Social Media
DataSift: Controlando el poder del Big Data en Social Media
aguming
 

Similar a Big Data : Extraer y visualizar grandes volúmenes de datos (20)

SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterSocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
 
Redes Sociales, Facebook Vs. Twitter
Redes Sociales, Facebook Vs. TwitterRedes Sociales, Facebook Vs. Twitter
Redes Sociales, Facebook Vs. Twitter
 
Presentación BigDataMachine para Marketing
Presentación BigDataMachine para MarketingPresentación BigDataMachine para Marketing
Presentación BigDataMachine para Marketing
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Big data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigaciónBig data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigación
 
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
 
Innovación mediante TIC aplicada con redes sociales y crowdsourcing
Innovación mediante TIC aplicada con redes sociales y crowdsourcingInnovación mediante TIC aplicada con redes sociales y crowdsourcing
Innovación mediante TIC aplicada con redes sociales y crowdsourcing
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
 
SMM-SEO.SEM
SMM-SEO.SEMSMM-SEO.SEM
SMM-SEO.SEM
 
Web 2.0
Web 2.0Web 2.0
Web 2.0
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Empresas con BDOO
Empresas con BDOOEmpresas con BDOO
Empresas con BDOO
 
Revista Mundo Contact Septiembre 2012
Revista Mundo Contact Septiembre 2012Revista Mundo Contact Septiembre 2012
Revista Mundo Contact Septiembre 2012
 
Gestión de redes sociales en bibliotecas
Gestión de redes sociales en bibliotecasGestión de redes sociales en bibliotecas
Gestión de redes sociales en bibliotecas
 
herramientas tic
herramientas ticherramientas tic
herramientas tic
 
herramientas tic
herramientas ticherramientas tic
herramientas tic
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
DataSift: Controlando el poder del Big Data en Social Media
DataSift: Controlando el poder del Big Data en Social Media DataSift: Controlando el poder del Big Data en Social Media
DataSift: Controlando el poder del Big Data en Social Media
 
#AmoSM2016 - Conferencia Social Big Data por Juan Carlos Mejía Llano
#AmoSM2016 - Conferencia Social Big Data por Juan Carlos Mejía Llano#AmoSM2016 - Conferencia Social Big Data por Juan Carlos Mejía Llano
#AmoSM2016 - Conferencia Social Big Data por Juan Carlos Mejía Llano
 

Último

Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
EdwinGarca59
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
Yanitza28
 
microsoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamtemicrosoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamte
2024020140
 

Último (20)

¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
¡Ya basta! Sanidad Interior - Angela Kellenberger.pdf
 
Tipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de DatosTipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de Datos
 
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptxAVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
 
herramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el temaherramientas web para estudiantes interesados en el tema
herramientas web para estudiantes interesados en el tema
 
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfpresentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
 
BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).
 
Desarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - EstradaDesarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - Estrada
 
Actividad 6/Las TIC en la Vida Cotidiana.
Actividad 6/Las TIC en la Vida Cotidiana.Actividad 6/Las TIC en la Vida Cotidiana.
Actividad 6/Las TIC en la Vida Cotidiana.
 
Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024
 
Editorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfEditorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdf
 
Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
 
10°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-810°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-8
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
 
microsoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamtemicrosoft word manuales para todos tipos de estudiamte
microsoft word manuales para todos tipos de estudiamte
 
Redes Neuronales profundas convolucionales CNN ́s-1.pdf
Redes Neuronales profundas convolucionales CNN ́s-1.pdfRedes Neuronales profundas convolucionales CNN ́s-1.pdf
Redes Neuronales profundas convolucionales CNN ́s-1.pdf
 
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
 
Introduccion-a-la-electronica-industrial.pptx
Introduccion-a-la-electronica-industrial.pptxIntroduccion-a-la-electronica-industrial.pptx
Introduccion-a-la-electronica-industrial.pptx
 
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptxTipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
 
Función del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacionFunción del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacion
 
presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...
 

Big Data : Extraer y visualizar grandes volúmenes de datos

  • 1. BIG DATA: Extraer y visualizar grandes volúmenes de datos Visualizaciones en tiempo real sobre Twitter Fernando Zunino Pauline Morrison Fell @fzunino @polinmf Thursday, June 21, 12
  • 2. Acerca de Zauber • Somos una boutique de software y lab con base en Argentina y Estados Unidos que provee servicios a una alta gama de líderes de la industria y startups de internet en América Latina y Silicon Valley. • Nos especializamos en proyectos de Consumer Web, Social Analytics y Big Data. Combinamos nuestros servicios de desarrollo boutique con un laboratorio de I+D para desarrollar nuevos emprendimientos y productos. Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 3. Nuestra experiencia con Twitter APIs Al Jazeera - Twitter Dashboard CABA - Elecciones legislativas 2011 JSConfAr - Visualizing Tweets Coca Cola - Social World Cup La Nacion - Elecciones presidenciales 2011 Zauberlabs - Tweet Discover Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 4. Análisis de audiencias online Value insights on social audiences and conversations Plataforma online que: • Procesa social media data a gran escala para entregar reportes en tiempo real • Identifica patrones demográficos y de comportamiento de seguidores y conversaciones en Twitter • Usa ML y NLP para entregar perfiles sociales aumentados con información nueva respecto de APIs existentes o perfiles de usuarios. Diseñada para: • Investigación de mercado online • Monitoreo de marcas en tiempo real • ROI en Social Media • Estrategias en Social Media Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 5. Visualizacio- nes animadas de Twitter Build your own Twitter real-time visualizations Plataforma online que permite: • Construir infografías animadas sobre temas en Twitter • Enriquecer noticias con contenido social • Ofrecer una segunda pantalla para un programa de TV • Aumentar la participación en un evento • Cubrir el buzz en eventos grandes o internacionales Diseñada para: • Periodistas, Bloggers, Directores de Contenido, Marketeers, Organizadores de Eventos, Emisoras Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 6. Cómo lo construimos FRONTEND BACKEND Storm Oozie INFRAESTRUCTURA TWITTER API Rest API ELB, EC2, S3 Streaming API Elastic Map Reduce Route53, CloudWatch Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 7. Desafíos tecnológicos • Límites API Twitter • Big Data • Manejo de datos no estructurados • Inferencia de atributos ocultos Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 8. Límites API Twitter • Rest API limitada a 350 requests por ahora por IP • Streaming API (statuses/filter) está limitada si tweets exceden el 1% del Firehose • Partners de Twitter (Gnip, DataSift) pueden ser una opción para obtener un acceso mayor Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 9. Big Data • Twitter en # • 400M tweets por dia (http://www.theverge.com/ 2012/6/6/3069424/twitter-400-million-total-daily-tweets) • 140M usuarios activos (http://blog.twitter.com/2012/03/twitter- turns-six.html) • Generación de estadísticas en tiempo real • Stream Processing => Storm • Generación de estadísticas sobre los usuarios • Batch Processing => Hadoop (Map Reduce, Pig) Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 10. Manejo de datos no estructurados • Ubicación • 5% de tweets utilizan GeoLocation API • 72% Ingresan datos de ubicación en forma no estructurada • Utilizamos técnicas de NLP e Information Retrieval para detectar ubicación Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 11. Inferencia de atributos ocultos • Datos demográficos de usuarios no están presentes • Tipo de Usuario • Hombre/Mujer/Compañia • Rango etario • Machine Learning al rescate! • Se utilizan técnicas de aprendizaje supervisado para detectar dichos atributos Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 12. Demos Rio+20 Malvinas Boca vs Universidad de Chile Elecciones en Mexico Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 13. Gracias! Preguntas? Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12