Social Mining en un
Ecosistema de Big
Data
M.C. Juan Carlos Olivares Rojas
2
Social Mining
Social Mining
• Análisis de Datos (Analytics) en “Social Media”
para obtener conocimiento para la toma
efectiva de decisiones.
• Va más allá de información estadística
Introducción
• Proyecto de Estímulo a la Innovación
CONACyT: Efecto Mescalina-ITM-ITESM
Campus Morelia
• Sistema de Interconexión entre la Web 2.0 y el
Internet de las Cosas para Aplicaciones de
Marketing Digital
Introducción
• Análisis de Tweets y de Mensajes en Instagram
para detectar intereses de viajes.
• Problemática en el almacenamiento de datos y
búsqueda de información
Desarrollo
• Revisión Teórica del Estado del Arte
• Esquemas de Almacenamiento Físico
• Bases de Datos NOSQL
• Herramientas para Análisis
Desarrollo
• Se utilizó el manejador de base de datos
Cassandra debido a su facilidad de migración
con su lenguaje CQL (Muy Similar a SQL de
Dialectos como MySQL)
Desarrollo
Conclusiones
• Se cuenta con un pequeño prototipo que
almacena, consulta y muestra información
usando un esquema de Big Data.
• Hace falta realizar un análisis de información
no estructurada para mejorar búsquedas.
Trabajo Futuro
• Análisis en profundidad de almacenamiento
físico para otras bases de datos (Diabetes)
• Explotación de datos en aplicaciones Web y
Móviles.
Agradecimientos
• M.C. Cristhian Torres Millarez
• Lic. Jorge Sánchez Vega
• Programa Delfín: ITS Huetamo, Puruándiro y
De los Ríos
¿Preguntas?
http://dsc.itmorelia.edu.mx/~jcolivares/
juancarlosolivares@hotmail.com
jcolivares@itmorelia.edu.mx
/juancarlosolivaresrojas
@jcolivares

Social miningesquemabigdata

Notas del editor

  • #2 M.C. Juan Carlos Olivares Rojas jcolivares@itmorelia.edu.mx
  • #3 En los últimos años, el volumen de información en las aplicaciones ha crecido de forma exponecialmente. Desafortunadamente las bases de datos relacionales comienzan a mostrar signos de estrés en entornos donde el almacenamiento, la búsqueda, y la compartición de los datos en grandes volúmenes son el pan nuestro de cada día, por tal motivo se necesita de nuevos esquemas de almacenamiento de información como el “Big Data”.
  • #4 Consiste en convertir datos imperfectos, no estructurados y complejos acerca del estado de bienestar de las personas, en información procesable, que reduzca las brechas temporales y de conocimiento para: Tomar decisiones de política pública que respondan oportunamente a determinadas situaciones Tener rápida retroalimentación sobre el impacto de tales políticas. Permite generar información inteligente que puede ahorrar recursos en la generación de estadísticas para políticas de desarrollo. La analítica de grandes datos se refiere a las herramientas y metodologías par transformar cantidades masivas de datos brutos en “datos sobre datos” con propósitos analíticos Se originó en las áreas de biología intensiva en cómputo, ingeniería biomédica, medicina y electrónica Algoritmos para detectar patrones, tendencias y correlaciones, en varios horizontes temporales, en los datos Uso de técnicas avanzadas de visualización: datos que hacen sentido
  • #5  En este trabajo, se utiliza un esquema de Big Data para dar soluciónes a almacenamiento de aplicaciones de redes sociales, donde en grandes volumenes de datos se pretende encontrar conocimiento, a esto se le denomina social mining.
  • #11  Resultando como herramientas viables para el análisis de los datos: Pentaho, InfiniDB, InfoBright, base de datos no relacionales (MongoDB, Cassandra). Dichas herramientas fueron instaladas y utilizadas. Teniendo como modelo relacional una BD de una aplicación social que usa la API detwitter, se normalizo a la estructura NoSQL de Cassandra del cual se realizaron consultas para obtener información específica sobre el planteamiento del problema
  • #12  Resultando como herramientas viables para el análisis de los datos: Pentaho, InfiniDB, InfoBright, base de datos no relacionales (MongoDB, Cassandra). Dichas herramientas fueron instaladas y utilizadas. Teniendo como modelo relacional una BD de una aplicación social que usa la API detwitter, se normalizo a la estructura NoSQL de Cassandra del cual se realizaron consultas para obtener información específica sobre el planteamiento del problema