SlideShare una empresa de Scribd logo
Arquitectura y Experiencia en la construcción del
"Estado de Ánimo de los Tuiteros en México 2.0"
@abxda
XII Congreso de Ciencias Exactas UAA
@abxdaAño 2012
Primer Producto de Ciencia de Datos
XII Congreso de Ciencias Exactas UAA
@abxda
El equipo de trabajo
XII Congreso de Ciencias Exactas UAA
@abxda
Grupo Directivo
Management-Group: The managers of the
Entire data science unit.
• Chief Data Scientist
• Domain Experts (Staff)
• Research Scientists (Staff)
• Agile Master (Staff)
• Systems Engineering Expert (Staff)
Dr. Alfredo Bustos
XII Congreso de Ciencias Exactas UAA
@abxda
Equipo de Ingeniería de Datos
• Data Engineering Team
• Data Engineer
• SysAdmin
• Statistician
• Geomatic Engineer
• Dataviz Expert
• GPU Developer
• IoT Expert
• Cloud Engineer
M.C. Abel Coronado
M.I. Oswaldo Diaz
L.I. Brenda Alejandra Muñoz
Tendencia: Kubernetes; Mesosphere DC/OS; Docker
XII Congreso de Ciencias Exactas UAA
@abxda
Equipo de Ciencia de Datos
Tendencia: AutoML ; Tensorflow; Keras; Python
• Data Science Team
• Data Scientist
• Statistician
• Mathematician
• Machine Learning Expert
• Deep Learning Expert
M.C. Miriam Romo
M.C. Abel Coronado
XII Congreso de Ciencias Exactas UAA
@abxda
Equipo de Producto de Datos
• Data Product Team
• Data Engineer
• Software Architect
• UX Expert
• App Developer
• Web Developer
• API Developer
M.C. Abel Coronado
L.D.G. Marco Ibarra
I.S.C. Ricardo Olvera
M.I. Oswaldo Diaz
Tendencia: SAAS; ITCSS; REACT, VUE.js, D3.js
XII Congreso de Ciencias Exactas UAA
@abxda
Grupo Dev Sec Ops
• Arquitecto DevSecOps (Developer Security Operation)
• Ingeniería de procesos
• [Patrones de Diseño]
• Control de Calidad TI
• [Normatividad y Cumplimientos]
• Infraestructura TI
• [Tolerante a fallas]
• Ciberseguridad
• [Administración de riesgos]
M.I. Oswaldo Diaz
Tendencia: Cloud to the edge; Hyper Converged Infrastructure; Blockchain
By  edgaroswaldodiaz2375@gmail.com
XII Congreso de Ciencias Exactas UAA
@abxda
Producto de Datos año 2013
XII Congreso de Ciencias Exactas UAA
@abxda
Big Data
XII Congreso de Ciencias Exactas UAA
@abxda
Arquitectura de Big Data y Ciencia de Datos
XII Congreso de Ciencias Exactas UAA
@abxda
Big Data y Ciencia de Datos
• Propuesta de indicadores obtenidos a partir de fuentes Big Data
• Establecimiento de correlaciones entre éstos y los producidos por la estadística oficial.
• Producción científica de los académicos participantes
XII Congreso de Ciencias Exactas UAA
@abxda
Equipo Interinstitucional
XII Congreso de Ciencias Exactas UAA
@abxda
Equipo de Ciencia de Datos
• Data Science Team
• Data Scientist
• Statistician
• Mathematician
• Machine Learning Expert
• Deep Learning Expert
Dra. Daniela Moctezuma
C. Dr. Elio Villaseñor
Dr. Mario Graff
Dr. Eric Tellez
Dr. Sabino Miranda
Dr. Oscar S. Siordia https://goo.gl/tegYae https://goo.gl/tzzbR0
XII Congreso de Ciencias Exactas UAA
@abxda
Recolección de Tuits Feb. 2014
XII Congreso de Ciencias Exactas UAA
@abxda
Infraestructura de Recolección Inicial
XII Congreso de Ciencias Exactas UAA
@abxda
Tuits geo-referenciados
https://abxda.wordpress.com
XII Congreso de Ciencias Exactas UAA
@abxda
Tuits Recolectados
XII Congreso de Ciencias Exactas UAA
@abxda
Base de Datos de Entrenamiento
https://cienciadedatos.inegi.org.mx/pioanalisis/
XII Congreso de Ciencias Exactas UAA
@abxda
Conjunto de Datos Etiquetado
• 54,131 Tuits etiquetados manualmente por 9,330 personas
• La clasificación sigue en :
https://cienciadedatos.inegi.org.mx/pioanalisis/
XII Congreso de Ciencias Exactas UAA
@abxda
Retos del análisis de sentimiento en redes
sociales
• Uso de Modismos
• Errores Ortográficos
• Errores Gramaticales
• Entre otros . . . 38,000
palabras
95,000
palabras
XII Congreso de Ciencias Exactas UAA
@abxda
Proceso de Clasificación de Sentimiento
• Normalización del Texto
• Representación vectorial del texto
• Entrenamiento del algoritmo de Machine Learning
• Clasificación del texto en producción
@abxda
XII Congreso de Ciencias Exactas UAA
Ejemplo de la normalización del texto
TEXTO ORIGINAL:
pésiiiimo auto :( @autoX fallan frenos y sistema de
entretenimiento; no lo compren
NORMALIZACIÓN:
pesiiiimo auto _negativo _user fallan frenos y sistema de
entretenimiento ; lo no_compren
@abxda
XII Congreso de Ciencias Exactas UAA
Ejemplo de la normalización del texto q-gramas
{_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__,
o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user,
ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos,
nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_,
de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient,
ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp,
ompr, mpre, pren, ren_ }
_pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_
lo_no_compren
q=4
@abxda
XII Congreso de Ciencias Exactas UAA
{_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__,
o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user,
ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos,
nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_,
de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient,
ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp,
ompr, mpre, pren, ren_ }
_pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_
lo_no_compren
q=4
Ejemplo de la normalización del texto q-gramas
@abxda
XII Congreso de Ciencias Exactas UAA
{_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__,
o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user,
ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos,
nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_,
de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient,
ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp,
ompr, mpre, pren, ren_ }
_pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_
lo_no_compren
q=4
Ejemplo de la normalización del texto q-gramas
@abxda
XII Congreso de Ciencias Exactas UAA
{_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__,
o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user,
ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos,
nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_,
de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient,
ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp,
ompr, mpre, pren, ren_ }
_pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_
lo_no_compren
q=4
Ejemplo de la normalización del texto q-gramas
@abxda
XII Congreso de Ciencias Exactas UAA
Representación vectorial del texto
@abxda
XII Congreso de Ciencias Exactas UAA
Algoritmo de Aprendizaje Maquina SVM
@abxda
XII Congreso de Ciencias Exactas UAA
Entrenamiento del algoritmo SVM
Tuits Positivos
Tuits Negativos
@abxda
XII Congreso de Ciencias Exactas UAA
Entrenamiento del algoritmo SVM
Tuits Positivos
Tuits Negativos
@abxda
XII Congreso de Ciencias Exactas UAA
Tuits Positivos
Tuits Negativos
Entrenamiento del algoritmo SVM
XII Congreso de Ciencias Exactas UAA
@abxda
Regla de Decisión
Clasificación Supervisada
Tuits Etiquetados Normalización y Representación Vectorial Entrenamiento
Nuevo Tuit
Estado de ánimo de los tuiteros
Normalización y Representación Vectorial
54,131 Tuits
etiquetados manualmente
por 9,330 personas
XII Congreso de Ciencias Exactas UAA
@abxda
Ánimo Tuitero 1.0 año 2015
XII Congreso de Ciencias Exactas UAA
@abxda
LOGSTASH
(2 Cores)
Location Query
Free Access
Apache Spark
(16 Cores)
Clean & Sentiment Analysis
Tweets
Procesamiento
Diario (6 Min)
(3 a.m.)
300 K
Geo-Tweets
Minimal
Representation
~8 Redhat Servers (8 Gb Ram, 4 Cores)
~300 Milliones of Geo-Tweets
~150 Milliones dentro de México
> 3 Years ~ 24/7
Ánimo Tuitero 2.0 año - 2018
XII Congreso de Ciencias Exactas UAA
@abxda
XII Congreso de Ciencias Exactas UAA
@abxda
XII Congreso de Ciencias Exactas UAA
@abxda
XII Congreso de Ciencias Exactas UAA
@abxda
Otros Proyectos
(Experiencia en 2014)
https://goo.gl/wHG0xE
XII Congreso de Ciencias Exactas UAA
@abxda
Estudiar la movilidad es un proceso complejo
XII Congreso de Ciencias Exactas UAA
@abxda
Herramienta de Consulta de la Movilidad de los Tuiteros
(2017)
XII Congreso de Ciencias Exactas UAA
@abxda
Herramienta de Consulta de la Movilidad de los Tuiteros
(2017)
XII Congreso de Ciencias Exactas UAA
@abxda
Detección del crecimiento de localidades
urbanas usando Twitter (2017)
XII Congreso de Ciencias Exactas UAA
@abxda
Nuevas Fuentes de Datos
XII Congreso de Ciencias Exactas UAA
@abxda
Imágenes de Satélite
https://www.technologyreview.com/s/603706/the-startup-thats-in-charge-of-the-biggest-private-satellite-fleet/ http://www.bbc.com/news/science-environment-39183353
XII Congreso de Ciencias Exactas UAA
@abxda
Imágenes de Satélite
XII Congreso de Ciencias Exactas UAA
@abxda
Extender los trabajos a otras fuentes de datos
Landsat 8
https://aws.amazon.com/es/public-datasets/landsat/
Tiempo de Revisita es de 16 días
30 m
https://upload.wikimedia.org/wikipedia/commons/4/48/HyperspectralCube.jpg
XII Congreso de Ciencias Exactas UAA
@abxda
Big Data 2,737,273,075 pixeles
XII Congreso de Ciencias Exactas UAA
@abxda
Extender los trabajos a otras fuentes de datos
Sentinel 2 A & B
https://scihub.copernicus.eu/
Tiempo de Revisita es de 5 días (Nov. 2017)
10 m
https://upload.wikimedia.org/wikipedia/commons/4/48/HyperspectralCube.jpg
http://www.mallontechnology.com/blog/view/198/sentinel-data-helping-downstream-space-industry-deliver-31-billion-in-benefits
XII Congreso de Ciencias Exactas UAA
@abxda
LANDSAT & SENTINEL
LANDSAT 8 (30 m) SENTINEL 2 (10 m)
30 m 10 m
2,737,273,075 pixeles 24,635,457,675 pixeles
XII Congreso de Ciencias Exactas UAA
@abxda
Sentinel
SENTINEL 2 (10 m)
XII Congreso de Ciencias Exactas UAA
@abxda
Datos de Entrenamiento
XII Congreso de Ciencias Exactas UAA
@abxda
Proceso de clasificación de imágenes de satélite
Selección del Modelo de Clasificación
Clases de cobertura
de suelo
Imágenes de Satélite
(30 m y 10 m)
Clasificación realizada por Expertos
de Percepción Remota
INEGI
15m, Modelo Digital de Elevación
Información Auxiliar
+
Extracción / Selección /
Generación de
Carácterísticas
Conjunto de Entrenamiento y
Pruebas
Experimentos
mediante validación
cruzada
Clasificador
Seleccionado
Bosques Aleatorios
SVM
Redes Neuronales
(Deep Learning)
XII Congreso de Ciencias Exactas UAA
@abxda
Algunos Aprendizajes
• Se requiere involucramiento y liderazgo de expertos del negocio.
• Es fundamental colaborar con la academia.
• No se requiere gran inversión en hardware, se pueden hacer los proyectos piloto
con los recursos que ya se cuentan.
• En proyectos de clasificación supervisada lo mas valioso es construir y mantener
actualizada una base de entrenamiento.
• Los proyectos de Big Data / Ciencia de Datos son proyectos de investigación, NO
HAY GARANTIAS DE ÉXITO.
XII Congreso de Ciencias Exactas UAA
@abxda
GRACIAS!
XII Congreso de Ciencias Exactas UAA
@abxda
¿Preguntas?
abel.coronado@inegi.org.mx
MC Abel Coronado
@abxda
Conociendo México
01 800 111 46 34
www.inegi.org.mx
atencion.usuarios@inegi.org.mx
@inegi_informa INEGI Informa

Más contenido relacionado

Similar a Congreso UAA 2018 Animo Tuitero 2 0

Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Oscar Corcho
 
Oferta de Trabajos de Titulación CIS-UNL
Oferta de Trabajos de Titulación CIS-UNLOferta de Trabajos de Titulación CIS-UNL
Oferta de Trabajos de Titulación CIS-UNL
Pablo Ordoñez
 
Te enamoraste jeje
Te enamoraste jejeTe enamoraste jeje
Te enamoraste jeje
mixmax27
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero.
GustavoMartin46
 
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
Artium Vitoria
 
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
Aprender 3C
 
Desarrollo de un agente buscador inteligente de metadatos
Desarrollo de un agente buscador inteligente  de metadatosDesarrollo de un agente buscador inteligente  de metadatos
Desarrollo de un agente buscador inteligente de metadatos
Hugo Banda
 
Metric Video Analytics
Metric Video AnalyticsMetric Video Analytics
Metric Video Analytics
Inteligencia Artificial Chile
 
Arquitectura de computadoras
Arquitectura de computadorasArquitectura de computadoras
Arquitectura de computadoras
RAQUEL CARDENAS GONZALEZ
 
ExperTIC
ExperTICExperTIC
ExperTIC
Roo Galvan
 
Atlas ti
Atlas tiAtlas ti
Manual atlas ti_7
Manual atlas ti_7Manual atlas ti_7
Manual atlas ti_7
Victor Zapata
 
Buscador Semántico
Buscador SemánticoBuscador Semántico
Buscador Semántico
Flor Cuenca
 
Algoritmos genéticos
Algoritmos genéticosAlgoritmos genéticos
Algoritmos genéticos
Educagratis
 
Paso - 2, Grupo 43
Paso - 2, Grupo 43Paso - 2, Grupo 43
Paso - 2, Grupo 43
Josue David
 
Big data taller inegi sedesol
Big data taller inegi sedesolBig data taller inegi sedesol
Big data taller inegi sedesol
Abel Alejandro Coronado Iruegas
 
Reto ExperTIC
Reto ExperTICReto ExperTIC
Reto ExperTIC
Guillermo Rodríguez
 
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticosAdiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
Oscar Corcho
 
Presentación: manejo y almacenamiento de bases de datos
Presentación: manejo y almacenamiento de bases de datosPresentación: manejo y almacenamiento de bases de datos
Presentación: manejo y almacenamiento de bases de datos
Sustainable Amazonian Landscapes project
 
Guia 1 sistemas expertos
Guia 1 sistemas expertosGuia 1 sistemas expertos
Guia 1 sistemas expertos
Eliezer Eduardo Cordova
 

Similar a Congreso UAA 2018 Animo Tuitero 2 0 (20)

Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
 
Oferta de Trabajos de Titulación CIS-UNL
Oferta de Trabajos de Titulación CIS-UNLOferta de Trabajos de Titulación CIS-UNL
Oferta de Trabajos de Titulación CIS-UNL
 
Te enamoraste jeje
Te enamoraste jejeTe enamoraste jeje
Te enamoraste jeje
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero.
 
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - O...
 
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
 
Desarrollo de un agente buscador inteligente de metadatos
Desarrollo de un agente buscador inteligente  de metadatosDesarrollo de un agente buscador inteligente  de metadatos
Desarrollo de un agente buscador inteligente de metadatos
 
Metric Video Analytics
Metric Video AnalyticsMetric Video Analytics
Metric Video Analytics
 
Arquitectura de computadoras
Arquitectura de computadorasArquitectura de computadoras
Arquitectura de computadoras
 
ExperTIC
ExperTICExperTIC
ExperTIC
 
Atlas ti
Atlas tiAtlas ti
Atlas ti
 
Manual atlas ti_7
Manual atlas ti_7Manual atlas ti_7
Manual atlas ti_7
 
Buscador Semántico
Buscador SemánticoBuscador Semántico
Buscador Semántico
 
Algoritmos genéticos
Algoritmos genéticosAlgoritmos genéticos
Algoritmos genéticos
 
Paso - 2, Grupo 43
Paso - 2, Grupo 43Paso - 2, Grupo 43
Paso - 2, Grupo 43
 
Big data taller inegi sedesol
Big data taller inegi sedesolBig data taller inegi sedesol
Big data taller inegi sedesol
 
Reto ExperTIC
Reto ExperTICReto ExperTIC
Reto ExperTIC
 
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticosAdiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
 
Presentación: manejo y almacenamiento de bases de datos
Presentación: manejo y almacenamiento de bases de datosPresentación: manejo y almacenamiento de bases de datos
Presentación: manejo y almacenamiento de bases de datos
 
Guia 1 sistemas expertos
Guia 1 sistemas expertosGuia 1 sistemas expertos
Guia 1 sistemas expertos
 

Más de Abel Alejandro Coronado Iruegas

Mobility Master Class.pdf
Mobility Master Class.pdfMobility Master Class.pdf
Mobility Master Class.pdf
Abel Alejandro Coronado Iruegas
 
Live UAEMex Cubo de Datos Geoespaciales de Mexico
Live UAEMex Cubo de Datos Geoespaciales de MexicoLive UAEMex Cubo de Datos Geoespaciales de Mexico
Live UAEMex Cubo de Datos Geoespaciales de Mexico
Abel Alejandro Coronado Iruegas
 
Cubo de datos uaemex
Cubo de datos uaemexCubo de datos uaemex
Cubo de datos uaemex
Abel Alejandro Coronado Iruegas
 
Geo Big Data 4 Datalab
Geo Big Data 4 DatalabGeo Big Data 4 Datalab
Geo Big Data 4 Datalab
Abel Alejandro Coronado Iruegas
 
Catedra INEGI Big Data en IBERO
Catedra INEGI Big Data en IBEROCatedra INEGI Big Data en IBERO
Catedra INEGI Big Data en IBERO
Abel Alejandro Coronado Iruegas
 
Integrating eo with official statistics using machine learning in mexico geo ...
Integrating eo with official statistics using machine learning in mexico geo ...Integrating eo with official statistics using machine learning in mexico geo ...
Integrating eo with official statistics using machine learning in mexico geo ...
Abel Alejandro Coronado Iruegas
 
Machine learning and Satellite Images
Machine learning and Satellite ImagesMachine learning and Satellite Images
Machine learning and Satellite Images
Abel Alejandro Coronado Iruegas
 
El Cubo de Datos Geoespaciales de Mexico
El Cubo de Datos Geoespaciales de MexicoEl Cubo de Datos Geoespaciales de Mexico
El Cubo de Datos Geoespaciales de Mexico
Abel Alejandro Coronado Iruegas
 
No Sql
No SqlNo Sql
Cubo de Datos Geoespaciales de Mexico
Cubo de Datos Geoespaciales de MexicoCubo de Datos Geoespaciales de Mexico
Cubo de Datos Geoespaciales de Mexico
Abel Alejandro Coronado Iruegas
 
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en MexicoAnalisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
Abel Alejandro Coronado Iruegas
 
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIEjemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Abel Alejandro Coronado Iruegas
 
INEGI ESS big data workshop
INEGI ESS big data workshopINEGI ESS big data workshop
INEGI ESS big data workshop
Abel Alejandro Coronado Iruegas
 
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Taller de Big Data y Ciencia de Datos en COLMEX dia 2Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Abel Alejandro Coronado Iruegas
 
Geo Big Data 2015
Geo Big Data 2015 Geo Big Data 2015
Realidades y Sueños de Big Data en México
Realidades y Sueños de Big Data en MéxicoRealidades y Sueños de Big Data en México
Realidades y Sueños de Big Data en México
Abel Alejandro Coronado Iruegas
 
Scala 1
Scala 1Scala 1
PresentacionParaINFOTEC
PresentacionParaINFOTECPresentacionParaINFOTEC
PresentacionParaINFOTEC
Abel Alejandro Coronado Iruegas
 
Revelando los secretos de twitter en México sg virtual
Revelando los secretos de twitter en México sg virtualRevelando los secretos de twitter en México sg virtual
Revelando los secretos de twitter en México sg virtual
Abel Alejandro Coronado Iruegas
 
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
Abel Alejandro Coronado Iruegas
 

Más de Abel Alejandro Coronado Iruegas (20)

Mobility Master Class.pdf
Mobility Master Class.pdfMobility Master Class.pdf
Mobility Master Class.pdf
 
Live UAEMex Cubo de Datos Geoespaciales de Mexico
Live UAEMex Cubo de Datos Geoespaciales de MexicoLive UAEMex Cubo de Datos Geoespaciales de Mexico
Live UAEMex Cubo de Datos Geoespaciales de Mexico
 
Cubo de datos uaemex
Cubo de datos uaemexCubo de datos uaemex
Cubo de datos uaemex
 
Geo Big Data 4 Datalab
Geo Big Data 4 DatalabGeo Big Data 4 Datalab
Geo Big Data 4 Datalab
 
Catedra INEGI Big Data en IBERO
Catedra INEGI Big Data en IBEROCatedra INEGI Big Data en IBERO
Catedra INEGI Big Data en IBERO
 
Integrating eo with official statistics using machine learning in mexico geo ...
Integrating eo with official statistics using machine learning in mexico geo ...Integrating eo with official statistics using machine learning in mexico geo ...
Integrating eo with official statistics using machine learning in mexico geo ...
 
Machine learning and Satellite Images
Machine learning and Satellite ImagesMachine learning and Satellite Images
Machine learning and Satellite Images
 
El Cubo de Datos Geoespaciales de Mexico
El Cubo de Datos Geoespaciales de MexicoEl Cubo de Datos Geoespaciales de Mexico
El Cubo de Datos Geoespaciales de Mexico
 
No Sql
No SqlNo Sql
No Sql
 
Cubo de Datos Geoespaciales de Mexico
Cubo de Datos Geoespaciales de MexicoCubo de Datos Geoespaciales de Mexico
Cubo de Datos Geoespaciales de Mexico
 
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en MexicoAnalisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
 
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIEjemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
 
INEGI ESS big data workshop
INEGI ESS big data workshopINEGI ESS big data workshop
INEGI ESS big data workshop
 
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Taller de Big Data y Ciencia de Datos en COLMEX dia 2Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
 
Geo Big Data 2015
Geo Big Data 2015 Geo Big Data 2015
Geo Big Data 2015
 
Realidades y Sueños de Big Data en México
Realidades y Sueños de Big Data en MéxicoRealidades y Sueños de Big Data en México
Realidades y Sueños de Big Data en México
 
Scala 1
Scala 1Scala 1
Scala 1
 
PresentacionParaINFOTEC
PresentacionParaINFOTECPresentacionParaINFOTEC
PresentacionParaINFOTEC
 
Revelando los secretos de twitter en México sg virtual
Revelando los secretos de twitter en México sg virtualRevelando los secretos de twitter en México sg virtual
Revelando los secretos de twitter en México sg virtual
 
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
 

Último

LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
NereaMolina10
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
mvargasleveau
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
MedTechBiz
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
DilmerCarranza
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
MarcoPolo545324
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
IrapuatoCmovamos
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
nahumrondanurbano
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
defola5717
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
DivergenteDespierto
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
DieguinhoSalazar
 
nombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docxnombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docx
silvanasotos
 
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdfSemana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
WendyMLaura
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
christianllacchasand
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 

Último (20)

LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
Sistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 cursoSistema informatico, power point asir 1 curso
Sistema informatico, power point asir 1 curso
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
 
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdfMinería de Datos e IA  Conceptos, Fundamentos y Aplicaciones.pdf
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdf
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
 
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
Obligaciones_de_los_Municipios_y_Departamentos_en_los_Determinantes_Ambiental...
 
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdfEncuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
 
nombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docxnombres de las unidades y situacion significativa 2024.docx
nombres de las unidades y situacion significativa 2024.docx
 
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdfSemana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
Semana 09 - Tema 02 Dinámica de cuentas del plan contable.pdf
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 

Congreso UAA 2018 Animo Tuitero 2 0

  • 1. Arquitectura y Experiencia en la construcción del "Estado de Ánimo de los Tuiteros en México 2.0" @abxda
  • 2. XII Congreso de Ciencias Exactas UAA @abxdaAño 2012 Primer Producto de Ciencia de Datos
  • 3. XII Congreso de Ciencias Exactas UAA @abxda El equipo de trabajo
  • 4. XII Congreso de Ciencias Exactas UAA @abxda Grupo Directivo Management-Group: The managers of the Entire data science unit. • Chief Data Scientist • Domain Experts (Staff) • Research Scientists (Staff) • Agile Master (Staff) • Systems Engineering Expert (Staff) Dr. Alfredo Bustos
  • 5. XII Congreso de Ciencias Exactas UAA @abxda Equipo de Ingeniería de Datos • Data Engineering Team • Data Engineer • SysAdmin • Statistician • Geomatic Engineer • Dataviz Expert • GPU Developer • IoT Expert • Cloud Engineer M.C. Abel Coronado M.I. Oswaldo Diaz L.I. Brenda Alejandra Muñoz Tendencia: Kubernetes; Mesosphere DC/OS; Docker
  • 6. XII Congreso de Ciencias Exactas UAA @abxda Equipo de Ciencia de Datos Tendencia: AutoML ; Tensorflow; Keras; Python • Data Science Team • Data Scientist • Statistician • Mathematician • Machine Learning Expert • Deep Learning Expert M.C. Miriam Romo M.C. Abel Coronado
  • 7. XII Congreso de Ciencias Exactas UAA @abxda Equipo de Producto de Datos • Data Product Team • Data Engineer • Software Architect • UX Expert • App Developer • Web Developer • API Developer M.C. Abel Coronado L.D.G. Marco Ibarra I.S.C. Ricardo Olvera M.I. Oswaldo Diaz Tendencia: SAAS; ITCSS; REACT, VUE.js, D3.js
  • 8. XII Congreso de Ciencias Exactas UAA @abxda Grupo Dev Sec Ops • Arquitecto DevSecOps (Developer Security Operation) • Ingeniería de procesos • [Patrones de Diseño] • Control de Calidad TI • [Normatividad y Cumplimientos] • Infraestructura TI • [Tolerante a fallas] • Ciberseguridad • [Administración de riesgos] M.I. Oswaldo Diaz Tendencia: Cloud to the edge; Hyper Converged Infrastructure; Blockchain By  edgaroswaldodiaz2375@gmail.com
  • 9. XII Congreso de Ciencias Exactas UAA @abxda Producto de Datos año 2013
  • 10. XII Congreso de Ciencias Exactas UAA @abxda Big Data
  • 11. XII Congreso de Ciencias Exactas UAA @abxda Arquitectura de Big Data y Ciencia de Datos
  • 12. XII Congreso de Ciencias Exactas UAA @abxda Big Data y Ciencia de Datos • Propuesta de indicadores obtenidos a partir de fuentes Big Data • Establecimiento de correlaciones entre éstos y los producidos por la estadística oficial. • Producción científica de los académicos participantes
  • 13. XII Congreso de Ciencias Exactas UAA @abxda Equipo Interinstitucional
  • 14. XII Congreso de Ciencias Exactas UAA @abxda Equipo de Ciencia de Datos • Data Science Team • Data Scientist • Statistician • Mathematician • Machine Learning Expert • Deep Learning Expert Dra. Daniela Moctezuma C. Dr. Elio Villaseñor Dr. Mario Graff Dr. Eric Tellez Dr. Sabino Miranda Dr. Oscar S. Siordia https://goo.gl/tegYae https://goo.gl/tzzbR0
  • 15. XII Congreso de Ciencias Exactas UAA @abxda Recolección de Tuits Feb. 2014
  • 16. XII Congreso de Ciencias Exactas UAA @abxda Infraestructura de Recolección Inicial
  • 17. XII Congreso de Ciencias Exactas UAA @abxda Tuits geo-referenciados https://abxda.wordpress.com
  • 18. XII Congreso de Ciencias Exactas UAA @abxda Tuits Recolectados
  • 19. XII Congreso de Ciencias Exactas UAA @abxda Base de Datos de Entrenamiento https://cienciadedatos.inegi.org.mx/pioanalisis/
  • 20. XII Congreso de Ciencias Exactas UAA @abxda Conjunto de Datos Etiquetado • 54,131 Tuits etiquetados manualmente por 9,330 personas • La clasificación sigue en : https://cienciadedatos.inegi.org.mx/pioanalisis/
  • 21. XII Congreso de Ciencias Exactas UAA @abxda Retos del análisis de sentimiento en redes sociales • Uso de Modismos • Errores Ortográficos • Errores Gramaticales • Entre otros . . . 38,000 palabras 95,000 palabras
  • 22. XII Congreso de Ciencias Exactas UAA @abxda Proceso de Clasificación de Sentimiento • Normalización del Texto • Representación vectorial del texto • Entrenamiento del algoritmo de Machine Learning • Clasificación del texto en producción
  • 23. @abxda XII Congreso de Ciencias Exactas UAA Ejemplo de la normalización del texto TEXTO ORIGINAL: pésiiiimo auto :( @autoX fallan frenos y sistema de entretenimiento; no lo compren NORMALIZACIÓN: pesiiiimo auto _negativo _user fallan frenos y sistema de entretenimiento ; lo no_compren
  • 24. @abxda XII Congreso de Ciencias Exactas UAA Ejemplo de la normalización del texto q-gramas {_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__, o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user, ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos, nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_, de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient, ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp, ompr, mpre, pren, ren_ } _pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_ lo_no_compren q=4
  • 25. @abxda XII Congreso de Ciencias Exactas UAA {_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__, o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user, ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos, nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_, de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient, ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp, ompr, mpre, pren, ren_ } _pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_ lo_no_compren q=4 Ejemplo de la normalización del texto q-gramas
  • 26. @abxda XII Congreso de Ciencias Exactas UAA {_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__, o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user, ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos, nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_, de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient, ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp, ompr, mpre, pren, ren_ } _pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_ lo_no_compren q=4 Ejemplo de la normalización del texto q-gramas
  • 27. @abxda XII Congreso de Ciencias Exactas UAA {_pes, pesi, esii, siii, iiii, iiim, iimo, imo_, mo_a, o_au, _aut, auto, uto_, to__, o__n, __ne, _neg, nega, egat, gati, ativ, tivo, ivo_, vo__, o__u, __us, _use, user, ser_, er_f, r_fa, _fal, fall, alla, llan, lan_, an_f, n_fr, _fre, fren, reno, enos, nos_, os_y, s_y_, _y_s, y_si, _sis, sist, iste, stem, tema, ema_, ma_d, a_de, _de_, de_e, e_en, _ent, entr, ntre, tret, rete, eten, teni, enim, nimi, imie, mien, ient, ento, nto_, to_;, o_;_, _;_l, ;_lo, _lo_, lo_n, o_no, _no_, no_c, o_co, _com, comp, ompr, mpre, pren, ren_ } _pesiiiimo_auto__negativo__user_fallan_frenos_y_sistema_de_entretenimiento_;_ lo_no_compren q=4 Ejemplo de la normalización del texto q-gramas
  • 28. @abxda XII Congreso de Ciencias Exactas UAA Representación vectorial del texto
  • 29. @abxda XII Congreso de Ciencias Exactas UAA Algoritmo de Aprendizaje Maquina SVM
  • 30. @abxda XII Congreso de Ciencias Exactas UAA Entrenamiento del algoritmo SVM Tuits Positivos Tuits Negativos
  • 31. @abxda XII Congreso de Ciencias Exactas UAA Entrenamiento del algoritmo SVM Tuits Positivos Tuits Negativos
  • 32. @abxda XII Congreso de Ciencias Exactas UAA Tuits Positivos Tuits Negativos Entrenamiento del algoritmo SVM
  • 33. XII Congreso de Ciencias Exactas UAA @abxda Regla de Decisión Clasificación Supervisada Tuits Etiquetados Normalización y Representación Vectorial Entrenamiento Nuevo Tuit Estado de ánimo de los tuiteros Normalización y Representación Vectorial 54,131 Tuits etiquetados manualmente por 9,330 personas
  • 34. XII Congreso de Ciencias Exactas UAA @abxda Ánimo Tuitero 1.0 año 2015
  • 35. XII Congreso de Ciencias Exactas UAA @abxda LOGSTASH (2 Cores) Location Query Free Access Apache Spark (16 Cores) Clean & Sentiment Analysis Tweets Procesamiento Diario (6 Min) (3 a.m.) 300 K Geo-Tweets Minimal Representation ~8 Redhat Servers (8 Gb Ram, 4 Cores) ~300 Milliones of Geo-Tweets ~150 Milliones dentro de México > 3 Years ~ 24/7 Ánimo Tuitero 2.0 año - 2018
  • 36. XII Congreso de Ciencias Exactas UAA @abxda
  • 37. XII Congreso de Ciencias Exactas UAA @abxda
  • 38. XII Congreso de Ciencias Exactas UAA @abxda
  • 39. XII Congreso de Ciencias Exactas UAA @abxda Otros Proyectos (Experiencia en 2014) https://goo.gl/wHG0xE
  • 40. XII Congreso de Ciencias Exactas UAA @abxda Estudiar la movilidad es un proceso complejo
  • 41. XII Congreso de Ciencias Exactas UAA @abxda Herramienta de Consulta de la Movilidad de los Tuiteros (2017)
  • 42. XII Congreso de Ciencias Exactas UAA @abxda Herramienta de Consulta de la Movilidad de los Tuiteros (2017)
  • 43. XII Congreso de Ciencias Exactas UAA @abxda Detección del crecimiento de localidades urbanas usando Twitter (2017)
  • 44. XII Congreso de Ciencias Exactas UAA @abxda Nuevas Fuentes de Datos
  • 45. XII Congreso de Ciencias Exactas UAA @abxda Imágenes de Satélite https://www.technologyreview.com/s/603706/the-startup-thats-in-charge-of-the-biggest-private-satellite-fleet/ http://www.bbc.com/news/science-environment-39183353
  • 46. XII Congreso de Ciencias Exactas UAA @abxda Imágenes de Satélite
  • 47. XII Congreso de Ciencias Exactas UAA @abxda Extender los trabajos a otras fuentes de datos Landsat 8 https://aws.amazon.com/es/public-datasets/landsat/ Tiempo de Revisita es de 16 días 30 m https://upload.wikimedia.org/wikipedia/commons/4/48/HyperspectralCube.jpg
  • 48. XII Congreso de Ciencias Exactas UAA @abxda Big Data 2,737,273,075 pixeles
  • 49. XII Congreso de Ciencias Exactas UAA @abxda Extender los trabajos a otras fuentes de datos Sentinel 2 A & B https://scihub.copernicus.eu/ Tiempo de Revisita es de 5 días (Nov. 2017) 10 m https://upload.wikimedia.org/wikipedia/commons/4/48/HyperspectralCube.jpg http://www.mallontechnology.com/blog/view/198/sentinel-data-helping-downstream-space-industry-deliver-31-billion-in-benefits
  • 50. XII Congreso de Ciencias Exactas UAA @abxda LANDSAT & SENTINEL LANDSAT 8 (30 m) SENTINEL 2 (10 m) 30 m 10 m 2,737,273,075 pixeles 24,635,457,675 pixeles
  • 51. XII Congreso de Ciencias Exactas UAA @abxda Sentinel SENTINEL 2 (10 m)
  • 52. XII Congreso de Ciencias Exactas UAA @abxda Datos de Entrenamiento
  • 53. XII Congreso de Ciencias Exactas UAA @abxda Proceso de clasificación de imágenes de satélite Selección del Modelo de Clasificación Clases de cobertura de suelo Imágenes de Satélite (30 m y 10 m) Clasificación realizada por Expertos de Percepción Remota INEGI 15m, Modelo Digital de Elevación Información Auxiliar + Extracción / Selección / Generación de Carácterísticas Conjunto de Entrenamiento y Pruebas Experimentos mediante validación cruzada Clasificador Seleccionado Bosques Aleatorios SVM Redes Neuronales (Deep Learning)
  • 54. XII Congreso de Ciencias Exactas UAA @abxda Algunos Aprendizajes • Se requiere involucramiento y liderazgo de expertos del negocio. • Es fundamental colaborar con la academia. • No se requiere gran inversión en hardware, se pueden hacer los proyectos piloto con los recursos que ya se cuentan. • En proyectos de clasificación supervisada lo mas valioso es construir y mantener actualizada una base de entrenamiento. • Los proyectos de Big Data / Ciencia de Datos son proyectos de investigación, NO HAY GARANTIAS DE ÉXITO.
  • 55. XII Congreso de Ciencias Exactas UAA @abxda GRACIAS!
  • 56. XII Congreso de Ciencias Exactas UAA @abxda ¿Preguntas? abel.coronado@inegi.org.mx MC Abel Coronado @abxda
  • 57. Conociendo México 01 800 111 46 34 www.inegi.org.mx atencion.usuarios@inegi.org.mx @inegi_informa INEGI Informa