SlideShare una empresa de Scribd logo
1 de 31
Text Mining con R en PowerBI
26 de Julio (12 pm GMT -5)
Jorge Muchaypiña Gutierrez
Resumen:
En esta sesión veremos como aplicar algunos algoritmos de Minería de Texto con el
software estadístico R y poder mostrarlos en PowerBI para una mejor toma de
decisiones.
Está por comenzar:
Moderador: Julián Castiblanco P
Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
3
4
Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
Sigan Participando!
• Obtén tu membresía gratuita en sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
Text Mining con R en PowerBI
26 de Julio 2017
Jorge Muchaypiña Gutierrez
Business Intelligence Specialist
MAP, MCP, MCSA, MCSE BI
Moderador: Julián Castiblanco P
Hola, soy Jorge
Muchaypiña
Business Intelligence Specialist
◦ MCSA SQL Server 2012/2014
◦ MCSA Development SQL Server 2016
◦ MCSE Business Intelligence
◦ MCSE Data Management and Analytics
◦ Scrum Master
◦ Itil Foundations
Speaker en SQL Pass Lima y SQL Saturdays.
Blog : https://jorgemuchaypina.wordpress.com/
Correo: jomichel2003@Hotmail.com
Agenda
Que es R?
Preguntas
Demo
R en Microsoft
Que es Text Mining?
Text Mining en nuestro día a día…
Feature
Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Tema 6
Que es Text Mining?
Se refiere al proceso de derivar
conocimiento(por ejemplo patrones) de una
gran cantidad de información almacenada en
forma de texto escrito.
Nube de palabras
Representación visual de las palabras que
conforman un texto, en donde el tamaño es
mayor para las palabras que aparecen con mas
frecuencia.
1.Definicion del problema y metas especificas.
2. Identificar el texto a ser coleccionado.
3. Organización de texto
4. Extracción de plantilla.
5. Análisis
6. Retroalimentación
Flujo de Trabajo de Text Mining
Feature
Text Mining en Nuestro día a día …Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Tema 6
https://www.linkedin.com/pulse/data-driven-view-first-presidential-debate-ed-lee
DEBATE PRESIDENCIAL
Word Cloud en el Debate Presidencial
13
Estadísticas en el Debate Presidencial
Feature
Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Tema 6
Que es R?
• Lenguaje interpretado, pobre IDE
• 5000+ paquetes de software estadístico
• Mejor IDE: RStudio
• http://www.rstudio.com/
• https://www.visualstudio.com/es/vs/rtvs
• Rattle y OnePageR hace que sea aún más fácil
• Código abierto, libre, multiplataforma
• R Core: la versión más pura: http://cran.r-project.org/
• Revolution Analytics: paralelismo y Rendimiento:
http://www.revolutionanalytics.com/
• Azure ML: built-in
15
Lenguajes mas usadas
Chart from "2014 Data Science Salary Survey" (ISBN 978-1-491-
91842-5)
© 2015 O'Reilly Media, used with permission. Arrows mine.
For more info, and great titles on data science, visit oreilly.com
Feature
Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Tema 6
R en Microsoft?
17
NOVEDADES
SQL Server 2016 R Services
Machine Learning
Services in SQL Server
2017
18
NOVEDADES
Limitaciones del open source R
R necesita datos en memoria R solo tiene un hilo
de ejecución
R require habilidades
especializadas para
crear cluster
R Open es soportado por la
comunidad
Revolution R Enterprise brinda una solución a
esto!
20
INSTALACION R SERVER
21
INSTALACION R SERVICES
22
R en Azure Machine Learning
23
R Como un Servicio Web
24
R en Excel
25
R en Visual
Studio
26
PowerBI: Aircraft Predictive Maintenance
Feature
Visualizaciones de R en PowerBI
Power BI User Group Lima
27
Feature
DEMO
Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Tema 6
Power BI User Group Lima
Feature
Bibliografía
•
Kaggle
https://www.kaggle.com/datasets
•
Datacamp
https://www.datacamp.com/courses/intro-to-text-mining-bag-of-words
Coursera (Universidad de Illinois)
https://www.coursera.org/learn/text-mining
Edx (Microsoft)
https://www.edx.org/course/programming-r-data-science-microsoft-dat209x-4
Feature
Tema 1
Tema 2
Tema 3
Tema 4
Tema 5
Tema 6
Power BI User Group Lima
PREGUNTAS
Muchas Gracias
Power BI User Group Lima

Más contenido relacionado

Similar a Text Mining con R en PowerBI - Global Spanish

Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0lara.rey
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data ScienceSpanishPASSVC
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosOscar Corcho
 
Power BI para office 365 - Jorge Castaneda
Power BI para office 365 - Jorge CastanedaPower BI para office 365 - Jorge Castaneda
Power BI para office 365 - Jorge CastanedaSpanishPASSVC
 
Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.
Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.
Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.Rolando Carrasco
 
Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerSpanishPASSVC
 
SEO semántico y búsqueda semántica
SEO semántico y búsqueda semánticaSEO semántico y búsqueda semántica
SEO semántico y búsqueda semánticaNatzir Turrado
 
Global Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalakeGlobal Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalakeJulián Castiblanco
 
La importancia de las APIs en los chatbots
La importancia de las APIs en los chatbotsLa importancia de las APIs en los chatbots
La importancia de las APIs en los chatbotsRolando Carrasco
 
Planes de ejecución en SQL Server 2014
Planes de ejecución en SQL Server 2014Planes de ejecución en SQL Server 2014
Planes de ejecución en SQL Server 2014SpanishPASSVC
 
Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...
Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...
Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...SemanticWebBuilder
 
Fundamentos de Indices en SQL Server - Enrrique Puig
Fundamentos de Indices en SQL Server - Enrrique PuigFundamentos de Indices en SQL Server - Enrrique Puig
Fundamentos de Indices en SQL Server - Enrrique PuigSpanishPASSVC
 
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian MirandaEscalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian MirandaSpanishPASSVC
 
Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27
Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27
Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27Elkin Garavito Beltran
 
Fundamentos sobre los indices en SQL Server
Fundamentos sobre los indices en SQL ServerFundamentos sobre los indices en SQL Server
Fundamentos sobre los indices en SQL ServerKike Puig
 
Tendencias para Desarrolladores Nov 2015
Tendencias para Desarrolladores Nov 2015Tendencias para Desarrolladores Nov 2015
Tendencias para Desarrolladores Nov 2015Software Guru
 
Query Store en SQL 2016
Query Store en SQL 2016Query Store en SQL 2016
Query Store en SQL 2016SpanishPASSVC
 
Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...
Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...
Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...Socialmetrix
 

Similar a Text Mining con R en PowerBI - Global Spanish (20)

Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data Science
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los Datos
 
Power BI para office 365 - Jorge Castaneda
Power BI para office 365 - Jorge CastanedaPower BI para office 365 - Jorge Castaneda
Power BI para office 365 - Jorge Castaneda
 
Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.
Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.
Oracle Developer Tour Santiago, Chile. Oracle Intelligent Bot Introduction.
 
Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint Server
 
Ifema taller de robotica
Ifema taller de roboticaIfema taller de robotica
Ifema taller de robotica
 
SEO semántico y búsqueda semántica
SEO semántico y búsqueda semánticaSEO semántico y búsqueda semántica
SEO semántico y búsqueda semántica
 
Global Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalakeGlobal Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalake
 
La importancia de las APIs en los chatbots
La importancia de las APIs en los chatbotsLa importancia de las APIs en los chatbots
La importancia de las APIs en los chatbots
 
Planes de ejecución en SQL Server 2014
Planes de ejecución en SQL Server 2014Planes de ejecución en SQL Server 2014
Planes de ejecución en SQL Server 2014
 
Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...
Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...
Web Semántica de la teoría a la práctica: lecciones aprendidas en ambientes p...
 
Fundamentos de Indices en SQL Server - Enrrique Puig
Fundamentos de Indices en SQL Server - Enrrique PuigFundamentos de Indices en SQL Server - Enrrique Puig
Fundamentos de Indices en SQL Server - Enrrique Puig
 
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian MirandaEscalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
 
Ciencia de datos con R y Microsoft Power BI
Ciencia de datos con R y Microsoft Power BICiencia de datos con R y Microsoft Power BI
Ciencia de datos con R y Microsoft Power BI
 
Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27
Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27
Charla Sobre prototipado en la universidad de los Andes 2014 - 03 - 27
 
Fundamentos sobre los indices en SQL Server
Fundamentos sobre los indices en SQL ServerFundamentos sobre los indices en SQL Server
Fundamentos sobre los indices en SQL Server
 
Tendencias para Desarrolladores Nov 2015
Tendencias para Desarrolladores Nov 2015Tendencias para Desarrolladores Nov 2015
Tendencias para Desarrolladores Nov 2015
 
Query Store en SQL 2016
Query Store en SQL 2016Query Store en SQL 2016
Query Store en SQL 2016
 
Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...
Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...
Construyendo una Infraestructura de Big Data rentable y escalable (la evoluci...
 

Más de jorge Muchaypiña

Azure days - Power BI Premium per User
Azure days - Power BI Premium per UserAzure days - Power BI Premium per User
Azure days - Power BI Premium per Userjorge Muchaypiña
 
Microsoft ignite 2021 data culture
Microsoft ignite 2021   data cultureMicrosoft ignite 2021   data culture
Microsoft ignite 2021 data culturejorge Muchaypiña
 
Businessintelligence vs businessanalytics
Businessintelligence vs businessanalyticsBusinessintelligence vs businessanalytics
Businessintelligence vs businessanalyticsjorge Muchaypiña
 
SQL Server Analysis Services
SQL Server Analysis ServicesSQL Server Analysis Services
SQL Server Analysis Servicesjorge Muchaypiña
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End jorge Muchaypiña
 
Business intelligence vs business analytics
Business intelligence vs business analyticsBusiness intelligence vs business analytics
Business intelligence vs business analyticsjorge Muchaypiña
 
SQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis ServicesSQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis Servicesjorge Muchaypiña
 
Microsoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power biMicrosoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power bijorge Muchaypiña
 
Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.jorge Muchaypiña
 
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...jorge Muchaypiña
 
Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogotajorge Muchaypiña
 
Global Azure Bootcamp - Jorge Muchaypiña G.
Global Azure Bootcamp - Jorge Muchaypiña G.Global Azure Bootcamp - Jorge Muchaypiña G.
Global Azure Bootcamp - Jorge Muchaypiña G.jorge Muchaypiña
 

Más de jorge Muchaypiña (15)

Azure days - Power BI Premium per User
Azure days - Power BI Premium per UserAzure days - Power BI Premium per User
Azure days - Power BI Premium per User
 
Microsoft ignite 2021 data culture
Microsoft ignite 2021   data cultureMicrosoft ignite 2021   data culture
Microsoft ignite 2021 data culture
 
Businessintelligence vs businessanalytics
Businessintelligence vs businessanalyticsBusinessintelligence vs businessanalytics
Businessintelligence vs businessanalytics
 
SQL Server Analysis Services
SQL Server Analysis ServicesSQL Server Analysis Services
SQL Server Analysis Services
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End
 
Business intelligence vs business analytics
Business intelligence vs business analyticsBusiness intelligence vs business analytics
Business intelligence vs business analytics
 
SQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis ServicesSQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis Services
 
Microsoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power biMicrosoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power bi
 
Introduccion a PowerBI
Introduccion a PowerBIIntroduccion a PowerBI
Introduccion a PowerBI
 
Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.
 
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
 
Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogota
 
Global Azure Bootcamp - Jorge Muchaypiña G.
Global Azure Bootcamp - Jorge Muchaypiña G.Global Azure Bootcamp - Jorge Muchaypiña G.
Global Azure Bootcamp - Jorge Muchaypiña G.
 
SQL Azure Datawarehouse
SQL Azure DatawarehouseSQL Azure Datawarehouse
SQL Azure Datawarehouse
 
Azure SQL Database
Azure SQL DatabaseAzure SQL Database
Azure SQL Database
 

Último

Unidad_3_T1_AutomatasFinitos presentacion
Unidad_3_T1_AutomatasFinitos presentacionUnidad_3_T1_AutomatasFinitos presentacion
Unidad_3_T1_AutomatasFinitos presentacionarmando_cardenas
 
Caso de éxito de Hervian con el ERP Sage 200
Caso de éxito de Hervian con el ERP Sage 200Caso de éxito de Hervian con el ERP Sage 200
Caso de éxito de Hervian con el ERP Sage 200Opentix
 
Manual de Usuario APPs_AppInventor-2023.pdf
Manual de Usuario APPs_AppInventor-2023.pdfManual de Usuario APPs_AppInventor-2023.pdf
Manual de Usuario APPs_AppInventor-2023.pdfmasogeis
 
Introducción a Funciones LENGUAJE DART FLUTTER
Introducción a Funciones LENGUAJE DART FLUTTERIntroducción a Funciones LENGUAJE DART FLUTTER
Introducción a Funciones LENGUAJE DART FLUTTEREMMAFLORESCARMONA
 
PARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLO
PARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLOPARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLO
PARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLOSelenaCoronadoHuaman
 
Segmentacion Segmantica_Modelos UNET and DEEPLABV3
Segmentacion Segmantica_Modelos UNET and DEEPLABV3Segmentacion Segmantica_Modelos UNET and DEEPLABV3
Segmentacion Segmantica_Modelos UNET and DEEPLABV3AlexysCaytanoMelndez1
 
BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...
BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...
BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...ITeC Instituto Tecnología Construcción
 

Último (7)

Unidad_3_T1_AutomatasFinitos presentacion
Unidad_3_T1_AutomatasFinitos presentacionUnidad_3_T1_AutomatasFinitos presentacion
Unidad_3_T1_AutomatasFinitos presentacion
 
Caso de éxito de Hervian con el ERP Sage 200
Caso de éxito de Hervian con el ERP Sage 200Caso de éxito de Hervian con el ERP Sage 200
Caso de éxito de Hervian con el ERP Sage 200
 
Manual de Usuario APPs_AppInventor-2023.pdf
Manual de Usuario APPs_AppInventor-2023.pdfManual de Usuario APPs_AppInventor-2023.pdf
Manual de Usuario APPs_AppInventor-2023.pdf
 
Introducción a Funciones LENGUAJE DART FLUTTER
Introducción a Funciones LENGUAJE DART FLUTTERIntroducción a Funciones LENGUAJE DART FLUTTER
Introducción a Funciones LENGUAJE DART FLUTTER
 
PARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLO
PARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLOPARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLO
PARTES DEL TECLADO Y SUS FUNCIONES - EJEMPLO
 
Segmentacion Segmantica_Modelos UNET and DEEPLABV3
Segmentacion Segmantica_Modelos UNET and DEEPLABV3Segmentacion Segmantica_Modelos UNET and DEEPLABV3
Segmentacion Segmantica_Modelos UNET and DEEPLABV3
 
BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...
BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...
BREEAM ES Urbanismo como herramienta para un planeamiento sostenible - Miguel...
 

Text Mining con R en PowerBI - Global Spanish

  • 1. Text Mining con R en PowerBI 26 de Julio (12 pm GMT -5) Jorge Muchaypiña Gutierrez Resumen: En esta sesión veremos como aplicar algunos algoritmos de Minería de Texto con el software estadístico R y poder mostrarlos en PowerBI para una mejor toma de decisiones. Está por comenzar: Moderador: Julián Castiblanco P
  • 2. Manténgase conectado a nosotros! Visítenos en http://globalspanish.sqlpass.org /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 3. 3
  • 4. 4 Oportunidades de Voluntariado PASS no pudiera existir sin personas apasionadas y dedicadas de todas partes del mundo que dan de su tiempo como voluntarios. Se un voluntario ahora!! Para identificar oportunidades locales visita volunteer.sqlpass.org Recuerda actualizar tu perfil en las secciones de “MyVolunteering” y MyPASS para mas detalles.
  • 5. Sigan Participando! • Obtén tu membresía gratuita en sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 6. Text Mining con R en PowerBI 26 de Julio 2017 Jorge Muchaypiña Gutierrez Business Intelligence Specialist MAP, MCP, MCSA, MCSE BI Moderador: Julián Castiblanco P
  • 7. Hola, soy Jorge Muchaypiña Business Intelligence Specialist ◦ MCSA SQL Server 2012/2014 ◦ MCSA Development SQL Server 2016 ◦ MCSE Business Intelligence ◦ MCSE Data Management and Analytics ◦ Scrum Master ◦ Itil Foundations Speaker en SQL Pass Lima y SQL Saturdays. Blog : https://jorgemuchaypina.wordpress.com/ Correo: jomichel2003@Hotmail.com
  • 8. Agenda Que es R? Preguntas Demo R en Microsoft Que es Text Mining? Text Mining en nuestro día a día…
  • 9. Feature Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 Que es Text Mining? Se refiere al proceso de derivar conocimiento(por ejemplo patrones) de una gran cantidad de información almacenada en forma de texto escrito. Nube de palabras Representación visual de las palabras que conforman un texto, en donde el tamaño es mayor para las palabras que aparecen con mas frecuencia.
  • 10. 1.Definicion del problema y metas especificas. 2. Identificar el texto a ser coleccionado. 3. Organización de texto 4. Extracción de plantilla. 5. Análisis 6. Retroalimentación Flujo de Trabajo de Text Mining
  • 11. Feature Text Mining en Nuestro día a día …Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 https://www.linkedin.com/pulse/data-driven-view-first-presidential-debate-ed-lee DEBATE PRESIDENCIAL
  • 12. Word Cloud en el Debate Presidencial
  • 13. 13 Estadísticas en el Debate Presidencial
  • 14. Feature Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 Que es R? • Lenguaje interpretado, pobre IDE • 5000+ paquetes de software estadístico • Mejor IDE: RStudio • http://www.rstudio.com/ • https://www.visualstudio.com/es/vs/rtvs • Rattle y OnePageR hace que sea aún más fácil • Código abierto, libre, multiplataforma • R Core: la versión más pura: http://cran.r-project.org/ • Revolution Analytics: paralelismo y Rendimiento: http://www.revolutionanalytics.com/ • Azure ML: built-in
  • 15. 15 Lenguajes mas usadas Chart from "2014 Data Science Salary Survey" (ISBN 978-1-491- 91842-5) © 2015 O'Reilly Media, used with permission. Arrows mine. For more info, and great titles on data science, visit oreilly.com
  • 16. Feature Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 R en Microsoft?
  • 17. 17 NOVEDADES SQL Server 2016 R Services Machine Learning Services in SQL Server 2017
  • 19. Limitaciones del open source R R necesita datos en memoria R solo tiene un hilo de ejecución R require habilidades especializadas para crear cluster R Open es soportado por la comunidad Revolution R Enterprise brinda una solución a esto!
  • 22. 22 R en Azure Machine Learning
  • 23. 23 R Como un Servicio Web
  • 27. Feature Visualizaciones de R en PowerBI Power BI User Group Lima 27
  • 28. Feature DEMO Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 Power BI User Group Lima
  • 29. Feature Bibliografía • Kaggle https://www.kaggle.com/datasets • Datacamp https://www.datacamp.com/courses/intro-to-text-mining-bag-of-words Coursera (Universidad de Illinois) https://www.coursera.org/learn/text-mining Edx (Microsoft) https://www.edx.org/course/programming-r-data-science-microsoft-dat209x-4
  • 30. Feature Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 Power BI User Group Lima PREGUNTAS
  • 31. Muchas Gracias Power BI User Group Lima

Notas del editor

  1. Key message: There are common challenges that IT professionals are faced with when implementing a new BI solution Talking points: Management of BI systems Variety of data sources Managing data in the cloud Integration with existing environment Keeping data current Ease of use and adoption
  2. Key message: There are common challenges that IT professionals are faced with when implementing a new BI solution Talking points: Management of BI systems Variety of data sources Managing data in the cloud Integration with existing environment Keeping data current Ease of use and adoption
  3. Key message: There are common challenges that IT professionals are faced with when implementing a new BI solution Talking points: Management of BI systems Variety of data sources Managing data in the cloud Integration with existing environment Keeping data current Ease of use and adoption