SlideShare una empresa de Scribd logo
1 de 35
15 al 17 de Noviembre 2018.NET Conf UY v2018
Microsoft Machine
Learning empresarial
Maximiliano Accotto | MVP Data Platform since 2005
TriggerDB Consulting SRL
www.triggerdb.com
15 al 17 de Noviembre 2018.NET Conf UY v2018
15 al 17 de Noviembre 2018.NET Conf UY v2018
¿Que es Machine Learning?
La creación de programas capaces de generalizar
comportamientos a partir de una información
suministrada en forma de ejemplos.
15 al 17 de Noviembre 2018.NET Conf UY v2018
AcciónDecisión
Tableros interactivos
¿Por qué pasó?
Predictions
¿Qué pasará?
Recommendations
¿Qué debería hacer? Recomendaciones Automatizadas
Soporte en la decisión
Data
Value
Reportes Estaticos
¿Qué pasó? Procesos manuales
Del dato a la decisión y acción
15 al 17 de Noviembre 2018.NET Conf UY v2018
Evolución del análisis
¿Qué debería
hacer?
¿Qué pasará?¿Por qué pasó?¿Qué pasó?
Dashboards
Interactivos
Recomendaciones
Automatización
Modelos
Predictivos
Reportes
Insight
Diagnóstico PrescriptivoPredictivoDescriptivo
BI Tradicional Análisis Avanzado
15 al 17 de Noviembre 2018.NET Conf UY v2018
Spark
SQL Server
Virtual machines
GPUs
Container services
Notebooks
IDEs
Azure Machine Learning Workbench
SQL Server
Machine Learning Server
O N - P R E M I S E S
Microsoft Machine Learning
E D G E C O M P U T I N G
Azure IoT Edge
Experimentation and
Model Management
T R A I N & D E P L O Y O P T I O N S
A Z U R E
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Server Machine Learning
15 al 17 de Noviembre 2018.NET Conf UY v2018
Regular Database + App Intelligence Database + App
Llevar la inteligencia a donde están los datos
Application +
Intelligence
Database
Application
Intelligence
+ Database
VS
15 al 17 de Noviembre 2018.NET Conf UY v2018
¿Porque ML en SQL Server?
Eliminar el movimiento de datos
Aprovechar la seguridad de la base de datos
Ejecutar los calculos de ML en la base de datos
Operación ML scripts y modelos
Usar store Procedures de T-SQL
Manejar los modelos en el SQL Server
Performance y escalabilidad Enterprise
Escalar con R y Python analytics usando multi-threading
y parallel processing.
SQL Server security, compliance, resource governance,
query performance, always on secondaries
Data Scientist
Interacts directly
with data
SQL Developer/
DBA
Manage data and
analytics together
SQL Transformations
010010
100100
010101
Relational data
Analytics library
R
integration
010010
100100
010101
010010
100100
010101
Python
integration
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Machine Learning Services
• SQL Server 2016
• R support (3.2.2 version)
• Microsoft R Server
• SQL Server 2017
• Scoring native en TSQL usando PREDICT function
• EXTERNAL LIBRARY DDL para el manejo de paquetes R
• Ejecución en batch para la entrada de datos
• Soporte para R (3.3.3 version)
• Soporte para Python (Anaconda 3.5.2)
15 al 17 de Noviembre 2018.NET Conf UY v2018
Any R/Python
IDE
Data Scientist
Workstation
Script
Results
Execution
1
3
Data Scientists - Exploración de Datos y Desarrollo de
Modelos
SQL Server
2
R/Python Runtime
Machine Learning
Services
train <- RxSqlServerData(query,
connectionString, computeContext)
rxLogit(formula, train)
15 al 17 de Noviembre 2018.NET Conf UY v2018
Application exec sp_execute_external_script
@language = ‘Python’
, @script =
-- Python code --
The stored procedure contains R or
Python code and executes in-
database
Application Developer - Operacionalización de
modelos
Stored Proc call
Results
1
3
Execution
SQL Server
2
R/Python Runtime
Machine Learning
Services
15 al 17 de Noviembre 2018.NET Conf UY v2018
Trabajo del DBA: Habilitar ML en SQL Server

Enable External scripts
– Exec sp_configure ‘external
scripts enabled’, 1
– RCONFIGURE
SQL Server
2016
O superior
15 al 17 de Noviembre 2018.NET Conf UY v2018
sp_execute_external_script
15 al 17 de Noviembre 2018.NET Conf UY v2018
Tipos de salida
1. Dataset
• Standard resultset of rows and columns
• Data types will vary
2. Plot
• Static images
• Binary
3. Model
• Trained models such as linear regression, naïve bayes, etc.
• Binary
15 al 17 de Noviembre 2018.NET Conf UY v2018
Realtime Predictions usando Scoring nativo
• PREDICT function
• No depende de R o Python runtime
• Habilitado on SQL Server tanto en Windows como Linux
• Uso
• Single or small number of rows scoring
• Highly concurrent scoring scenarios
• Predict during INSERT, UPDATE, MERGE statements
• Requirements
• Models built using RevoScaleR or revoscalepy
• rxLinMod, rxLogit, rxBTrees, rxDTree, rxDForest
• Serialized using rxSerializeModel (R) or rx_serialize_model (Python)
15 al 17 de Noviembre 2018.NET Conf UY v2018
PREDICT syntax
15 al 17 de Noviembre 2018.NET Conf UY v2018
1,000,000 predictions per second
https://blogs.technet.microsoft.com/dataplatforminsider/2016/10/11/1000000-predictions-per-
second/
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Server Machine Server
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Machine Learning Server
• Soporte Multi-plataforma
• Windows, Linux, Hadoop, SQL Server
• Microsoft R Server
• RevoScaleR, MicrosoftML, olapR, sqlrutils packages
• Uso de Web services para operar.
• Microsoft Machine Learning Server
• Soporte de R & Python
• revoscalepy, microsoftml python libraries
• rxExecBy
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Machine Learning Server
• Setup one-box
configuration
> az ml admin boostrap
• Jupyter notebook
deploy, and consume
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Machine Learning Server – Multi Server
Configuration
15 al 17 de Noviembre 2018.NET Conf UY v2018
SQL Server 2019 y ML (big data Cluster)
15 al 17 de Noviembre 2018.NET Conf UY v2018
Azure Machine Learning
15 al 17 de Noviembre 2018.NET Conf UY v2018
Azure Machine Learning
• Compila y entrena modelos en Microsoft Azure.
• Utiliza tecnologías de código abierto como TensorFlow, PyTorch o
Jupyter.
• Puede hacer experimentos en su entorno local y luego escálelos
vertical u horizontalmente a la nube con grandes clústeres
habilitados para GPU.
• Puede administrar sus modelos con herramientas integradas
15 al 17 de Noviembre 2018.NET Conf UY v2018
Azure Machine Learning workbench
15 al 17 de Noviembre 2018.NET Conf UY v2018
Integración con VS code
15 al 17 de Noviembre 2018.NET Conf UY v2018
Machine Learning Studio
15 al 17 de Noviembre 2018.NET Conf UY v2018
15 al 17 de Noviembre 2018.NET Conf UY v2018
Machine Learning en Apache
Spark
15 al 17 de Noviembre 2018.NET Conf UY v2018
Implementaciones de ML para Spark
• Machine Learning Server
• Azure Hdinsight con ML Server
• Azure Databricks
15 al 17 de Noviembre 2018.NET Conf UY v2018
ML para Spark
• PySpark y R
• Integración con herramientas como jupyter , Visual Studio, Vscode o
Rstudio
15 al 17 de Noviembre 2018.NET Conf UY v2018
Recursos
15 al 17 de Noviembre 2018.NET Conf UY v2018
Recursos
• Galerías de ML
• Ejemplos de MS en Github
• Ejemplos ML para Spark GitHub
• Azure Data Science Virtual Machine
• Lab Azure Machine Learning
• Lab Azure Hdinsight
15 al 17 de Noviembre 2018.NET Conf UY v2018
Microsoft Machine Learning
www.triggerdb.com
maxiaccotto
maxi@triggerdb.com
Maximiliano Accotto | MVP Data Platform

Más contenido relacionado

Similar a Microsoft machine learning

Power BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconfPower BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconfAntonio Soto
 
Real-Time y Big Data: descubre el poder de tus datos
Real-Time y Big Data: descubre el poder de tus datosReal-Time y Big Data: descubre el poder de tus datos
Real-Time y Big Data: descubre el poder de tus datosEsri España
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricksEduardo Castro
 
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...DEMSSHILLLEONELCOUTI
 
Suite de inteligencia de negocios pentaho
Suite de inteligencia de negocios pentahoSuite de inteligencia de negocios pentaho
Suite de inteligencia de negocios pentahoBeacon Software
 
Técnicas avanzadas para resolver tus problemas de sql server
Técnicas avanzadas para resolver tus problemas de sql serverTécnicas avanzadas para resolver tus problemas de sql server
Técnicas avanzadas para resolver tus problemas de sql serverEnrique Catala Bañuls
 
Operations & Data Graph
Operations & Data GraphOperations & Data Graph
Operations & Data GraphNeo4j
 
Summer school python in spanish
Summer school python in spanishSummer school python in spanish
Summer school python in spanishAjay Ohri
 
Evolución hacia las plataformas de datos modernas, el Edge-to-cloud continuum
Evolución hacia las plataformas de datos modernas, el Edge-to-cloud continuumEvolución hacia las plataformas de datos modernas, el Edge-to-cloud continuum
Evolución hacia las plataformas de datos modernas, el Edge-to-cloud continuumAngel Conde Manjon
 
Big data: a data sicentist view
Big data: a data sicentist viewBig data: a data sicentist view
Big data: a data sicentist viewfernandocalle
 
NetConfUy 2018 - Azure B2C
NetConfUy 2018 - Azure B2CNetConfUy 2018 - Azure B2C
NetConfUy 2018 - Azure B2Cfernando sonego
 
24 HOP edición Español - Machine learning - Cesar Oviedo
24 HOP edición Español - Machine learning - Cesar Oviedo24 HOP edición Español - Machine learning - Cesar Oviedo
24 HOP edición Español - Machine learning - Cesar OviedoSpanishPASSVC
 
GAIBT LaPaz - Serverless Machine Learning.pptx
GAIBT LaPaz - Serverless Machine Learning.pptxGAIBT LaPaz - Serverless Machine Learning.pptx
GAIBT LaPaz - Serverless Machine Learning.pptxLuis Beltran
 
Futbol multi-screen con Azure SignalR Services
Futbol multi-screen con Azure SignalR ServicesFutbol multi-screen con Azure SignalR Services
Futbol multi-screen con Azure SignalR ServicesJose A. Fernandez
 

Similar a Microsoft machine learning (20)

Power BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconfPower BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconf
 
Real-Time y Big Data: descubre el poder de tus datos
Real-Time y Big Data: descubre el poder de tus datosReal-Time y Big Data: descubre el poder de tus datos
Real-Time y Big Data: descubre el poder de tus datos
 
Introduccion a databricks
Introduccion a databricksIntroduccion a databricks
Introduccion a databricks
 
Arduino day mex
Arduino day mexArduino day mex
Arduino day mex
 
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
 
Machine Learning en SQL Server
Machine Learning en SQL ServerMachine Learning en SQL Server
Machine Learning en SQL Server
 
Arduino day
Arduino dayArduino day
Arduino day
 
Power bi para desarrolladores
Power bi para desarrolladoresPower bi para desarrolladores
Power bi para desarrolladores
 
Suite de inteligencia de negocios pentaho
Suite de inteligencia de negocios pentahoSuite de inteligencia de negocios pentaho
Suite de inteligencia de negocios pentaho
 
Web Day Devops - Plain Concepts
Web Day Devops - Plain ConceptsWeb Day Devops - Plain Concepts
Web Day Devops - Plain Concepts
 
Técnicas avanzadas para resolver tus problemas de sql server
Técnicas avanzadas para resolver tus problemas de sql serverTécnicas avanzadas para resolver tus problemas de sql server
Técnicas avanzadas para resolver tus problemas de sql server
 
Operations & Data Graph
Operations & Data GraphOperations & Data Graph
Operations & Data Graph
 
Summer school python in spanish
Summer school python in spanishSummer school python in spanish
Summer school python in spanish
 
Evolución hacia las plataformas de datos modernas, el Edge-to-cloud continuum
Evolución hacia las plataformas de datos modernas, el Edge-to-cloud continuumEvolución hacia las plataformas de datos modernas, el Edge-to-cloud continuum
Evolución hacia las plataformas de datos modernas, el Edge-to-cloud continuum
 
Big data: a data sicentist view
Big data: a data sicentist viewBig data: a data sicentist view
Big data: a data sicentist view
 
NetConfUy 2018 - Azure B2C
NetConfUy 2018 - Azure B2CNetConfUy 2018 - Azure B2C
NetConfUy 2018 - Azure B2C
 
24 HOP edición Español - Machine learning - Cesar Oviedo
24 HOP edición Español - Machine learning - Cesar Oviedo24 HOP edición Español - Machine learning - Cesar Oviedo
24 HOP edición Español - Machine learning - Cesar Oviedo
 
GAIBT LaPaz - Serverless Machine Learning.pptx
GAIBT LaPaz - Serverless Machine Learning.pptxGAIBT LaPaz - Serverless Machine Learning.pptx
GAIBT LaPaz - Serverless Machine Learning.pptx
 
Querona
QueronaQuerona
Querona
 
Futbol multi-screen con Azure SignalR Services
Futbol multi-screen con Azure SignalR ServicesFutbol multi-screen con Azure SignalR Services
Futbol multi-screen con Azure SignalR Services
 

Más de Maximiliano Accotto (19)

SQL Server 2019 Big Data Cluster
SQL Server 2019 Big Data ClusterSQL Server 2019 Big Data Cluster
SQL Server 2019 Big Data Cluster
 
Modernizando plataforma de bi
Modernizando plataforma de biModernizando plataforma de bi
Modernizando plataforma de bi
 
Sql server machine learning
Sql server machine learningSql server machine learning
Sql server machine learning
 
Solucion de BI en Azure
Solucion de BI en AzureSolucion de BI en Azure
Solucion de BI en Azure
 
Seguridad en sql server 2016 y 2017
Seguridad en sql server 2016 y 2017Seguridad en sql server 2016 y 2017
Seguridad en sql server 2016 y 2017
 
Seguridad en sql server 2016 y 2017
Seguridad en sql server 2016 y 2017Seguridad en sql server 2016 y 2017
Seguridad en sql server 2016 y 2017
 
Sql 2016 2017 full
Sql 2016   2017 fullSql 2016   2017 full
Sql 2016 2017 full
 
SQL on linux
SQL on linuxSQL on linux
SQL on linux
 
Sql 2017 net raf
Sql 2017  net rafSql 2017  net raf
Sql 2017 net raf
 
Net conf uy 2017 sql 2017
Net conf uy 2017   sql 2017Net conf uy 2017   sql 2017
Net conf uy 2017 sql 2017
 
SQL on Azure
SQL on AzureSQL on Azure
SQL on Azure
 
Bootcamp 2017 - SQL Server on Linux
Bootcamp 2017 - SQL Server on LinuxBootcamp 2017 - SQL Server on Linux
Bootcamp 2017 - SQL Server on Linux
 
SQL Linux - Instalación
SQL Linux - Instalación SQL Linux - Instalación
SQL Linux - Instalación
 
Feliz 2016 ppt
Feliz 2016 pptFeliz 2016 ppt
Feliz 2016 ppt
 
Auditoria performance SQL Server
Auditoria performance SQL ServerAuditoria performance SQL Server
Auditoria performance SQL Server
 
Workshop sql
Workshop sqlWorkshop sql
Workshop sql
 
Sql 2016
Sql 2016Sql 2016
Sql 2016
 
TriggerDB Brochure
TriggerDB BrochureTriggerDB Brochure
TriggerDB Brochure
 
Dba tuning
Dba tuningDba tuning
Dba tuning
 

Último

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 

Último (10)

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 

Microsoft machine learning

  • 1. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Microsoft Machine Learning empresarial Maximiliano Accotto | MVP Data Platform since 2005 TriggerDB Consulting SRL www.triggerdb.com
  • 2. 15 al 17 de Noviembre 2018.NET Conf UY v2018
  • 3. 15 al 17 de Noviembre 2018.NET Conf UY v2018 ¿Que es Machine Learning? La creación de programas capaces de generalizar comportamientos a partir de una información suministrada en forma de ejemplos.
  • 4. 15 al 17 de Noviembre 2018.NET Conf UY v2018 AcciónDecisión Tableros interactivos ¿Por qué pasó? Predictions ¿Qué pasará? Recommendations ¿Qué debería hacer? Recomendaciones Automatizadas Soporte en la decisión Data Value Reportes Estaticos ¿Qué pasó? Procesos manuales Del dato a la decisión y acción
  • 5. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Evolución del análisis ¿Qué debería hacer? ¿Qué pasará?¿Por qué pasó?¿Qué pasó? Dashboards Interactivos Recomendaciones Automatización Modelos Predictivos Reportes Insight Diagnóstico PrescriptivoPredictivoDescriptivo BI Tradicional Análisis Avanzado
  • 6. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Spark SQL Server Virtual machines GPUs Container services Notebooks IDEs Azure Machine Learning Workbench SQL Server Machine Learning Server O N - P R E M I S E S Microsoft Machine Learning E D G E C O M P U T I N G Azure IoT Edge Experimentation and Model Management T R A I N & D E P L O Y O P T I O N S A Z U R E
  • 7. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Server Machine Learning
  • 8. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Regular Database + App Intelligence Database + App Llevar la inteligencia a donde están los datos Application + Intelligence Database Application Intelligence + Database VS
  • 9. 15 al 17 de Noviembre 2018.NET Conf UY v2018 ¿Porque ML en SQL Server? Eliminar el movimiento de datos Aprovechar la seguridad de la base de datos Ejecutar los calculos de ML en la base de datos Operación ML scripts y modelos Usar store Procedures de T-SQL Manejar los modelos en el SQL Server Performance y escalabilidad Enterprise Escalar con R y Python analytics usando multi-threading y parallel processing. SQL Server security, compliance, resource governance, query performance, always on secondaries Data Scientist Interacts directly with data SQL Developer/ DBA Manage data and analytics together SQL Transformations 010010 100100 010101 Relational data Analytics library R integration 010010 100100 010101 010010 100100 010101 Python integration
  • 10. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Machine Learning Services • SQL Server 2016 • R support (3.2.2 version) • Microsoft R Server • SQL Server 2017 • Scoring native en TSQL usando PREDICT function • EXTERNAL LIBRARY DDL para el manejo de paquetes R • Ejecución en batch para la entrada de datos • Soporte para R (3.3.3 version) • Soporte para Python (Anaconda 3.5.2)
  • 11. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Any R/Python IDE Data Scientist Workstation Script Results Execution 1 3 Data Scientists - Exploración de Datos y Desarrollo de Modelos SQL Server 2 R/Python Runtime Machine Learning Services train <- RxSqlServerData(query, connectionString, computeContext) rxLogit(formula, train)
  • 12. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Application exec sp_execute_external_script @language = ‘Python’ , @script = -- Python code -- The stored procedure contains R or Python code and executes in- database Application Developer - Operacionalización de modelos Stored Proc call Results 1 3 Execution SQL Server 2 R/Python Runtime Machine Learning Services
  • 13. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Trabajo del DBA: Habilitar ML en SQL Server  Enable External scripts – Exec sp_configure ‘external scripts enabled’, 1 – RCONFIGURE SQL Server 2016 O superior
  • 14. 15 al 17 de Noviembre 2018.NET Conf UY v2018 sp_execute_external_script
  • 15. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Tipos de salida 1. Dataset • Standard resultset of rows and columns • Data types will vary 2. Plot • Static images • Binary 3. Model • Trained models such as linear regression, naïve bayes, etc. • Binary
  • 16. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Realtime Predictions usando Scoring nativo • PREDICT function • No depende de R o Python runtime • Habilitado on SQL Server tanto en Windows como Linux • Uso • Single or small number of rows scoring • Highly concurrent scoring scenarios • Predict during INSERT, UPDATE, MERGE statements • Requirements • Models built using RevoScaleR or revoscalepy • rxLinMod, rxLogit, rxBTrees, rxDTree, rxDForest • Serialized using rxSerializeModel (R) or rx_serialize_model (Python)
  • 17. 15 al 17 de Noviembre 2018.NET Conf UY v2018 PREDICT syntax
  • 18. 15 al 17 de Noviembre 2018.NET Conf UY v2018 1,000,000 predictions per second https://blogs.technet.microsoft.com/dataplatforminsider/2016/10/11/1000000-predictions-per- second/
  • 19. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Server Machine Server
  • 20. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Machine Learning Server • Soporte Multi-plataforma • Windows, Linux, Hadoop, SQL Server • Microsoft R Server • RevoScaleR, MicrosoftML, olapR, sqlrutils packages • Uso de Web services para operar. • Microsoft Machine Learning Server • Soporte de R & Python • revoscalepy, microsoftml python libraries • rxExecBy
  • 21. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Machine Learning Server • Setup one-box configuration > az ml admin boostrap • Jupyter notebook deploy, and consume
  • 22. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Machine Learning Server – Multi Server Configuration
  • 23. 15 al 17 de Noviembre 2018.NET Conf UY v2018 SQL Server 2019 y ML (big data Cluster)
  • 24. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Azure Machine Learning
  • 25. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Azure Machine Learning • Compila y entrena modelos en Microsoft Azure. • Utiliza tecnologías de código abierto como TensorFlow, PyTorch o Jupyter. • Puede hacer experimentos en su entorno local y luego escálelos vertical u horizontalmente a la nube con grandes clústeres habilitados para GPU. • Puede administrar sus modelos con herramientas integradas
  • 26. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Azure Machine Learning workbench
  • 27. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Integración con VS code
  • 28. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Machine Learning Studio
  • 29. 15 al 17 de Noviembre 2018.NET Conf UY v2018
  • 30. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Machine Learning en Apache Spark
  • 31. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Implementaciones de ML para Spark • Machine Learning Server • Azure Hdinsight con ML Server • Azure Databricks
  • 32. 15 al 17 de Noviembre 2018.NET Conf UY v2018 ML para Spark • PySpark y R • Integración con herramientas como jupyter , Visual Studio, Vscode o Rstudio
  • 33. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Recursos
  • 34. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Recursos • Galerías de ML • Ejemplos de MS en Github • Ejemplos ML para Spark GitHub • Azure Data Science Virtual Machine • Lab Azure Machine Learning • Lab Azure Hdinsight
  • 35. 15 al 17 de Noviembre 2018.NET Conf UY v2018 Microsoft Machine Learning www.triggerdb.com maxiaccotto maxi@triggerdb.com Maximiliano Accotto | MVP Data Platform