El documento presenta una introducción a Azure Machine Learning. Explica los conceptos clave de aprendizaje automático e inteligencia artificial como aprendizaje automático, minería de datos, estadística y modelado predictivo. También describe las herramientas de Azure ML como Azure ML Studio y los pasos típicos para crear un experimento de ML, incluida la obtención de datos, preprocesamiento, selección de características, entrenamiento de modelos, prueba e implementación de modelos predictivos.
3. Cubriendo el espectro Analytics
Descriptivo Diagnóstico PreceptivoProfético
Profesionales de TI
Modelado de datos, ETL, Data
Almacenamiento, Marts y
cubos de datos
Información del Trabajador
Self-Service y
Exploración con BI
Poder
Los científicos de datos
Advanced Analytics de
Microsoft y 3rd partes
BI Enablement Advanced Analytics
Gestión de datos empresariales
Que pasó? ¿Por qué ocurrió? Lo que sucederá? Qué tengo que hacer?
4. Científico de datos
Un científico de datos incorpora técnicas y teorías de
muchos campos, incluyendo las matemáticas, la estadística,
la ingeniería de datos, reconocimiento de patrones,
aprendizaje avanzado , visualización, modelado de la
incertidumbre, almacenamiento de datos y la computación
de alto rendimiento con el objetivo de extraer el significado
de datos.
Ciencia de datos: un término
utilizado indistintamente con
inteligencia de negocio o análitica
empresarial
6. Experiencia Científico de Datos
Telecomunicaciones Servicios Financieros Cuidado De La Salud
Línea Fija y Móvil
Banca, Seguros,
Bienes Raíces
Productos
farmacéuticos,
Biotecnología
Industria
Aeroespacial,
Manufactura
7. ¿Qué es el análisis predictivo?
• El análisis de datos con técnicas matemáticas de
estadística, minería de datos y aprendizaje
automático. Se utiliza para descubrir patrones
ocultos, que da una ventaja competitiva.
8. Qué es el análisis predictivo?
Predictive Analytics es el descubrimiento de información
predictiva, a veces oculta, de las bases de datos
utilizando atributos de datos relacionados y no
relacionados con la aplicación de algoritmos de análisis,
y la creación de modelos que generan resultados
predictivos.
Modelaje Predictivo es el proceso de creación de un
modelo para predecir mejor la probabilidad de un
resultado.
12. • La automatización de la automatización
• Utilizar computadoras para programar computadoras
• Escribir software es el cuello de botella
• Deje que los datos hagan el trabajo!
Qué es el aprendizaje autómático o Machine Learning
13. 2
¿Por qué "Aprender"?
• El aprendizaje automático es la programación de
computadoras para optimizar un criterio de desempeño
usando datos como ejemplo o experiencia previa.
• El aprendizaje se utiliza cuando:
• Experiencia humana no existe (la navegación en Marte),
• Los seres humanos son incapaces de explicar su experiencia
(reconocimiento de voz)
• Solución cambios en el tiempo (el enrutamiento en una red
informática)
• Solución necesita ser adaptada a los casos particulares (biométrica
de usuario)
14. Cumpliendo con uno de los viejos sueños
del co-fundador de Microsoft, Bill Gates:
Computadoras que podemos ver, oír
y entender.
John Platt
Científico distinguido en
Microsoft Research
¿Qué es
Aprendizaje
Automático?
Sistemas informáticos de
predicción se vuelven más
inteligentes, con experiencia
"
"
15. 3
De qué hablamos cuando hablamos de "Aprendizaje"
• Aprender modelos generales a partir de ejemplos de
datos particulares
• Los datos son baratos y abundantes (data warehouses,
data marts); el conocimiento es caro y escaso.
• Ejemplo para comercio minorista: las transacciones de los
clientes y la conducta del consumidor:
Las personas que compraron "Código Da Vinci" también compraron "Las cinco personas que conoces en
el cielo" (www.amazon.com)
• Construir un modelo que es una aproximación buena y
útil de los datos.
17. Analytics Vision
Utilizando los datos del pasado para predecir el futuro
Motores
recomenda-ción
Análisis
Publicidad
El pronóstico del
tiempo para la
planificación de
negocios
Análisis de redes
sociales
Legal
descubrimiento y
archivo de
documentos
Análisis de
precios
Fraude
detección
Mantequera
análisis
Supervisión de
equipos
Seguimiento y
servicios basados
en localización
Seguros
personalizada
El aprendizaje automático y
el análisis predictivo son
capacidades básicas que se
necesitan en toda la
empresa
19. ¿Cuál es Azure ML?
•Plataforma de Aprendizaje Automático
•Parte de Microsoft Azure
20. Herramientas Azure ML
• Azure Portal
• Empieza aqui: una disposición ML Workspace
• Opcional: trabajo con SQL Azure
• Herramienta ML Estudio
• ML Estudio
• Conectar a datos y construir experimentos
• Publicar servicios web
• Azure Portal
• Gestionar o eliminar espacios de trabajo
• Opcionalmente, publicar servicios a Azure DataMarket
21. Los pasos del proceso Azure ML
1. Iterar hasta modelo sea válido:
1. Datos
1. Conectar
2. Transformar si es necesario
3. Seleccione características (columnas útiles)
2. Modelo
1. Inicialice
2. Ejecute
3. Puntuación (Predecir)
4. Evaluar Resultados (predicciones)
3. Válido?
2. Etapa y Publicar un servicio web
22. ¿Cómo utilizo Azure Machine Learning?
Importar datos
Constuir un
modelo
Combinar el
Modelo con el
API
23. Una solución de Aprendizaje Automático – obtener resultados a
partir de los datos
Azure Portal
Operaciones
Azure Equipo
ML Studio
Científico de
Datos
HDInsight
Almacenamiento
En Azure
Datos de
escritorio
Azure Portal y
Servicio API ML
Equipo de operaciones de
Azure
PowerBI/
Dashboards
Aplicaciones MóvilesAplicaciones Web
Servicio API ML Desarrollador
24. Una solución de Aprendizaje Automático - obtener resultados a partir de
los datos
Azure Portal
Operaciones
Azure Equipo
ML Estudio
Datos Científico
HDInsight
Almacenamiento
Azure
Datos de
escritorio
Azure Portal y
Servicio API ML
Operaciones
Azure Equipo
PowerBI/
Dashboards
Aplicaciones MóvilesAplicaciones Web
Servicio API ML Revelador
ML Studio
y el científico de datos
• Acceso y preparación de
datos
• Crear, modelos de prueba
• Con un solo clic pasar a la
etapa de producción a través
de la API de Servicios
Servicio API Azure Portal y
ML
• Crear ML Studio Workplace
• Asignar cuenta de almacenamiento
(s)
• Monitor Consumo ML
• Ver alertas cuando el modelo es listo
• Publicar WebServices
API ML servicio y el desarrollador
• Modelos disponibles como una url que se puede invocar
Los usuarios pueden acceder
fácilmente a los resultados: desde
cualquier lugar,en cualquier dispositivo
27. Machine Learning Studio
Experimentos: Los experimentos que se han creado, ejecutado, y
guardado como borradores. Estos incluyen un conjunto de experimentos
de ejemplo que se incluyen con el servicio que le ayudará en sus
proyectos.
Servicios Web Servicios: Una lista de los experimentos que se han
publicado como servicios web. Esta lista estará vacía hasta que publique
su primer
experimento.
Settings: Una colección de parámetros que puede utilizar para
configurar
su cuenta y recursos. Puede utilizar esta opción para invitar otros
usuarios compartir su espacio de trabajo en Azure Machine Learning.
28. Componentes de un experimento
• Un experimento consta de los componentes clave necesarios
para construir, probar y evaluar un modelo predictivo. En Azure
Machine Learning, un experimento contiene dos componentes
principales: los conjuntos de datos y módulos.
• Un conjunto de datos contiene datos que se han subido a
Machine Learning Studio. El conjunto de datos se utiliza al crear
un modelo predictivo. Machine Learning Studio también ofrece
varios conjuntos de datos de demostración para ayudarle a
reactivar la creación de sus primeros experimentos.
• Un módulo es un algoritmo que va a utilizar en la construcción
de su modelo predictivo.
29. Módulos
• Reader: Este módulo se utiliza para leer los datos de varias fuentes, incluyendo la
Web, base de datos SQL Azure, almacenamiento Blob Azure, o mesas Hive.
• Split: Este módulo se divide un conjunto de datos en dos partes. Normalmente se
utiliza para dividir un conjunto de datos de aprendizaje y prueba de datos
separadas.
• Elementary Statistics: Calcula estadísticas elementales como la media, la desviación
estándar, etc., de un determinado conjunto de datos.
• Regresión lineal: se puede utilizar para crear un modelo predictivo con un
algoritmo de regresión lineal.
30. Módulos
• Train Model: Este módulo entrena un algoritmo de clasificación o regresión
seleccionado con un conjunto de datos de entrenamiento dado.
• Evaluate Model: Este módulo se utiliza para evaluar el desempeño de un
modelo de clasificación o regresión entrenado.
• Cross Validate Model: Este módulo se utiliza para llevar a cabo validación
cruzada para evitar el exceso de ajuste. Por defecto, este módulo usa 10
veces la validación cruzada.
• Score Model: Puntúa un modelo de clasificación o regresión entrenado.
31. Pasos para la creación de un experimento
•Crear un modelo
• Paso 1: Obtener datos
• Paso 2: Preproceso de datos
• Paso 3: Definir las características
•Entrenar el modelo
• Paso 4: Seleccionar y aplicar un algoritmo de aprendizaje
• Pruebe el Modelo
•Paso 5: Predecir sobre nuevos datos
32. Evaluación del modelo
• Mean Absolute Error (MAE). El promedio de los errores
absolutos (un error es la diferencia entre el valor predicho y el
valor real)
• Root Mean Squared Error (RMSE). La raíz cuadrada del
promedio de errors al cuadrado
• Relative Absolute Error. El promedio de los valores absolutos
relativos a la diferencia absoluta entre los valores reales y el
promedio de todos los valores reales
33. • Relative Squared Error. El promedio de los errores cuadrados
relativos al cuadrado de la diferencia entre los valores reales y el
promedio de los todos los valores reales
• Coefficient of Determination. También conocido como R
cuadrado, es una métrica estadísitca que indica qué tan bien el
modelo predice los datos
• Un coeficiente cercano a 1.0 significa mejores predicciones. Un
1.0 significa que el modelo explica el 100% de los datos