3. Cubriendo el espectro Analytics
Descriptivo Diagnóstico PreceptivoProfético
Profesionales de TI
Modelado de datos, ETL, Data
Almacenamiento, Marts y
cubos de datos
Información del Trabajador
Self-Service y
Exploración con BI
Poder
Los científicos de datos
Advanced Analytics de
Microsoft y 3rd partes
BI Enablement Advanced Analytics
Gestión de datos empresariales
Que pasó? ¿Por qué ocurrió? Lo que sucederá? Qué tengo que hacer?
4. Científico de datos
Un científico de datos incorpora técnicas y teorías de
muchos campos, incluyendo las matemáticas, la estadística,
la ingeniería de datos, reconocimiento de patrones,
aprendizaje avanzado , visualización, modelado de la
incertidumbre, almacenamiento de datos y la computación
de alto rendimiento con el objetivo de extraer el significado
de datos.
Ciencia de datos: un término
utilizado indistintamente con
inteligencia de negocio o análitica
empresarial
6. Experiencia Científico de Datos
Telecomunicaciones Servicios Financieros Cuidado De La Salud
Línea Fija y Móvil
Banca, Seguros,
Bienes Raíces
Productos
farmacéuticos,
Biotecnología
Industria
Aeroespacial,
Manufactura
7. ¿Qué es el análisis predictivo?
• El análisis de datos con técnicas matemáticas de
estadística, minería de datos y aprendizaje
automático. Se utiliza para descubrir patrones
ocultos, que da una ventaja competitiva.
8. Qué es el análisis predictivo?
Predictive Analytics es el descubrimiento de información
predictiva, a veces oculta, de las bases de datos
utilizando atributos de datos relacionados y no
relacionados con la aplicación de algoritmos de análisis,
y la creación de modelos que generan resultados
predictivos.
Modelaje Predictivo es el proceso de creación de un
modelo para predecir mejor la probabilidad de un
resultado.
12. • La automatización de la automatización
• Utilizar computadoras para programar computadoras
• Escribir software es el cuello de botella
• Deje que los datos hagan el trabajo!
Qué es el aprendizaje autómático o Machine Learning
13. 2
¿Por qué "Aprender"?
• El aprendizaje automático es la programación de
computadoras para optimizar un criterio de desempeño
usando datos como ejemplo o experiencia previa.
• El aprendizaje se utiliza cuando:
• Experiencia humana no existe (la navegación en Marte),
• Los seres humanos son incapaces de explicar su experiencia
(reconocimiento de voz)
• Solución cambios en el tiempo (el enrutamiento en una red
informática)
• Solución necesita ser adaptada a los casos particulares (biométrica
de usuario)
14. Cumpliendo con uno de los viejos sueños
del co-fundador de Microsoft, Bill Gates:
Computadoras que podemos ver, oír
y entender.
John Platt
Científico distinguido en
Microsoft Research
¿Qué es
Aprendizaje
Automático?
Sistemas informáticos de
predicción se vuelven más
inteligentes, con experiencia
"
"
15. 3
De qué hablamos cuando hablamos de "Aprendizaje"
• Aprender modelos generales a partir de ejemplos de
datos particulares
• Los datos son baratos y abundantes (data warehouses,
data marts); el conocimiento es caro y escaso.
• Ejemplo para comercio minorista: las transacciones de los
clientes y la conducta del consumidor:
Las personas que compraron "Código Da Vinci" también compraron "Las cinco personas que conoces en
el cielo" (www.amazon.com)
• Construir un modelo que es una aproximación buena y
útil de los datos.
17. ""
¿Qué es la Internet de las cosas?
La red de los objetos
físicos que contienen la
tecnología embebida para
comunicarse e interactuar
con sus estados internos o
el ambiente externo.
Fuente: Gartner
18. Visión de Microsoft
El Internet de las Cosas comienza
con Tus Cosas.
• Construir sobre la infraestructura que ya tiene.
• Añadir más dispositivos a los que ya posee.
• Obtenga más de los datos que ya existe.
19. Microsoft y la Internet de las cosas
Dispositivo de rastreo de
vehículos
Cámaras Contador De Potencia Medidor de carga
Detectores de humo de
incendios
Sensor de humedad Medidor de flujo Sensor de Ocupación Sensor De Temperatura
DISPOSITIVOS INTELIGENTES
Agregación | AnálisisLocal
Protocolo Multi-Wireless
Controlador de máquina
Seguimiento de
Vehículos
Smart Grid Equipamiento Quiosco Retail
Detección de
incendios
Cuidado De La Salud
Edificio Inteligente
Automatización
Publicidad Digital
Inicio Automatización
Inteligente
Automotor Al Por Menor Industrial
Cuidado De La
Salud
Seguridad y Vigilancia Energía Smart Home Smart Cities
Monitoreo
La recolección de datos y
alertas
El seguimiento de activos y
Geo-cercas
Preventivo mantenimiento
Facturación basada Uso
Acceso Remoto
Segura iniciar sesión en los
dispositivos y productos para
diagnosticar problemas
remotos
Mantenimiento remoto -
diagnosticar y reparar
problemas
Distribución de
Contenido
Automatizar la
implementación de software
de bienes
Distribuir archivos a los
dispositivos. El contenido
incluye archivos de activos
específicos, doc, anuncios
Microsoft Azure Intelligent Systems Service(s)
Gestión de la Configuración
Almacenar y acceder a
configuraciones de activos
Conformidad Administración
Telemática
App LOB personalizada
Herramientas Dash-
embarque
Grandes herramientas de
visualizaciónde datos Integracion Social Integración de la empresa
M2M pasarelaRED
22. Core Azure IoT Arquitectura
Conecte aplicaciones, servicios y dispositivos
Integrar otros elementos (Azure SQL, Almacenamiento, Sitios Web y Aplicaciones)
Protocolos (REST, AMQP, WS *) y API
Integración con actuales y 3rd
Gestión De Eventos
Reglas, Alarmas
Almacenamiento
Analítica
DispositivodeDatos
Capa de presentación
Service Bus / Evento Hubs
23. DocumentDB
Microsoft Azure IoT Nube Servicios
Productores Evento Ingestión TransformaciónAlmacenamiento
Externo Fuente de datos
Evento Hub (Service Bus)
Azure ML
HD Insight
Azure NRT
Presentación y acción
Service Cloud
Externo Fuente de datos
Base de datos SQL
Tabla / Blob Almacenamiento
Websites Azure
Servicios móviles
BI Poder
Service Cloud
Servicio Exterior
Conectividad del dispositivo
24. ConectividadMensajería
Desafíos de IoT con las capacidades de la
plataforma Azure
Direccionabilida
d
Short Haul / protocolos
de Larga Distancia, los
dispositivos no IP,
cortafuegos / NAT de
enrutamiento, en línea /
fuera de línea, la
itinerancia, la
orientación
Heterogeneidad
OS / firmware, energía /
red, protocolos
Seguridad
La federación de identidades, de
dispositivos y datos de autorización,
privacidad, integridad de los datos de
borde, la seguridad de transporte,
formato
Escala
Gran volumen
de dispositivos
por ejemplo y
rentable
Telemetría
Colección, filtrado,
enrutamiento,
rendimiento, Per-
mensaje QoS
Notificaciones
Programación y
Orientación
dispositivos de borde
Device grupos
dentro de grandes
poblaciones
Comando / Control
Correlación, Sesiones / lotes
Organizacional IP / Arquitectura, integración de proveedores, 3rd servicio fiesta y tecnología
26. Analytics Vision
Utilizando los datos del pasado para predecir el futuro
Motores
recomenda-ción
Análisis
Publicidad
El pronóstico del
tiempo para la
planificación de
negocios
Análisis de redes
sociales
Legal
descubrimiento y
archivo de
documentos
Análisis de
precios
Fraude
detección
Mantequera
análisis
Supervisión de
equipos
Seguimiento y
servicios basados
en localización
Seguros
personalizada
El aprendizaje automático y
el análisis predictivo son
capacidades básicas que se
necesitan en toda la
empresa
28. ¿Cuál es Azure ML?
•Plataforma de Aprendizaje Automático
•Parte de Microsoft Azure
29. Herramientas Azure ML
• Azure Portal
• Empieza aqui: una disposición ML Workspace
• Opcional: trabajo con SQL Azure
• Herramienta ML Estudio
• ML Estudio
• Conectar a datos y construir experimentos
• Publicar servicios web
• Azure Portal
• Gestionar o eliminar espacios de trabajo
• Opcionalmente, publicar servicios a Azure DataMarket
30. Los pasos del proceso Azure ML
1. Iterar hasta modelo sea válido:
1. Datos
1. Conectar
2. Transformar si es necesario
3. Seleccione características (columnas útiles)
2. Modelo
1. Inicialice
2. Ejecute
3. Puntuación (Predecir)
4. Evaluar Resultados (predicciones)
3. Válido?
2. Etapa y Publicar un servicio web
31. ¿Cómo utilizo Azure Machine Learning?
Importar datos
Constuir un
modelo
Combinar el
Modelo con el
API
32. Una solución de Aprendizaje Automático – obtener resultados a
partir de los datos
Azure Portal
Operaciones
Azure Equipo
ML Studio
Científico de
Datos
HDInsight
Almacenamiento
En Azure
Datos de
escritorio
Azure Portal y
Servicio API ML
Equipo de operaciones de
Azure
PowerBI/
Dashboards
Aplicaciones MóvilesAplicaciones Web
Servicio API ML Desarrollador
33. Una solución de Aprendizaje Automático - obtener resultados a partir de
los datos
Azure Portal
Operaciones
Azure Equipo
ML Estudio
Datos Científico
HDInsight
Almacenamiento
Azure
Datos de
escritorio
Azure Portal y
Servicio API ML
Operaciones
Azure Equipo
PowerBI/
Dashboards
Aplicaciones MóvilesAplicaciones Web
Servicio API ML Revelador
ML Studio
y el científico de datos
• Acceso y preparación de
datos
• Crear, modelos de prueba
• Con un solo clic pasar a la
etapa de producción a través
de la API de Servicios
Servicio API Azure Portal y
ML
• Crear ML Studio Workplace
• Asignar cuenta de almacenamiento
(s)
• Monitor Consumo ML
• Ver alertas cuando el modelo es listo
• Publicar WebServices
API ML servicio y el desarrollador
• Modelos disponibles como una url que se puede invocar
Los usuarios pueden acceder
fácilmente a los resultados: desde
cualquier lugar,en cualquier dispositivo
41. Machine Learning Studio
Experimentos: Los experimentos que se han creado, ejecutado, y
guardado como borradores. Estos incluyen un conjunto de experimentos
de ejemplo que se incluyen con el servicio que le ayudará en sus
proyectos.
Servicios Web Servicios: Una lista de los experimentos que se han
publicado como servicios web. Esta lista estará vacía hasta que publique
su primer
experimento.
Settings: Una colección de parámetros que puede utilizar para
configurar
su cuenta y recursos. Puede utilizar esta opción para invitar otros
usuarios compartir su espacio de trabajo en Azure Machine Learning.
42. Componentes de un experimento
• Un experimento consta de los componentes clave necesarios
para construir, probar y evaluar un modelo predictivo. En Azure
Machine Learning, un experimento contiene dos componentes
principales: los conjuntos de datos y módulos.
• Un conjunto de datos contiene datos que se han subido a
Machine Learning Studio. El conjunto de datos se utiliza al crear
un modelo predictivo. Machine Learning Studio también ofrece
varios conjuntos de datos de demostración para ayudarle a
reactivar la creación de sus primeros experimentos.
• Un módulo es un algoritmo que va a utilizar en la construcción
de su modelo predictivo.
43. Módulos
• Reader: Este módulo se utiliza para leer los datos de varias fuentes, incluyendo la
Web, base de datos SQL Azure, almacenamiento Blob Azure, o mesas Hive.
• Split: Este módulo se divide un conjunto de datos en dos partes. Normalmente se
utiliza para dividir un conjunto de datos de aprendizaje y prueba de datos
separadas.
• Elementary Statistics: Calcula estadísticas elementales como la media, la desviación
estándar, etc., de un determinado conjunto de datos.
• Regresión lineal: se puede utilizar para crear un modelo predictivo con un
algoritmo de regresión lineal.
44. Módulos
• Train Model: Este módulo entrena un algoritmo de clasificación o regresión
seleccionado con un conjunto de datos de entrenamiento dado.
• Evaluate Model: Este módulo se utiliza para evaluar el desempeño de un
modelo de clasificación o regresión entrenado.
• Cross Validate Model: Este módulo se utiliza para llevar a cabo validación
cruzada para evitar el exceso de ajuste. Por defecto, este módulo usa 10
veces la validación cruzada.
• Score Model: Puntúa un modelo de clasificación o regresión entrenado.
45. Pasos para la creación de un experimento
•Crear un modelo
• Paso 1: Obtener datos
• Paso 2: Preproceso de datos
• Paso 3: Definir las características
•Entrenar el modelo
• Paso 4: Seleccionar y aplicar un algoritmo de aprendizaje
• Pruebe el Modelo
•Paso 5: Predecir sobre nuevos datos
46. Evaluación del modelo
• Mean Absolute Error (MAE). El promedio de los errores
absolutos (un error es la diferencia entre el valor predicho y el
valor real)
• Root Mean Squared Error (RMSE). La raíz cuadrada del
promedio de errors al cuadrado
• Relative Absolute Error. El promedio de los valores absolutos
relativos a la diferencia absoluta entre los valores reales y el
promedio de todos los valores reales
47. • Relative Squared Error. El promedio de los errores cuadrados
relativos al cuadrado de la diferencia entre los valores reales y el
promedio de los todos los valores reales
• Coefficient of Determination. También conocido como R
cuadrado, es una métrica estadísitca que indica qué tan bien el
modelo predice los datos
• Un coeficiente cercano a 1.0 significa mejores predicciones. Un
1.0 significa que el modelo explica el 100% de los datos