1. Microsoft
Business Analytics 2013
José Redondo - @redondoj
CL SQL PASS Venezuela, Caracas Chapter – DPA SolidQ – SC SynergyTPC
jredondo@synergytpc.com
http://redondoj.wordpress.com
2. AGENDA
• Análisis Empresarial en el Nuevo Mundo de Datos
• Análisis del Big Data
• Demo
• Plataforma Analítica On-Premise, Cloud y Híbrida
• Demo
• Análisis Avanzado
• Demo
• Conclusiones
9. Valores de análisis modernos
Nuevo
mundo de
datos
En 2015, las organizaciones han de integrar alto valor,
diversificándose, generando nuevos tipos y fuentes de
información en una infraestructura de gestión de
información coherente, superando a sus colegas del sector
financieramente por más de 20 %.
Gartner, Regina Casonato et al., “Information
Management in the 21st Century”
24. Big data, o sólo datos complejos?
Velocidad
Variedad Complejidad
volume
InterpretandoPreparando
25. Big data de hoy,
pocos datos del mañana
Complejidad vs. Capacidades actuales
26. Dominio Escenarios comunes de Big Data
Servicios Financieros Modelando riesgos reales
Detección de fraude y análisis de amenazas
Vigilancia del comercio
Credit scoring y análisis
Medios & Entretenimientos Motores de recomendación
Ad targeting
Calidad de búsqueda
Abuso y haga clic en detección de fraude
Ventas Punto de análisis de transacciones de ventas
Análisis de abandono de clientes
Sentimiento analítico
Telecomunicaciones Prevención de abandono de clientes
Optimización de rendimiento de la red
Análisis Call Detail Record (CDR)
Predicción de fallas de redes
Gobierno Seguridad cibernética (botnets, fraudes)
Congestión de tráfico y desvíos
Monitoreo ambiental
Monitorización antisocial a través de los medios de comunicación social
Salud Investigación genómica
Investigación del cáncer
Detección temprana de las pandemias de salud
Monitoreo de la calidad del aire
27. Big Data + BI Tradicional =
Power & Simplicidad
Grandes, rápido, o
datos complejos
Microsoft HDInsight
SQL Server tabular,
multidimensional, DW
relacional, o PDW
010101010101010101
1010101010101010
01010101010101
101010101010
Interacción, exploración, visualiz
ación
36. Contador de Palabras en JS
MapReduce
• var map = function (key, value, context) {
• var words = value.split(/[^a-zA-Z]/);
• for (var i = 0; i < words.length; i++) {
• if (words[i] !== "") {
•
context.write(words[i].toLowerCase(), 1);
• }
• }
• };
• var reduce = function (key, values, context) {
• var sum = 0;
• while (values.hasNext()) {
• sum += parseInt(values.next());
• }
• context.write(key, sum);
• };
37. Ejemplo de Pig Latin
Esto es Paralelismo!!!
raw = LOAD ’search.log' USING PigStorage('t') AS (user, time, query);
houred = FOREACH raw GENERATE user, org.apache.pig.tutorial.ExtractHour(time) as hour, query;
ngramed1 = FOREACH houred GENERATE user, hour, flatten(org.apache.pig.tutorial.NGramGenerator(query)) as ngram;
ngramed2 = DISTINCT ngramed1;
hour_frequency1 = GROUP ngramed2 BY (ngram, hour);
… [see http://pig.apache.org/docs/r0.7.0/tutorial.html]
STORE ordered_uniq_frequency INTO '/tmp/tutorial-results' USING PigStorage();
38. Procesamiento lógico
reutilizable - Librerías
Filtrado
colaborativo, Recomendadores, Cl
ustering,
La descomposición en valores
simple,
Parallel frequent pattern mining,
Naive Bayes, Árbol de decisión
57. Aplicaciones
Híbridas (VM)
Business App
Connect
SQL Server
ON-PREM
WINDOWS AZURE
Windows Azure
Virtual Network
Extend
Flexibility &
Control
Low TCO for
Existing Apps
Full SQL Server
Capability
Managed
SQL Server in VM
58. Nuevos diseños de Apps
en la Nube
SQL Database
Mobile Web
Managed Platform
& Infra.
Low TCO for New
Apps
Dynamic Scalability
Based on SQL
Server Technology
59. Apps Híbridos (no VM)
On-Prem
Business App
SQL Database
On-Prem
SQL Server
Connect
Connect
Managed Platform
& Infra.
Low TCO for New
Apps
Dynamic Scalability
Based on SQL
Server Technology
60.
61. Todas las características
Nube Privada Analítica
System Center para la administración y aprovisionamiento de la nube
privada
63. Soluciones para la Nube Privada
Rápido Tiempo de solución
Bueno Muy bueno Excelente
Ejecución a escala
Flexible en componentes
Rápido Tiempo de solución
Bueno Muy bueno Excelente
Ejecución a escala
Flexible en componentes
Rápido Tiempo de solución
Bueno Muy bueno Excelente
Ejecución a escala
Flexible en componentes
Construido sobre DW
relacional
Arquitectura de Referencia
Fast Track DW
Infraestructura PDW & BDW
67. Expresiones DAX
= [First Name] & " " & [Last Name] Concatenación de cadenas, como en Excel
= SUM (Sales[Amount]) Creación de SUM en contextos de agregaciones
= RELATED (Product[Cost]) Sigue relaciones entre tablas, como las uniones
No se hace referencia
a celdas o rangos
individuales
Las funciones siempre
se refieren a las
columnas o tablas
68. Modelo Semántico BI
Data Model
Business Logic & Queries
Data Access ROLAP MOLAP xVelocity
MDX, soon: “DAXMD” DAX
Multidimensional Tabular
Applications Power View Excel PowerPivot SharePoint
Direct query
69. Entregando Power View y
PowerPivot a los usuarios
Archivos Standalone Excel
Excel en SharePoint,
SharePoint Online,
SkyDrive
Power View,
PowerPivot
directamente
en SSAS
Modo
SharePoint
Modelo tabular
SSAS nativo +
Archivo de
conexión
SharePoint
BISM
71. Power View
Exploración de datos
interactivos y
presentación visual
Experiencia de usuario
Excel 2013 SharePoint
2013 SQL
2012 SP1
Reporting
Service
72. Visualización de datos
Power View
Tablas, matrices, small
multiples, cards, tiles, filters,
slicers
Chart,
scatter plot,
bubble
animation
Interacción
Geoespacial
y Mapas con
Bing
76. SQL Server
Analysis
Services
Server
Tus modelos de mineria de datos
Algoritmos de mineria de datos Origen
datos
Excel, Visio, SSRS
Tu aplicación
Despliegue
Excel
Visio
SSDT
SSMS
App
Data
Arquitectura de la
Minería de Datos
78. Decision
Trees
Finds the odds of an outcome, great for visualising relationships between
values
Association
Rules
Identifies causal relationships between cases, good for market basket analysis
and recommendation engines
Clustering Classifies cases into distinctive groups based on any attribute sets
Naïve Bayes Shows the differences in a particular variable for various data elements
Sequence
Clustering
Groups or clusters data based on a sequence of previous events
Time Series Analyzes and forecasts time-based data combining the powerof ARTXP for
accurate short-term predictions with ARIMA
Neural Nets Uncovers non-intuitive relationships
Linear
Regression
Determines mathematical linear relationship between inputs and an outcome
Logistic
Regression
Determines the relationship between columns in order to evaluate the
probability that a column will contain a specific state
80. CONCLUSIONES
• Análisis de negocios en el nuevo mundo de los datos: Conectados, inmersivo,
de cualquier tamaño
• Plataforma Microsoft más poderosa y sencilla
• Big data = Datos demasiado complejos para los métodos tradicionales
• Microsoft HDInsight + Sencillez de BI tradicional = Potentes herramientas de
análisis
• Desde el centro de datos tradicional a la nube OS: Su opción flexible para el
análisis
• Nube en sus propios términos: Está bien cambiar de opinión
• Advanced Analytics no es complejo hoy día
• Microsoft Business Analytics: Potencia y simplicidad