La BI Microsoft a bien changée depuis 2005. Aujourd’hui, c’est Cloud-First et Mobile-First, mais comment s’y retrouver et choisir la bonne architecture ? Power BI, HDInsight, DMG, IaaS, SQL Azure, etc.
Dans cette session nous ferons le tour des composants BI et verrons comment ils s’articulent ensemble pour construire un système de gestion de l’information moderne.
5. #JSS2014
Jean-Pierre Riehl
Responsable Data & BI – AZEO
http://blog.djeepy1.net
@djeepy1
MVP SQL Server
Membre du Board
Pure-Player Microsoft
Spécialiste Self-Service BI
Projets « Agile BI »
Stratégie Data
Hybrid-BI
6. ETL DWH Cube Reports
#JSS2014
BI traditionnelle (1990-2010)
SSIS SQL SSAS
SSRS
Excel
8. #JSS2014
Vers la
« Data Culture »
“We believe that with the right tools,
insights can come from anyone, anywhere,
at any time. When that happens,
organizations develop what we describe as a
data culture.“
Satya Nadella, CEO Microsoft
13. Source : Albert Barron (https://www.linkedin.com/pulse/article/20140730172610-9679881-pizza-as-a-service) ##JJSSSS22001144
IaaS,
PaaS,
SaaS.
14. #JSS2014
IaaS
Des VM
On retrouve toutes les briques traditionnelles
SQL Server, SSIS, SSAS, SSRS, SharePoint
VM optimisées
A1 -> D14
Azure Active
Directory
Express Route
16. #JSS2014
SaaS
Modèle
Restituer
Partage
Recherche
Q&A
Mobilité
Acquisition Récupérer des données de
sources multiples et les
façonner au besoin
Partager les modèles,
constituer un Catalogue de
Données et collaborer
Créer des modèles d’analyse
et de calculs en toute
autonomie
Restituer les données dans
des tableaux de bords
interactifs et riches
Faites parler vos données
en les interrogeant en
langage naturel
Accéder à vos rapports
simplement depuis n’importe
quel terminal
Dimensionnement | Gestion | Sécurité
Power BI
17. #JSS2014
PaaS
HDInsight
Intelligent
Systems Service
HBase
Storm
Azure
DocumentDB
SQL Azure
Azure Blob
Azure Machine
Learning
Azure Data
Factory
Azure Stream
Analytics
18. SQL Azure
#JSS2014
SQL Azure
• WA SQL : Windows Azure SQL
• SQL Server en mode PaaS
…avec des limitations
• Principe de Scale-Out : Sharding/Federation
• Assistants de migration
• Outils de gestion (SSDT, SSMS, Online)
19. Azure Blob / Azure Tables Azure Blob
#JSS2014
• Espace de stockage Cloud
– Blob = binaire (ie. ce que vous voulez : csv, json, etc.)
– Table = entités
• Utilise des API pour manipuler
Plutôt orienté développeur
• Azure Blob à la base d’autres services Azure
20. #JSS2014
Azure DocumentDB Azure
• Stockage de documents JSON
Schema-free
• Les documents sont rangés dans des collections
• Requêtes en SQL (light)
• API REST
• Attention : Eventual Consistency
Orienté développeurs
DocumentDB
21. #JSS2014
HDInsight : le monde Big Data
HDInsight
Map/Reduce Hive Pig HCatalog Ambari HBase Storm
Azure Blob HDFS
Sqoop
Oozie
Azure UX
SDK
Azure
WebHcat/
Templeton
RDP
Yarn
HDInsight
HBase
Storm
22. Azure Stream Analytics Azure Stream
#JSS2014
• Permet d’analyser des flux temps réel
– Millions d’événements / seconde
– 365 jours de rétention (ou 20To)
• Basé sur Event Hub
• Syntaxe SQL
• Export vers SQL Azure
Analytics
SELECT Category, COUNT(*)
FROM Input TIMESTAMP BY EntryTime
GROUP BY
Category,
SlidingWindow(minute, 5)
23. #JSS2014
IoT : Internet of Things Intelligent
Systems Service
ISS
25. Azure Machine Learning Azure Machine
#JSS2014
• Support de R
• Requêtable par Web Service
– Azure ML API
• ML Studio Principe de la paillasse de
laboratoire
– Démarrage immédiat
Learning
26. Azure Data Factory Azure Data
#JSS2014
• Consume, Orchestrate, Transform
– Principe de Data Pipeline
– Cloud-ETL
Factory
29. Azure Data Factory Azure Data
#JSS2014
• Pipeline de données asynchrone
– Notion de conditions et disponibilité
• Reprise sur erreur
• Haute-disponibilité
• Monitoring
Factory
30. Get Data Modelize Analyze
#JSS2014
HDInsight
Intelligent Systems
Service
HBase
Storm
Azure
DocumentDB
SQL Azure
IaaS
Power BI
Azure Blob Azure Machine
Learning
Azure Stream
Analytics
Store
Manage
Azure Data Factory
SSIS SQL SSAS
31. Hybrid
• Une partie des données reste On-Premises
#JSS2014
• Data Management Gateway
• Express Route
• APS (Analytics Platform System)
32. #JSS2014
Les enjeux
• Data Movement
– Bande passante
• Sécurité
– Connexion, Containment
• Redondance des données
33. #JSS2014
De nouvelles questions
Data Lake, Datawarehouse, Datamart ?
Data Virtualization
Schema-less / Schema-bound
Gestion du changement
Etc.