Business Intelligence e Business Analytics sono termini che ricorrono ormai quotidianemente. Cosa significano? Che valore portano in una azienda? Come si crea una soluzione di Business Intelligece e di Business Analytics? Che strumenti mette a disposizione la piattaforma Microsoft? In questa sessione andremo ad introdurre tutti gli attori, gli strumenti e le tecnologie che concorrono a realizzare tali soluzioni, vendendone alcune "dal vivo" per capire come si usano ed il grande valore aggiunto che, in una società sempre più affamata di informazioni, ma ricca solo di dati, possono portare.
3. Works with SQL Server from 6.5, on BI from 2003
Specialized in Data Solution Architecture, Database Design,
Performance Tuning, BI
Microsoft SQL Server MVP
President of UGISS (Italian SQL Server UG)
Mentor @ SolidQ
Regular Speaker @ SQL Server events
Consulting & Training
Davide Mauri
3
4. Le basi della Business Intelligence
Il futuro e le nuove tendenze
Agenda
5. “Per Business Intelligence si intende un insieme di processi
aziendali per raccogliere e analizzare informazioni
strategiche; la tecnologia utilizzata per ottenere questi
processi; le informazioni ottenute come risultato di questi
processi.”
(Hans Peter Luhn, ricercatore IBM, 1958)
Business Intelligence
6. Forrester Research distingue tra Business Intelligence e
Data Warehouse
“Business intelligence (BI) is a set of methodologies, processes, architectures, and
technologies that transform raw data into meaningful and useful information. It
allows business users to make informed business decisions with real-time data that
can put a company ahead of its competitors”
“Data warehouses form the back-end infrastructure”
Business Intelligence & Data Warehouse
7. Business Intelligence Full Architecture
Files
Web Svc
Cloud /
Syndicated
RDBMS
Master Data
Ex
tr
ac
t
Archive / Big Data
Facts
Staging
Archive
Replay
DimensionsStandardise
Extract
Cube
V-Mart
Mart
Mart
Copy
Facts
Facts
Process
Secure
/ Expose
Aggregate
Transform
8. Un database OLTP è progettato per assicurare l’integrità e la
coerenza dei dati
Una tabella per entità
• “Ogni cosa al suo posto”
• Normalizzazione
Si hanno molte tabelle
• Facilità di aggiornamento dei dati
• Nessun dato duplicato
• Molte join per recuperare le informazioni
Dal database OLTP al DWH
9. Un Data Warehouse è pensato per aiutare la reportistica e
l’analisi
Deve essere semplice!
• L’utente finale deve poterlo capire
Si può assumere che sia solamente letto
Deve essere molto veloce a leggere grosse moli di dati
Deve poter tenere traccia di informazioni storiche che nel database OLTP possono
non interessare
Dal database OLTP al DWH
10. Un DWH deve essere quindi modellato appositamente allo
scopo
Star Schema
Si può supporre che l’unica entità autorizzata a modificare I dati
nel DWH sia quella che implementa il processo di caricamento
dello stesso
Si può denormalizzare fortemente
Facilita la scrittura di query
Si può ottimizzare il db per essere letto molto velocemente
Dal database OLTP al DWH
13. Il caricamento del DWH avviene mediante un processo di
ETL
Extract-Transform-Load
Questo processo si occupa di
Prendere i dati dalle varie fonti che contribuiranno alla creazione del DWH
Pulire e standardizzare i dati
Caricarli nel DWH
Gestire gli errori
Gestire l’aspetto temporale dei dati
Caricamento del DWH
14. Con i tool MS normalmente questo si può fare con
T-SQL
SSIS
Entrambi hanno pro e contro…il meglio è prendere i pro e
scartare i contro
Caricamento del DWH
15. Semplificando molto: principalmente è un motore di
aggregazione di dati
Storage “Multidimensionale”
• MOLAP. ROLAP, HOLAP
Dati pre-aggregati fortemente ottimizzati per essere letti molto molto velocemente
Non è un motore relazionale
Ha un funzionamento “gerarchico”
E’ ricco di metadati
E’ ricco di informazioni “accessorie”
• Es: Tempo
Analysis Services - Multidimensional
16. E’ basato su “Misure” e “Dimensioni”
Misure: il valore da calcolare
Dimensione: le informazioni attraverso quali analizzare i dati delle misure
Utilizza un linguaggio specifico: MDX
E’ simile a SQL ma NON è SQL
Viene alimentato con i dati presenti nel DWH
Analysis Services - Multidimensional
17. E’ un motore di analisi ed aggregazione «in-memory»
Storage basato su ColumnStore
Stesso algoritmo Vertipaq di SQL Server, ma differente implementazione
Analysis Services - Tabular
18. Ha un funzionamento più simile ad un database relazionale
Si basa su tabelle e relazioni
Permette però di creare gerarchie
Permette l’aggiunti di alcuni metadati
• Es: Tempo
Utilizza un linguaggio specifico: DAX
Completamente nuovo
Pensato per il Power User (di Excel)
Viene alimentato con i dati presenti nel DWH
Analysis Services - Tabular
20. Facile: fa report
Mette a disposizione
Strumenti per lo sviluppatore : BIDS / Data Tools / Web Services
Strumenti per l’utente evoluto : Report Builder
Strumenti per la condivisione dei report : Report Manager
Strumenti per l’amministrazione : Report Manager / SSMS
Reporting Services
21. Di fatto è un framework (.NET Based)
Tramite web services
Completamente estendibile
Completamente integrabile con applicazioni custom
Reporting Services
23. Motore di analisi predittiva e di classificazione
Contenuto all’interno di Analysis Services Multidimensional
Permette di effettuare analisi per
Ricerca di pattern
Ricerca di associazioni
Classificazione dei dati
Previsione
Utilizza DMX come linguaggio di query
Data Mining
24. Raccolta, memorizzazione ed analisi di enormi(*) moli di dati
(*) Enormi is undefined
Cosa utilizzare?
Magari non (del tutto) strutturati?
SQL Server + Fast Track
Parallel Data Warehouse
HDInsight (Hadoop)
Big Data
25. Come cercare nei dati a disposizione informazioni
«nascoste»?
Ossia pattern / informazioni che a priori non ci verrebbero in mente
Power View (Excel 2013 / Sharepoint)
Data Explorer (Excel 2013)
GeoFlow (Excel 2013)
Data Exploration / Visualization
26. Utilizzo di dati enterprise con l’aggiunto di dati «personali»
Esempio reale: Analisi «al volo» di una ipotesi che si vuole verificare, come «le
condizioni meteo influiscono sulle vendite»
Se l’analisi diventa di importanza strategia ed aziendale viene poi integrate
nell’Enterprise BI (la BI «classica»)
PowerPivot for Excel
Disponibile da SQL Server 2008R2
Integrato in Excel dalla versione 2013
Porta Analysis Services Tabular sul client
Self-Service BI
28. Grazie a tutti per la partecipazione
Riceverete il link per il download a slide e demo via email nei
prossimi giorni
Per contattarmi
dmauri@solidq.com
Grazie