SlideShare una empresa de Scribd logo
1 de 45
Descargar para leer sin conexión
Informatique Décisionnelle
Modélisation Multidimensionnelle
Med. AMNAI
Master spécialisé
BIG DATA Cloud Computing
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Plan
1 Modélisation Entité/Association
Med AMNAI Informatique Décisionnelle 2 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Plan
1 Modélisation Entité/Association
2 Limites du modèle relationnel : OLTP vs OLAP
Med AMNAI Informatique Décisionnelle 2 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Plan
1 Modélisation Entité/Association
2 Limites du modèle relationnel : OLTP vs OLAP
3 Nécessité d'une structure muti-dimensionnelle
Med AMNAI Informatique Décisionnelle 2 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Plan
1 Modélisation Entité/Association
2 Limites du modèle relationnel : OLTP vs OLAP
3 Nécessité d'une structure muti-dimensionnelle
4 Modélisation multidimensionnelle des DW
Med AMNAI Informatique Décisionnelle 2 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Plan
1 Modélisation Entité/Association
2 Limites du modèle relationnel : OLTP vs OLAP
3 Nécessité d'une structure muti-dimensionnelle
4 Modélisation multidimensionnelle des DW
5 Schémas Multidimensionnels
Med AMNAI Informatique Décisionnelle 2 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Modélisation Entité/Association
• Avantages
• Normalisation;
• Éliminer les redondances ;
• Préserver la cohérence des données.
• Optimisation des transactions;
• Réduction de l'espace de stockage;
• Inconvénients pour un utilisateur nal
• Schéma trop complet : Contient des tables/champs inutiles
pour l'analyse;
• Pas d'interface graphique capable de rendre utilisable le
modèle E/A;
• Inadapté pour l'analyse.
Med AMNAI Informatique Décisionnelle 3 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Limites du modèle relationnel : OLTP vs OLAP
• OLTP : Requêtes simples qui, quoi
• ex. les ventes de X;
• jointures : les ventes de X à quel prix de quel fournisseur.
• OLAP : besoin de données agrégées, synthétisées
• nombre de ventes par vendeur, par région, par mois;
• nombre de ventes par vendeur, par fournisseur, par mois.
• SQL : Possibilité d'agréger les données (group by) :
• très coûteux (parcourir toutes les tables) et il faut recalculer à
chaque utilisation.
Med AMNAI Informatique Décisionnelle 4 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Nécessité d'une structure muti-dimensionnelle
• Les BD relationnelles ne sont pas adaptées à l'OLAP
car :
• Pas les mêmes objectifs;
• Pas les mêmes données;
• Pas les mêmes traitements et requêtes.
• Il est donc nécessaire de disposer d'une structure de
stockage adaptée à l'OLAP, i.e. permettant de :
• représenter les données dans plusieurs dimensions;
• manipuler les données facilement et ecacement.
Med AMNAI Informatique Décisionnelle 5 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple d'un DW (Entrpôt de données)
• L'ED doit fournir le CA des ventes d'un produit, par date,
client, magasin et vendeur, ainsi que toutes les sommations
possibles de chire d'aaires dans une année donnée.
• Une vente est caractérisée par :
Vente (produit, client, magasin, date, pays, coût de
vente, montant des ventes, Qté vendue)
• Produit : clé produit, Description (et libellés), . . .
• Client : clé client, type client, . . .
• Magasin : clé magasin, . . .
• Date : clé temps, jour, semaine, mois, . . .
Med AMNAI Informatique Décisionnelle 6 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Représentation multidimensionnelle
Cube représentant le sujet des Ventes
Med AMNAI Informatique Décisionnelle 7 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Cocepts de schéma de modélisation
• Nouvelle méthode de conception autour des concepts métiers
(Ne pas normaliser au maximum.)
• Notion de cube (en fonction des dimensions).
• Introduction de nouveaux types des tables :
• Table de faits (mesure).
• Table de dimensions
• Introduction de nouveaux modèles :
• Modèle en étoile.
• Modèle en ocon.
Med AMNAI Informatique Décisionnelle 8 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Cube
• Modélisation multidimensionnelle des données facilitant
l'analyse d'une quantité selon diérentes dimensions :
• Temps.
• Localisation géographique ...
• Les calculs sont réalisés lors du chargement ou de la mise à
jour du cube.
Med AMNAI Informatique Décisionnelle 9 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Manipulation du cube
• Opérateurs appliqués sur le cube sont algébriques (le résultat
est un autre cube) et peuvent être combinés.
• Opérateurs :
• Slicing, Dicing (extraction).
• Changement de la granularité d'une dimension
• Roll up (agrégation d'une dimension = résumé).
• Drill down (plus détaillées).
Med AMNAI Informatique Décisionnelle 10 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Slicing et Dicing
• Slicing : Sélection de tranches du cube par des prédicats selon
une dimension
• Filtrer une dimension selon une valeur.
• Exemple : Slice (1998) : on ne retient que la partie du cube qui
correspond à cette date.
• Dicing : extraction d'un sous-cube.
• RQ : Slicing et Dicing Opérateurs sur le cube
Med AMNAI Informatique Décisionnelle 11 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple Slicing
Données d'une activité de Vente
Med AMNAI Informatique Décisionnelle 12 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple Dicing
Extraction d'un sous cube
Med AMNAI Informatique Décisionnelle 13 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Drill-Down et Roll-Up
• Les opérations agissant sur la granularité d'observation des
données caractérisent la hiérarchie de navigation entre les
diérents niveaux.
• Roll-up ou forage vers le haut : consiste à représenter les
données du cube à un niveau de granularité supérieur
conformément à la hiérarchie dénie sur la dimension.
• Utilisation de la fonction d'agrégation (somme, moyenne, etc)
spécifée pour la mesure et la dimension.
• Drill-down ou forage vers le bas : consiste à représenter les
données du cube à un niveau de granularité de niveau inférieur
sous forme plus détaillée.
• RQ : Roll-up et Drill-down Opérateurs sur les dimensions
Med AMNAI Informatique Décisionnelle 14 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple Drill-Down
Med AMNAI Informatique Décisionnelle 15 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple Roll-Up
Med AMNAI Informatique Décisionnelle 16 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Concept Faits
• Le fait modélise le sujet de l'analyse. Un fait est formé de
mesures correspondant aux informations de l'activité analysée
(ex : Quantités vendues, montant des ventes,. . . ).
• Les mesures d'un fait sont numériques et généralement
valorisées de manière continue.
• Les mesures sont numériques pour permettre de résumer un
grand nombre d'enregistrements en quelques enregistrements
(on peut les additionner, les dénombrer ou bien calculer le
minimum, le maximum ou la moyenne).
Med AMNAI Informatique Décisionnelle 17 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Table de Faits
• Table principale du modèle multidimensionnel.
• Contient les données observables (les faits) sur le sujet étudié
selon divers axes d'analyse (les dimensions).
Med AMNAI Informatique Décisionnelle 18 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Table de Faits (suite)
• Contient les clés étrangères des axes d'analyse (dimension) :
CléDate, Cléproduit, Clémagasin
• Trois types de faits :
• Additif.
• Semi Additif.
• Non Additif.
• Les faits les plus utiles sont numériques et additifs.
Med AMNAI Informatique Décisionnelle 19 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Types de Faits
• Additif : additionnable suivant toutes les dimensions
• Quantités vendues, chire d'aaire.
• Peut être le résultat d'un calcul : Bénéce = montant vente -
coût
• Semi additif : additionnable suivant certaines dimensions
• Solde d'un compte bancaire : Pas de sens d'additionner sur les
dates car cela représente des instantanés d'un niveau.
• Non additif : fait non additionnable quelque soit la dimension.
• Prix unitaire : l'addition sur n'importe quelle dimension donne
un nombre dépourvu de sens.
Med AMNAI Informatique Décisionnelle 20 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Dimension
• Le sujet (les faits, mesures) est analysé suivant diérentes
perspectives.
• Ces perspectives correspondent à une catégorie utilisée pour
caractériser les mesures d'activité analysées, on parle de
dimensions.
• Une dimension modélise une perspective d'analyse.
• Une dimension se compose d'attributs et niveaux
correspondant aux informations faisant varier les mesures de
l'activité.
Med AMNAI Informatique Décisionnelle 21 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemples dimension
Vente (Produit, client, magasin, vendeur, date, coût de vente,
montant des ventes, Qté vendue)
Med AMNAI Informatique Décisionnelle 22 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Attributs et Niveaux
• Une dimension est généralement formée de paramètres (ou
attributs) textuels et discrets.
• Les paramètres textuels sont utilisés pour restreindre la
portée des requêtes an de limiter la taille des réponses.
• Les paramètres sont discrets, c'est à dire que les valeurs
possibles sont bien déterminées et sont des descripteurs
constants.
Med AMNAI Informatique Décisionnelle 23 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Concept Hiérarchie/Granularité
• Une hiérarchie organise les attributs d'une dimension selon
une relation est plus n conformément à leur niveau de
détail ou granularité.
• On distingue deux types de hiérarchies Simple et Multiple :
Med AMNAI Informatique Décisionnelle 24 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Modèle Multidimensionnel
• Table de faits + Tables de dimensions reliées à la table de
faits par une jointure.
• Chaque enregistrement de la table de faits stocke les clés des
tables de dimensions et les mesures faites à un instant précis.
• Chacune des tables de dimension possède une clé primaire
unique correspondant à l'un des composants de la clé multiple
de la table de faits.
• On obtient un schéma en étoile (dans le cas le plus simple).
Med AMNAI Informatique Décisionnelle 25 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Types de modèles
Med AMNAI Informatique Décisionnelle 26 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Modèle en étoile
• Une table de fait centrale et des dimensions.
• Les dimensions n'ont pas de liaison entre elles
• Chacune des tables de dimension possède une clé primaire
unique correspondant à l'un des composants de la clé multiple
de la table de faits.
• Avantages :
• Facilité de navigation.
• Nombre de jointures limité.
• Inconvénients :
• Redondance dans les dimensions.
• Toutes les dimensions ne concernent pas les mesures.
Med AMNAI Informatique Décisionnelle 27 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple de Modèle en étoile
Med AMNAI Informatique Décisionnelle 28 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Modèle en ocon
• Une table de fait et des dimensions décomposées en sous
hiérarchies.
• Un seul niveau hiérarchique par table de dimension.
• La table de dimension de niveau hiérarchique le plus bas est
reliée à la table de fait.
• Avantages :
• Normalisation des dimensions.
• Économie d'espace disque.
• Inconvénients :
• Modèle plus complexe (jointure).
• Requêtes moins performantes.
Med AMNAI Informatique Décisionnelle 29 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Exemple de Modèle en ocon
Med AMNAI Informatique Décisionnelle 30 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Notions de Modélisation Multidimensionnelle
Cocepts Multidimensionnelle
Table des Faits
Dimensions
Schémas Multidimensionnel
Méthodologie de Kimball
Méthodologie de Kimball
1 Choisir le sujet.
2 Choisir la granularité des faits.
3 Identier et adapter les dimensions.
4 Choisir les faits.
5 Stocker les pré-calculs.
6 Établir les tables de dimensions.
7 Choisir la durée de la base.
8 Suivre les dimensions lentement évolutives.
9 Décider des requêtes prioritaires, des modes de requêtes.
Med AMNAI Informatique Décisionnelle 31 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Dénition d'un ETL
Alimentation/ mise à jour de l'entrepôt
Dénition d'un ETL
• Ore un environnement de développement;
• Ore des outils de gestion des opérations et de maintenance;
• Permet de découvrir, analyser et extraire les données à
partir de sources hétérogènes;
• Permet de nettoyer et standardiser les données;
• Permet de charger les données dans un entrepôt.
Med AMNAI Informatique Décisionnelle 32 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Dénition d'un ETL
Alimentation/ mise à jour de l'entrepôt
Alimentation/ mise à jour de l'entrepôt
• Entrepôt mis à jour régulièrement;
• Chargement automatisé de l'entrepôt;
• Utilisation d'outils ETL (Extract, Transform, Load)
Med AMNAI Informatique Décisionnelle 33 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Dénition d'un ETL
Alimentation/ mise à jour de l'entrepôt
Aperçu d'un ETL
Med AMNAI Informatique Décisionnelle 34 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
Dénition d'un ETL
Alimentation/ mise à jour de l'entrepôt
Aperçu d'un ETL (suite)
Med AMNAI Informatique Décisionnelle 35 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
ROLAP
MOLAP
HOLAP
ROLAP
• Relational OLAP :
• Données stockées dans une base de données
relationnelles;
• Un moteur OLAP permet de simuler le comportement d'un
SGBD multidimensionnel;
• Plus facile et moins cher à mettre en place;
• Moins performant lors des phases de calcul;
• Exemples de moteurs ROLAP : Mondrian
Med AMNAI Informatique Décisionnelle 36 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
ROLAP
MOLAP
HOLAP
MOLAP
• Multi dimensional OLAP : :
• Utilise un système multidimensionnel  pur  qui gère les
structures multidimensionnelles natives (les cubes);
• Accès direct aux données dans le cube;
• Plus dicile à mettre en place;
• Formats souvent propriétaires;
• Conçu exclusivement pour l'analyse multidimensionnelle.
• Exemples de moteurs MOLAP : (Microsoft Analysis Services,
Hyperion)
Med AMNAI Informatique Décisionnelle 37 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
ROLAP
MOLAP
HOLAP
HOLAP
• Hybride OLAP :
• tables de faits et tables de dimensions stockées dans SGBD
relationnel (données de base);
• données agrégées stockées dans des cubes;
• Solution hybride entre MOLAP et ROLAP;
• Bon compromis au niveau coût et performance.
Med AMNAI Informatique Décisionnelle 38 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
ROLAP
MOLAP
HOLAP
Marché Décisionnel
Med AMNAI Informatique Décisionnelle 39 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
ROLAP
MOLAP
HOLAP
Quelques solutions commerciales
Med AMNAI Informatique Décisionnelle 40 / 38
Modélisation Entité/Association
Limites du modèle relationnel : OLTP vs OLAP
Nécessité d'une structure muti-dimensionnelle
Modélisation Multidimensionnelle
Alimentation d'un Datawarehouse
Implémentations des modèles multidimensionnelles
ROLAP
MOLAP
HOLAP
Quelques solutions open source
Med AMNAI Informatique Décisionnelle 41 / 38

Más contenido relacionado

Similar a _3_expo_MM.pdf

CHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdf
amine17157
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
Alexandre Equoy
 
Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...
Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...
Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...
Alphorm
 
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v160 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
CERTyou Formation
 

Similar a _3_expo_MM.pdf (20)

Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Neo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métierNeo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métier
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
 
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
 
CHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdfCHAP 1 PRÉSENTATION GENERALE.pdf
CHAP 1 PRÉSENTATION GENERALE.pdf
 
Introduction NoSQL 201401 - Ensim
Introduction NoSQL 201401 - EnsimIntroduction NoSQL 201401 - Ensim
Introduction NoSQL 201401 - Ensim
 
Point de vue expert: la stratégie “ comptoir des données”
Point de vue expert: la stratégie “ comptoir des données”Point de vue expert: la stratégie “ comptoir des données”
Point de vue expert: la stratégie “ comptoir des données”
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Nouveautes Minitab-Integration Python, Arbres de decision, Validation de mode...
Nouveautes Minitab-Integration Python, Arbres de decision, Validation de mode...Nouveautes Minitab-Integration Python, Arbres de decision, Validation de mode...
Nouveautes Minitab-Integration Python, Arbres de decision, Validation de mode...
 
ItSMF 2011 : Tablettes, VDI, Cloud, Opportunités et impacts pour la Gestion d...
ItSMF 2011 : Tablettes, VDI, Cloud, Opportunités et impacts pour la Gestion d...ItSMF 2011 : Tablettes, VDI, Cloud, Opportunités et impacts pour la Gestion d...
ItSMF 2011 : Tablettes, VDI, Cloud, Opportunités et impacts pour la Gestion d...
 
Introduction NoSql 201406 - lbroudoux
Introduction NoSql 201406 - lbroudouxIntroduction NoSql 201406 - lbroudoux
Introduction NoSql 201406 - lbroudoux
 
Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...
Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...
Alphorm.com Formation Power BI : Transformation de Données avec DAX et Power ...
 
Moteur de rapprochement de factures avec des outils Open Source
Moteur de rapprochement de factures avec des outils Open SourceMoteur de rapprochement de factures avec des outils Open Source
Moteur de rapprochement de factures avec des outils Open Source
 
Power BI : les bonnes pratiques - aMS Strasbourg 2021
Power BI : les bonnes pratiques - aMS Strasbourg 2021Power BI : les bonnes pratiques - aMS Strasbourg 2021
Power BI : les bonnes pratiques - aMS Strasbourg 2021
 
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v160 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
 
Module 02_FR.pdf
Module 02_FR.pdfModule 02_FR.pdf
Module 02_FR.pdf
 
Comment piloter votre activité à l’aide de SAP Analytics Cloud ?
Comment piloter votre activité à l’aide de SAP Analytics Cloud ?Comment piloter votre activité à l’aide de SAP Analytics Cloud ?
Comment piloter votre activité à l’aide de SAP Analytics Cloud ?
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
 
Retour d’expérience - Architecture MicroService chez BotsUnit
Retour d’expérience - Architecture MicroService chez BotsUnitRetour d’expérience - Architecture MicroService chez BotsUnit
Retour d’expérience - Architecture MicroService chez BotsUnit
 

Más de OuailChoukhairi (10)

the-blockchain-innovation-hub.pptx
the-blockchain-innovation-hub.pptxthe-blockchain-innovation-hub.pptx
the-blockchain-innovation-hub.pptx
 
BI_Part1_2020.pdf
BI_Part1_2020.pdfBI_Part1_2020.pdf
BI_Part1_2020.pdf
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
Data Mining (Partie 2).pdf
Data Mining (Partie 2).pdfData Mining (Partie 2).pdf
Data Mining (Partie 2).pdf
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
_2_expo_DW_DM.pdf
_2_expo_DW_DM.pdf_2_expo_DW_DM.pdf
_2_expo_DW_DM.pdf
 
_1_expo_SIAD.pdf
_1_expo_SIAD.pdf_1_expo_SIAD.pdf
_1_expo_SIAD.pdf
 
___WS_Chap-3__RDF.pdf
___WS_Chap-3__RDF.pdf___WS_Chap-3__RDF.pdf
___WS_Chap-3__RDF.pdf
 
___WS_Chap-5__SPARQL.pdf
___WS_Chap-5__SPARQL.pdf___WS_Chap-5__SPARQL.pdf
___WS_Chap-5__SPARQL.pdf
 
___WS_Chap-4__RDFS.pdf
___WS_Chap-4__RDFS.pdf___WS_Chap-4__RDFS.pdf
___WS_Chap-4__RDFS.pdf
 

_3_expo_MM.pdf

  • 1. Informatique Décisionnelle Modélisation Multidimensionnelle Med. AMNAI Master spécialisé BIG DATA Cloud Computing
  • 2. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Plan 1 Modélisation Entité/Association Med AMNAI Informatique Décisionnelle 2 / 38
  • 3. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Plan 1 Modélisation Entité/Association 2 Limites du modèle relationnel : OLTP vs OLAP Med AMNAI Informatique Décisionnelle 2 / 38
  • 4. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Plan 1 Modélisation Entité/Association 2 Limites du modèle relationnel : OLTP vs OLAP 3 Nécessité d'une structure muti-dimensionnelle Med AMNAI Informatique Décisionnelle 2 / 38
  • 5. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Plan 1 Modélisation Entité/Association 2 Limites du modèle relationnel : OLTP vs OLAP 3 Nécessité d'une structure muti-dimensionnelle 4 Modélisation multidimensionnelle des DW Med AMNAI Informatique Décisionnelle 2 / 38
  • 6. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Plan 1 Modélisation Entité/Association 2 Limites du modèle relationnel : OLTP vs OLAP 3 Nécessité d'une structure muti-dimensionnelle 4 Modélisation multidimensionnelle des DW 5 Schémas Multidimensionnels Med AMNAI Informatique Décisionnelle 2 / 38
  • 7. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Modélisation Entité/Association • Avantages • Normalisation; • Éliminer les redondances ; • Préserver la cohérence des données. • Optimisation des transactions; • Réduction de l'espace de stockage; • Inconvénients pour un utilisateur nal • Schéma trop complet : Contient des tables/champs inutiles pour l'analyse; • Pas d'interface graphique capable de rendre utilisable le modèle E/A; • Inadapté pour l'analyse. Med AMNAI Informatique Décisionnelle 3 / 38
  • 8. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Limites du modèle relationnel : OLTP vs OLAP • OLTP : Requêtes simples qui, quoi • ex. les ventes de X; • jointures : les ventes de X à quel prix de quel fournisseur. • OLAP : besoin de données agrégées, synthétisées • nombre de ventes par vendeur, par région, par mois; • nombre de ventes par vendeur, par fournisseur, par mois. • SQL : Possibilité d'agréger les données (group by) : • très coûteux (parcourir toutes les tables) et il faut recalculer à chaque utilisation. Med AMNAI Informatique Décisionnelle 4 / 38
  • 9. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Nécessité d'une structure muti-dimensionnelle • Les BD relationnelles ne sont pas adaptées à l'OLAP car : • Pas les mêmes objectifs; • Pas les mêmes données; • Pas les mêmes traitements et requêtes. • Il est donc nécessaire de disposer d'une structure de stockage adaptée à l'OLAP, i.e. permettant de : • représenter les données dans plusieurs dimensions; • manipuler les données facilement et ecacement. Med AMNAI Informatique Décisionnelle 5 / 38
  • 10. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple d'un DW (Entrpôt de données) • L'ED doit fournir le CA des ventes d'un produit, par date, client, magasin et vendeur, ainsi que toutes les sommations possibles de chire d'aaires dans une année donnée. • Une vente est caractérisée par : Vente (produit, client, magasin, date, pays, coût de vente, montant des ventes, Qté vendue) • Produit : clé produit, Description (et libellés), . . . • Client : clé client, type client, . . . • Magasin : clé magasin, . . . • Date : clé temps, jour, semaine, mois, . . . Med AMNAI Informatique Décisionnelle 6 / 38
  • 11. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Représentation multidimensionnelle Cube représentant le sujet des Ventes Med AMNAI Informatique Décisionnelle 7 / 38
  • 12. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Cocepts de schéma de modélisation • Nouvelle méthode de conception autour des concepts métiers (Ne pas normaliser au maximum.) • Notion de cube (en fonction des dimensions). • Introduction de nouveaux types des tables : • Table de faits (mesure). • Table de dimensions • Introduction de nouveaux modèles : • Modèle en étoile. • Modèle en ocon. Med AMNAI Informatique Décisionnelle 8 / 38
  • 13. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Cube • Modélisation multidimensionnelle des données facilitant l'analyse d'une quantité selon diérentes dimensions : • Temps. • Localisation géographique ... • Les calculs sont réalisés lors du chargement ou de la mise à jour du cube. Med AMNAI Informatique Décisionnelle 9 / 38
  • 14. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Manipulation du cube • Opérateurs appliqués sur le cube sont algébriques (le résultat est un autre cube) et peuvent être combinés. • Opérateurs : • Slicing, Dicing (extraction). • Changement de la granularité d'une dimension • Roll up (agrégation d'une dimension = résumé). • Drill down (plus détaillées). Med AMNAI Informatique Décisionnelle 10 / 38
  • 15. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Slicing et Dicing • Slicing : Sélection de tranches du cube par des prédicats selon une dimension • Filtrer une dimension selon une valeur. • Exemple : Slice (1998) : on ne retient que la partie du cube qui correspond à cette date. • Dicing : extraction d'un sous-cube. • RQ : Slicing et Dicing Opérateurs sur le cube Med AMNAI Informatique Décisionnelle 11 / 38
  • 16. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple Slicing Données d'une activité de Vente Med AMNAI Informatique Décisionnelle 12 / 38
  • 17. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple Dicing Extraction d'un sous cube Med AMNAI Informatique Décisionnelle 13 / 38
  • 18. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Drill-Down et Roll-Up • Les opérations agissant sur la granularité d'observation des données caractérisent la hiérarchie de navigation entre les diérents niveaux. • Roll-up ou forage vers le haut : consiste à représenter les données du cube à un niveau de granularité supérieur conformément à la hiérarchie dénie sur la dimension. • Utilisation de la fonction d'agrégation (somme, moyenne, etc) spécifée pour la mesure et la dimension. • Drill-down ou forage vers le bas : consiste à représenter les données du cube à un niveau de granularité de niveau inférieur sous forme plus détaillée. • RQ : Roll-up et Drill-down Opérateurs sur les dimensions Med AMNAI Informatique Décisionnelle 14 / 38
  • 19. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple Drill-Down Med AMNAI Informatique Décisionnelle 15 / 38
  • 20. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple Roll-Up Med AMNAI Informatique Décisionnelle 16 / 38
  • 21. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Concept Faits • Le fait modélise le sujet de l'analyse. Un fait est formé de mesures correspondant aux informations de l'activité analysée (ex : Quantités vendues, montant des ventes,. . . ). • Les mesures d'un fait sont numériques et généralement valorisées de manière continue. • Les mesures sont numériques pour permettre de résumer un grand nombre d'enregistrements en quelques enregistrements (on peut les additionner, les dénombrer ou bien calculer le minimum, le maximum ou la moyenne). Med AMNAI Informatique Décisionnelle 17 / 38
  • 22. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Table de Faits • Table principale du modèle multidimensionnel. • Contient les données observables (les faits) sur le sujet étudié selon divers axes d'analyse (les dimensions). Med AMNAI Informatique Décisionnelle 18 / 38
  • 23. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Table de Faits (suite) • Contient les clés étrangères des axes d'analyse (dimension) : CléDate, Cléproduit, Clémagasin • Trois types de faits : • Additif. • Semi Additif. • Non Additif. • Les faits les plus utiles sont numériques et additifs. Med AMNAI Informatique Décisionnelle 19 / 38
  • 24. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Types de Faits • Additif : additionnable suivant toutes les dimensions • Quantités vendues, chire d'aaire. • Peut être le résultat d'un calcul : Bénéce = montant vente - coût • Semi additif : additionnable suivant certaines dimensions • Solde d'un compte bancaire : Pas de sens d'additionner sur les dates car cela représente des instantanés d'un niveau. • Non additif : fait non additionnable quelque soit la dimension. • Prix unitaire : l'addition sur n'importe quelle dimension donne un nombre dépourvu de sens. Med AMNAI Informatique Décisionnelle 20 / 38
  • 25. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Dimension • Le sujet (les faits, mesures) est analysé suivant diérentes perspectives. • Ces perspectives correspondent à une catégorie utilisée pour caractériser les mesures d'activité analysées, on parle de dimensions. • Une dimension modélise une perspective d'analyse. • Une dimension se compose d'attributs et niveaux correspondant aux informations faisant varier les mesures de l'activité. Med AMNAI Informatique Décisionnelle 21 / 38
  • 26. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemples dimension Vente (Produit, client, magasin, vendeur, date, coût de vente, montant des ventes, Qté vendue) Med AMNAI Informatique Décisionnelle 22 / 38
  • 27. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Attributs et Niveaux • Une dimension est généralement formée de paramètres (ou attributs) textuels et discrets. • Les paramètres textuels sont utilisés pour restreindre la portée des requêtes an de limiter la taille des réponses. • Les paramètres sont discrets, c'est à dire que les valeurs possibles sont bien déterminées et sont des descripteurs constants. Med AMNAI Informatique Décisionnelle 23 / 38
  • 28. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Concept Hiérarchie/Granularité • Une hiérarchie organise les attributs d'une dimension selon une relation est plus n conformément à leur niveau de détail ou granularité. • On distingue deux types de hiérarchies Simple et Multiple : Med AMNAI Informatique Décisionnelle 24 / 38
  • 29. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Modèle Multidimensionnel • Table de faits + Tables de dimensions reliées à la table de faits par une jointure. • Chaque enregistrement de la table de faits stocke les clés des tables de dimensions et les mesures faites à un instant précis. • Chacune des tables de dimension possède une clé primaire unique correspondant à l'un des composants de la clé multiple de la table de faits. • On obtient un schéma en étoile (dans le cas le plus simple). Med AMNAI Informatique Décisionnelle 25 / 38
  • 30. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Types de modèles Med AMNAI Informatique Décisionnelle 26 / 38
  • 31. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Modèle en étoile • Une table de fait centrale et des dimensions. • Les dimensions n'ont pas de liaison entre elles • Chacune des tables de dimension possède une clé primaire unique correspondant à l'un des composants de la clé multiple de la table de faits. • Avantages : • Facilité de navigation. • Nombre de jointures limité. • Inconvénients : • Redondance dans les dimensions. • Toutes les dimensions ne concernent pas les mesures. Med AMNAI Informatique Décisionnelle 27 / 38
  • 32. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple de Modèle en étoile Med AMNAI Informatique Décisionnelle 28 / 38
  • 33. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Modèle en ocon • Une table de fait et des dimensions décomposées en sous hiérarchies. • Un seul niveau hiérarchique par table de dimension. • La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait. • Avantages : • Normalisation des dimensions. • Économie d'espace disque. • Inconvénients : • Modèle plus complexe (jointure). • Requêtes moins performantes. Med AMNAI Informatique Décisionnelle 29 / 38
  • 34. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Exemple de Modèle en ocon Med AMNAI Informatique Décisionnelle 30 / 38
  • 35. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Notions de Modélisation Multidimensionnelle Cocepts Multidimensionnelle Table des Faits Dimensions Schémas Multidimensionnel Méthodologie de Kimball Méthodologie de Kimball 1 Choisir le sujet. 2 Choisir la granularité des faits. 3 Identier et adapter les dimensions. 4 Choisir les faits. 5 Stocker les pré-calculs. 6 Établir les tables de dimensions. 7 Choisir la durée de la base. 8 Suivre les dimensions lentement évolutives. 9 Décider des requêtes prioritaires, des modes de requêtes. Med AMNAI Informatique Décisionnelle 31 / 38
  • 36. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Dénition d'un ETL Alimentation/ mise à jour de l'entrepôt Dénition d'un ETL • Ore un environnement de développement; • Ore des outils de gestion des opérations et de maintenance; • Permet de découvrir, analyser et extraire les données à partir de sources hétérogènes; • Permet de nettoyer et standardiser les données; • Permet de charger les données dans un entrepôt. Med AMNAI Informatique Décisionnelle 32 / 38
  • 37. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Dénition d'un ETL Alimentation/ mise à jour de l'entrepôt Alimentation/ mise à jour de l'entrepôt • Entrepôt mis à jour régulièrement; • Chargement automatisé de l'entrepôt; • Utilisation d'outils ETL (Extract, Transform, Load) Med AMNAI Informatique Décisionnelle 33 / 38
  • 38. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Dénition d'un ETL Alimentation/ mise à jour de l'entrepôt Aperçu d'un ETL Med AMNAI Informatique Décisionnelle 34 / 38
  • 39. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles Dénition d'un ETL Alimentation/ mise à jour de l'entrepôt Aperçu d'un ETL (suite) Med AMNAI Informatique Décisionnelle 35 / 38
  • 40. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles ROLAP MOLAP HOLAP ROLAP • Relational OLAP : • Données stockées dans une base de données relationnelles; • Un moteur OLAP permet de simuler le comportement d'un SGBD multidimensionnel; • Plus facile et moins cher à mettre en place; • Moins performant lors des phases de calcul; • Exemples de moteurs ROLAP : Mondrian Med AMNAI Informatique Décisionnelle 36 / 38
  • 41. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles ROLAP MOLAP HOLAP MOLAP • Multi dimensional OLAP : : • Utilise un système multidimensionnel pur qui gère les structures multidimensionnelles natives (les cubes); • Accès direct aux données dans le cube; • Plus dicile à mettre en place; • Formats souvent propriétaires; • Conçu exclusivement pour l'analyse multidimensionnelle. • Exemples de moteurs MOLAP : (Microsoft Analysis Services, Hyperion) Med AMNAI Informatique Décisionnelle 37 / 38
  • 42. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles ROLAP MOLAP HOLAP HOLAP • Hybride OLAP : • tables de faits et tables de dimensions stockées dans SGBD relationnel (données de base); • données agrégées stockées dans des cubes; • Solution hybride entre MOLAP et ROLAP; • Bon compromis au niveau coût et performance. Med AMNAI Informatique Décisionnelle 38 / 38
  • 43. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles ROLAP MOLAP HOLAP Marché Décisionnel Med AMNAI Informatique Décisionnelle 39 / 38
  • 44. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles ROLAP MOLAP HOLAP Quelques solutions commerciales Med AMNAI Informatique Décisionnelle 40 / 38
  • 45. Modélisation Entité/Association Limites du modèle relationnel : OLTP vs OLAP Nécessité d'une structure muti-dimensionnelle Modélisation Multidimensionnelle Alimentation d'un Datawarehouse Implémentations des modèles multidimensionnelles ROLAP MOLAP HOLAP Quelques solutions open source Med AMNAI Informatique Décisionnelle 41 / 38