SlideShare una empresa de Scribd logo
1 de 30
Informatique 
Décisionnelle 
Hajer TRABELSI 
Mastère de recherche IMD/ISAMM 
Mai 2014 
1 
Michel de rougemont 
Université Parie II 
2007
Contexte 
 But: préciser la robustesse de certains modèles, par rapport à l’incertitude de 
données. 
 Les données économiques sont en effet souvent bruitées (inexactes et 
approximatives) 
 Il est fondamental d’isoler les procédures informatiques robustes au bruit, 
c’est à dire qui produisent des résultat approchés lorsque les données sont 
bruitées. 
2
Plan 
 Modèles d’automates 
 Modèle relationnel 
 Modèle Olap 
 Data-Mining 
 Modèle XML 
3
Introduction 
4 Les principaux liens entre les modèles
Introduction 
 Les automates sur les mots se généralisent aux arbres et sont le fondement 
du langage du XML. 
 Le modèle relationnel se généralise au modèle OLAP et constitue le coeur des 
systèmes d’information. 
 Le Data-Mining s’applique à tous les modèles, mais décrit son utilisation à 
partir du modèle OLAP, qui constitue les fondements du Business Intelligence. 
5
Les modèles d’automates 
 Le traitement de l’information nécessite un modèle de calcul 
 les automates finis sont un des modèles les plus simples, qui ont des variantes 
selon les classes de structures considérés. 
 Un automate fini est défini par (Q, q0, F, ) 
- Q est un ensemble fini d’états 
- q0 Є est l’état initial 
- F Ϲ Q est un ensemble d’états finaux 
-  Ϲ Q x Σ x Q (Σ alphabet fini) 
 On présente souvent un automate par un graphe où les noeuds sont les états et les 
arêtes sont des transitions possibles lorsque l’automate lit un symbole s. 
 Chaque arête est étiquetée par un tel symboles s tel que q.s.q’ soit une transition. 
6
Les modèles d’automates 
 Dans cet exemple on a 4 états {0, 
1, 2, 3}. 
 L’état 4 est l’état qui permet de 
compléter l’automate pour que la 
fonctions  soit toujours définie. 
 On obtient alors la complétion de 
l’automates. 
7
Modèle relationnel 
 Les données sont représentées par des tables. 
 Une table est constituée de plusieurs colonnes appelées attributs et de 
plusieurs lignes appelées enregistrement ou tuples. 
 Une requête est une fonction qui associe à un ensemble de tables une 
nouvelle table. 
 C’est la représentation mathématique d’une question posée à une BD. 
 La définition des différentes tables constitue le Schéma. 
 Pour concevoir un schéma, il est utile d’isoler des entités et des relations 
entre entités. 
 Une entité décrit un objet muni d’attributs. 
8
Modèle relationnel - Entité-Relations 
 La conception d’un schéma est facilitée par un diagramme Entité-Relations. 
 Il qui décrit de manière graphique des entités munies d’attributs et des 
relations entre entités. 
9 
Buy 
Name add Date Item Price
Modèle relationnel - Schéma relationnel 
 Chaque relation peut être considérée comme une table. 
 Un attribut est le nom d’une colonne dont les valeurs sont dans un domaine 
Di. 
 L’information spécifiant le domaine de chaque attribut définit le schéma. 
10
Modèle Olap 
 Online Analytic Processing, permet de définir des requêtes. 
 Effectuer des résumés/ agrégations selon plusieurs critères et sur plusieurs 
dimensions. 
 Générer des rapports. 
 Répondre à des questions de gestionnaires et d’économistes, pour analyser des 
données. Par exemple : 
- Quels sont les produits les plus vendus en 2005 ? 
- Quels sont les magasins et les produits les plus vendus entre 2004 et 2005 en 
Europe ? 
 Ces requêtes généralisent le GROUP BY de SQL mais en l’intégrant à plusieurs 
attributs. 
 Les requêtes OLAP étendent SQL dans ce sens. 
11
Modèle Olap – Intégration des 
informations 
 Le besoin: collecter des informations à partir des plusieurs sources dont le 
but est d’exploiter leur synthèse. 
 Le problème: les sources peuvent être autonomes et hétérogènes. 
- autorisations nécessaires pour l’extraction 
- utilisation de plusieurs langages pour la définition de l’information à 
extraire. 
 La solution: utiliser un schéma fédérateur, avec ou sans données, que les 
utilisateurs manipulent comme s’il s’agissait d’une BD habituelle. 
12
Modèle Olap – Intégration des 
informations 
 Avec données courantes provenant d’une seule source (vues matérialisées) ou de 
plusieurs sources autonomes et éventuellement hétérogènes (base de données 
intégrée). 
besoin d’outils pour la conception du schéma, transformation/chargement de 
données et propagation de changements. 
 Avec données historiques (entrepôt de données, données en avance), c’est notre cas. 
besoin d’outils pour la conception du schéma, transformation/chargement de 
données propagation de changements et rafraîchissement périodique. 
 Sans données, au sein d’une seule source (vues virtuelles) ou lié à plusieurs sources 
autonomes et éventuellement hétérogènes (médiateurs, données à la demande). 
besoin d’outils pour la récriture/évaluation des requêtes et la fusion des résultats. 
 Dans tous les cas, l’accès aux données se fait presque exclusivement en lecture. 
13
Modèle Olap – Construction d’un 
entrepôt de données 
 Architecture à trois niveaux : sources – entrepôt – data mart 
 data mart : ‘petit’ entrepôt orienté sujet, dont les données sont dérivées de l’entrepôt 
 Extraction, Transformation, Chargement de données  outils ETL 
 Extracteur : 
- traduction vers le langage source, évaluation, traduction vers le langage de l’entrepôt 
- détection de changements aux sources 
 Intégrateur : 
- réconciliation /correction d’erreurs/filtrage/estampillage pour conformer au schéma de 
l’entrepôt 
- chargement de données, rafraîchissement 
14
Modèle Olap – Caractéristiques 
principales d’un entrepôt de données 
 C’est un endroit où les données intégrées sont stockées et exploitées à l’aide 
d’un système de gestion de BD. 
 Par conséquent, un entrepôt de données est avant tout une BD, même si les 
caractéristiques suivantes le distinguent clairement des BD transactionnelles 
habituelles. 
- Utilisations: Les utilisateurs principaux sont les décideurs de l’entreprise qui 
ont besoin des schémas faciles à lire. 
- Mode d’accès: souvent à travers un data mart, en lecture uniquement. 
- Volume: de l’ordre de tera octets 
- Maintenance: les mises à jour sont propagées de sources vers l’entrepôt 
immédiatement ou périodiquement, par construction ou de manière 
incrémentale. 
15
Modèle Olap – Expressions de chemin 
et langage OLAP 
Un schéma dimensionnel aussi appelé Schéma Etoile est un graphe connexe, 
orienté, acyclique, étiqueté tel que: 
 Une seule racine, appelé l’origine et notée O. 
 Chaque noeud a une étiquette (dimension) et chaque arête (flèche) a une 
étiquette. 
 Toutes les flèches ont des étiquettes distinctes. 
 Les flèches de source O sont d’un de deux types, dimension ou mesure. 
16
Modèle Olap – Expressions de chemin 
 Etant donné un schéma dimensionnel S, une expression de chemin sur S est 
une expression bien formée dont les opérandes sont des flèches de S et dont 
les opérateurs sont ceux de l’algèbre fonctionnelle. 
 Une expression dimensionnelle sur S: toute expression de chemin constituée 
uniquement de flèches figurant sur des chemins dimensionnels. 
 Une évaluation d’une expression de chemin e par rapport à une BDD  sur S: 
se fait en remplaçant chaque flèche f figurant dans e par la fonction (f) qui 
lui est associée par , et en effectuant les opérations de l’algèbre 
fonctionnelle. 
 Une vue sur S: schéma dimensionnel S’ dont chaque sommet est un sommet 
de S et donc chaque flèche est une expression de chemin sur S. 
 Un data mart est défini comme une vue sur S, pouvant être virtuelle ou 
matérialisée suivant les besoins de l’application. 
17
Modèle Olap – Requête OLAP 
 Etant donné un schéma dimensionnel S, un ‘OLAP Pattern’ sur S est un couple 
P= (u, v), où u est une expression dimensionnelle, v une expression de mesure 
et source(u)= source(v)= O. 
 La cible de u est appelée le niveau d’agrégation de P et la cible de v le niveau 
de mesure de P. 
 Une requête OLAP sur S est alors un couple Q= <P, op>, où P est un OLAP 
pattern et op est une opération applicable sur le domaine du niveau de 
mesure de P. 
18
Modèle Olap – Exemple OLAP 
 Considérons un entrepôt qui 
regroupe toutes factures émises 
par une chaine de magasin. 
 Le schéma pourrait être défini par 
cet arbre. 
 On peut analyser le nombre de 
ventes par gamme de produits et 
par ville. 
 Les démentions de cette requête 
sont Gamme, Ville. 
19
Modèle Olap – Exemple OLAP 
 On peut exprimer cette requête 
par les chemins: f2of1 pour Gamme 
et h2oh1 pour Ville. 
 La mesure est Ventes et 
l’opérateur est la somme. 
 On peut aussi donner des 
conditions de sélection: par 
exemple Année= 2004, Région= 
Europe. 
20
Modèle Olap – Exemple OLAP 
 On affiche alors un tableau ordonné selon les valeurs des attributs. 
 Dans le cas de l’analyse Gamme, Ville, où Gamme a les valeurs (A,B, C) et 
Ville a les valeurs (NY, Paris, Berlin) on aura un tableau comme dans cet 
exemple. 
21
Data-Mining 
 Le terme Data-Mining est utilisé dans de nombreux contextes avec un sens 
différent. 
 Dans son interprétation la plus simple, il s’agit de trouver une fonction f sur 
la base d’échantillons de valeurs xi, yi= f(xi). 
22
Data-Mining – Arbres de décision 
 Un arbre de décision est une représentation succincte d’une fonction. 
 Dans le cas d’une fonction booléenne, on imagine une arbre dont les noeuds 
sont les variables et les arêtes représentent les valeurs des variables. 
 Deux noeuds terminaux correspondent aux valeurs de la fonction. 
 L’arbre de décision est déterminé par l’ordre des variables. 
Deux arbres de décision pour la fonction f= (x1 Λ x2) Λ (x2 V x3), selon deux 23 
ordres différents: x1, x2, x3 et x2, x1, x3.
Data-Mining – Arbres de décision 
 Dans le cas d’une table T avec les 
attributs A, B, C, supposons que la 
3ème colonne soit la valeur de la 
fonction. 
 On peut donc représenter la table 
suivante par plusieurs arbres 
possibles: 
24
Data-Mining – Arbres de décision 
Approximation et arbre de décision: 
 Dans un cas réel, on peut imaginer 30 
attributs, des valeurs cibles discrètes, par 
exemple 10, 20, 50, 100. 
 On cherche alors un arbre de profondeur 
minimum et chaque feuille correspond à 
une valeur prépondérante. 
 Par exemple: la feuille gauche correspond 
à la valeur prépondérante de 100, à 90%. 
 Chaque feuille est une distribution de 
valeurs, qui permet de prédire une valeur 
et une confiance. 
 La feuille gauche correspond à la 
prédiction 100 avec la confiance 90% ou la 
valeur 20 avec la confiance 10% , ou la 
valeur 50 avec la confiance 10%. 
25
Data-Mining – logiciels de Fouille de 
Données 
3 trois logiciels qui implémentent les techniques de fouilles de données. 
 Dtree : ce logiciel est très simple, construit des arbres de décision à partir 
d’un fichier de données, sur des valeurs discrètes. 
 SAS / Entreprise Miner: ce module de SAS intègre les 3 principaux modèles et 
permet de les comparer, en sortant des courbes de lift. 
26
Data-Mining – logiciels de Fouille de 
Données 
 Weka: ce logiciel libre a une interface, largement inspirée de celle de SAS/ 
Entreprise Miner. 
 De très nombreux modèles sont disponibles, ce qui rend le logiciel plus 
difficile à utiliser. 
27
Modèle XML 
 Langage générique qui permet d’unifier la manipulation de données sur des 
serveurs différents. 
 Les fonctions essentielles sont: 
- La transmission de données semi-structurées entre Client et Serveur. 
- L’interrogation de données semi-structurées. 
- La transmission de données. 
- L’intégration de données. 
 Ce langage est important dans l’usage du Web, car XML (eXtensible Markup 
Langage) est une recommandation du W3C, l’organisme de normalisation de 
logiciels pour le Web. 
28
Conclusion 
Nous avons étudier les Modèles d’automates, le Modèle relationnel, le Modèle 
Olap, le Data-Mining et le Modèle XML, qui représentent les principaux 
modèles informatiques, afin de connaître les principaux liens entre eux et de 
préciser leur robustesse par rapport à l’incertitude de données. 
29
Merci pour votre attention 
30

Más contenido relacionado

La actualidad más candente

Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouseHassane Dkhissi
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsJean-Marc Dupont
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence Cynapsys It Hotspot
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
ImpléMentation D’Une Solution De Bi Avec Sql Server
ImpléMentation D’Une Solution De Bi Avec Sql ServerImpléMentation D’Une Solution De Bi Avec Sql Server
ImpléMentation D’Une Solution De Bi Avec Sql ServerHamza Boukraa
 
Microsoft Power Business Intelligence
Microsoft Power Business IntelligenceMicrosoft Power Business Intelligence
Microsoft Power Business IntelligenceMario-Charly TOBOSSOU
 
Orsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - CertificatOrsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - CertificatRégis Bernasconi
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionAmal Brioual
 
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...Jean-Pierre Riehl
 
Projet décisionnel
Projet décisionnelProjet décisionnel
Projet décisionnelSiham JABRI
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?Jean-Marc Dupont
 
Competitic simplifiez le pilotage de votre entreprise avec la business inte...
Competitic   simplifiez le pilotage de votre entreprise avec la business inte...Competitic   simplifiez le pilotage de votre entreprise avec la business inte...
Competitic simplifiez le pilotage de votre entreprise avec la business inte...COMPETITIC
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big DataTechnofutur TIC
 

La actualidad más candente (20)

Bi
BiBi
Bi
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouse
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Introduction à la Business Intelligence
Introduction à la Business Intelligence Introduction à la Business Intelligence
Introduction à la Business Intelligence
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?Qu'est-ce qu'un ETL ?
Qu'est-ce qu'un ETL ?
 
ImpléMentation D’Une Solution De Bi Avec Sql Server
ImpléMentation D’Une Solution De Bi Avec Sql ServerImpléMentation D’Une Solution De Bi Avec Sql Server
ImpléMentation D’Une Solution De Bi Avec Sql Server
 
Microsoft Power Business Intelligence
Microsoft Power Business IntelligenceMicrosoft Power Business Intelligence
Microsoft Power Business Intelligence
 
Orsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - CertificatOrsys - Contruire un Data Warehouse - Certificat
Orsys - Contruire un Data Warehouse - Certificat
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décision
 
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
 
Projet décisionnel
Projet décisionnelProjet décisionnel
Projet décisionnel
 
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?La BI : Qu’est-ce que c’est ? A quoi ça sert ?
La BI : Qu’est-ce que c’est ? A quoi ça sert ?
 
Competitic simplifiez le pilotage de votre entreprise avec la business inte...
Competitic   simplifiez le pilotage de votre entreprise avec la business inte...Competitic   simplifiez le pilotage de votre entreprise avec la business inte...
Competitic simplifiez le pilotage de votre entreprise avec la business inte...
 
De la business intelligence au Big Data
De la business intelligence au Big DataDe la business intelligence au Big Data
De la business intelligence au Big Data
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 

Similar a Informatique Décisionnelle décisionnelle

Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
 
14_PM_chapitre3_Modelisation pour modélisation
14_PM_chapitre3_Modelisation pour modélisation14_PM_chapitre3_Modelisation pour modélisation
14_PM_chapitre3_Modelisation pour modélisationGeorges OLE
 
U M L Analyse Et Conception Objet
U M L Analyse Et Conception ObjetU M L Analyse Et Conception Objet
U M L Analyse Et Conception ObjetAmine Chkr
 
Apache SPARK ML : principes, concepts et mise en œuvre
Apache SPARK  ML : principes, concepts et  mise en œuvre Apache SPARK  ML : principes, concepts et  mise en œuvre
Apache SPARK ML : principes, concepts et mise en œuvre MICHRAFY MUSTAFA
 
DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill Olivier Pinette
 
Introduction à NetLogo
Introduction à NetLogoIntroduction à NetLogo
Introduction à NetLogoAlvaro Gil
 
Data Mining (Partie 2).pdf
Data Mining (Partie 2).pdfData Mining (Partie 2).pdf
Data Mining (Partie 2).pdfOuailChoukhairi
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueAntidot
 
Cours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdfCours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdfadeljaouadi
 
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiSSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiMicrosoft Technet France
 
Introduction NoSQL 201401 - Ensim
Introduction NoSQL 201401 - EnsimIntroduction NoSQL 201401 - Ensim
Introduction NoSQL 201401 - EnsimLaurent Broudoux
 
Introduction NoSql 201406 - lbroudoux
Introduction NoSql 201406 - lbroudouxIntroduction NoSql 201406 - lbroudoux
Introduction NoSql 201406 - lbroudouxLaurent Broudoux
 
Formation viseo modelisation_uml_avec_enterprise_architect
Formation viseo modelisation_uml_avec_enterprise_architectFormation viseo modelisation_uml_avec_enterprise_architect
Formation viseo modelisation_uml_avec_enterprise_architectMïna You
 

Similar a Informatique Décisionnelle décisionnelle (20)

Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvre
 
Scilab command
Scilab commandScilab command
Scilab command
 
14_PM_chapitre3_Modelisation pour modélisation
14_PM_chapitre3_Modelisation pour modélisation14_PM_chapitre3_Modelisation pour modélisation
14_PM_chapitre3_Modelisation pour modélisation
 
U M L Analyse Et Conception Objet
U M L Analyse Et Conception ObjetU M L Analyse Et Conception Objet
U M L Analyse Et Conception Objet
 
Uml
UmlUml
Uml
 
Apache SPARK ML : principes, concepts et mise en œuvre
Apache SPARK  ML : principes, concepts et  mise en œuvre Apache SPARK  ML : principes, concepts et  mise en œuvre
Apache SPARK ML : principes, concepts et mise en œuvre
 
DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill DataDrill EXPRESS: Les équations dans DataDrill
DataDrill EXPRESS: Les équations dans DataDrill
 
ORM
ORMORM
ORM
 
Migrer d'Excel vers power bi
Migrer d'Excel vers power biMigrer d'Excel vers power bi
Migrer d'Excel vers power bi
 
chap4.pdf
chap4.pdfchap4.pdf
chap4.pdf
 
Introduction à NetLogo
Introduction à NetLogoIntroduction à NetLogo
Introduction à NetLogo
 
Sparkmllib
SparkmllibSparkmllib
Sparkmllib
 
Data Mining (Partie 2).pdf
Data Mining (Partie 2).pdfData Mining (Partie 2).pdf
Data Mining (Partie 2).pdf
 
JasperReport
JasperReportJasperReport
JasperReport
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 
Cours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdfCours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdf
 
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essaiSSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
SSAS 2012 : Multidimensionnel et tabulaire au banc d'essai
 
Introduction NoSQL 201401 - Ensim
Introduction NoSQL 201401 - EnsimIntroduction NoSQL 201401 - Ensim
Introduction NoSQL 201401 - Ensim
 
Introduction NoSql 201406 - lbroudoux
Introduction NoSql 201406 - lbroudouxIntroduction NoSql 201406 - lbroudoux
Introduction NoSql 201406 - lbroudoux
 
Formation viseo modelisation_uml_avec_enterprise_architect
Formation viseo modelisation_uml_avec_enterprise_architectFormation viseo modelisation_uml_avec_enterprise_architect
Formation viseo modelisation_uml_avec_enterprise_architect
 

Último

Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film françaisTxaruka
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursStagiaireLearningmat
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfbdp12
 
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 37
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24BenotGeorges3
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 37
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Gabriel Gay-Para
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneTxaruka
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfRiDaHAziz
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfRiDaHAziz
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 37
 
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxJCAC
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfSylvianeBachy
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxMartin M Flynn
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film françaisTxaruka
 

Último (18)

Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film français
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceurs
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
 
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienne
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdf
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdf
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
 
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film français
 

Informatique Décisionnelle décisionnelle

  • 1. Informatique Décisionnelle Hajer TRABELSI Mastère de recherche IMD/ISAMM Mai 2014 1 Michel de rougemont Université Parie II 2007
  • 2. Contexte  But: préciser la robustesse de certains modèles, par rapport à l’incertitude de données.  Les données économiques sont en effet souvent bruitées (inexactes et approximatives)  Il est fondamental d’isoler les procédures informatiques robustes au bruit, c’est à dire qui produisent des résultat approchés lorsque les données sont bruitées. 2
  • 3. Plan  Modèles d’automates  Modèle relationnel  Modèle Olap  Data-Mining  Modèle XML 3
  • 4. Introduction 4 Les principaux liens entre les modèles
  • 5. Introduction  Les automates sur les mots se généralisent aux arbres et sont le fondement du langage du XML.  Le modèle relationnel se généralise au modèle OLAP et constitue le coeur des systèmes d’information.  Le Data-Mining s’applique à tous les modèles, mais décrit son utilisation à partir du modèle OLAP, qui constitue les fondements du Business Intelligence. 5
  • 6. Les modèles d’automates  Le traitement de l’information nécessite un modèle de calcul  les automates finis sont un des modèles les plus simples, qui ont des variantes selon les classes de structures considérés.  Un automate fini est défini par (Q, q0, F, ) - Q est un ensemble fini d’états - q0 Є est l’état initial - F Ϲ Q est un ensemble d’états finaux -  Ϲ Q x Σ x Q (Σ alphabet fini)  On présente souvent un automate par un graphe où les noeuds sont les états et les arêtes sont des transitions possibles lorsque l’automate lit un symbole s.  Chaque arête est étiquetée par un tel symboles s tel que q.s.q’ soit une transition. 6
  • 7. Les modèles d’automates  Dans cet exemple on a 4 états {0, 1, 2, 3}.  L’état 4 est l’état qui permet de compléter l’automate pour que la fonctions  soit toujours définie.  On obtient alors la complétion de l’automates. 7
  • 8. Modèle relationnel  Les données sont représentées par des tables.  Une table est constituée de plusieurs colonnes appelées attributs et de plusieurs lignes appelées enregistrement ou tuples.  Une requête est une fonction qui associe à un ensemble de tables une nouvelle table.  C’est la représentation mathématique d’une question posée à une BD.  La définition des différentes tables constitue le Schéma.  Pour concevoir un schéma, il est utile d’isoler des entités et des relations entre entités.  Une entité décrit un objet muni d’attributs. 8
  • 9. Modèle relationnel - Entité-Relations  La conception d’un schéma est facilitée par un diagramme Entité-Relations.  Il qui décrit de manière graphique des entités munies d’attributs et des relations entre entités. 9 Buy Name add Date Item Price
  • 10. Modèle relationnel - Schéma relationnel  Chaque relation peut être considérée comme une table.  Un attribut est le nom d’une colonne dont les valeurs sont dans un domaine Di.  L’information spécifiant le domaine de chaque attribut définit le schéma. 10
  • 11. Modèle Olap  Online Analytic Processing, permet de définir des requêtes.  Effectuer des résumés/ agrégations selon plusieurs critères et sur plusieurs dimensions.  Générer des rapports.  Répondre à des questions de gestionnaires et d’économistes, pour analyser des données. Par exemple : - Quels sont les produits les plus vendus en 2005 ? - Quels sont les magasins et les produits les plus vendus entre 2004 et 2005 en Europe ?  Ces requêtes généralisent le GROUP BY de SQL mais en l’intégrant à plusieurs attributs.  Les requêtes OLAP étendent SQL dans ce sens. 11
  • 12. Modèle Olap – Intégration des informations  Le besoin: collecter des informations à partir des plusieurs sources dont le but est d’exploiter leur synthèse.  Le problème: les sources peuvent être autonomes et hétérogènes. - autorisations nécessaires pour l’extraction - utilisation de plusieurs langages pour la définition de l’information à extraire.  La solution: utiliser un schéma fédérateur, avec ou sans données, que les utilisateurs manipulent comme s’il s’agissait d’une BD habituelle. 12
  • 13. Modèle Olap – Intégration des informations  Avec données courantes provenant d’une seule source (vues matérialisées) ou de plusieurs sources autonomes et éventuellement hétérogènes (base de données intégrée). besoin d’outils pour la conception du schéma, transformation/chargement de données et propagation de changements.  Avec données historiques (entrepôt de données, données en avance), c’est notre cas. besoin d’outils pour la conception du schéma, transformation/chargement de données propagation de changements et rafraîchissement périodique.  Sans données, au sein d’une seule source (vues virtuelles) ou lié à plusieurs sources autonomes et éventuellement hétérogènes (médiateurs, données à la demande). besoin d’outils pour la récriture/évaluation des requêtes et la fusion des résultats.  Dans tous les cas, l’accès aux données se fait presque exclusivement en lecture. 13
  • 14. Modèle Olap – Construction d’un entrepôt de données  Architecture à trois niveaux : sources – entrepôt – data mart  data mart : ‘petit’ entrepôt orienté sujet, dont les données sont dérivées de l’entrepôt  Extraction, Transformation, Chargement de données  outils ETL  Extracteur : - traduction vers le langage source, évaluation, traduction vers le langage de l’entrepôt - détection de changements aux sources  Intégrateur : - réconciliation /correction d’erreurs/filtrage/estampillage pour conformer au schéma de l’entrepôt - chargement de données, rafraîchissement 14
  • 15. Modèle Olap – Caractéristiques principales d’un entrepôt de données  C’est un endroit où les données intégrées sont stockées et exploitées à l’aide d’un système de gestion de BD.  Par conséquent, un entrepôt de données est avant tout une BD, même si les caractéristiques suivantes le distinguent clairement des BD transactionnelles habituelles. - Utilisations: Les utilisateurs principaux sont les décideurs de l’entreprise qui ont besoin des schémas faciles à lire. - Mode d’accès: souvent à travers un data mart, en lecture uniquement. - Volume: de l’ordre de tera octets - Maintenance: les mises à jour sont propagées de sources vers l’entrepôt immédiatement ou périodiquement, par construction ou de manière incrémentale. 15
  • 16. Modèle Olap – Expressions de chemin et langage OLAP Un schéma dimensionnel aussi appelé Schéma Etoile est un graphe connexe, orienté, acyclique, étiqueté tel que:  Une seule racine, appelé l’origine et notée O.  Chaque noeud a une étiquette (dimension) et chaque arête (flèche) a une étiquette.  Toutes les flèches ont des étiquettes distinctes.  Les flèches de source O sont d’un de deux types, dimension ou mesure. 16
  • 17. Modèle Olap – Expressions de chemin  Etant donné un schéma dimensionnel S, une expression de chemin sur S est une expression bien formée dont les opérandes sont des flèches de S et dont les opérateurs sont ceux de l’algèbre fonctionnelle.  Une expression dimensionnelle sur S: toute expression de chemin constituée uniquement de flèches figurant sur des chemins dimensionnels.  Une évaluation d’une expression de chemin e par rapport à une BDD  sur S: se fait en remplaçant chaque flèche f figurant dans e par la fonction (f) qui lui est associée par , et en effectuant les opérations de l’algèbre fonctionnelle.  Une vue sur S: schéma dimensionnel S’ dont chaque sommet est un sommet de S et donc chaque flèche est une expression de chemin sur S.  Un data mart est défini comme une vue sur S, pouvant être virtuelle ou matérialisée suivant les besoins de l’application. 17
  • 18. Modèle Olap – Requête OLAP  Etant donné un schéma dimensionnel S, un ‘OLAP Pattern’ sur S est un couple P= (u, v), où u est une expression dimensionnelle, v une expression de mesure et source(u)= source(v)= O.  La cible de u est appelée le niveau d’agrégation de P et la cible de v le niveau de mesure de P.  Une requête OLAP sur S est alors un couple Q= <P, op>, où P est un OLAP pattern et op est une opération applicable sur le domaine du niveau de mesure de P. 18
  • 19. Modèle Olap – Exemple OLAP  Considérons un entrepôt qui regroupe toutes factures émises par une chaine de magasin.  Le schéma pourrait être défini par cet arbre.  On peut analyser le nombre de ventes par gamme de produits et par ville.  Les démentions de cette requête sont Gamme, Ville. 19
  • 20. Modèle Olap – Exemple OLAP  On peut exprimer cette requête par les chemins: f2of1 pour Gamme et h2oh1 pour Ville.  La mesure est Ventes et l’opérateur est la somme.  On peut aussi donner des conditions de sélection: par exemple Année= 2004, Région= Europe. 20
  • 21. Modèle Olap – Exemple OLAP  On affiche alors un tableau ordonné selon les valeurs des attributs.  Dans le cas de l’analyse Gamme, Ville, où Gamme a les valeurs (A,B, C) et Ville a les valeurs (NY, Paris, Berlin) on aura un tableau comme dans cet exemple. 21
  • 22. Data-Mining  Le terme Data-Mining est utilisé dans de nombreux contextes avec un sens différent.  Dans son interprétation la plus simple, il s’agit de trouver une fonction f sur la base d’échantillons de valeurs xi, yi= f(xi). 22
  • 23. Data-Mining – Arbres de décision  Un arbre de décision est une représentation succincte d’une fonction.  Dans le cas d’une fonction booléenne, on imagine une arbre dont les noeuds sont les variables et les arêtes représentent les valeurs des variables.  Deux noeuds terminaux correspondent aux valeurs de la fonction.  L’arbre de décision est déterminé par l’ordre des variables. Deux arbres de décision pour la fonction f= (x1 Λ x2) Λ (x2 V x3), selon deux 23 ordres différents: x1, x2, x3 et x2, x1, x3.
  • 24. Data-Mining – Arbres de décision  Dans le cas d’une table T avec les attributs A, B, C, supposons que la 3ème colonne soit la valeur de la fonction.  On peut donc représenter la table suivante par plusieurs arbres possibles: 24
  • 25. Data-Mining – Arbres de décision Approximation et arbre de décision:  Dans un cas réel, on peut imaginer 30 attributs, des valeurs cibles discrètes, par exemple 10, 20, 50, 100.  On cherche alors un arbre de profondeur minimum et chaque feuille correspond à une valeur prépondérante.  Par exemple: la feuille gauche correspond à la valeur prépondérante de 100, à 90%.  Chaque feuille est une distribution de valeurs, qui permet de prédire une valeur et une confiance.  La feuille gauche correspond à la prédiction 100 avec la confiance 90% ou la valeur 20 avec la confiance 10% , ou la valeur 50 avec la confiance 10%. 25
  • 26. Data-Mining – logiciels de Fouille de Données 3 trois logiciels qui implémentent les techniques de fouilles de données.  Dtree : ce logiciel est très simple, construit des arbres de décision à partir d’un fichier de données, sur des valeurs discrètes.  SAS / Entreprise Miner: ce module de SAS intègre les 3 principaux modèles et permet de les comparer, en sortant des courbes de lift. 26
  • 27. Data-Mining – logiciels de Fouille de Données  Weka: ce logiciel libre a une interface, largement inspirée de celle de SAS/ Entreprise Miner.  De très nombreux modèles sont disponibles, ce qui rend le logiciel plus difficile à utiliser. 27
  • 28. Modèle XML  Langage générique qui permet d’unifier la manipulation de données sur des serveurs différents.  Les fonctions essentielles sont: - La transmission de données semi-structurées entre Client et Serveur. - L’interrogation de données semi-structurées. - La transmission de données. - L’intégration de données.  Ce langage est important dans l’usage du Web, car XML (eXtensible Markup Langage) est une recommandation du W3C, l’organisme de normalisation de logiciels pour le Web. 28
  • 29. Conclusion Nous avons étudier les Modèles d’automates, le Modèle relationnel, le Modèle Olap, le Data-Mining et le Modèle XML, qui représentent les principaux modèles informatiques, afin de connaître les principaux liens entre eux et de préciser leur robustesse par rapport à l’incertitude de données. 29
  • 30. Merci pour votre attention 30