Présentation de l'Image Mining dans le cadre des Base de Données Avancées en Master Informatique Appliquée au Développement Offshore à l'Université Mohammed V - Agdal de Rabat.
Une introduction au Text Mining et à la sémantique
Image Mining
1. UNIVERSITE MOHAMMED V - AGDAL
Faculté des Sciences de Rabat
Master Informatique Appliquée au Dévelopement Offshore
Base de Données Avancées
Image Mining
Présenté par: Encadré par:
Mehdi EL KRARI Mohammed BENKHALIFA
Novembre 2012
2. Plan de Présentation
Introduction au Data Mining
Introduction à l'Image Mining
Les techniques de l'Image Mining
Les principaux Frameworks
Quelques outils pour l'Image Mining (Application)
2
3. Introduction au Data Mining
Apparu au début des années 1990
Facteurs technologiques, économiques et sociopolitiques
Besoin des entreprises de valoriser les données qu’elles
accumulent dans leurs bases
Réduire les coûts élevés de stockage de données
Data Mining appliqué à l'image ali.mhiri.perso.neuf.fr/sobie/ 3
4. Introduction à l'Image Mining
●
Accumulation de données Multimédia dans les base de
données
●
Besoin d'extraire de nouvelles connaissances à partir
d'une collection d'images
la recherche d'images basée sur le contenu
Image la compréhension d'images
Mining le Data Mining
les bases de données
Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 4
5. Introduction à l'Image Mining
L'Image Mining a deux thèmes principaux:
●
La fouille de grandes collections d'images
Exemple: collection de images de satellites météorologiques
Trouver si il y a une tendance qui existe entre les différentes
villes
●
L'extraction de données combinées de grandes collections
d'images et de données alphanumériques associées.
Exemple: l'imagerie médicale et les dossiers d'un patient
développer un diagnostic pour les deux données d'image (rayons
X) et les données des patients (poids) ensemble pour trouver des
liens intéressants.
Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 5
6. Introduction à l'Image Mining
Domaines d'application:
●
reconnaissance militaire;
●
prévisions météorologiques;
stockage et traitement
●
gestion des ressources de la terre; de collections massives
d'images
●
enquêtes criminelles;
●
imagerie médicale...
Les techniques de fouille de données doivent
être appliquées
Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 6
7. Introduction à l'Image Mining
●
Problèmes typiques de fouille de données:
Trouver des règles d'association entre les éléments de
données dans une base de données.
Problème non posée pour les données explicites !
●
Le cas des bases de données d'images:
Indexation exhaustives des images impossible
Analyse du contenu de l'image puis fouille sur les
descripteurs générés:
●
Couleur;
●
Texture;
●
Forme...
Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 7
8. Les techniques de l'Image Mining
1. Reconnaissance des objets
●
Utiliser des modèles d'objets qui sont connus
●
Le système trouve des objets dans le monde réel à partir
d'une image
●
L'extraction automatique des informations ne peut être
réalisé que lorsque certains objets ont été identifiés par la
machine
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 8
9. Les techniques de l'Image Mining
2. Recherche des images
Les images doivent être récupérées en fonction de
certaines spécifications, et peuvent être classées en trois
niveaux:
●
Niveau 1: comprend les caractéristiques primitives
d'extraction d'images telles que la couleur, la texture, la
forme.
Récupérer les images contenant des étoiles bleues disposées en
anneau
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 9
10. Les techniques de l'Image Mining
2. Recherche des images
Les images doivent être récupérées en fonction de
certaines spécifications, et peuvent être classées en trois
niveaux:
●
Niveau 2: comprend la recherche d'images par des
caractéristiques dérivées ou logiques d'un type donné ou
d'objets
Récupérer les images d'une table ronde
Récupérer les images de Jimmy
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 10
11. Les techniques de l'Image Mining
2. Recherche des images
Les images doivent être récupérées en fonction de
certaines spécifications, et peuvent être classées en trois
niveaux:
●
Niveau 3: comprend la recherche d'images par attributs
abstraits, impliquant une quantité importante de
raisonnement de haut niveau
Récupérer les images d'un match de football
Récupérer les images qui illustrent le bonheur
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 11
12. Les techniques de l'Image Mining
2. Recherche des images
Il existe trois schémas de requêtes pour la recherche
d'images:
●
Requête par attributs associés:
Les images sont ajoutées en tant que champ
supplémentaire
La recherche est effectuée sur la base d'autres
attributs associés à l'intérieur d'une même table.
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 12
13. Les techniques de l'Image Mining
2. Recherche des images
Il existe trois schémas de requêtes pour la recherche
d'images:
●
Requête par description:
Stocker les descriptions (étiquettes) des images
La recherche des images se fait en utilisant les
descriptions
Les descriptions sont générées manuellement
Souffre des inconvénients du «problème de
vocabulaire»
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 13
14. Les techniques de l'Image Mining
2. Recherche des images
Il existe trois schémas de requêtes pour la recherche
d'images:
●
La recherche d'images basée sur le contenu:
extraction de caractéristiques + indexation + récupération
Les images sont indexées sur la base du contenu
visuel (couleur, texture...)
Elles peuvent être représentées par un vecteur
multidimensionnel des caractéristiques
Ce vecteur agit comme une signature de l'image
R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System 14
15. Les techniques de l'Image Mining
3. Classification et Regroupement d'images
3.1 Caractéristiques de couleur
●
L'une des caractéristiques les plus utilisées
●
La couleur d'une image est très robuste au contexte, à
l'orientation, à l'échelle et à la texture de l'image
●
Toutes les couleurs sont générées par une combinaison
de -Rouge Vert Bleu-
R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System 15
16. Les techniques de l'Image Mining
3. Classification et Regroupement d'images
3.2 Caractéristiques de texture
●
Une caractéristique majeure: répétition d'un(des) motif(s)
sur une région dans une image
●
Une propriété innée de presque toutes les surfaces
(tissus, bois, papiers...)
●
Contient des informations importantes concernant
l'arrangement de la structure des surfaces dans une
image
R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System 16
17. Les techniques de l'Image Mining
3. Classification et Regroupement d'images
3.3 Caractéristiques de forme
●
C'est la description d'un objet par sa position, son
orientation et sa taille
●
Pour l'utiliser en tant que caractéristique, il est essentiel
de segmenter l'image pour détecter l'objet ou les limites
de la région
●
Deux techniques de caractérisation: en utilisant le contour
extérieur de la forme d'un objet ou en utilisant la région
entière formant de l'objet
Sushmita Mitra, Tinku Acharya Data Mining Multimedia, Soft Computing, and Bioinformatics 17
18. Les principaux Frameworks
●
Une base de données d'images contenant des données
brutes de l'image ne peut pas être directement utilisé à
des fins de fouille
●
Les données brutes de l'image doivent d'abord être
traitées pour générer l'information utilisable
élaboration d'un Framework adéquat pour accomplir la
tâche
●
On peut distinguer deux types de Frameworks:
guidés par les fonctions
guidés par l'information
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 18
19. Les principaux Frameworks
1. Frameworks guidés par les fonctions
Sert à organiser et clarifier les rôles et les tâches à
accomplir dans les fouilles d'image
Ne parvient pas à mettre en évidence les différents
niveaux de représentation de l'information
La majorité des architectures des systèmes d'Image
Mining existantes échouent avec ces Frameworks
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 19
20. Les principaux Frameworks
2. Frameworks guidés par l'information
●
Vise à mettre en évidence le rôle de l'information à
différents niveaux de représentation
●
distingue quatre niveaux d'information:
●
niveau pixel: comprend des informations d'image
brute comme les pixels de l'image et les
caractéristiques primitives de l'image telles que la
couleur, la texture et la forme.
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 20
21. Les principaux Frameworks
2. Frameworks guidés par l'information
●
Vise à mettre en évidence le rôle de l'information à
différents niveaux de représentation
●
distingue quatre niveaux d'information:
●
niveau objet: traite de l'objet ou des informations de
région sur la base des caractéristiques primitives du
niveau pixel
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 21
22. Les principaux Frameworks
2. Frameworks guidés par l'information
●
Vise à mettre en évidence le rôle de l'information à
différents niveaux de représentation
●
distingue quatre niveaux d'information:
●
niveau concept sémantique: place les objets
identifiées dans le niveau objet dans le contexte des
scènes représentées.
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 22
23. Les principaux Frameworks
2. Frameworks guidés par l'information
●
Vise à mettre en évidence le rôle de l'information à
différents niveaux de représentation
●
distingue quatre niveaux d'information:
●
niveau modèle et connaissances: intègre un domaine
lié aux données alphanumériques et aux relations
sémantiques découverts à partir des données d'image
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 23
24. Quelques outils pour l'Image Mining
Data Mining
+ Image
Mining
Traitement
d'image
24
25. Quelques outils pour l'Image Mining
Outil de traitement d'image: ImageJ
●
Un logiciel libre de traitement d'images écrit en Java par le
National Institute of Health
●
Développé initialement pour des applications biomédicales
●
Permet de faire des analyses de gels d'électrophorèse, ou de
la détection et analyse de tumeurs.
●
Possibilité de développer et/ou ajouter de nouveaux plugins
ou Macros pour le logiciel
25
26. Quelques outils pour l'Image Mining
Outil de data mining:
Weka
Weka = Waikato Environment for Knowledge Analysis
●
Une suite de logiciels d’apprentissage automatique et
d’exploration de données écrite en Java développée à
l’université de Waikato en Nouvelle-Zélande
TANAGRA
Implémente une série de méthodes de fouilles de données
issues du domaine de la statistique exploratoire, de l'analyse
de données, de l’apprentissage automatique et des bases de
données.
26
27. Quelques outils pour l'Image Mining
Outil de data mining:
RapidMiner
Contient de nombreux outils pour traiter des données :
●
lecture de différents formats d'entrée
●
préparation et nettoyage des données
●
statistiques
●
tous les algorithmes de data mining
●
évaluation des performances
●
visualisations diverses
C'est un logiciel
●
Puissant
●
Pas facile à manipuler au premier abord
●
Qui permet de mettre en place rapidement une chaîne
complète de traitement de données, de la saisie des
27
données à leur classifcation
28. Quelques outils pour l'Image Mining
Outil de data mining:
RapidMiner (extensions)
Les extensions permetterons d'ajouter de nouvelles
fonctionnalités...
Weka
Reporting
Text
Web
Image Mining (basé sur ImageJ)
28
Parallel Processing
29. Quelques outils pour l'Image Mining
Data
Mining
ImageJ
+ Image
Mining
+
Fonctionnalités
d'extraction
29