SlideShare una empresa de Scribd logo
1 de 30
UNIVERSITE MOHAMMED V - AGDAL
                    Faculté des Sciences de Rabat

  Master Informatique Appliquée au Dévelopement Offshore
                      Base de Données Avancées




                     Image Mining

  Présenté par:                                Encadré par:
Mehdi EL KRARI                        Mohammed BENKHALIFA



                                                        Novembre 2012
Plan de Présentation

Introduction au Data Mining

Introduction à l'Image Mining
Les techniques de l'Image Mining

Les principaux Frameworks

Quelques outils pour l'Image Mining (Application)




                                                    2
Introduction au Data Mining

    Apparu au début des années 1990


   Facteurs technologiques, économiques et sociopolitiques

    Besoin des entreprises de valoriser les données qu’elles
    accumulent dans leurs bases

    Réduire les coûts élevés de stockage de données




Data Mining appliqué à l'image ali.mhiri.perso.neuf.fr/sobie/   3
Introduction à l'Image Mining

   ●
       Accumulation de données Multimédia dans les base de
       données
   ●
       Besoin d'extraire de nouvelles connaissances à partir
       d'une collection d'images

                   la recherche d'images basée sur le contenu
 Image             la compréhension d'images
 Mining            le Data Mining
                   les bases de données


Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining   4
Introduction à l'Image Mining

       L'Image Mining a deux thèmes principaux:
   ●
       La fouille de grandes collections d'images

       Exemple: collection de images de satellites météorologiques
            Trouver si il y a une tendance qui existe entre les différentes
       villes
   ●
       L'extraction de données combinées de grandes collections
       d'images et de données alphanumériques associées.

       Exemple: l'imagerie médicale et les dossiers d'un patient
           développer un diagnostic pour les deux données d'image (rayons
       X) et les données des patients (poids) ensemble pour trouver des
       liens intéressants.

Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining   5
Introduction à l'Image Mining

     Domaines d'application:
        ●
            reconnaissance militaire;
        ●
            prévisions météorologiques;
                                                                    stockage et traitement
        ●
            gestion des ressources de la terre;                     de collections massives
                                                                           d'images
        ●
            enquêtes criminelles;
        ●
            imagerie médicale...


        Les techniques de fouille de données doivent
     être appliquées

Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining        6
Introduction à l'Image Mining
   ●
       Problèmes typiques de fouille de données:
          Trouver des règles d'association entre les éléments de
       données dans une base de données.
       Problème non posée pour les données explicites !
   ●
       Le cas des bases de données d'images:
          Indexation exhaustives des images impossible
         Analyse du contenu de l'image puis fouille sur les
       descripteurs générés:
           ●
             Couleur;
           ●
             Texture;
           ●
             Forme...

Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining   7
Les techniques de l'Image Mining
      1. Reconnaissance des objets

  ●
      Utiliser des modèles d'objets qui sont connus
  ●
      Le système trouve des objets dans le monde réel à partir
      d'une image
  ●
      L'extraction automatique des informations ne peut être
      réalisé que lorsque certains objets ont été identifiés par la
      machine




Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   8
Les techniques de l'Image Mining
      2. Recherche des images

      Les images doivent être récupérées en fonction de
      certaines spécifications, et peuvent être classées en trois
      niveaux:

  ●
      Niveau 1: comprend les caractéristiques primitives
      d'extraction d'images telles que la couleur, la texture, la
      forme.

      Récupérer les images contenant des étoiles bleues disposées en
      anneau


Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   9
Les techniques de l'Image Mining
      2. Recherche des images

      Les images doivent être récupérées en fonction de
      certaines spécifications, et peuvent être classées en trois
      niveaux:

  ●
      Niveau 2: comprend la recherche d'images par des
      caractéristiques dérivées ou logiques d'un type donné ou
      d'objets

      Récupérer les images d'une table ronde
      Récupérer les images de Jimmy


Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   10
Les techniques de l'Image Mining
      2. Recherche des images

      Les images doivent être récupérées en fonction de
      certaines spécifications, et peuvent être classées en trois
      niveaux:

  ●
      Niveau 3: comprend la recherche d'images par attributs
      abstraits, impliquant une quantité importante de
      raisonnement de haut niveau

      Récupérer les images d'un match de football
      Récupérer les images qui illustrent le bonheur


Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   11
Les techniques de l'Image Mining
      2. Recherche des images

      Il existe trois schémas de requêtes pour la recherche
      d'images:

  ●
      Requête par attributs associés:
         Les images sont ajoutées en tant que champ
         supplémentaire
         La recherche est effectuée sur la base d'autres
         attributs associés à l'intérieur d'une même table.



Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   12
Les techniques de l'Image Mining
     2. Recherche des images

     Il existe trois schémas de requêtes pour la recherche
     d'images:

       ●
           Requête par description:
             Stocker les descriptions (étiquettes) des images
             La recherche des images se fait en utilisant les
             descriptions
             Les descriptions sont générées manuellement
             Souffre des inconvénients du «problème de
             vocabulaire»
Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   13
Les techniques de l'Image Mining
        2. Recherche des images

       Il existe trois schémas de requêtes pour la recherche
       d'images:

          ●
              La recherche d'images basée sur le contenu:
       extraction de caractéristiques + indexation + récupération
               Les images sont indexées sur la base du contenu
               visuel (couleur, texture...)
               Elles peuvent être représentées par un vecteur
               multidimensionnel des caractéristiques
               Ce vecteur agit comme une signature de l'image
R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System   14
Les techniques de l'Image Mining
         3. Classification et Regroupement d'images
            3.1 Caractéristiques de couleur

     ●
         L'une des caractéristiques les plus utilisées

     ●
         La couleur d'une image est très robuste au contexte, à
         l'orientation, à l'échelle et à la texture de l'image

     ●
         Toutes les couleurs sont générées par une combinaison
         de -Rouge Vert Bleu-



R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System   15
Les techniques de l'Image Mining
         3. Classification et Regroupement d'images
            3.2 Caractéristiques de texture

     ●
         Une caractéristique majeure: répétition d'un(des) motif(s)
         sur une région dans une image

     ●
         Une propriété innée de presque toutes les surfaces
         (tissus, bois, papiers...)

     ●
         Contient des informations importantes concernant
         l'arrangement de la structure des surfaces dans une
         image
R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System   16
Les techniques de l'Image Mining
         3. Classification et Regroupement d'images
             3.3 Caractéristiques de forme
     ●
         C'est la description d'un objet par sa position, son
         orientation et sa taille

     ●
         Pour l'utiliser en tant que caractéristique, il est essentiel
         de segmenter l'image pour détecter l'objet ou les limites
         de la région

     ●
         Deux techniques de caractérisation: en utilisant le contour
         extérieur de la forme d'un objet ou en utilisant la région
         entière formant de l'objet

Sushmita Mitra, Tinku Acharya Data Mining Multimedia, Soft Computing, and Bioinformatics   17
Les principaux Frameworks

  ●
      Une base de données d'images contenant des données
      brutes de l'image ne peut pas être directement utilisé à
      des fins de fouille

  ●
      Les données brutes de l'image doivent d'abord être
      traitées pour générer l'information utilisable
         élaboration d'un Framework adéquat pour accomplir la
      tâche
  ●
      On peut distinguer deux types de Frameworks:
         guidés par les fonctions
         guidés par l'information

Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   18
Les principaux Frameworks
          1. Frameworks guidés par les fonctions


    Sert à organiser et clarifier les rôles et les tâches à
    accomplir dans les fouilles d'image

    Ne parvient pas à mettre en évidence les différents
    niveaux de représentation de l'information

    La majorité des architectures des systèmes d'Image
    Mining existantes échouent avec ces Frameworks


Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   19
Les principaux Frameworks
            2. Frameworks guidés par l'information

  ●
      Vise à mettre en évidence le rôle de l'information à
      différents niveaux de représentation
  ●
      distingue quatre niveaux d'information:

       ●
           niveau pixel: comprend des informations d'image
           brute comme les pixels de l'image et les
           caractéristiques primitives de l'image telles que la
           couleur, la texture et la forme.



Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   20
Les principaux Frameworks
           2. Frameworks guidés par l'information

  ●
      Vise à mettre en évidence le rôle de l'information à
      différents niveaux de représentation
  ●
      distingue quatre niveaux d'information:

       ●
           niveau objet: traite de l'objet ou des informations de
           région sur la base des caractéristiques primitives du
           niveau pixel




Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   21
Les principaux Frameworks
           2. Frameworks guidés par l'information

  ●
      Vise à mettre en évidence le rôle de l'information à
      différents niveaux de représentation
  ●
      distingue quatre niveaux d'information:

       ●
           niveau concept sémantique: place les objets
           identifiées dans le niveau objet dans le contexte des
           scènes représentées.




Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   22
Les principaux Frameworks
           2. Frameworks guidés par l'information

  ●
      Vise à mettre en évidence le rôle de l'information à
      différents niveaux de représentation
  ●
      distingue quatre niveaux d'information:

       ●
           niveau modèle et connaissances: intègre un domaine
           lié aux données alphanumériques et aux relations
           sémantiques découverts à partir des données d'image




Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques   23
Quelques outils pour l'Image Mining

 Data Mining


          +             Image
                        Mining
 Traitement
   d'image


                                 24
Quelques outils pour l'Image Mining
       Outil de traitement d'image: ImageJ

●
    Un logiciel libre de traitement d'images écrit en Java par le
    National Institute of Health

●
    Développé initialement pour des applications biomédicales

●
    Permet de faire des analyses de gels d'électrophorèse, ou de
    la détection et analyse de tumeurs.

●
    Possibilité de développer et/ou ajouter de nouveaux plugins
    ou Macros pour le logiciel



                                                                    25
Quelques outils pour l'Image Mining
       Outil de data mining:
         Weka
    Weka = Waikato Environment for Knowledge Analysis

●
    Une suite de logiciels d’apprentissage automatique et
    d’exploration de données écrite en Java développée à
    l’université de Waikato en Nouvelle-Zélande

         TANAGRA
    Implémente une série de méthodes de fouilles de données
    issues du domaine de la statistique exploratoire, de l'analyse
    de données, de l’apprentissage automatique et des bases de
    données.

                                                                     26
Quelques outils pour l'Image Mining
      Outil de data mining:
       RapidMiner
  Contient de nombreux outils pour traiter des données :
  ●
     lecture de différents formats d'entrée
  ●
    préparation et nettoyage des données
  ●
    statistiques
  ●
    tous les algorithmes de data mining
  ●
    évaluation des performances
  ●
    visualisations diverses

      C'est un logiciel
  ●
      Puissant
  ●
      Pas facile à manipuler au premier abord
  ●
      Qui permet de mettre en place rapidement une chaîne
      complète de traitement de données, de la saisie des
                                                            27
      données à leur classifcation
Quelques outils pour l'Image Mining
   Outil de data mining:
     RapidMiner (extensions)
  Les extensions permetterons d'ajouter de nouvelles
  fonctionnalités...

  Weka

  Reporting

  Text

  Web

  Image Mining (basé sur ImageJ)
                                                       28
  Parallel Processing
Quelques outils pour l'Image Mining

      Data
      Mining


      ImageJ
              +         Image
                        Mining
         +
  Fonctionnalités
   d'extraction



                                 29
Merci de votre attention



                           30

Más contenido relacionado

La actualidad más candente

TP / Traitement d'image : Discrimination de Texture
TP / Traitement d'image : Discrimination de TextureTP / Traitement d'image : Discrimination de Texture
TP / Traitement d'image : Discrimination de TextureAhmed EL ATARI
 
Vision et traitement d'images
Vision et traitement d'imagesVision et traitement d'images
Vision et traitement d'imagesWided Miled
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learningQuentin Ambard
 
Traitement d'image
Traitement d'imageTraitement d'image
Traitement d'imageAnissa Teyeb
 
Data Mining Spatial
Data Mining Spatial Data Mining Spatial
Data Mining Spatial dihiaselma
 
Bases de données réparties
Bases de données répartiesBases de données réparties
Bases de données répartiesAbdelouahed Abdou
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
Programmation Dynamique : Mise en œuvre et application à des problèmes en TAL
Programmation Dynamique : Mise en œuvre et application à des problèmes en TALProgrammation Dynamique : Mise en œuvre et application à des problèmes en TAL
Programmation Dynamique : Mise en œuvre et application à des problèmes en TALECAM Brussels Engineering School
 
diagramme de séquence UML
diagramme de séquence UMLdiagramme de séquence UML
diagramme de séquence UMLAmir Souissi
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 

La actualidad más candente (20)

TP / Traitement d'image : Discrimination de Texture
TP / Traitement d'image : Discrimination de TextureTP / Traitement d'image : Discrimination de Texture
TP / Traitement d'image : Discrimination de Texture
 
Vision et traitement d'images
Vision et traitement d'imagesVision et traitement d'images
Vision et traitement d'images
 
ségmentation d'image
ségmentation d'imageségmentation d'image
ségmentation d'image
 
Vision par ordinateur
Vision par ordinateurVision par ordinateur
Vision par ordinateur
 
Formation traitement d_images
Formation traitement d_imagesFormation traitement d_images
Formation traitement d_images
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Base des données réparties
Base des données répartiesBase des données réparties
Base des données réparties
 
Data mining - Associativité
Data mining - AssociativitéData mining - Associativité
Data mining - Associativité
 
Traitement d'image
Traitement d'imageTraitement d'image
Traitement d'image
 
Hive ppt (1)
Hive ppt (1)Hive ppt (1)
Hive ppt (1)
 
Data Mining Spatial
Data Mining Spatial Data Mining Spatial
Data Mining Spatial
 
Bases de données réparties
Bases de données répartiesBases de données réparties
Bases de données réparties
 
Modelisation conception SI
Modelisation conception SIModelisation conception SI
Modelisation conception SI
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Programmation Dynamique : Mise en œuvre et application à des problèmes en TAL
Programmation Dynamique : Mise en œuvre et application à des problèmes en TALProgrammation Dynamique : Mise en œuvre et application à des problèmes en TAL
Programmation Dynamique : Mise en œuvre et application à des problèmes en TAL
 
diagramme de séquence UML
diagramme de séquence UMLdiagramme de séquence UML
diagramme de séquence UML
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 

Destacado

Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Syllabs - Seo campus : text mining & data mining
Syllabs - Seo campus : text mining & data miningSyllabs - Seo campus : text mining & data mining
Syllabs - Seo campus : text mining & data miningChristophe Tricot
 
Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES
Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTESPetit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES
Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTESPhilippe YONNET
 
Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.Bruno Teboul
 
E book Content-Mining l SocialShare la veille par l'analyse des partages sociaux
E book Content-Mining l SocialShare la veille par l'analyse des partages sociauxE book Content-Mining l SocialShare la veille par l'analyse des partages sociaux
E book Content-Mining l SocialShare la veille par l'analyse des partages sociauxYouSeeMii
 
Fouille de données sur des graphes : Introduction
Fouille de données sur des graphes : IntroductionFouille de données sur des graphes : Introduction
Fouille de données sur des graphes : Introductiontuxette
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Basics of openpit mining
Basics of openpit miningBasics of openpit mining
Basics of openpit miningSATYANARAYANA I
 
Design of openpit mining
Design of openpit miningDesign of openpit mining
Design of openpit miningSATYANARAYANA I
 
Opinion Mining : Etat de l'art et exemples d'applications
Opinion Mining : Etat de l'art et exemples d'applicationsOpinion Mining : Etat de l'art et exemples d'applications
Opinion Mining : Etat de l'art et exemples d'applicationsLingway
 
8 syllabs - data tuesday toursisme - v2
8   syllabs - data tuesday toursisme - v28   syllabs - data tuesday toursisme - v2
8 syllabs - data tuesday toursisme - v2Data Tuesday
 
Du Data Mining à la Data Science
Du Data Mining à la Data ScienceDu Data Mining à la Data Science
Du Data Mining à la Data ScienceSoft Computing
 
Session 5 : Diffuser les résultats de la veille
Session 5 : Diffuser les résultats de la veilleSession 5 : Diffuser les résultats de la veille
Session 5 : Diffuser les résultats de la veilleBachr
 
Essca Angers 01 Avril 2009
Essca Angers 01 Avril 2009Essca Angers 01 Avril 2009
Essca Angers 01 Avril 2009Bourrion Daniel
 
Une introduction au Text Mining et à la sémantique
Une introduction au Text Mining et à la sémantiqueUne introduction au Text Mining et à la sémantique
Une introduction au Text Mining et à la sémantiqueSeth Grimes
 

Destacado (20)

Image mining
Image miningImage mining
Image mining
 
Datamining damien-jubeau
Datamining damien-jubeauDatamining damien-jubeau
Datamining damien-jubeau
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Syllabs - Seo campus : text mining & data mining
Syllabs - Seo campus : text mining & data miningSyllabs - Seo campus : text mining & data mining
Syllabs - Seo campus : text mining & data mining
 
8017 25 image mining
8017 25 image mining8017 25 image mining
8017 25 image mining
 
Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES
Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTESPetit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES
Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES
 
Mining vocabulary
Mining vocabularyMining vocabulary
Mining vocabulary
 
Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.Text mining, sentiment analysis, big data.
Text mining, sentiment analysis, big data.
 
E book Content-Mining l SocialShare la veille par l'analyse des partages sociaux
E book Content-Mining l SocialShare la veille par l'analyse des partages sociauxE book Content-Mining l SocialShare la veille par l'analyse des partages sociaux
E book Content-Mining l SocialShare la veille par l'analyse des partages sociaux
 
Fouille de données sur des graphes : Introduction
Fouille de données sur des graphes : IntroductionFouille de données sur des graphes : Introduction
Fouille de données sur des graphes : Introduction
 
Bddwdm
BddwdmBddwdm
Bddwdm
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Basics of openpit mining
Basics of openpit miningBasics of openpit mining
Basics of openpit mining
 
Design of openpit mining
Design of openpit miningDesign of openpit mining
Design of openpit mining
 
Opinion Mining : Etat de l'art et exemples d'applications
Opinion Mining : Etat de l'art et exemples d'applicationsOpinion Mining : Etat de l'art et exemples d'applications
Opinion Mining : Etat de l'art et exemples d'applications
 
8 syllabs - data tuesday toursisme - v2
8   syllabs - data tuesday toursisme - v28   syllabs - data tuesday toursisme - v2
8 syllabs - data tuesday toursisme - v2
 
Du Data Mining à la Data Science
Du Data Mining à la Data ScienceDu Data Mining à la Data Science
Du Data Mining à la Data Science
 
Session 5 : Diffuser les résultats de la veille
Session 5 : Diffuser les résultats de la veilleSession 5 : Diffuser les résultats de la veille
Session 5 : Diffuser les résultats de la veille
 
Essca Angers 01 Avril 2009
Essca Angers 01 Avril 2009Essca Angers 01 Avril 2009
Essca Angers 01 Avril 2009
 
Une introduction au Text Mining et à la sémantique
Une introduction au Text Mining et à la sémantiqueUne introduction au Text Mining et à la sémantique
Une introduction au Text Mining et à la sémantique
 

Image Mining

  • 1. UNIVERSITE MOHAMMED V - AGDAL Faculté des Sciences de Rabat Master Informatique Appliquée au Dévelopement Offshore Base de Données Avancées Image Mining Présenté par: Encadré par: Mehdi EL KRARI Mohammed BENKHALIFA Novembre 2012
  • 2. Plan de Présentation Introduction au Data Mining Introduction à l'Image Mining Les techniques de l'Image Mining Les principaux Frameworks Quelques outils pour l'Image Mining (Application) 2
  • 3. Introduction au Data Mining Apparu au début des années 1990 Facteurs technologiques, économiques et sociopolitiques Besoin des entreprises de valoriser les données qu’elles accumulent dans leurs bases Réduire les coûts élevés de stockage de données Data Mining appliqué à l'image ali.mhiri.perso.neuf.fr/sobie/ 3
  • 4. Introduction à l'Image Mining ● Accumulation de données Multimédia dans les base de données ● Besoin d'extraire de nouvelles connaissances à partir d'une collection d'images la recherche d'images basée sur le contenu Image la compréhension d'images Mining le Data Mining les bases de données Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 4
  • 5. Introduction à l'Image Mining L'Image Mining a deux thèmes principaux: ● La fouille de grandes collections d'images Exemple: collection de images de satellites météorologiques Trouver si il y a une tendance qui existe entre les différentes villes ● L'extraction de données combinées de grandes collections d'images et de données alphanumériques associées. Exemple: l'imagerie médicale et les dossiers d'un patient développer un diagnostic pour les deux données d'image (rayons X) et les données des patients (poids) ensemble pour trouver des liens intéressants. Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 5
  • 6. Introduction à l'Image Mining Domaines d'application: ● reconnaissance militaire; ● prévisions météorologiques; stockage et traitement ● gestion des ressources de la terre; de collections massives d'images ● enquêtes criminelles; ● imagerie médicale... Les techniques de fouille de données doivent être appliquées Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 6
  • 7. Introduction à l'Image Mining ● Problèmes typiques de fouille de données: Trouver des règles d'association entre les éléments de données dans une base de données. Problème non posée pour les données explicites ! ● Le cas des bases de données d'images: Indexation exhaustives des images impossible Analyse du contenu de l'image puis fouille sur les descripteurs générés: ● Couleur; ● Texture; ● Forme... Carlos Ordonez & Edward Omiecinski - Image Mining: A New Approach for Data Mining 7
  • 8. Les techniques de l'Image Mining 1. Reconnaissance des objets ● Utiliser des modèles d'objets qui sont connus ● Le système trouve des objets dans le monde réel à partir d'une image ● L'extraction automatique des informations ne peut être réalisé que lorsque certains objets ont été identifiés par la machine Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 8
  • 9. Les techniques de l'Image Mining 2. Recherche des images Les images doivent être récupérées en fonction de certaines spécifications, et peuvent être classées en trois niveaux: ● Niveau 1: comprend les caractéristiques primitives d'extraction d'images telles que la couleur, la texture, la forme. Récupérer les images contenant des étoiles bleues disposées en anneau Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 9
  • 10. Les techniques de l'Image Mining 2. Recherche des images Les images doivent être récupérées en fonction de certaines spécifications, et peuvent être classées en trois niveaux: ● Niveau 2: comprend la recherche d'images par des caractéristiques dérivées ou logiques d'un type donné ou d'objets Récupérer les images d'une table ronde Récupérer les images de Jimmy Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 10
  • 11. Les techniques de l'Image Mining 2. Recherche des images Les images doivent être récupérées en fonction de certaines spécifications, et peuvent être classées en trois niveaux: ● Niveau 3: comprend la recherche d'images par attributs abstraits, impliquant une quantité importante de raisonnement de haut niveau Récupérer les images d'un match de football Récupérer les images qui illustrent le bonheur Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 11
  • 12. Les techniques de l'Image Mining 2. Recherche des images Il existe trois schémas de requêtes pour la recherche d'images: ● Requête par attributs associés: Les images sont ajoutées en tant que champ supplémentaire La recherche est effectuée sur la base d'autres attributs associés à l'intérieur d'une même table. Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 12
  • 13. Les techniques de l'Image Mining 2. Recherche des images Il existe trois schémas de requêtes pour la recherche d'images: ● Requête par description: Stocker les descriptions (étiquettes) des images La recherche des images se fait en utilisant les descriptions Les descriptions sont générées manuellement Souffre des inconvénients du «problème de vocabulaire» Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 13
  • 14. Les techniques de l'Image Mining 2. Recherche des images Il existe trois schémas de requêtes pour la recherche d'images: ● La recherche d'images basée sur le contenu: extraction de caractéristiques + indexation + récupération Les images sont indexées sur la base du contenu visuel (couleur, texture...) Elles peuvent être représentées par un vecteur multidimensionnel des caractéristiques Ce vecteur agit comme une signature de l'image R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System 14
  • 15. Les techniques de l'Image Mining 3. Classification et Regroupement d'images 3.1 Caractéristiques de couleur ● L'une des caractéristiques les plus utilisées ● La couleur d'une image est très robuste au contexte, à l'orientation, à l'échelle et à la texture de l'image ● Toutes les couleurs sont générées par une combinaison de -Rouge Vert Bleu- R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System 15
  • 16. Les techniques de l'Image Mining 3. Classification et Regroupement d'images 3.2 Caractéristiques de texture ● Une caractéristique majeure: répétition d'un(des) motif(s) sur une région dans une image ● Une propriété innée de presque toutes les surfaces (tissus, bois, papiers...) ● Contient des informations importantes concernant l'arrangement de la structure des surfaces dans une image R. S. Dubey, N. Bhargava, R. Choubey Image Mining using Content Based Image Retrieval System 16
  • 17. Les techniques de l'Image Mining 3. Classification et Regroupement d'images 3.3 Caractéristiques de forme ● C'est la description d'un objet par sa position, son orientation et sa taille ● Pour l'utiliser en tant que caractéristique, il est essentiel de segmenter l'image pour détecter l'objet ou les limites de la région ● Deux techniques de caractérisation: en utilisant le contour extérieur de la forme d'un objet ou en utilisant la région entière formant de l'objet Sushmita Mitra, Tinku Acharya Data Mining Multimedia, Soft Computing, and Bioinformatics 17
  • 18. Les principaux Frameworks ● Une base de données d'images contenant des données brutes de l'image ne peut pas être directement utilisé à des fins de fouille ● Les données brutes de l'image doivent d'abord être traitées pour générer l'information utilisable élaboration d'un Framework adéquat pour accomplir la tâche ● On peut distinguer deux types de Frameworks: guidés par les fonctions guidés par l'information Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 18
  • 19. Les principaux Frameworks 1. Frameworks guidés par les fonctions Sert à organiser et clarifier les rôles et les tâches à accomplir dans les fouilles d'image Ne parvient pas à mettre en évidence les différents niveaux de représentation de l'information La majorité des architectures des systèmes d'Image Mining existantes échouent avec ces Frameworks Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 19
  • 20. Les principaux Frameworks 2. Frameworks guidés par l'information ● Vise à mettre en évidence le rôle de l'information à différents niveaux de représentation ● distingue quatre niveaux d'information: ● niveau pixel: comprend des informations d'image brute comme les pixels de l'image et les caractéristiques primitives de l'image telles que la couleur, la texture et la forme. Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 20
  • 21. Les principaux Frameworks 2. Frameworks guidés par l'information ● Vise à mettre en évidence le rôle de l'information à différents niveaux de représentation ● distingue quatre niveaux d'information: ● niveau objet: traite de l'objet ou des informations de région sur la base des caractéristiques primitives du niveau pixel Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 21
  • 22. Les principaux Frameworks 2. Frameworks guidés par l'information ● Vise à mettre en évidence le rôle de l'information à différents niveaux de représentation ● distingue quatre niveaux d'information: ● niveau concept sémantique: place les objets identifiées dans le niveau objet dans le contexte des scènes représentées. Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 22
  • 23. Les principaux Frameworks 2. Frameworks guidés par l'information ● Vise à mettre en évidence le rôle de l'information à différents niveaux de représentation ● distingue quatre niveaux d'information: ● niveau modèle et connaissances: intègre un domaine lié aux données alphanumériques et aux relations sémantiques découverts à partir des données d'image Ji Zhang, Wynne Hsu, Mong Li Lee Image Mining: Issues, Frameworks and Techniques 23
  • 24. Quelques outils pour l'Image Mining Data Mining + Image Mining Traitement d'image 24
  • 25. Quelques outils pour l'Image Mining Outil de traitement d'image: ImageJ ● Un logiciel libre de traitement d'images écrit en Java par le National Institute of Health ● Développé initialement pour des applications biomédicales ● Permet de faire des analyses de gels d'électrophorèse, ou de la détection et analyse de tumeurs. ● Possibilité de développer et/ou ajouter de nouveaux plugins ou Macros pour le logiciel 25
  • 26. Quelques outils pour l'Image Mining Outil de data mining: Weka Weka = Waikato Environment for Knowledge Analysis ● Une suite de logiciels d’apprentissage automatique et d’exploration de données écrite en Java développée à l’université de Waikato en Nouvelle-Zélande TANAGRA Implémente une série de méthodes de fouilles de données issues du domaine de la statistique exploratoire, de l'analyse de données, de l’apprentissage automatique et des bases de données. 26
  • 27. Quelques outils pour l'Image Mining Outil de data mining: RapidMiner Contient de nombreux outils pour traiter des données : ● lecture de différents formats d'entrée ● préparation et nettoyage des données ● statistiques ● tous les algorithmes de data mining ● évaluation des performances ● visualisations diverses C'est un logiciel ● Puissant ● Pas facile à manipuler au premier abord ● Qui permet de mettre en place rapidement une chaîne complète de traitement de données, de la saisie des 27 données à leur classifcation
  • 28. Quelques outils pour l'Image Mining Outil de data mining: RapidMiner (extensions) Les extensions permetterons d'ajouter de nouvelles fonctionnalités... Weka Reporting Text Web Image Mining (basé sur ImageJ) 28 Parallel Processing
  • 29. Quelques outils pour l'Image Mining Data Mining ImageJ + Image Mining + Fonctionnalités d'extraction 29
  • 30. Merci de votre attention 30