SlideShare una empresa de Scribd logo
1 de 26
Indexation de données
SS tree
• Demba SYLLA
• Rachid TALBI
Contexte

Indexation multidimensionnelle des données

multimédia

1
Introduction
Multimédia
• Arrivée des CD_ROM (1980) apparition du mot multimédia
• Il désignait les applications qui pouvait utiliser ou piloter différents
médias simultanément.

• Recherche informatique : mutlimédia  l’étude des média non textuels

Images , Vidéos, Son

2
Introduction
Base de données multimédia (MMDB)

• Initialement traitées comme des BD standards:
– Objet multimédia ↔ un seul item : champ d’une BDDR

– Recherche sur mots clés.
– Utilisation des relation entre objet.
– Recherche sur les mots dans les pages web (http://images.google.com)

3
Introduction
Spécificités des MMDB
• L’information portée par le multimédia est tout ce qui peut venir du
monde réel, alors que l’information portée par une base de données
classique ne peut être qu’une représentation symbolique de faits
limités a l’univers de la base de données.

•Le développeur d’une MMDB ne peut expliciter tous les aspects
des données qui seront importants pour l’utilisateur.

Informations

4
Introduction
Spécificités des MMDB
• Ex de requête impossible avec un SGDB “classique”:
récupérer toutes les images “qui ressemblent” à une image requête ??

•Besoin de recherche d’information sur le contenu des objets, non pas
sur leurs attributs. (recherche approximative/par contenu )

5
Introduction
Spécificités des MMDB
• Ex de requête impossible avec un SGDB “classique”:
récupérer toutes les images “qui ressemblent” à une image requête ??

•Besoin de recherche d’information sur le contenu des objets, non pas
sur leurs attributs. (recherche approximative/par contenu )

6
Indexation
• Décrire les images par leurs contenu à l’aide des descripteurs
relatifs aux indices visuels (couleurs, forme, texture,…).
Image BD

Indices
visuels

Descripteurs

Vecteur caractéristique

Couleur

Forme

V

Texture

7
Recherche approximative /par similarité
• L’idée clé dans la recherche de média est la recherche approximative
• Utilise la notion de proximité, de similarité, de distance entre objets

 Retrouver les vecteurs similaires à un vecteur de requête au sens
d’une mesure de similarité (distance entre eux)

8
Distance et mesure de similarité
• Avoir un outil quantitatif pour répondre à la question:
Est-ce que deux entités X et Y se ressemblent ?
• comparer des entités obtenir un scalaire indiquant la
proximité de ces entités

9
Distance
• Une distance d sur un ensemble E de vecteurs est une
application dans R+ vérifiant les axiomes suivantes:
 Séparation : d(x,y)=0 ↔ x=y
 Symétrie: d(x,y)=d(y,x)
 Inégalité triangulaire : d(x,z)<= d(x,y)+d(y,z)

10
Distance
• La similarité est basée sur la notion de distance entre deux points x, y:
 Distance euclidienne:
d(x,y) =

 Distance X2: pour comparer deux distributions

11
Approches de recherche par similarité
• Recherche à Ɛ près: (par intervalle)

V5

V3

Q (q,ε )= { v∈ BD/ sim(q,v) < ε }
q
V2

V4

V1

12
Approche de recherche par similarité
• Recherche des K plus proches voisins :
V5

V3

q
V2
V1

V4

K=2

13
Le SS-tree

• Arbre de recherche par similarité
 basé sur des sphères qui englobes les objets
 Le centre de la sphère est le centre de gravité des points

14
Le SS-tree

Utilisation de sphères
Centre d’une sphère=
centre De gravité des
points englobés

Représentation multidimensionnelle

15
Le SS-tree

représentation de l'arbre utilisé dans la mémoire
ou sur le disque

16
Le SS-tree
• Maintien le nombre des points dans les sous arbres
• La sphère représentée par son centre et le rayon
Avantages:
 Moins d’espace que le rectangle (R*-tree)
 Fanout plus élevé en raison du fait que l’espace de stockage requis est
plus petit

17
Le SS-tree
Avantages:
 Moins d’espace que le rectangle (R*-tree)
 Fanout plus élevé en raison du fait que l’espace de stockage requis est
plus petit

Inconvénients:
 SS-tree comporte plus de volume que le R-tree, ce qui augmente la
quantité de chevauchement

18
SR-tree

Idéalement, un noeud d'index devrait combiner l’espace de
stockage petit du SS-tree avec le volume petit du R *-tree,
d’où le SR-tree

19
SR-tree
• Utilise les sphères de délimitation du SS-tree et les rectangles
englobant du R-tree

20
SR-tree
• Le nœud d’index est l’intersection de ces deux

21
SR-tree
• Le nœud d’index est l’intersection de ces deux

22
SR-tree

Sur mémoire

23
SR-tree
• Structures:
 Nœud d'index maintient explicitement à la fois

o sphère délimitant
o rectangle englobant
 Center est barycentre pondéré de nœuds enfants
 Le rayon est le minimum des distances maximales de

o Sphères englobant des nœuds enfants
o Rectangles de délimitation de nœuds enfants

24
Questions ??

Más contenido relacionado

La actualidad más candente

Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
Data warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosData warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosMarcos Pessoa
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data miningDonia Hammami
 
Digital Image File Formats
Digital Image File FormatsDigital Image File Formats
Digital Image File Formatsindiangarg
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionAmal Brioual
 
Analyse et conception des systèmes d’information (d’outils et modèles pour le...
Analyse et conception des systèmes d’information (d’outils et modèles pour le...Analyse et conception des systèmes d’information (d’outils et modèles pour le...
Analyse et conception des systèmes d’information (d’outils et modèles pour le...HB1-Sela
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
 
Representação da informação
Representação da informaçãoRepresentação da informação
Representação da informaçãoIgor Falce
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 
Image seg using_thresholding
Image seg using_thresholdingImage seg using_thresholding
Image seg using_thresholdingVani011
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'imagesAbdelouahed Abdou
 
Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...
Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...
Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...VisionGEOMATIQUE2014
 

La actualidad más candente (17)

Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Data warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentosData warehousing - Técnicas e procedimentos
Data warehousing - Técnicas e procedimentos
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
01 introducaocaats
01 introducaocaats01 introducaocaats
01 introducaocaats
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Digital Image File Formats
Digital Image File FormatsDigital Image File Formats
Digital Image File Formats
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décisionBusiness Intelligence au coeur de la décision
Business Intelligence au coeur de la décision
 
Reconstruction 3 D
Reconstruction 3 DReconstruction 3 D
Reconstruction 3 D
 
camera calibration
 camera calibration camera calibration
camera calibration
 
Analyse et conception des systèmes d’information (d’outils et modèles pour le...
Analyse et conception des systèmes d’information (d’outils et modèles pour le...Analyse et conception des systèmes d’information (d’outils et modèles pour le...
Analyse et conception des systèmes d’information (d’outils et modèles pour le...
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Representação da informação
Representação da informaçãoRepresentação da informação
Representação da informação
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Image seg using_thresholding
Image seg using_thresholdingImage seg using_thresholding
Image seg using_thresholding
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'images
 
Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...
Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...
Un outil pour la configuration des paramètres d’acquisition d’images hyperspe...
 

Destacado

SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...Conférence IC 2009
 
Présentation1 grammaire textuelle
Présentation1 grammaire textuellePrésentation1 grammaire textuelle
Présentation1 grammaire textuelleelhachimiabdelhak
 
La femme-grillagee
La femme-grillageeLa femme-grillagee
La femme-grillageecdt34400
 
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en CataluñaConferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluñacosasdeandalucia
 
Bloque de novedades y anuncios
Bloque de novedades y anunciosBloque de novedades y anuncios
Bloque de novedades y anunciosjuanjoreverte
 
IV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de HostelturIV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de HostelturHosteltur
 
L'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou RubyL'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou RubyMarc Bojoly
 
Connected Commerce by DigitasLBI
Connected Commerce by DigitasLBIConnected Commerce by DigitasLBI
Connected Commerce by DigitasLBIPhilippe Dumont
 
Reporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clicReporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clicAT Internet
 
F Otos Y Sabiduria
F Otos Y SabiduriaF Otos Y Sabiduria
F Otos Y Sabiduriaguesta6167d
 
Ameublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéAmeublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéCA Consumer Finance
 
Webinar campañas efectivas
Webinar campañas efectivasWebinar campañas efectivas
Webinar campañas efectivasMasterBase®
 
Relais De Croissance ExtéRieure
Relais De Croissance ExtéRieureRelais De Croissance ExtéRieure
Relais De Croissance ExtéRieureSully Médiations
 
Charla Violencia Escolar
Charla Violencia EscolarCharla Violencia Escolar
Charla Violencia Escolarchiquian
 

Destacado (20)

SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
 
Présentation1 grammaire textuelle
Présentation1 grammaire textuellePrésentation1 grammaire textuelle
Présentation1 grammaire textuelle
 
Text mining
Text miningText mining
Text mining
 
Textmining Introduction
Textmining IntroductionTextmining Introduction
Textmining Introduction
 
La femme-grillagee
La femme-grillageeLa femme-grillagee
La femme-grillagee
 
gradle_nantesjug
gradle_nantesjuggradle_nantesjug
gradle_nantesjug
 
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en CataluñaConferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
Conferencia Y Festival San Sebastián de Los Ballesteros en Cataluña
 
Bloque de novedades y anuncios
Bloque de novedades y anunciosBloque de novedades y anuncios
Bloque de novedades y anuncios
 
IV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de HostelturIV eBook turismo 2.0, marketing y empresa de Hosteltur
IV eBook turismo 2.0, marketing y empresa de Hosteltur
 
L'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou RubyL'avenir de Java : Erlang, Haskell ou Ruby
L'avenir de Java : Erlang, Haskell ou Ruby
 
Connected Commerce by DigitasLBI
Connected Commerce by DigitasLBIConnected Commerce by DigitasLBI
Connected Commerce by DigitasLBI
 
Reporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clicReporting multi site - toutes vos donnees en un clic
Reporting multi site - toutes vos donnees en un clic
 
F Otos Y Sabiduria
F Otos Y SabiduriaF Otos Y Sabiduria
F Otos Y Sabiduria
 
Ameublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéAmeublement et crédit : analyse du marché
Ameublement et crédit : analyse du marché
 
Webinar campañas efectivas
Webinar campañas efectivasWebinar campañas efectivas
Webinar campañas efectivas
 
Planeta Web2
Planeta Web2Planeta Web2
Planeta Web2
 
Relais De Croissance ExtéRieure
Relais De Croissance ExtéRieureRelais De Croissance ExtéRieure
Relais De Croissance ExtéRieure
 
Charla Violencia Escolar
Charla Violencia EscolarCharla Violencia Escolar
Charla Violencia Escolar
 
Synthese complexite entreprises 2011
Synthese complexite entreprises 2011Synthese complexite entreprises 2011
Synthese complexite entreprises 2011
 
Chacao digital
Chacao digitalChacao digital
Chacao digital
 

Similar a SS tree (par SYLLA Demba et TALBI Rachid)

Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de donnéesAbdoulaye Dieng
 
Base de Données Chapitre I .pptx
Base de Données Chapitre I .pptxBase de Données Chapitre I .pptx
Base de Données Chapitre I .pptxAbdoulayeTraore48
 
Diaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfDiaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfEST-UMI de Meknès
 
Devoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigéDevoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigéRimaDaqch
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Desconnets Jean-Christophe
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4jBoris Guarisma
 
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...SCD Université Côte d'Azur
 
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Yi YANG
 

Similar a SS tree (par SYLLA Demba et TALBI Rachid) (10)

Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Base de Données Chapitre I .pptx
Base de Données Chapitre I .pptxBase de Données Chapitre I .pptx
Base de Données Chapitre I .pptx
 
Diaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfDiaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdf
 
Devoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigéDevoir Final dans No Sql Base de donnée avec corrigé
Devoir Final dans No Sql Base de donnée avec corrigé
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4j
 
BDRO.pdf
BDRO.pdfBDRO.pdf
BDRO.pdf
 
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques ...
 
R-Lab-1-ppt.pdf
R-Lab-1-ppt.pdfR-Lab-1-ppt.pdf
R-Lab-1-ppt.pdf
 
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
 

Más de rchbeir

Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)rchbeir
 
Ranking (par IBRAHIM Sirine et TANIOS Dany)
Ranking (par IBRAHIM Sirine et TANIOS	 Dany)Ranking (par IBRAHIM Sirine et TANIOS	 Dany)
Ranking (par IBRAHIM Sirine et TANIOS Dany)rchbeir
 
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)rchbeir
 
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)rchbeir
 
NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)rchbeir
 
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)rchbeir
 
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)rchbeir
 
Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)rchbeir
 
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)rchbeir
 
Information Retrieval
Information RetrievalInformation Retrieval
Information Retrievalrchbeir
 

Más de rchbeir (13)

Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
Web ontologie language (par RAFEH Aya et VAILLEUX Arnaud)
 
Ranking (par IBRAHIM Sirine et TANIOS Dany)
Ranking (par IBRAHIM Sirine et TANIOS	 Dany)Ranking (par IBRAHIM Sirine et TANIOS	 Dany)
Ranking (par IBRAHIM Sirine et TANIOS Dany)
 
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
Crawlers (par DE COURCHELLE Inès et JACOB Sophie)
 
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
Quad-Tree et Kd-Tree (par MARQUES Patricia et OLIVIER Aymeric)
 
NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)NoSQL (par HEGUY Xabier)
NoSQL (par HEGUY Xabier)
 
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
Mpeg7 et comm ontology (par MOHIBE Amine et BENSLIMANE Mohamed-Amine)
 
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
LSI latent (par HATOUM Saria et DONGO ESCALANTE Irvin Franco)
 
Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)Arbre b (par EL HACHEM Marwan et RICHA Elias)
Arbre b (par EL HACHEM Marwan et RICHA Elias)
 
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
Adaptative hypermedia (par MALKI Sara et MAKSIMOVICH Aleksandra)
 
Information Retrieval
Information RetrievalInformation Retrieval
Information Retrieval
 
Plsql2
Plsql2Plsql2
Plsql2
 
Plsql
PlsqlPlsql
Plsql
 
Sql3
Sql3Sql3
Sql3
 

SS tree (par SYLLA Demba et TALBI Rachid)

  • 1. Indexation de données SS tree • Demba SYLLA • Rachid TALBI
  • 3. Introduction Multimédia • Arrivée des CD_ROM (1980) apparition du mot multimédia • Il désignait les applications qui pouvait utiliser ou piloter différents médias simultanément. • Recherche informatique : mutlimédia  l’étude des média non textuels Images , Vidéos, Son 2
  • 4. Introduction Base de données multimédia (MMDB) • Initialement traitées comme des BD standards: – Objet multimédia ↔ un seul item : champ d’une BDDR – Recherche sur mots clés. – Utilisation des relation entre objet. – Recherche sur les mots dans les pages web (http://images.google.com) 3
  • 5. Introduction Spécificités des MMDB • L’information portée par le multimédia est tout ce qui peut venir du monde réel, alors que l’information portée par une base de données classique ne peut être qu’une représentation symbolique de faits limités a l’univers de la base de données. •Le développeur d’une MMDB ne peut expliciter tous les aspects des données qui seront importants pour l’utilisateur. Informations 4
  • 6. Introduction Spécificités des MMDB • Ex de requête impossible avec un SGDB “classique”: récupérer toutes les images “qui ressemblent” à une image requête ?? •Besoin de recherche d’information sur le contenu des objets, non pas sur leurs attributs. (recherche approximative/par contenu ) 5
  • 7. Introduction Spécificités des MMDB • Ex de requête impossible avec un SGDB “classique”: récupérer toutes les images “qui ressemblent” à une image requête ?? •Besoin de recherche d’information sur le contenu des objets, non pas sur leurs attributs. (recherche approximative/par contenu ) 6
  • 8. Indexation • Décrire les images par leurs contenu à l’aide des descripteurs relatifs aux indices visuels (couleurs, forme, texture,…). Image BD Indices visuels Descripteurs Vecteur caractéristique Couleur Forme V Texture 7
  • 9. Recherche approximative /par similarité • L’idée clé dans la recherche de média est la recherche approximative • Utilise la notion de proximité, de similarité, de distance entre objets  Retrouver les vecteurs similaires à un vecteur de requête au sens d’une mesure de similarité (distance entre eux) 8
  • 10. Distance et mesure de similarité • Avoir un outil quantitatif pour répondre à la question: Est-ce que deux entités X et Y se ressemblent ? • comparer des entités obtenir un scalaire indiquant la proximité de ces entités 9
  • 11. Distance • Une distance d sur un ensemble E de vecteurs est une application dans R+ vérifiant les axiomes suivantes:  Séparation : d(x,y)=0 ↔ x=y  Symétrie: d(x,y)=d(y,x)  Inégalité triangulaire : d(x,z)<= d(x,y)+d(y,z) 10
  • 12. Distance • La similarité est basée sur la notion de distance entre deux points x, y:  Distance euclidienne: d(x,y) =  Distance X2: pour comparer deux distributions 11
  • 13. Approches de recherche par similarité • Recherche à Ɛ près: (par intervalle) V5 V3 Q (q,ε )= { v∈ BD/ sim(q,v) < ε } q V2 V4 V1 12
  • 14. Approche de recherche par similarité • Recherche des K plus proches voisins : V5 V3 q V2 V1 V4 K=2 13
  • 15. Le SS-tree • Arbre de recherche par similarité  basé sur des sphères qui englobes les objets  Le centre de la sphère est le centre de gravité des points 14
  • 16. Le SS-tree Utilisation de sphères Centre d’une sphère= centre De gravité des points englobés Représentation multidimensionnelle 15
  • 17. Le SS-tree représentation de l'arbre utilisé dans la mémoire ou sur le disque 16
  • 18. Le SS-tree • Maintien le nombre des points dans les sous arbres • La sphère représentée par son centre et le rayon Avantages:  Moins d’espace que le rectangle (R*-tree)  Fanout plus élevé en raison du fait que l’espace de stockage requis est plus petit 17
  • 19. Le SS-tree Avantages:  Moins d’espace que le rectangle (R*-tree)  Fanout plus élevé en raison du fait que l’espace de stockage requis est plus petit Inconvénients:  SS-tree comporte plus de volume que le R-tree, ce qui augmente la quantité de chevauchement 18
  • 20. SR-tree Idéalement, un noeud d'index devrait combiner l’espace de stockage petit du SS-tree avec le volume petit du R *-tree, d’où le SR-tree 19
  • 21. SR-tree • Utilise les sphères de délimitation du SS-tree et les rectangles englobant du R-tree 20
  • 22. SR-tree • Le nœud d’index est l’intersection de ces deux 21
  • 23. SR-tree • Le nœud d’index est l’intersection de ces deux 22
  • 25. SR-tree • Structures:  Nœud d'index maintient explicitement à la fois o sphère délimitant o rectangle englobant  Center est barycentre pondéré de nœuds enfants  Le rayon est le minimum des distances maximales de o Sphères englobant des nœuds enfants o Rectangles de délimitation de nœuds enfants 24