SlideShare une entreprise Scribd logo
1  sur  55
Enrichissement des moteurs de recherche à partir de connaissances métier Mondeca thomas.francart@mondeca.com
A l’intersection entre les problématiques Amélioration de la recherche grâce au référentiel métier Univers du Document Structuration sémantique du contenu Indexation intelligente du contenu sur sa structure Univers de la recherche Univers de la connaissance
Cas LERUDI Univers du Document Univers de la connaissance Outil de gestion de contenu WCM AFS ITM SDK Univers de la recherche
De quelles connaissances parle-t-on ? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Où peut-on intervenir ? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Le moteur de recherche ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
SolR explorer : une interface de test ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Le jeu de données ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Point de départ : une indexation simple des sites web – sans enrichissement
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
1 : enrichissement avec des synonymes ,[object Object],[object Object],[object Object],[object Object],[object Object],< fieldType name =&quot; text &quot;  class =&quot; solr.TextField &quot;  positionIncrementGap =&quot; 100 &quot;> < analyzer type =&quot; index &quot;>     < tokenizer   class =&quot; solr.WhitespaceTokenizerFactory &quot; /> <!--   in this example, we will only use synonyms at index time      -->       < filter   class =&quot; solr.SynonymFilterFactory &quot;  synonyms =&quot; synonyms.txt &quot;  ignoreCase =&quot; true &quot;  expand =&quot; true &quot; /> <!--   ...   -->       </ analyzer > < analyzer type =&quot; query &quot;>     < tokenizer   class =&quot; solr.WhitespaceTokenizerFactory &quot; /> <!--   <filter class=&quot;solr.SynonymFilterFactory&quot; synonyms=&quot;synonyms.txt&quot; ignoreCase=&quot;true&quot; expand=&quot;true&quot;/>      --> <!--   ...   -->       </ analyzer > </ fieldType >
Format du fichier de synonymes ,[object Object],[object Object],[object Object],[object Object],[object Object],déreglementation,libéralisation,dérégulation croisière,croisière de plaisance,croisière maritime spectacle,attraction,show vacances familiales,tourisme familial pêche,pêche à la ligne,permis de pêche,article de pêche,pêche au gros,pêche touristique office de tourisme,otsi,office municipal de tourisme,syndicat d'initiative libéralisation,dérégulation => déréglementation croisière de plaisance,croisière maritime => croisière attraction,show => spectacle tourisme familial => vacances familiales pêche à la ligne,permis de pêche,article de pêche,pêche au gros,pêche touristique => pêche otsi,office municipal de tourisme,syndicat d'initiative => office de tourisme
Génération d’un fichier de synonymes ,[object Object],[object Object],< skos:Concept rdf:about =&quot; http://thes.world-tourism.org#VACANCES &quot;>     < skos:altLabel  xml:lang =&quot; en &quot;> long stays </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> marché des vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> genre de vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> long séjour </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; en &quot;> holiday markets </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; en &quot;> vacations </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; es &quot;> mercado de vacaciones </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> activité de vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> type de vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; en &quot;> holiday tourism </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> congés payés </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; es &quot;> estancia larga </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> 06.09 </ skos:altLabel >       < skos:broader   rdf:resource =&quot; http://thes.world-tourism.org#FLUX_TOURISTIQUE &quot; />       < skos:inScheme   rdf:resource =&quot; http://thes.world-tourism.org#_06_FLUX_TOURISTIQUE &quot; />       <!-- … -->       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#VACANCES_D'HIVER &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#VACANCES_D'ETE &quot; />       < skos:prefLabel  xml:lang =&quot; en &quot;> HOLIDAYS </ skos:prefLabel >       < skos:prefLabel  xml:lang =&quot; fr &quot;> VACANCES </ skos:prefLabel >       < skos:prefLabel  xml:lang =&quot; es &quot;> VACACIONES </ skos:prefLabel >   </ skos:Concept > … Activités nautiques HOLIDAYS,VACANCES,long stays,marché des vacances,genre de vacances,long séjour,holiday markets,vacations,activité de vacances,type de vacances,holiday tourism,congés payés,06.09 KOREA DPR,COREE RDP,20.03.05.03 TOURISM IN NATIONAL ECONOMIES,TOURISME DANS L'ECONOMIE NATIONALE,04.04.04,place du tourisme dans l'économie …
Résultat
Au moment de l’indexation ou de la recherche ? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Étendre ou ne pas étendre ? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],spectacle,attraction,show pêche,pêche à la ligne,permis de pêche,article de pêche,pêche au gros,pêche touristique office de tourisme,otsi,office municipal de tourisme,syndicat d'initiative attraction,show => spectacle pêche à la ligne,permis de pêche,article de pêche,pêche au gros,pêche touristique => pêche otsi,office municipal de tourisme,syndicat d'initiative => office de tourisme attraction,show,spectacle => http://thes.world-tourism.org#SPECTACLE pêche, pêche à la ligne,permis de pêche,article de pêche,pêche au gros,pêche touristique => http://thes.world-tourism.org#PECHE office de tourisme, otsi,office municipal de tourisme,syndicat d'initiative => http://thes.world-tourism.org#OFFICE_DE_TOURISME
Des approches mixtes ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
2 : enrichissement avec des traductions ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],… achat,purchase,compra mosaïque,mosaic,mosaico station de montagne,mountain resort,centro turístico de montaña … < rdf:Description rdf:about =&quot; concept/10910 &quot;>     < skos:prefLabel  xml:lang =&quot; fr &quot;> station de montagne </ skos:prefLabel >       < skos:prefLabel  xml:lang =&quot; en &quot;> mountain resort </ skos:prefLabel >       < skos:prefLabel  xml:lang =&quot; es &quot;> centro turistico de montana </ skos:prefLabel >   </ rdf:Description > < fieldType name =&quot; text &quot;  class =&quot; solr.TextField &quot;  positionIncrementGap =&quot; 100 &quot;> < analyzer type =&quot; index &quot;>      < filter   class =&quot; solr.SynonymFilterFactory &quot;  synonyms =&quot; synonyms.txt &quot;  ignoreCase =&quot; true &quot;  expand =&quot; true &quot; />       < filter   class =&quot; solr.SynonymFilterFactory &quot;  synonyms =&quot; gemet.txt &quot;  ignoreCase =&quot; true &quot;  expand =&quot; true &quot; /> </ analyzer > <!-- … --> </ fieldType >
Résultat
!? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],… achat,purchase,compra mosaïque , mosaic ,mosaico station de montagne,mountain resort,centro turístico de montaña … ARTISANAT,vitrail,orfèvrerie,mécanique,dentelle,plomberie,tapisserie,ébénisterie, mosaïque ,modélisme,tissage,porcelaine,crafts,artisanat d'art,menuiserie,cristallerie,joaillerie,émaux,peinture sur soie, poterie
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
3 : enrichissement avec les termes spécifiques ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],Génération du fichier de termes spécifiques < skos:Concept rdf:about =&quot; http://thes.world-tourism.org#LOISIRS &quot;>     < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#LOISIRS_DE_PLEIN_AIR &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#SORTIE &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#LOISIRS_D'INTERIEUR &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#OISIVETE &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#LOISIRS_CULTURELS &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#JEU &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#ARTISANAT &quot; />       < skos:prefLabel  xml:lang =&quot; fr &quot;> LOISIRS </ skos:prefLabel >   </ skos:Concept > < skos:Concept rdf:about =&quot; http://thes.world-tourism.org#LOISIRS_CULTURELS &quot;>     < skos:altLabel  xml:lang =&quot; fr &quot;> loisirs artistiques </ skos:altLabel >       < skos:broader   rdf:resource =&quot; http://thes.world-tourism.org#LOISIRS &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#PEINTURE &quot; />       < skos:prefLabel  xml:lang =&quot; fr &quot;> LOISIRS CULTURELS </ skos:prefLabel >   </ skos:Concept > < skos:Concept rdf:about =&quot; http://thes.world-tourism.org#PEINTURE &quot;>     < skos:altLabel  xml:lang =&quot; fr &quot;> 09.03.07 </ skos:altLabel >       < skos:broader   rdf:resource =&quot; http://thes.world-tourism.org#LOISIRS_CULTURELS &quot; />       < skos:prefLabel  xml:lang =&quot; fr &quot;> PEINTURE </ skos:prefLabel >   </ skos:Concept > RESEAU => TRAFIC,TRANSPORT PEINTURE => LOISIRS CULTURELS,LOISIRS FETE => MANIFESTATION CULTURELLE,MANIFESTATION TOURISTIQUE TRANSPORT FLUVIAL => MODE DE TRANSPORT,TRANSPORT
Résultat
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
4 : correction orthographique ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Spellchecking à base d’une liste contrôlée ,[object Object],< config > < searchComponent name =&quot; spellcheck &quot;  class =&quot; solr.SpellCheckComponent &quot;>     < str name =&quot; queryAnalyzerFieldType &quot;> textSpell </ str >   < lst name =&quot; spellchecker &quot;>     < str name =&quot; name &quot;> default </ str >       < str name =&quot; field &quot;> name </ str >       < str name =&quot; spellcheckIndexDir &quot;> ./spellchecker </ str >       </ lst > < lst name =&quot; spellchecker &quot;>     < str name =&quot; classname &quot;> solr.FileBasedSpellChecker </ str >       < str name =&quot; name &quot;> file </ str >       < str name =&quot; sourceLocation &quot;> spellcheck.txt </ str >       < str name =&quot; characterEncoding &quot;> UTF-8 </ str >       < str name =&quot; accuracy &quot;> 0.8 </ str >       < str name =&quot; spellcheckIndexDir &quot;> ./spellcheckerFile </ str >       </ lst > </ searchComponent > < requestHandler name =&quot; standard &quot;  class =&quot; solr.SearchHandler &quot;  default =&quot; true &quot;> < lst name =&quot; defaults &quot;>    < str name =&quot; echoParams &quot;> explicit </ str >       < str name =&quot; spellcheck.onlyMorePopular &quot;> false </ str >       < str name =&quot; spellcheck.extendedResults &quot;> false </ str >       < str name =&quot; spellcheck.count &quot;> 1 </ str >     </ lst > < arr name =&quot; last-components &quot;>     < str > spellcheck </ str >       </ arr > </ requestHandler > </ config >
Génération du fichier spellcheck.txt ,[object Object],< skos:Concept rdf:about =&quot; http://thes.world-tourism.org#VACANCES &quot;>     < skos:altLabel  xml:lang =&quot; en &quot;> long stays </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> marché des vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> genre de vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> long séjour </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; en &quot;> holiday markets </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; en &quot;> vacations </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; es &quot;> mercado de vacaciones </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> activité de vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> type de vacances </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; en &quot;> holiday tourism </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> congés payés </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; es &quot;> estancia larga </ skos:altLabel >       < skos:altLabel  xml:lang =&quot; fr &quot;> 06.09 </ skos:altLabel >       < skos:broader   rdf:resource =&quot; http://thes.world-tourism.org#FLUX_TOURISTIQUE &quot; />       < skos:inScheme   rdf:resource =&quot; http://thes.world-tourism.org#_06_FLUX_TOURISTIQUE &quot; />       <!-- … -->       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#VACANCES_D'HIVER &quot; />       < skos:narrower   rdf:resource =&quot; http://thes.world-tourism.org#VACANCES_D'ETE &quot; />       < skos:prefLabel  xml:lang =&quot; en &quot;> HOLIDAYS </ skos:prefLabel >       < skos:prefLabel  xml:lang =&quot; fr &quot;> VACANCES </ skos:prefLabel >       < skos:prefLabel  xml:lang =&quot; es &quot;> VACACIONES </ skos:prefLabel >   </ skos:Concept > ORGANISMO DE CREDITO 14.11.02 Activités nautiques HOLIDAYS VACANCES VACACIONES marché des vacances genre de vacances long séjour activité de vacances type de vacances congés payés 06.09 KOREA DPR …
Résultat
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
5 : structurer sémantiquement le contenu  ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Catalogue structuré en RDF
Configuration du schema d’indexation ,[object Object],[object Object],    < field   name =&quot; Mot_Cle_103696 &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; animaux_acceptes &quot;  multiValued =&quot; false &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; bassin_touristique_at &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; bordereau_Tourinfrance_103952 &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; commune_at &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; zone_geographique_at &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; paiement_accepte &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; label_at &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; langue_parlee &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; type_h &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; classement &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; tarif_nuit_mini &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />
Résultat : facettes
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
7 : classification dynamique du contenu ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
ITM-rules : création des règles
Définition de règles : format ,[object Object],[object Object],< skos:Concept  rdf:about =&quot; itm:n#_migration_taxo_106544 &quot;>     < skos:prefLabel  xml:lang =&quot; fr &quot;> Raffiné </ skos:prefLabel >       < skos:definition > PREFIX r: <itm:n#> PREFIX q:  http://www.nievre-tourisme.com/onto# CONSTRUCT { ?SEARCHED_TOPIC <http://purl.org/dc/terms/subject> r:_migration_taxo_106544 .} WHERE { ?SEARCHED_TOPIC a q:Hebergement . ?SEARCHED_TOPIC q:classement q:class_CAT4 . } </ skos:definition >       < skos:definition > PREFIX j: <itm:n#> PREFIX i:  http://www.nievre-tourisme.com/onto# CONSTRUCT { ?SEARCHED_TOPIC <http://purl.org/dc/terms/subject> j:_migration_taxo_106544 .} WHERE { ?SEARCHED_TOPIC a i:Hebergement . ?SEARCHED_TOPIC i:classement i:class_4EP . } </ skos:definition >   </ skos:Concept >
Content-classifier : Execution des règles 26/10/11 Taxonomy (Classification Rules) SKOS + SPARQL Classification engine RDF Content Metadata … Classification Metadata … ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],?x is a <Hotel>  and price(?x) < 50 ?x is a <Camping>  and size(?x) > 300 … Terminology SKOS + RDF Content classified with additionnal  dcterms:subject  and  dc:subject  properties
Le catalogue classifié avec des métadonnées supplémentaires
Champs d’index supplémentaires pour les nouvelles classifications ,[object Object],[object Object],    < field   name =&quot; taxo_confort &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />       < field   name =&quot; taxo_generale &quot;  multiValued =&quot; true &quot;  type =&quot; string &quot;  indexed =&quot; true &quot;  stored =&quot; true &quot; />
Classification dynamique : Résultat
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
8 : utilisation d’alignements de référentiels ,[object Object],[object Object],[object Object],GEMET Alignement des thesaurus OMT
ITM-align : Création des alignements
Format des alignements < map > < Cell rdf:about =&quot; 150046 &quot;> < entity1 >     < edoal:Class   rdf:about =&quot; http://eurlex-directory-codes.europa.eu/0350 &quot; />       </ entity1 > < entity2 >     < edoal:Class   rdf:about =&quot; http://eurovoc.europa.eu/2897 &quot; />       </ entity2 >     < relation > fr.inrialpes.exmo.align.impl.rel.EquivRelation </ relation >       < measure rdf:datatype =&quot; http://www.w3.org/2001/XMLSchema#float &quot;> 1.0 </ measure >       </ Cell > </ map > < map > < Cell rdf:about =&quot; 152849 &quot;> < entity1 >     < edoal:Class   rdf:about =&quot; http://eurlex-directory-codes.europa.eu/0350 &quot; />       </ entity1 > < entity2 >     < edoal:Class   rdf:about =&quot; http://eurovoc.europa.eu/2479 &quot; />       </ entity2 >     < relation > fr.inrialpes.exmo.align.impl.rel.EquivRelation </ relation >       < measure rdf:datatype =&quot; http://www.w3.org/2001/XMLSchema#float &quot;> 1.0 </ measure >       </ Cell > </ map > Concepts alignés Type de la relation Score Format « EDOAL » de l’INRIA : http://alignapi.gforge.inria.fr/edoal.html
Utilisation des alignements ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Alignements des référentiels : résultat Facette sur l’annotation du thesaurus de départ Facette sur les concepts traduits par l’alignement
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Désambiguïsation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Désambiguïsation : principe 1. Utilisation du référentiel à l’indexation 2. Indexation du référentiel 3. Désambiguïsation du terme vers une entité contrôlée 4. Recherche sur l’identifiant de l’entité contrôlée doc2 http://www.z.fr/e1 doc1 http://www.z.fr/e1 http://www.z.fr/e2 cupidon http://www.z.fr/e1 venus
Désambiguïsation : Résultat
Plan ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Merci de votre attention ! [email_address]

Contenu connexe

Similaire à Enrichissement des moteurs de recherche: technologie

RDFa, comment insuffler un peu d'intelligence à une page Web ?
RDFa, comment insuffler un peu d'intelligence à une page Web ?RDFa, comment insuffler un peu d'intelligence à une page Web ?
RDFa, comment insuffler un peu d'intelligence à une page Web ?Antidot
 
Xquery
XqueryXquery
Xquerysamir
 
Domi code-igniter-4 i18-n
Domi code-igniter-4 i18-nDomi code-igniter-4 i18-n
Domi code-igniter-4 i18-nAFPA
 
Formation pour les bibliothécaires: RSS
Formation pour les bibliothécaires: RSSFormation pour les bibliothécaires: RSS
Formation pour les bibliothécaires: RSSNicolas Morin
 
Web sémantique et Ecommerce
Web sémantique et EcommerceWeb sémantique et Ecommerce
Web sémantique et EcommerceAntidot
 
Apprendre Solr en deux heures
Apprendre Solr en deux heuresApprendre Solr en deux heures
Apprendre Solr en deux heuresSaïd Radhouani
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueAntidot
 
Présentation travelport journée-xft+jg+2011-03-29
Présentation travelport journée-xft+jg+2011-03-29Présentation travelport journée-xft+jg+2011-03-29
Présentation travelport journée-xft+jg+2011-03-29eXchange For Travel (XFT)
 
Comprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de venteComprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de venteeXchange For Travel (XFT)
 
Comprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de venteComprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de venteeXchange For Travel (XFT)
 
Site Web Centrale Eco
Site Web   Centrale EcoSite Web   Centrale Eco
Site Web Centrale Ecom.dubucq
 
Dublin core : raffinements
Dublin core : raffinementsDublin core : raffinements
Dublin core : raffinementsLyrae
 
Présentation petit déjeuner a la découverte du xft 2012 01-12
Présentation petit déjeuner a la découverte du xft 2012 01-12Présentation petit déjeuner a la découverte du xft 2012 01-12
Présentation petit déjeuner a la découverte du xft 2012 01-12jguivarch
 
Referencement et performance pour sites E-commerce
Referencement et performance pour sites E-commerceReferencement et performance pour sites E-commerce
Referencement et performance pour sites E-commerceMohammed ALAMI ✅
 
Oxalide Workshop #3 - Elasticearch, an overview
Oxalide Workshop #3 - Elasticearch, an overviewOxalide Workshop #3 - Elasticearch, an overview
Oxalide Workshop #3 - Elasticearch, an overviewLudovic Piot
 

Similaire à Enrichissement des moteurs de recherche: technologie (20)

Comité technique XFT 2011-01-11
Comité technique XFT 2011-01-11Comité technique XFT 2011-01-11
Comité technique XFT 2011-01-11
 
RDFa, comment insuffler un peu d'intelligence à une page Web ?
RDFa, comment insuffler un peu d'intelligence à une page Web ?RDFa, comment insuffler un peu d'intelligence à une page Web ?
RDFa, comment insuffler un peu d'intelligence à une page Web ?
 
Xquery
XqueryXquery
Xquery
 
Domi code-igniter-4 i18-n
Domi code-igniter-4 i18-nDomi code-igniter-4 i18-n
Domi code-igniter-4 i18-n
 
Formation pour les bibliothécaires: RSS
Formation pour les bibliothécaires: RSSFormation pour les bibliothécaires: RSS
Formation pour les bibliothécaires: RSS
 
Web sémantique et Ecommerce
Web sémantique et EcommerceWeb sémantique et Ecommerce
Web sémantique et Ecommerce
 
Apprendre Solr en deux heures
Apprendre Solr en deux heuresApprendre Solr en deux heures
Apprendre Solr en deux heures
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 
Présentation travelport journée-xft+jg+2011-03-29
Présentation travelport journée-xft+jg+2011-03-29Présentation travelport journée-xft+jg+2011-03-29
Présentation travelport journée-xft+jg+2011-03-29
 
Comprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de venteComprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de vente
 
Comprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de venteComprendre le langage xft avec le processus de vente
Comprendre le langage xft avec le processus de vente
 
Site Web Centrale Eco
Site Web   Centrale EcoSite Web   Centrale Eco
Site Web Centrale Eco
 
Dublin core : raffinements
Dublin core : raffinementsDublin core : raffinements
Dublin core : raffinements
 
Présentation petit déjeuner a la découverte du xft 2012 01-12
Présentation petit déjeuner a la découverte du xft 2012 01-12Présentation petit déjeuner a la découverte du xft 2012 01-12
Présentation petit déjeuner a la découverte du xft 2012 01-12
 
Referencement et performance pour sites E-commerce
Referencement et performance pour sites E-commerceReferencement et performance pour sites E-commerce
Referencement et performance pour sites E-commerce
 
Paris Web
Paris WebParis Web
Paris Web
 
Introduction à PHP
Introduction à PHPIntroduction à PHP
Introduction à PHP
 
Association 2 0
Association 2 0Association 2 0
Association 2 0
 
HTML
HTMLHTML
HTML
 
Oxalide Workshop #3 - Elasticearch, an overview
Oxalide Workshop #3 - Elasticearch, an overviewOxalide Workshop #3 - Elasticearch, an overview
Oxalide Workshop #3 - Elasticearch, an overview
 

Plus de mondeca

Data2Ontology
Data2OntologyData2Ontology
Data2Ontologymondeca
 
T2 m mondeca vfinale
T2 m mondeca vfinaleT2 m mondeca vfinale
T2 m mondeca vfinalemondeca
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...mondeca
 
Rendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audienceRendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audiencemondeca
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?mondeca
 
Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012mondeca
 
Smart Content Factory
Smart Content FactorySmart Content Factory
Smart Content Factorymondeca
 
Raisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examplesRaisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examplesmondeca
 

Plus de mondeca (8)

Data2Ontology
Data2OntologyData2Ontology
Data2Ontology
 
T2 m mondeca vfinale
T2 m mondeca vfinaleT2 m mondeca vfinale
T2 m mondeca vfinale
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
 
Rendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audienceRendez vos contenus plus intelligents et développez votre audience
Rendez vos contenus plus intelligents et développez votre audience
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?
 
Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012Mondeca SmartContentFactory MIS2012
Mondeca SmartContentFactory MIS2012
 
Smart Content Factory
Smart Content FactorySmart Content Factory
Smart Content Factory
 
Raisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examplesRaisonnement pour le web sémantique : examples
Raisonnement pour le web sémantique : examples
 

Enrichissement des moteurs de recherche: technologie

  • 1. Enrichissement des moteurs de recherche à partir de connaissances métier Mondeca thomas.francart@mondeca.com
  • 2. A l’intersection entre les problématiques Amélioration de la recherche grâce au référentiel métier Univers du Document Structuration sémantique du contenu Indexation intelligente du contenu sur sa structure Univers de la recherche Univers de la connaissance
  • 3. Cas LERUDI Univers du Document Univers de la connaissance Outil de gestion de contenu WCM AFS ITM SDK Univers de la recherche
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9. Point de départ : une indexation simple des sites web – sans enrichissement
  • 10.
  • 11.
  • 12.
  • 13.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 21.
  • 22.
  • 23.
  • 24.
  • 26.
  • 27.
  • 28.
  • 29.
  • 31.
  • 32.
  • 34.
  • 36.
  • 37.
  • 38. ITM-rules : création des règles
  • 39.
  • 40.
  • 41. Le catalogue classifié avec des métadonnées supplémentaires
  • 42.
  • 44.
  • 45.
  • 46. ITM-align : Création des alignements
  • 47. Format des alignements < map > < Cell rdf:about =&quot; 150046 &quot;> < entity1 >   < edoal:Class rdf:about =&quot; http://eurlex-directory-codes.europa.eu/0350 &quot; />   </ entity1 > < entity2 >   < edoal:Class rdf:about =&quot; http://eurovoc.europa.eu/2897 &quot; />   </ entity2 >   < relation > fr.inrialpes.exmo.align.impl.rel.EquivRelation </ relation >   < measure rdf:datatype =&quot; http://www.w3.org/2001/XMLSchema#float &quot;> 1.0 </ measure >   </ Cell > </ map > < map > < Cell rdf:about =&quot; 152849 &quot;> < entity1 >   < edoal:Class rdf:about =&quot; http://eurlex-directory-codes.europa.eu/0350 &quot; />   </ entity1 > < entity2 >   < edoal:Class rdf:about =&quot; http://eurovoc.europa.eu/2479 &quot; />   </ entity2 >   < relation > fr.inrialpes.exmo.align.impl.rel.EquivRelation </ relation >   < measure rdf:datatype =&quot; http://www.w3.org/2001/XMLSchema#float &quot;> 1.0 </ measure >   </ Cell > </ map > Concepts alignés Type de la relation Score Format « EDOAL » de l’INRIA : http://alignapi.gforge.inria.fr/edoal.html
  • 48.
  • 49. Alignements des référentiels : résultat Facette sur l’annotation du thesaurus de départ Facette sur les concepts traduits par l’alignement
  • 50.
  • 51.
  • 52. Désambiguïsation : principe 1. Utilisation du référentiel à l’indexation 2. Indexation du référentiel 3. Désambiguïsation du terme vers une entité contrôlée 4. Recherche sur l’identifiant de l’entité contrôlée doc2 http://www.z.fr/e1 doc1 http://www.z.fr/e1 http://www.z.fr/e2 cupidon http://www.z.fr/e1 venus
  • 54.
  • 55. Merci de votre attention ! [email_address]