Chapitre 2 : fondations et analyses de données géotechniques
Tendances et innovation des outils de recherche
1. Tendances et innovations des outils et
méthodes de Recherche d’Informations
Jérémy Marteau
Promo EI4 IDI 2014-2015 Richard Paquereau
2. Sommaire
I. Préambule
1. Histoire des méthodes et outils de Recherche d’Informations (RI)
2. Définition de l’internet
3. Définition de la Recherche d’Informations
II. Les outils de RI actuels
1. Introduction des outils
2. Présentation des outils
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
2. Les tendances futures
IV.Présentation d’outils
1. Présentation d’un moteur graphique
2. Présentation d’un moteur « vidéographique »
V. Conclusion
VI.Bibliographie 2
3. 1. Histoire des méthodes et outils de Recherche d’Informations
• D’une rareté à une abondance des outils de RI.
• Création de la RI en 1950 suite à une explosion de l’information.
• RI = « Information retrieval » Nom donné par Calvin N. Mooers.
• Aujourd’hui des milliers d’outils de RI sont disponibles.
• Popularité Pertinence
3
I. Préambule
4. 2. Définition de l’internet
• Système de mise en réseau à grande échelle.
Echange d’informations sur le World Wide Web.
• Informations de tout le monde pour tout le monde.
• Les grands problèmes de l’internet :
• Validation des information.
• Surabondance des informations.
• Traçabilité des données.
4
I. Préambule
5. 3. Définition de la Recherche d’Informations (RI)
• Internet Utilisateurs face à un « Déluge informationnel ».
• Des outils ont été mis en place pour répondre à la question :
Comment mieux exploiter et gérer les informations ?
5
I. Préambule
6. II. Les outils de RI actuels
Nous pouvons distinguer quatre modalités de recherche l’information:
• La navigation arborescente (dans les annuaires thématiques, classifications)
• La navigation hypertextuelle (dans les sites web, encyclopédies)
• Recherche par requêtes ou mots-clés (bases de données, moteurs de
recherche)
• Recherche par requêtes de contenu (recherche en texte intégral, moteurs de
recherches)
6
7. II. Les outils de RI actuels
Les signets de la Bibliothèque Nationale de France (BNF)
• Annuaire de sites enrichis par des professionnels
• Plusieurs langues
• Richesses de domaines
7
8. II. Les outils de RI actuels
Les signets de la Bibliothèque Nationale de France (BNF)
8
9. II. Les outils de RI actuels
Les annuaires
• Saisis de mots clefs
• Analyse les descriptions des sites et non les contenus de ces sites en question
• Classement ordonné en catégories et sous-catégories
• Principalement géré par des cyber-documentalistes
• Mise à jour moins rapide
• En voie de disparition
9
10. Les moteurs de recherche
10
II. Les outils de RI actuels
11. Les moteurs de recherche
• Saisis de mots clefs
• Analyse du texte intégral
• Mise à jour rapide
• Classement pas toujours pertinent
• Tendance de personnalisation
11
II. Les outils de RI actuels
12. Les métamoteurs de recherche
• Interrogent plusieurs moteurs de recherche
• Affichage personnalisé (possibilité de cartographie )
• Absence du paramètre « Recherche avancée»
12
II. Les outils de RI actuels
14. Les bases de données
• Principalement une base de données par thème/domaine
• Classement ordonné
• Web invisible
14
II. Les outils de RI actuels
15. Intégration des techniques du TAL (Traitement Automatique des langues)
• ANALYSE MORPHOLOGIQUE :
• Reconnaissance de mots
• Aucuns pièges de langage n’est éliminé
• Ça induit des bruits considérables
15
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
4 niveaux d’analyse linguistiques automatisées
16. Intégration des techniques du TAL (Traitement Automatique des langues)
• ANALYSE lexicale :
• Réduire un mot à sa racine Lemmatisation
• Permet de chercher les déclinaisons d’un terme
16
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
4 niveaux d’analyse linguistiques automatisées
17. Intégration des techniques du TAL (Traitement Automatique des langues)
• ANALYSE syntaxique :
• Reconnaissance d’expression er de groupes nominaux
• Peut servir à générer des mots-clés
17
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
4 niveaux d’analyse linguistiques automatisées
18. Intégration des techniques du TAL (Traitement Automatique des langues)
• ANALYSE sémantique :
• Fonctionne par compréhension de la signification d’un texte
• Liée au projet du Web sémantique
18
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
Le Web actuel est prisonnier d’un paradoxe :
« l’information et les services sur le Web sont aujourd’hui peu exploitables par
des machines… mais de moins en moins exploitables sans l’aide des machines. »
Philippe Loblet
4 niveaux d’analyse linguistiques automatisées
19. Progrès dans les fonctionnalités de recherche et de filtrage
de l’information
19
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
• Concerne les interfaces de requête
22. 22
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
Diversification des méthodes de classement et de présentation
des résultats
3 innovations importantes
• LA CATÉGORISATION DES RÉSULTATS :
• Classer les résultats trouvés dans des catégories
23. 23
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
Diversification des méthodes de classement et de présentation
des résultats
3 innovations importantes
• LES RÉSEAUX SÉMANTIQUES :
• Manière graphique de présenter les résultats
25. 25
III. Les nouveaux outils de RI
1. Présentation des 3 grands domaines d’évolution
Diversification des méthodes de classement et de présentation
des résultats
• L’ANALYSE DE CONTENUS :
• Création automatique de fiche récapitulative d’une synthèse
de l’info de chaque résultats de la recherche
26. Les innovations technologiques
• Changement des données d’entrée
• Changement des interfaces
• Le World Wide Wear
• Automatisation de la veille
• Les outils de recherche d’images
• Les outils de recherche de vidéos/ de sons
• Numérisation des bibliothèques
• La lecture connectée
26
III. Les nouveaux outils de RI
2. Les tendances futures
27. La gestion du Big Data
• Conception d’outils collaboratifs
• Intelligence collaborative
27
III. Les nouveaux outils de RI
2. Les tendances futures
28. III. Les nouveaux outils de RI
Les professionnels de la recherche d’information
• Du documentaliste vers le cyber-documentaliste
• Formation aux nouveaux outils, à la collaboration
• Formation à la veille automatisée
• Création de cabinets de veille
28
2. Les tendances futures
29. Carrot² : Un moteur graphique
• Moteur de recherche en ligne
• Permet de trier et regrouper les
résultats sous différents thèmes
• Facilité d’utilisation
• Rapidité des résultats
• Ludique et interactif
• Possibilité du choix du moteur de
recherche
• Pertinence des résultats
• 2 formes de graphiques possibles
29
IV. Présentation d’outils
30. Carrot² : Un moteur graphique
30
IV. Présentation d’outils
31. Blinkx video : Un moteur « vidéographique »
• Moteur de recherche en ligne
• Permet d’analyser le contenu des
vidéos
• Facilité d’utilisation
• Rapidité des résultats
• Nombre et qualité des sources • Classement des vidéos
• Pertinence des résultats
• Sources principalement anglophones
• Absence de gestion des opérateurs
booléens
31
IV. Présentation d’outils
32. Blinkx video : Un moteur « vidéographique »
32
IV. Présentation d’outils
33. • Nous sommes à un tournant de la recherche d’information avec les objets
connectés
• Les Big Data vont changer les modes de penser
• La recherche d’information a encore de l’avenir et va prendre encore plus
d’importance qu’aujourd’hui
• Pourquoi un outil a t-il du succès ou non ?
• La supériorité de Google
33
V. Conclusion
34. VI. La bibliographie
Les signets de la BNF
http://chroniques.bnf.fr/numero_courant/reseaux/signets_bnf.htm
http://signets.bnf.fr/accueil.html
Les annuaires
http://branchez-vous.com/2014/09/30/yahoo-debranchera-son-annuaire-du-web/
https://dir.yahoo.com/
Moteurs de recherches
http://www.exalead.com/search/
http://fr.slideshare.net/URFISTParis/evolution-des-moteurs-de-recherche-sur-internet
Metamoteur
http://lookahead.surfwax.com/index-2011.html
http://www.polymeta.com/
Bases de données:
http://www.legifrance.gouv.fr/
Les googlesglass:
http://www.protegez-vous.ca/technologie/google-glass-verres-futes.html
Big Data
http://www.visibility.fr/366-big-data-de-mad-men-a-math-men/
Blinkx : http://www.blinkx.com/
Documentaliste Sciences de l’information - Décembre 2013 – « L’information: quels
scénarios dans 50 ans ?
Histoire recherche d’info :
http://www.iro.umontreal.ca/~nie/IFT6255/historique-RI.html
FAQ concernant la Recherche d’info :
http://docs.abondance.com/faq_recherche.html#q1
Explication extrêmement complète avec très bon contenu :
http://www.cndp.fr/savoirscdi/societe-de-linformation/tic-et-documentation/veille-technologique/
la-recherche-dinformation/recherche-dinformation-sur-internet-ou-en-sommes-
nous-ou-allons-nous.html#c3384
Explication extrêmement complète de la RI avec liens vers les outils de recherche :
http://eduscol.education.fr/numerique/dossier/competences/rechercher/@@documen
t_whole2
Explications basiques de la RI :
http://www2.ac-lyon.fr/etab/lycees/lyc-
42/pcoton/cdi/rechercher%20sur%20internet.html
http://www.netpublic.fr/2014/04/recherche-d-information-comment-trouver-des-resultats-
pertinents-sur-le-web-formation-en-ligne/
34
A la création d’internet distinction aisée entre les outils annuaires- moteur de recherche
Aujourd’hui => plus difficile
110 bibliothécaires de l’établissement.
Référencement de sites de qualités, sources sûres
110 bibliothécaires de l’établissement.
Référencement de sites de qualités, sources sûres
Analyse des descriptions => principale diff avec les moteurs de recherche
Fermeture de Yahoo 31 dec 2014
Les plus connus : yahoo, looksmart, le guide de voila, l’annuaire de Lycos France
Utilisent des robots logiciels (spiders) pour scruter le web, aller de lien en lien et sauvegarde le contenus des textes au fur et à mesure des pages rencontrées
Constitution d’un index
Le moteur de recherche va rechercher les occurrences dan son index
Classement google => Par les lien pointant vers la page
Personnalisation d’après des prefs, historiques => Pertinence de l’info ??
Google/Voila/AltaVista/Exalead => Plus axé sur le web français
De moins en moins de résultats commun entre les diff moteurs
Utilisent des robots logiciels (spiders) pour scruter le web, aller de lien en lien et sauvegarde le contenus des textes au fur et à mesure des pages rencontrées
Constitution d’un index
Le moteur de recherche va rechercher les occurrences dan son index
Classement google => Par les lien pointant vers la page
Personnalisation d’après des prefs, historiques => Pertinence de l’info ??
Google/Voila/AltaVista/Exalead => Plus axé sur le web français
De moins en moins de résultats commun entre les diff moteurs
Pas de recherche avancée car ça varie trop entre les différents moteurs de recherche
Polymeta, Dogpile, Surfwax
Self driving vehicle (si clic sur 1 cat seul ces résultats sont affichés )
Pas de recherche avancée car ça varie trop entre les différents moteurs de recherche
Polymeta, Dogpile, Surfwax
Self driving vehicle (si clic sur 1 cat seul ces résultats sont affichés )
Web of science, science direct, technique de l’ingénieur , LegiFrance (constitution, déclaration des droits de l’homme) , espacenet, les dictionnaires
BU
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Suppression des claviers et souris pour les remplacer par la pensée
Les outils devront donc être capable d’analyser les pensées
Démocratisation des appareils mobile (smartphone, tablette)
De plus en plus de recherche sont effectuées sur ces supports
Démocratisation des googleglass
Explosion du nombre d’objets connectés (voitures, montre, frigos…) => Plus de données à gérer
Définir les objectifs et les outils de veille vont proposer des scénarios argumentés
Etre plusieurs à chercher les informations dans le but de mieux les comprendre et de pouvoir les analyser plus efficacement
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information
Cliché du documentaliste seul / rats de bibliothèque
Transfert du pouvoir de la personne qui sait à la personne qui sait chercher l’information