Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...
Cours 10 octobre
1. Des sources pour approfondir le besoin
d‘information
• Les usuels (encyclopédies, dictionnaires, sites portails de référence…)
• Qui sont les spécialistes du domaine ? Ont-ils un site web de référence ?
Noël Uguen, cours L1, Isfec BN, 2017-2018
2. Synthèse : méthodologie de la recherche
d’information
Ensemble des opérations Les écrits de travail liés à la
recherche d’information
STRATEGIE DE RECHERCHE
Définir le besoin
d’information
Carte mentale, tableau, liste
de mots-clés
sélectionner les sources
d’information (« sourcing »)
Carte des sources, tableau
des sources, sitographie
Accéder aux sources
d’information, chercher et
localiser les documents
Requête, équation de
recherche, opérateurs
booléens, filtres…
STRATEGIE D’EVALUATION
Savoir évaluer l’information,
la critiquer Référencement de
l’information
TRAITER L’INFORMATION
Organiser l’information pour
son application pratique
Intégrer de nouvelles
informations dans un corpus
existant de connaissances
Prise de notes, annotation
3. B : Les moteurs de recherche
• Parts de marché
• Fonctionnement
• Le web profond
• La place de Google
• Le pagerank
• Les opérateurs et les filtres de recherche
Noël Uguen, cours L1, Isfec BN, 2017-2018
4. 1.1 : Parts de marché des moteurs
Source : blog du modérateur http://www.blogdumoderateur.com/chiffres-google/
Noël Uguen, cours L1, Isfec BN, 2017-2018
5. 1.2 : Fonctionnement d’un moteur de
recherche
Source : Gaelle Sogliuzzo http://beaumont-redon.fr/wp/cultureinfomedias/
Noël Uguen, cours L1, Isfec BN, 2017-2018
6. Etat des lieux
• Recherche plein texte
• Web visible / web invisible
• Google et le Pagerank
Noël Uguen, cours L1, Isfec BN, 2017-2018
7. 1.3 : Le web profond / invisible
"Distribution des sites du Deep Web par types de contenu » de l'étude Bright Planet.
Les causes de la non indexation des
pages par les moteurs
Noël Uguen, cours L1, Isfec BN, 2017-2018
8. Ce qu’il faut en retenir…
• Avoir conscience des limites d’un moteur de recherche
=> stratégies plurielles
savoir établir un « sourcing » ou inventaire des sources à explorer
importance des catalogues des bases de données
Noël Uguen, cours L1, Isfec BN, 2017-2018
9. 1.4 : Google
Google, créé en 1998
• mode de recherche (AND par défaut)
• simplicité de l’interface (one box) – recherche simple
• données
• Taille de l’index, non communiqué depuis 2005
• ne concerne qu’une partie du web
• 100 milliards de requêtes par mois
• recherche avancée
• classement des résultats
• algorithme tenu secret prenant en compte plusieurs éléments :
• - ordre des mots dans la requête
• - fréquence et place des mots
• - fraîcheur de l’information
• - PageRank (notoriété d’une page grâce aux liens)
pages connues et non les plus pertinentes dans les premiers résultats
prise en compte des nouveaux sites pas encore populaires ?
• Vers une personnalisation des résultats
Noël Uguen, cours L1, Isfec BN, 2017-2018
10. Une interface minimaliste
• Le mode de recherche avancée est disponible seulement lors de
l’affichage des résultats,
• Voir le menu « paramètres »
Noël Uguen, cours L1, Isfec BN, 2017-2018
11. 1.5 : Le pagerank ou indice
de popularité de Google
• « Lorsqu'un document est pointé par de nombreux hyperliens
(popularité de liens), son PageRank augmente. Plus son PageRank est
élevé, plus il aura de chance d'être affiché dans les premiers résultats
d'une recherche. Ce système donne une indication de la
« popularité » du document parmi les autres documents du web ».
• Source : Wikipedia, article Google
Noël Uguen, cours L1, Isfec BN, 2017-2018
12. Origine du Pagerank de Google
• Années 50 et 60, émergence de l’IST et des bases de données
• Travaux d’Eugène Garfield, fondateur de l’ISI et du « science citation
index »
• Idées de Vannevar Bush
=> relations entre articles scientifiques
=> modéliser les réseaux de citations
=> déterminer le facteur d’impact d’un article
Noël Uguen, cours L1, Isfec BN, 2017-2018
14. 1.6 : Les filtres de Google
Source : Urfist Paris
Noël Uguen, cours L1, Isfec BN, 2017-2018
15. Recherche plein texte ou recherche ciblée sur
un champ
• Par défaut le moteur fait la recherche des mots-clés en
« plein texte »
• Option : recherche des mots-clés dans le titre des pages web
• Intitle:
• Allintitle:
• Option : recherche des mots-clés dans l’URL de la page
• Inurl:
• Allinurl:
Noël Uguen, cours L1, Isfec BN, 2017-2018
16. TD1 : filtres de Google
• Télécharger la fiche TD sur le site de la formation
• https://portfolioveille.wordpress.com/