L’exposé porte sur l’illustration par des cas concrets des problèmes qui se posent de nos jours au scientifique dans la gestion de la masse considérable d’information qu’il doit consulter ou générer que sa démarche soit exploratoire (ex: thèse) ou finalisée (ex: projet contractuel).
Zotero avancé - support de formation doctorants SHS 2024
Gérer l’information d’une démarche scientifique
1. Gérer l'information d'une démarche scientifique J-M Monget Mines Paristech - Nov 2011 [email_address] Adresse LinkedIn Adresse Sudoc : PPN=075598078
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
Notas del editor
L’exposé porte sur l’illustration par des cas concrets des problèmes qui se posent de nos jours au scientifique dans la gestion de la masse considérable d’information qu’il doit consulter ou générer que sa démarche soit exploratoire (ex: thèse) ou finalisée (ex: projet contractuel).
Dans l'approche la plus classique, l'information manipulée par le chercheur se trouve localisée dans des textes publiés ou non sur Internet et qui peuvent lui servir : (1) à développer ses connaissances; (2) à suivre l'actualité scientifique; (3) à faire un point exhaustif sur un sujet particulier de recherche. Mais l'information utile à une démarche de recherche se trouve aussi dans une foule d'autres contenus et supports : notes, codes sources de logiciels, fichiers de données structurés ou non, flux d'informations diverses provenant d'Internet, images et vidéos provenant de sources pédagogiques ou non … Comment gérer cet ensemble toujours grandissant d'information au fil de la vie d'un projet ? Comment insérer cette démarche dans un travail d'équipe ? Comment synthétiser cet ensemble pour produire des publications au meilleur standard du domaine et faire reconnaître son expertise ? Tels sont certains des problèmes abordés ici.
Pour naviguer dans l’océan des connaissances disponibles sur Internet tout le monde utilise Google. C’est probablement que sa recherche “plein texte” se révèle pour l’instant plus exploitable que celle par mots clefs. D’autres outils généraux peuvent aussi être utiles (Bing, Exalead). Pour une démarche plus finalisée : moteurs spécialisés (Google Scholar, Google Books). On n’oubliera pas les services multilingue offerts par Google Translate.
Bases de données d’éditeurs (ScienceDirect), bases ouvertes (HAL-SHS) et bases de données bibliométriques (Web of Science, SUDOC).
Mais aussi les exposés et conférences en Powerpoint (SlideShare)mais aussi en vidéo (YouTube ou Vimeo).
Une fois les cibles identifiées, il faut souvent se tenir au courant des nouveautés, des évènements et des démarches des collègues. La veille se fait soit par abonnement à des fils RSS grâce à un intégrateur de type Google Reader ou même par l’entremise des réseaux sociaux tel Twitter et ses “hash tags”.
Face au torrent d’information généré par cette démarche exploratoire comment synthétiser ou à défaut organiser ce que l’on a glané ? Souvent la lecture “en ligne” est brève et sert surtout à naviguer, l’analyse se pratiquant de manière différée sur un fichier pdf, souvent imprimé.. Comment garder une trace de sa démarche au “fil de l’eau” ? Des outils gratuits mais puissants existent : Evernote pour tous types d’extraits
Mais les diverses phases d’un projet de recherche génèrent une quantité encore plus importante de données : mesures expérimentales, notes d’essais, programmation … Le plus souvent ces informations restent cloisonnées. Une solution de gestion globale est possible à l’aide d’un système de type LIMS (Laboratory Information Management System ). Coûteux on les trouve plutôt dans l’industrie. Des solutions ouvertes peuvent être utilisées autour du “Cloud” avec Google Docs comme outil collaboratif ou Amazon pour construire un environnement informatique virtuel Google Fusion Tables
Le mémoire de thèse doit prouver la véracité de la démarche scientifique choisie, sa pertinence et son originalité. C’est le moment du retour aux outils bibliographiques: Google Scolar, Web of Science, Scopus et autres. Attention aux nouveaux outils de l’examinateur: authentification automatisée des notes bibliographiques et détection de plagiat. C’est la rançon du progrès technique … La première communauté à convaincre est celle des « rapporteurs ». Authenticité : ID-SUDOC (Numéro PPN), Autorités, site Web: Linked Data
Zotero pour construire une bibliographie structurée et annotée.
Enfin, le temps de la communication. Faire connaître son travail au sein d’un réseau professionnel (ex: LinkedIn ou Research Gate). Publier des archives ouvertes (HAL-SHS, license Creative Commons) ou des logiciels libres (Plume CNRS, CeCILL INRIA). Il faudra aussi prêter attention à l’archivage de l’ensemble des documents produits pour faciliter la réutilisation des résultats par les génération futures... Pour associer aux informations des méta-données détaillant le contenu et la provenance les outils du web sémantique se développent. La publication en ligne de style “Linked Data” sera peut-être un des défis du futur thésard.