1. CNRS
Maxime Ragot
Marc Roux
Direction IST (DIST)
Plateforme ISTEX : contenus et services associés
La plateforme ISTEX [https://www.istex.fr/] propose un accès à une collection
pluridisciplinaire de 22 millions de documents pour l’ensemble des établissements de
l’ESR français.
Les ressources proviennent de plus de 50 éditeurs scientifiques (internationaux,
généralistes, spécialisés et agrégateurs) et ont été acquises sans date limite d’accès et
d’exploitation.
Le développement de solutions automatiques a permis d’enrichir et d’uniformiser
l’ensemble des ressources afin d’interroger très finement l’intégralité de la base.
Les ressources ISTEX sont signalées sur les différentes plateformes de consultations (HAL,
Pubmed, BibCNRS, etc.). L’installation de l’extension navigateur ISTEX sur Firefox et
Google Chrome permet d’afficher un bouton « ISTEX » pour toute page web consultée
(Google Scholar, Wikipédia, etc.) affichant un numéro DOI/PMID correspondant à un
article de la base ISTEX.
La base de données textuelle que constitue ISTEX avec des documents bien structurés,
des données enrichies et qualifiées permet à des outils d’analyse ou de fouille de texte de
s’y nourrir. Plusieurs outils de visualisation dynamique sont directement connectés à la
base ISTEX comme Carto ISTEX [https://carto.istex.fr/] (axé sur les affiliations), Cillex
[http://cillex.padagraph.io/ ] (axé sur les métadonnées structurées) et Gargantext
[https://gargantext.org/] (axé sur la terminologie).
L’infrastructure collaborative Visa TM [https://www.inist.fr/projets/visa-tm/] (projet
d’instance française d’OpenMinTeD) [http://openminted.eu/] s’ouvre sur la fouille de
contenus en analysant un corpus extrait ISTEX à partir de logiciels adaptés à chaque
référentiel disciplinaire.
2. L’excellence documentaire pour tous
ANR-10-IDEX-0004-02
WWW.ISTEX.FR
USAGE DOCUMENTAIRE
USAGE POUR L’EXPLORATION DE CORPUS
« TEXT & DATA MINING »
GUIDE
ISTEX
CONTACT
TECHNIQUE
BLOG
TECHNIQUE
COMPTE
TWITTER
@istex_plateformcontact@listes.istex.frblog.istex.frdoc.istex.fr
DEMO
ISTEX
demo.istex.fr
La plateforme ISTEX rassemble près de
22 millions de documents provenant
de plus de 50 éditeurs de 1473 à 2017
Outils de cartographie
Visualisation de corpus documentaire
Carto ISTEX
Infrastructure de Text & Data Mining
Interaction entre contenus et applications de TDM
pour favoriser la science ouverte
Vers une infrastructure de services
avancés de text mining
STOCKAGE DE DONNEES
STANDARDISATION
MODS + TEI
ENRICHISSEMENT
INDEXATION & CLASSIFICATION
Bouton Applicatif Widget ISTEX Extension Navigateur