Lyon, 27 novembre 2012 - journée d'étude : "Le moteur de recherche interne, élément clé de l’accès à l’information dans l’entreprise"
Retour d'expérience sur un corpus documentaire semi-structuré : les délibérations de la collectivité
Le moteur de recherche, opportunité pour bâtir une application documentaire
1. Le moteur de recherche :
opportunité pour bâtir
une application documentaire
Retour d'expérience
sur un corpus documentaire semi-structuré
Veille & Documentation 27/11/2012
2. Plan de la présentation
le contexte
institution, corpus documentaire
le projet
antécédents, autres usages du moteur
déroulement, interfaces développées
des focus
• indexation/restitution
• résultats
• facettes
• utilisation du thésaurus
• typologie documentaire
Veille & Documentation 27/11/2012
3. Rhône-Alpes : la région, la Région
La 2ème région de France par sa taille et sa population
Une collectivité territoriale, 2 assemblées :
• Conseil régional (CR)
• Conseil économique social environnemental régional (CESER)
Les compétences : emploi-formation,
lycées, transports, développement
économique…
Budget 2012 : 2,4 Mds €
L’administration : 6600 agents
Veille & Documentation 27/11/2012
4. La délibération, document fondateur
« Le Conseil régional règle par ses délibérations les affaires de
la région» (Art. L. 4221-1 Code Gén. Collectivités Territoriales)
Acte réglementaire, créateur de droits/obligations
Résulte des discussions de l’assemblée
Exécutoire après publication
Effets perpétuels, tant qu’il n’est pas modifié ou abrogé
Veille & Documentation 27/11/2012
5. Les documents
liés aux délibérations
En amont des débats :
- rapports préparatoires (directions),
- comptes-rendus (commissions thématiques),
- avis (CESER)
- droit d’initiative, amendements, questions d’actualité, vœux
(groupes d’élus)
Pendant les débats :
- procès-verbaux (assemblée plénière)
- comptes-rendus (commission permanente)
En aval :
- arrêtés (Président)
Produits à partir de modèles, qui harmonisent a minima leur forme et
posent des règles de rédaction communes
Veille & Documentation 27/11/2012
6. Les faiblesses de l’interface précédente
Application « Rapports et délibérations » sur l’Intranet
(technologie Microsoft Index Server)
Un formulaire multicritères… très critiqué !
- sensible à la casse et l’accentuation
- opérateurs obligatoires (ET, OU, SAUF, PRES)
- résultats peu parlants
- manuel d’utilisation et longues explications en ligne.
Des retours négatifs des usagers finaux, contraints de faire appel
aux documentalistes pour trouver le bon document
Un mode de recherche présupposant que l’utilisateur « sait » :
ce qu’il cherche précisément et comment l’exprimer
Veille & Documentation 27/11/2012
8. Le moteur FAST
à la Région Rhône-Alpes
acquis avec l’Intranet Sharepoint 2007
les usages :
- recherche globale sur les contenus Intranet,
- contextualisation d’informations,
- personnalisation d’affichages,
- mise à disposition de données.
Veille & Documentation 27/11/2012
9. Développer un usage applicatif
A la base : un processus et une ressource documentaire
contraignants
Inenvisageable de construire une base de données documentaire,
vu l’arriéré et les volumes
(ex. Région Île-de-France : base Mariane sous CINDOC)
La décision : tirer parti de FAST dans une logique applicative
Quel intérêt ?
Moteur pertinent pour des recherches plein texte, sur des contenus
non structurés et de gros volumes de données
Quels objectifs ?
permettre des recherches qualitatives, donner du sens au corpus
Comment ?
Un travail conjoint du Service Veille & Documentation, de la DSI,
des développeurs, en lien avec les services producteurs
Veille & Documentation 27/11/2012
10. Le déroulement du projet
1. Étude de l’existant
localisation documents, bilan de l’application
2. Analyse du besoin
retour sur recherches effectuées par les documentalistes,
détermination de questions-types
3. Réalisation du prototype
à partir d’une V0 isofonctionnelle
processus d’indexation réitéré de très nombreuses fois
construction des facettes
4. Validation auprès des services producteurs/gestionnaires
5. Publication sur l’Intranet, communication auprès des publics-
cibles
6. Suites
déclinaison pour le site web
évolutions internes (nouvelles commissions…)
suivi des usages
Veille & Documentation 27/11/2012
11. La nouvelle interface
Un nouvel intitulé : « Actes et débats »
Un unique champ de recherche « à la Google »
Une page de résultats efficace et intuitive
Des contraintes réduites en recherche :
insensibilité à la casse, aux accents, aux pluriels ; gestion des mots vides ;
opérateur ET par défaut; « expression » ; troncature *; exclusion -
Présentation des résultats fortement améliorée :
ordre, cartouche sur mesure, résumé dynamique…
Des facettes pour préciser la recherche et naviguer dans les
résultats proposés
Veille & Documentation 27/11/2012
12. Deux applications : sur l’Intranet…
Une interface très complète :
- pour les agents et les élus
- tous les documents liés à la vie des assemblées
(soit 33 000 depuis 1997)
- 7 facettes liées au contenant
- 3 facettes liées au contenu
Veille & Documentation 27/11/2012
13. … et sur le site web Région
Une interface allégée
- pour le « grand public »
- 2 entrées : CR, CESER
- seulement les documents communicables (17600)
- 3 facettes : date, géographie, thème
- requête pré-câblée sur les dernières décisions
Veille & Documentation 27/11/2012
14. Focus 1 : indexation et restitution
Processus d’indexation commun
La source : un répertoire informatique où sont déposés les fichiers
correspondant aux documents produits par les deux assemblées
(CR et CESER)
Fast indexe les fichiers .html, mais affiche les documents .pdf
Recherche Intranet : le pdf affiché est stocké sur serveur interne
Recherche sur le site web : le pdf affiché est stocké sur un serveur
externe, ne contenant que les documents communicables
Arborescence identique :
- pour les documents PDF et HTML,
- sur les serveur interne ou externe.
Veille & Documentation 27/11/2012
15. Focus 2 : les résultats
Ordre déterminé en combinant plusieurs critères :
- pertinence du document,
- valeur juridique,
- fraîcheur.
Pondération : chaque résultat se voit attribuer un rang défini par
un score dynamique
présence du mot dans le titre, le numéro du document, le corps du texte
…et statique
boost en fonction de la valeur juridique, du + au moins contraignant
Modulé en fonction de la fraîcheur du document
Un cartouche de résultats dynamique et parlant
Source de rebonds : vers le document PDF + documents liés
Veille & Documentation 27/11/2012
17. Focus 3 : les facettes
Retenues à partir des besoins et pratiques
Typologie :
- contenant : type de document, date, mandature, assemblée et
commission concernées, réunion
- contenu : vocabulaire métier, territoires, relations entre
documents
Construction: structure du document, propriétés, texte
Les sources principales :
- le chemin informatique d’accès au document (URL) ;
- le texte intégral du document ;
- les métadonnées portées par le document ;
- le thésaurus interne.
Veille & Documentation 27/11/2012
18. Champ de recherche
Facettes Facettes
Résultats de recherche
« contenant » « contenu »
Veille & Documentation 27/11/2012
20. Focus 4 : le recours au thésaurus
Appel au thésaurus interne VOCOM, en l’absence d’indexation
Vocabulaire métier sur mesure (mots-clés, politiques régionales,
territoires, organismes partenaires…)
Utilisé pour les facettes DISPOSITIFS et GEOGRAPHIE
Extraction des descripteurs dans le texte des documents
Listes normalisées : mandatures, commissions thématiques
Veille & Documentation 27/11/2012
21. Exemple de recherche : entreprise + 2012
- facette issue de la liste des ACTIONS
REGION (VOCOM)
- liste ouverte par défaut sur 5 items
- classement / occurences
- facette issue de l’INDEX
GEOGRAPHIQUE (VOCOM) :
extrait de la branche Rhône-Alpes
- fermée par défaut
- une taxonomie
Veille & Documentation 27/11/2012
22. Focus 5 : typologie de délibérations
répondre aux les besoins métiers
en l’absence de règles d’écriture, identification d’habitudes et de choix
rédactionnels
construction de règles de gestion
plusieurs clés : titres, récurrence de certains mots, commission
responsable…
Veille & Documentation 27/11/2012
23. Délibération budgétaire
DOB, budget primitif, décision modificative, compte de gestion, compte
administratif, taux de fiscalité (directe / indirecte), TIPP,
attribution de subvention, caducité des subventions et dépenses
similaires, programme prévisionnel des investissements
Commission Finances + présence dans le titre des termes suivants
BUDGET* PRIMITIF*; COMPTE DE GESTION ; COMPTE* ADMINISTRATIF* ; TIPP ; TARIF* FISCALITE*;
DECISION* BUDGETAIRE* MODIFICATIVE* ; DECISION* MODIFICATIVE* EXERCICE* ; ORIENTATION* BUDGET*
EXONÉRATION* TAXE PROFESSIONNELLE ; EXONÉRATION* COTISATION* VALEUR AJOUTÉE ; RÈGLEMENT
BUDGÉTAIRE FINANCIER ; DISPOSITION* BUDGETAIRE* ; DISPOSITION* FINANCIERE* ; PROGRAMME PRÉVISIONNEL
INVESTISSEMENT* ; MODELE* CONVENTION* ATTRIBUTIVE* SUBVENTION* ; CADUCITE* SUBVENTION* ; DEPENSE*
SUBVENTIONNABLE*
Délibération cadre
(création/révision d’une politique régionale)
Plan régional en faveur de…Politique régionale…Plan de mandat…
Schéma régional…Plan…Plan de soutien…Plan cadre…Stratégie
régionale…Modalités d’intervention…
Présence dans le titre des termes suivants :
PLAN REGIONAL EN FAVEUR DEPLAN POUR LE DEVELOPPEMENTPLAN REGIONAL POURPLAN REGIONAL DE
DEVELOPPEMENTPLAN REGIONAL D’AIDEPLAN REGIONAL DESPOLITIQUE* REGIONALE*PLAN* MANDAT*SCHEMA*
REGIONA*PLAN TRIENNALPLAN ROUTIERPLAN* ENERGIE*PLAN* D'ACCES*PLAN* MODERNISATION*PLAN*
CAMPUS*PLAN* SAISONNIER*PLAN* SAISONNALITE* TOURISME*PLAN* DEPLACEMENT* URBAIN*PLAN*
PREVENTION*PLAN* SOUTIEN*DELIBERATION* CADRE*PLAN* CADRE*STRATEGIE* REGIONALE*STRATEGIES
EUROPEENESMODALITE* D’INTERVENTION* PRINCIPE* D'INTERVENTION* MODALITE* MISE ŒUVRE*MODALITE*
D'APPLICATION*
Veille & Documentation 27/11/2012