1. STATISTIQUES D’UTILISATION DES
RESSOURCES ÉLECTRONIQUES
JOURNÉE D’ÉTUDE COUPERIN, 23/03/2012
ANNE-CHRISTINE GIRARD,
SERVICE D'INGÉNIERIE DOCUMENTAIRE SCD UNIVERSITÉ D'AIX-MARSEILLE
2. 20/04/2012
Statistiques de consultation des ressources électroniques ,
quelle réalité dans les BU ?
Enquête menée par Couperin en 2011 auprès de ses membres
Fort taux de participation : 60%
94% des répondants recueillent des statistiques
Revues : 93% recueillent JR1
BDD : 95,8% le DR1
Ebooks : 57% le BR1
62% : au moment de l’ESGBU et des rapports d'activité
51% plusieurs fois par an et presque autant 1 fois/an
But de l'exercice : rendre des comptes
93% : pour justifier des dépenses
Pour l’Esgbu, la gestion des abonnements, la communication, la comparaison (p/r autres
établissements), la veille sur téléchargements abusifs, la formation.
2
3. 20/04/2012
Statistiques de consultation des ressources électroniques ,
quelle réalité dans les BU ?
Recueil des données : émiettement des tâches et du temps
• 22 interfaces en moyenne (jusqu'à 72 !)
• bouquets (96%), titres isolés (53%)
• sur 70% des ressources
• non automatisé à 87%
Difficultés récurrentes
Recueil :
• connexions à la plateforme
• formats des fichiers
• multiplicité des interfaces et gestion des mots de passe
• activité chronophage
Analyse :
• manque de compétence pour analyser les données
• manque de fiabilité des données
• difficultés à comparer les bouquets
• difficultés des analyses par discipline
3
4. 20/04/2012
Statistiques de consultation des ressources électroniques ,
quelle réalité dans les BU ?
Traitement des données ?
Oui : 82%
97% avec des tableurs
Enrichir les données ?
Oui à 79%
84% avec des données financières
environ 50% avec publics et effectifs
Comparaison des données entre éditeurs ?
68% oui
72% données brutes (et pas des ratios)
4
5. 20/04/2012
Statistiques de consultation des ressources électroniques ,
quelle réalité dans les BU ?
Synthèses et recommandations :
• isolement des personnels
• manque de temps
• manque de formation
• manque de communication
• manque d'outils
• manque de gouvernance
5
6. 20/04/2012
JUF (Journal Usage Factor)
Projet de recherche COUNTER
Phase de test 2011-2012
• Pour étudier comment les statistiques d'utilisation en ligne pourraient constituer une
nouvelle mesure de l'impact et de la qualité d'une revue
• Pour compléter l’Impact Factor
• Disponible pour de nombreux journaux
• Couverture : toutes les disciplines des journaux électroniques
• Immédiateté des rapports
6
7. 20/04/2012
Projet de portail COUPERIN pour le recueil, l'archivage et le
traitement des statistiques d'usage
Sur le modèle du JUSP (Journal Usage Statistics Portal) : portail anglosaxon.
Moissonne automatiquement via SUSHI, agrège et présente pour ses membres les
statistiques JR1 et JR1a par éditeurs
Projet MESURE : mutualisation et évaluation des statistiques d'utilisation des ressources
électroniques
Portail :
• collecte automatique des statistiques d’usage éditeurs
• archivage depuis 2009
• point d'accès unique pour les membres
• quelques indicateurs simples
Phase de prototypage
Bientôt : mise en ligne pour les 5 établissements pilotes (Bordeaux 1, Lorraine, Paris 5
Descartes, Rennes 1, Toulouse 3)
3 éditeurs : Elsevier, Springer, IOP
Nouveau client SUSHI pour ACS en cours de développement
7
8. 20/04/2012
La production de statistiques locales au moyen de l'analyse
des logs d'un reverse proxy : l'expérience de l'Inist et le
projet nancéien
Récupération mensuelle des chiffres éditeurs :
• collecte manuelle (45 plateformes, 4 SUSHI)
• dépendance vis à vis des mises à jour des éditeurs
• offre de données hétérogènes
• statistiques incomplètes
• information sur les ressources limitées
• pas d'information sur les unités CNRS qui consultent (1 IP/portail)
Création GT en 2006 : pour exploiter les logs d’un reverse-proxy
Avantages :
• données riches et homogènes
• disponibles pour tous les éditeurs
• rapidité des mises à disposition (journal des logs quotidien)
8
9. 20/04/2012
La production de statistiques locales au moyen de l'analyse
des logs d'un reverse proxy : l'expérience de l'Inist et le
projet nancéien
Analyse des logs Ezproxy :
• une identification par laboratoire
• un parseur/plateforme (une trentaine)
• transactions de certaines plateformes pas exploitables
• stockage des fichiers journaux dans une bdd : num_stat
Statistiques locales :
• identification de l'utilisateur
• transaction datée (cf. téléchargements abusifs)
• traitements particuliers
• résultats vérifiés (comptage des consultations en interne et comparaison avec les
statistiques produites)
• détection des anomalies
Statistiques locales complétées par celles des éditeurs.
Enrichissement des données recueillies : tarifs, disciplines, langues.
9
10. 20/04/2012
La production de statistiques locales au moyen de l'analyse
des logs d'un reverse proxy : l'expérience de l'Inist et le
projet nancéien
Depuis 2011 : collaboration Université de Lorraine et Inist-CNRS, pour analyser les logs.
Objectifs :
• disposer statistiques locales à comparer avec celles fournies par les éditeurs et pour les
bases qui n'en ont pas
• développer de nouveaux parseurs
• partager la maintenance
26 ressources communes Université de Lorraine/Inist
Phase de test
10