Les sujets traités dans cette conférence :
1) Le Programme Archives Audiovisuelles de la Recherche (AAR) – présentation, enjeux et objectifs, réalisations et positionnement actuel.
2) La banque des données ouvertes des AAR.
3) La publication-diffusion de la banque des données ouvertes des AAR.
4) Le genre de publication « portail ».
5) Une nouvelle génération de portails réalisée avec le Studio ASA, l’environnement de travail (le « lab ») des AAR.
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Travailler avec des archives audiovisuels numériques. Première partie : Le fonds audiovisuel des AAR et sa publication-diffusion
1. Travailler avec des archives audiovisuels numériques.
Première partie :
Le fonds audiovisuel des AAR et sa publication-diffusion
Peter Stockinger, P.U.
Fondation Masion des Sciences de l’Homme (FMSH) - ESCoM
Institut National des Langues et Civilisations Orientales (INALCO)
Université de la Manouba (UMA)
Institut Supérieur de Documentation de Tunis
Unité de Recherche « Bibliothèque numérique et patrimoine »
Tunis, 24 Avril 2013
2. 1. Le Programme Archives Audiovisuelles de la Recherche (AAR) –
présentation, enjeux et objectifs, réalisations et positionnement actuel
2. La banque des données ouvertes des AAR
3. La publication-diffusion de la banque des données ouvertes des AAR
4. Le genre de publication « portail »
5. Une nouvelle génération de portails réalisée avec le Studio ASA,
l’environnement de travail (le « lab ») des AAR
Les principaux
points
3. Le Programme « Archives Audiovisuelles de la Recherche » (AAR)
4. Le Programme Archives Audiovisuelles de la Recherche (AAR):
= programme de « recherche appliquée » …
… dans le contexte des archives/bibliothèques numériques pour la
recherche, l’enseignement et la valorisation de patrimoines
scientifiques et culturels
… élaboré en 2000 et mis en place concrètement à partir du mois
d’avril 2002 …
… par l’ESCoM (Equipe Sémiotique Cognitive et Nouveaux Médias)
à la FMSH (Fondation Maison des Sciences de l’Homme) à Paris.
Le programme
AAR
5. 2 objectifs sous-tendent le programme AAR:
Premier objectif:
Projet d’archivage audiovisuel numérique en SHS (sciences
humaines et sociales)
a) Constituer et préserver des corpus audiovisuels numériques
qui documentent le patrimoine scientifique dans les
différentes « disciplines » en SHS
– patrimoine scientifique réalisé par une communauté
internationale de chercheurs et enseignants-chercheurs …
b) Publier et diffuser en ligne une partie des corpus archivés …
sous forme d’événements (conférences, séminaires,
entretiens, recherches de terrain, …)
et de collections (« dossiers ») d’événements
scientifiques en français et dans d’autres langues (=
portail AAR en accès libre).
Le programme
AAR
6. Deuxième objectif:
Environnement numérique de travail (le « Lab(oratoire) »)
Deux aspects
1) Définir et valider une méthodologie et des procédures
explicites (documentées) …
1. … de production et de gestion-diffusion d’archives
audiovisuelles numériques en SHS.
2. … d’exploitation (« repurposing ») des données archivées
Le programme
AAR
7. Deuxième objectif:
Environnement numérique de travail (« Lab(oratoire) »)
2) Développer un ensemble d’outils, d’instruments pour …
I. … la conception et définition de l’organisation d’une archive
(collections, classements thématiques, thesaurus, …).
II. … la constitution de banques de données audiovisuelles
numériques (d’ « ingestion » de données audiovisuelles dans
une archive) .
III. … l’analyse personnalisée (de segmentation, de description et
d’indexation) de corpus AV archivés.
IV. … la publication/republication et de diffusion personnalisées des
données AV et des métadonnées ainsi que d’une archive elle-
même sous forme d’un portail web adaptable.
Le programme
AAR
8. Aujourd’hui, les Archives Audiovisuelles de la Recherche (AAR) forment à la
fois :
1) une archive numérique enligne stricto sensu: Les « AAR »
une banque de données ouvertes et d’accès ouvert qui est l’objet
d’un projet d’archivage spécifique
objectif du projet d’archivage: constituer un patrimoine scientifique
représentatif des recherches en SHS (>9000 heures de vidéos)
2) et un environnement de travail – un « laboratoire »: Studio ASA
(Atelier de Sémiotique Audiovisuelle) …
sous forme d’une série d’Ateliers spécialisés (de logiciels, de
ressources métalinguistiques, de guides, …) qui instrumentent un
projet d’archivage AAR ainsi que son exploitation.
Le programme
AAR
10. Banque des données numériques (= le fonds des AAR):
Quelques caractéristiques (des « ressources » au sens de DC/OAIS) :
a) types de données
• Données vidéos
• enregistrements bruts,
• enregistrements traités a posteriori,
• enregistrements montés,
• documents filmiques édités (reportages, documentaires, …)
• Données visuelles statiques
• captures brutes,
• captures traitées à posteriori,
• Données textuelles
• (pré-)publications des contributeurs
• CV, bibliographies, …
• Données structurées
• Sur les contributeurs (> 2500),
• Sur les abonnés à la newsletter AAR (> 10.000),
• Sur les visteurs/utilisateurs des AAR: questionnaires enligne (> 500)
• Données à caractère juridique
• contrats de mise en ligne
La banque des
données des AAR
…
11. Banque des données numériques (= le fonds des AAR):
Quelques caractéristiques (des « ressources » au sens de DC/OAI) :
b) volume du fonds (vidéos seulement)
• environ 9000 heures de vidéos produites et/ou co-produites
par la FMSH-ESCoM et un réseau national et international de
partenaires;
• quelques 5600 heures de ressources AV en accès libre (« open
access ») sur le portail général du programme AAR;
• des milliers d’heures de ressources AV également librement
accessibles sur une série de portails plus spécialisés (cf. plus
loin);
c) formats des fichiers vidéo
• données vidéos: wmv, flash, en partie avi,
• en cours: encodage en mpeg4
La banque des
données des AAR
…
12. Banque des données numériques (= le fonds des AAR):
Quelques caractéristiques (des « ressources » au sens de DC/OAI) :
d) contributeurs: communauté internationale
• environ 2600 chercheurs-enseignants, artistes, journalistes, …
• de quelques 85 pays du monde
e) fonds AAR par langue:
• une très grande partie des vidéos est monolingue,
• une petite partie est monolingue assorti d’un résumé en une
ou plusieurs autres langues,
• une grande partie des vidéos est en français,
• vidéos également en anglais, espagnol, allemand, chinois, etc.
La banque des
données des AAR
…
14. Publications de la banque des données audiovisuelles ouvertes des AAR:
4 Genres de publication:
1. Genre principal: l’événement:
• site d’événement ou encore site événementiel
2. Collections de sites d’événements
• corpus par discipline ou thème
3. Portails (portail général; portail à thème)
• points d’accès aux événements et/ou collections d’événements
4. Publications expérimentales (issues de projets de R&D européens
et français)
• nouvelles formes spécialisées d’accès aux et d’explorations de
ressources audiovisuelles
La publication-
diffusion des
données AAR
15. Publication:
1) Genre central de publication: Evénement (site d’événement)
Un événement =
• toute occasion de collecte d’informations,
• occasion doit posséder une valeur patrimoniale,
• « valeur patrimoniale »: définie par les missions/objectifs du
projet d’archivage numérique
Genres d’événements filmés (dans le cadre des AAR):
• Manifestations scientifiques: entretiens, conférences, colloques,
workshops, …
• Manifestations culturelles: concerts, expositions, …
• Terrains de recherche: sociologiques, linguistiques, ;…
• Et aussi: produits édités (reportages, documentaires, films de
fiction, …)
La publication-
diffusion des
données AAR
16. Publication:
1) Genre central de publication: Evénement (site d’événement)
Exemple concret:
• La fabrication du pain domestique au Portugal (15 juin 2006)
Structure typique d’un événement:
1. un événement = un site (dynamique) aussi appelé « mini-site »,
2. page d’accueil identifiant l’événement,
3. accès aux ressources (vidéos, textes, images, …) documentant
l’événement,
4. « page vidéo » de lecture et d’exploration d’une ressource
vidéo.
Sur portail AAR:
• environ 670 sites (« mini-sites ») événementiels,
• en tout: 960 sites sur tous les portails du programme AAR …
La publication-
diffusion des
données AAR
17. Publication:
2) Le genre Collections (d’événements)
« Collection » = ensemble cohérent de sites d’événements
• Un ensemble de sites d’événements constitue un corpus publié
(enligne) d’événements
• Attention: corpus publié ≠ corpus collecté ≠ corpus indexé !!
Dans le cadre des AAR:
• notamment corpora publiés par discipline et/ou domaine de
recherche (environ 40 « grands corpus »)
Exemple:
• Grand corpus « Sociologie »: 160 sites d’événements
• 46 corpus spécialisés qui font partie du grand corpus « Sociologie »
• Sociologie urbaine (8);
• Sociologie de la culture (27),
• Sociologie des migrations (11), …
La publication-
diffusion des
données AAR
18. Un corpus AAR est composé d’enregistrements divers …
• … d’entretiens (avec chercheurs, experts, journalistes, témoins, …),
• … de séminaires et/ou de colloques (tables rondes, journées d’étude,
…),
mais aussi:
• … de documentaires AV, …
• … d’enregistrements de terrain documentant le thème/le sujet,
• … d’enregistrements d’événements culturels (expositions, concerts,
…)
• … de prises de vue de « scène de vie ».
Un corpus:
• est en général multilingue,
• reflète la recherche actuelle au niveau international
La publication-
diffusion des
données AAR
19. Publication:
3) Le genre Portails (d’archive)
« Portail » =
1. lieu d’accès aux événements et/ou au corpus publiés
d’événements d’une archive,
2. lieu d’exploration des ressources documentant un événement
(notamment des ressources vidéos),
3. lieu de visualisation du fonds d’une archive
La publication-
diffusion des
données AAR
20. Publication:
Les portails dans le cadre du programme AAR:
1) Portail web central
• Le portail des Archives Audiovisuelles de la Recherche
(AAR) en huit langues
2) Portails thématiquement spécialisés:
• Averroès – la médiathèque France-Maghreb,
• Portail DLC – Diversité Culturelle et Linguistique,
• Portail PCM – Peuples et Cultures du Monde,
• Portail SCC – Semiotica, Cultura e Comunicazione
(coopération avec l’Università di Roma – Sapienza)
Exemples concrets – cf. ci-après …
La publication-
diffusion des
données AAR
21. Publication:
4) Le genre Publications expérimentales
Différents genres de publications expérimentales:
4.1) Les vidéo-lexiques
• Corpus de segments assez brefs de vidéos qui illustrent un
terme, une notion, un domaine, …
• Exemple:
• Le vidéo-lexique « Peuples du monde »
4.2) Dossiers bilingues
• Republication d’une vidéo (ou d’une partie d’une vidéo) dans
une langue-cible différente à la langue-source
• Exemples:
• Republication (en arabe, chinois, anglais, italien, ….) d’un
entretien en français avec Sabine Trebinjac (CNRS) consacré à la
musique ouïgoure
• Tous les dossiers bilingues français – arabe.
La publication-
diffusion des
données AAR
22. Publication:
4) Le genre Publications expérimentales
4.3) Dossiers thématiques
• analyse et explication des grandes thématiques dans une
prestation (entretien, séminaire, …)
les vidéos sont totalement délinéarisées!
• Exemples:
• Republication d’une conférence de Joëlle Allouche-Benayoun
(02/04/2008) sur La place de la femme dans le judaïsme
(passages thématiques – encyclopédie – lexique)
• Accès à l’ensemble des dossiers thématiques (par discipline).
La publication-
diffusion des
données AAR
23. Publication:
4) Le genre Publications expérimentales
Quelques explications …
• Publications pas intégrées dans le « processus standard de production
– diffusion.
• Ce sont des republications de données archivées et publiées
(« repurposing »).
• Objectifs:
• Adaptations à des contextes d’usage spécifiques (notamment:
enseignement et valorisation).
La publication-
diffusion des
données AAR
25. L’interface du portail général du programme AAR : principal point d’accès à et
de visualisation de la banque des données AAR (5600 heures de vidéos en
accès libre)
Le genre de
publication « portail »
26. L’interface de la page d’accueil du portail général des AAR:
Les accès …
Accès « standards » à la banque des données ouvertes AAR :
1. accès par « nouveautés »:
publications les plus récentes; les « grands titres », …
2. accès par domaines et disciplines : évènements publiés en …
> sociologie (160)
> développement (11) ; mouvement social, groupes sociaux;
conflits, …
3. accès par types d’événements:
> entretiens (360); séminaires (72); colloques (180); reportages (50);
documentations audiovisuelles (20 = « archives provoquées »);
4. accès par langue (version originale des vidéos): évènements publiés en …
> français (682); anglais (107); espagnol (59); chinois, russe, arabe, …
Le genre de
publication « portail »
27. L’interface de la page d’accueil du portail général des AAR…
Accès « standards » à la banque des données ouvertes AAR :
5. accès par auteurs (2448):
liste alphabétique + descriptif
6. accès à l’ensemble des événements (682):
par date d’enregistrement
7. accès à des dossiers hypermédias spécialisés issus d’un processus de
republication de corpus audiovisuels ;
> dossiers par discipline
> anthropologie culturelle; anthropologie de la santé;
linguistique; musicologie; …
8. accès à un ensemble de portails spécialisés (i.e. de portails proposant à leur
tour des accès communs et/ou spécifiques à une sélection du fonds
audiovisuel de la banque des données ouvertes AAR) sous forme d’événements
(scientifiques, culturels, …):
1. > AVERROES – La médiathèque France-Maghreb
2. > DLC – Diversité Linguistique et Culturelle
3. > PCM – Peuples et Cultures du Monde
4. > SCC – Semiotica, Cultura e Comunicazione (avec Univ. di Roma)
5. > MDD – Mondialisation et Développement Durable
6. > …
Le genre de
publication « portail »
28. L’interface de la page d’accueil du portail Averroès – La médiathèque France –
Maghreb
Même type de publication que le portail général AAR
Le genre de
publication « portail »
29. Une « nouvelle génération » de portails réalisés avec le Studio ASA (le « lab »
du Programme AAR)
30. Grace à un ensemble de projets de R&D européens et français (ANR) depuis
2006, le programme AAR a mis en place …
… une nouvelle « génération » de portails (bientôt en ligne, i.e. dès le 20
mai 2013):
Caractéristiques:
Accès sémantique à des corpora audiovisuels choisis (par thesaurus,
thèmes ou sujets de discours, localisations géographiques et temporelles,
références culturelles, etc.);
Descriptions et indexations très riches et détaillées des vidéos pour des
usages dans l’enseignement et la recherche;
Republications « auteurs » totalement intégrées dans le processus de
gestion éditorial d’un portail;
Customisation de l’interface physique et graphique et des accès aux
corpus audiovisuels;
Intégration des médias sociaux dans chaque portail et chaque « page
vidéo »;
Environnement de travail « unifié »: Studio ASA (cf. plus loin)
Une nouvelle
génération de
portails
31. Illustration: L’interface de la page d’accueil du portail AMSUR = un corpus AV
d’environ 360 heures
Une nouvelle
génération de
portails
32. Illustration: La « Page vidéo » page permet l’exploration systématique d’une
ressource vidéo
Une nouvelle
génération de
portails
33. Illustration: La Page « vidéo » s’adapte aux métadonnées disponibles
Une nouvelle
génération de
portails
34. Illustration: La Page « vidéo » donne accès aux « vidéos similaires »
Une nouvelle
génération de
portails
35. Illustration: Accès à un corpus publié de vidéos (!!) via le thesaurus propre à
l’archive (« Lexique »)
Une nouvelle
génération de
portails
37. Illustration: Accès par collections filmiques:
• Ressources [(re)publiées] ….
Vidéos par genre > Documentaires et reportages [(re)publiés]
Une nouvelle
génération de
portails
40. Quelques remarques:
Le portail AMSUR donne accès à un corpus audiovisuel qui:
provient de la banque de données ouvertes AAR,
est consacré à l’histoire et aux cultures de l’Amérique Latine.
Ce corpus:
… constitue donc une partie du fonds commun de la banque des
données des AAR (> 360 heures)
Il est également accessible via le portail général des AAR …
… mais uniquement par le biais des accès généraux du portail (qui
« valent » pour toutes les vidéos composant la banque des données
AAR)
Sur le portail AMSUR, le corpus en question se présente …
sous une forme profondément retravaillé selon les objectifs éditoriaux
propres au portail AMSUR.
Au sujet du corpus
AMSUR
41. Un corpus audiovisuel « profondément retravaillé » veut dire que …
… les vidéos qui font partie du corpus sont ….
… localisées dans le fonds (AAR) et sélectionnées selon leur
pertinence pour la politique éditoriale du portail
… redécoupées en segments pertinents (selon la politique
éditoriale propre au portail)
… reclassées à l’aide d’un métalangage propre au portail (cf. les
accès de ce portail: sujets, thesaurus, …)
… re-décrites et re-indexées à l’aide d’une bibliothèque de
modèles de description propre au portail
… re-contextualisées (i.e. « mises en relation » avec d’autres
données selon la politique éditoriale du portail)
… « mélangées » avec d’autres données afin de donner lieu à de
nouvelles publications
Ci-après la problématique du « Repurposing » de données numériques archivées!
Au sujet du corpus
AMSUR
42. Le « Repurposing » de corpus audiovisuels –
un usage complètement central pour toutes archives numériques
43. « Repurposing »:
Réutilisation de données numériques archivées.
Problématique centrale pour l’exploitation d’archives numériques dans
le contexte de la recherche, de l’enseignement, de la communication, ….
Cas particuliers:
1. Ré-description et ré-indexation de données archivées (cf. le corpus
AMSUR)
2. Ré-publication de données archivées:
1. Ré-publication concurrente d’une donnée numériques archivée
sur deux ou plusieurs portails
2. « Réunir, mélanger » différentes données numériques archivées
pour faire une nouvelle publication (« dossier thématique)
Le « repurposing »
de corpus
audiovisuels
44. Exemple 1: Dossier thématique « Linguistique et langues amérindiennes » -
dossier réunissant un corpus de vidéos autour de ce sujet
Le « repurposing »
de corpus
audiovisuels
45. Exemple 2: Analyse, description et publication concurrente d’une même
vidéo sur deux portails différents
Analyse et publication concurrentes d’un entretien avec Luiz Carlos
Bresser-Pereira sur trois portails différents:
… sur le portail général des AAR : publication « de base »
… sur le portail AMSUR (cf. ci-après)
…. et sur le portail FMSH-AAR (cf. ci-après)
Le « repurposing »
de corpus
audiovisuels
46. Republication sur AMSUR (réalisée par Manuela Papino, webmestre du portail
AMSUR):
Le « repurposing »
de corpus
audiovisuels
48. Caractéristiques d’une analyse/publication concurrente …
1. Découpage qui varie systématiquement (l’analyste décide des segments
– chapitres – dont il a besoin).
2. Métalangages utilisés sont différents (thesaurus par portail +
bibliothèque de modèles de description propre à chaque portail).
3. Informations pragmatiques et mises en relation différentes.
4. Accès différents (et propres à chaque portail).
5. Interface partiellement différente.
Le « repurposing »
de corpus
audiovisuels
50. Schéma simplifié les 3 niveaux à distinguer dans une archive numérique:
Données – Corpus – Publication
Banque de données ouvertes 1
AAR
Corpus 1 ≅
Fonds AAR
Corpus 2 = Sélection
thématique
Corpus n =
Sélection
Visualisation
Accès 1
(portail général
des AAR)
Visualisation
Accès 2
(= portail
AMSUR)
Visualisation
Accès 3
(= portail
AMSUD)
Banque de données ouvertes 2 (N)
HAL (Canal U, …)
Les trois niveaux
d’une archive
numérique