Elisabeth de PABLO, attachée de recherche à l’ESCoM‐FMSH
Le studio ASA pour segmenter, décrire et publier des corpus audiovisuels – présentation générale
Développé dans le cadre du projet ANR ASA‐SHS, le Studio ASA est un environnement complet de travail permettant la segmentation, l’analyse, la publication en ligne de corpus audiovisuels ainsi que la gestion des ressources métalinguistiques ASA. Nous présenterons succinctement les grandes fonctionnalités des quatre grands « ateliers » qui le composent. Divers exemples de ces fonctionnalités seront exposés au cours du colloque.
Processus de réalisation et d’indexation collaboratives et échanges entre sa...
Le studio ASA pour segmenter, décrire et publier des corpus audiovisuels – présentation générale, Elisabeth de PABLO,
1. Le studio ASA pour segmenter,
décrire et publier des ressources
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
audiovisuelles : une présentation
générale
1
2. STUDIO un environnement de travail numérique, composé
par un ensemble de logiciels et ressources [ESCoM
ASA suite] et d’une application web [Semiosphere]
destiné à segmenter, décrire, publier, modéliser
des ressources audiovisuelles.
Atelier de Atelier de Atelier de Atelier de
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
segmentation description publication modélisation
Semiosphere OntoEditor
ESCoM-INA
Interview
Rédacteur/éditeur Modélisateur
Analyste
2
Le studio ASA : présentation générale
3. STUDIO Atelier de
ASA segmentation
Espace de travail
permettant de
découper virtuellement
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
une ressource
audiovisuelle en
segments intéressant
l’analyste.
3
Le studio ASA : présentation générale
4. STUDIO Atelier de
ASA description
Espace de travail
permettant d’analyser la
ressource audiovisuelle
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
dans son intégralité ou en
partie.
Il est composé de 3 niveaux:
méta-description, vidéo et
segment, eux-mêmes
décomposés en différentes
rubriques
4
Le studio ASA : présentation générale
5. STUDIO Atelier de
ASA publication
Espace de travail spécialisé permettant au rédacteur/éditeur de réunir des
vidéos préalablement décrites et indexées pour les publier en ligne.
Dans le cadre du projet ASA > utilisation d’un seul modèle de publication : le site
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
portail, d’autres genres de publication sont actuellement à l’étude comme les
dossiers spécialisés (thématiques, pédagogiques, …) ou encore les vidéo-
lexiques,… nous n’avons pas eu les moyens de les développer, faute de
temps, pour le moment.
L’outil « Semiosphere » permet de faire tourner cet atelier. Composé d’un
ensemble de service web, il est développé par Francis Lemaitre et Richard
Guérinet.
5
Le studio ASA : présentation générale
6. STUDIO Atelier de
ASA modélisation
Espace de travail réservé au
modélisateur pour définir et
développer les modèles de
description dont une
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
« archive » a besoin pour faire
analyser ses vidéos.
L’outil qui permet de faire
tourner cet espace est
« OntoEditor » . C’est un
éditeur xml développé par
l’ESCoM.
6
Le studio ASA : présentation générale
7. Pour toutes informations supplémentaires relatives au studio ASA :
Colloque ASA-SHS – 5-6 décembre 2011 - Elisabeth de Pablo
http://semiolive.ext.msh-paris.fr/asa-shs/
Toute l’équipe est à votre disposition pour des démonstrations complémentaires,
les outils pouvant être testés par toutes les personnes intéressées.
Des ateliers de formation pourront éventuellement être mis sur pied
en fonction de l’évolution de notre groupe.
7
Notas del editor
L’atelier de sémiotique audiovisuelleLe programme des AAR : contenu, missions et aperçu historique
Le studio ASAest un environnement de travail numérique, composé par un ensemble de logiciels et ressources [ESCoM suite] et d’une application web [semiosphere] destiné à segmenter, décrire, publier, modéliser des ressources audiovisuelles. Il se compose de 4 ateliers = des espaces de travailqui permettent l’organisation du travail et qui sont composés d’interfaces, de modèles, de guides, d’aides, d’exemples… : atelier de segmentation, de description, de publication, de modélisation.Mais cette liste n’est pas close, d’autres ateliers peuvent s’y ajouter. A chaque atelier correspond des outils spécifiques qui permettent de réaliser des tâches précises : ESCoM INA Interview, Semiosphere, OntoEditorInterview a été développé initialement par Steffen Lalande (INA recherche) et adapté au besoin du programme AAR par Francis Lemaitre.Ces outils ne sont pas figés, ils peuvent évoluer, on peut les remplacer par d’autres.Mais également des rôles précis : L’analyste utilisera les ateliers de segmentation et de description, Le rédacteur/éditeur l’atelier de publication,Le modélisateur ou concept-designer l’atelier de modélisation
Atelier de segmentation : Permet la segmentation virtuelle d’une ressource audiovisuelle (dans son entité ou en partie). Pour le moment il est composé par l’outil Interview, mais tout à l’heure, Steffen Lalande et Abdelkrim Beloued de l’INA nous présenteront l’outil SAPHIR développé au cours du projet SAPHIR, qui va plus loin en terme de segmentation puisqu’il permet de segmenter des documents audiovisuels mais également des documents visuels (statiques) et il permet également de réaliser des segmentations multicouches. A terme, nous aimerions bien inclure l’ensemble de ces fonctionnalités dans le Studio ASA. Concrètement Il s’agit de segmenter, de découper la ressource en fonction de ses intérêts et des usages désirés. Il est donc nécessaire, avant de se lancer dans cette segmentation, d’avoir des idées bien claires en têtes : qu’est ce que je veux faire avec mon document, quelles sont mes objectifs, pour quels usages, pour quel public ? Les objectifs étant multiples, les segmentations devront être réalisées en fonction du type de produits recherchés. Elles vont s’organiser en fonction d’un axe : professionnelle, éducatif, … et de la finalité technique des objectifs (publications web, mobile ??)Quelques exemples ? Pour créer un vidéo lexique on privilégiera des segments de courtes durées de types définitions, pour développer un dossier pédagogique on alternera peut-être des passages théoriques avec des passages pratiques exemplifiant les explications fournies au préalable, etc.
Une fois segmenter, il s’agit de décrire, c’est-à-dire d’analyser la ressource. L’atelier de description permet trois niveaux d’indexation : -Méta-description > la marque du choix éditorial (présentation de l’analyse et de ses objectifs)La méta description contient différentes rubriques (5) destinées à formaliser les objectifs de la description, définir les droits, référencer les sources sur lesquelles l’analyste s’est appuyé, mais surtout c’est le niveau où l’on choisit son ontologie de domaine cad un métalangage de description (élaboré au préalable l’atelier de modélisation) qui va permettre l’affichage de formulaires dans les rubriques. Ontologie de domaine qui correspond à l’archive (aux archives) pour lesquels on travaille, chaque archive a son propre métalangage et donc son propre modèle de description et on le choisit à ce niveau.Pour le projet ASA, nous avons développé plusieurs ateliers d’expérimentation - qui vont vous être présentés plus en détail par la suite - et qui ont chacun une ontologie de domaine propre. -Vidéo > description de la ressource audiovisuelle dans sa globalité (dans son entité)-Segment > description détailles des segments préalablement identifiés et sélectionnés par l’analyste via l’atelier de segmentationLes rubriques accessibles via les niveaux video et segment permettent de procéder à une description systématique de la ressource. Chaque rubrique s’ouvre sur un formulaire interactif qui représente l’interface du travail de l’analyste. C’est à ce niveau que l’on visualise les modèles un modèle de description élaborée dans le cadre du projet ASA-SHS. Chaque formulaire va permettre de décrire contenu et forme de la ressource : plan visuel, plan acoustique, plan thématique, plan discursif, usages, ressources liées complémentaires, résumés, traduction, mentions des droits, … Tout de suite après moi, Muriel Chemouny et JirasriDeslis nous présenterons des exemples concrets d’analyse de corpus audiovisuels à l’aide de l’atelier de description.
Atelier de publicationDédié à réunir et publier des vidéos préalablement décrit et indexés pour les publier sous forme de portail mais également sous la forme de dossiers
Atelier de modélisationOntoEditor est un éditeur xml qui permet la réalisation et la gestion des ressources métalinguistiques (hiérarchie de termes conceptuels, schémas et modèles de description) nécessaires à l’analyse de corpus audiovisuel. C’est ici où se trouve tous les fichiers qui contiennent tous les modèles dont on a besoin pour analyser les vidéos (fichiers regroupés dans des bibliothèque de modèles). L’atelier de modélisation permet à un cogniticien de définir, développer, tester et valider les modèles de description qui seront utilisés dans l’atelier de description.
Pour plus d’informations les deux livres : Les archives audiovisuelles, description, indexation et publication Nouveaux usages des archives audiovisuelles numériquesLe nouveau site de publication Atelier de Sémiotique Audiovisuelle qui présentent les résultats sous forme de prototypes (encore un peu lent) mais ce problèmes de chargement seront résolus début janvier. JirasriDeslis et Richard Guérinet vous présenteront demain matin, ces portails thématiques Toute l’équipe se tient à votre disposition pour des démonstrations complémentaires, les outils pouvant être testés par les gens intéressés. Nous songeons à monter des ateliers de formation, mais comme nous sommes un groupe de recherche et que le projet se termine, nous ne savons pas encore comment les choses vont se développer dans les mois à venir.