L application de la physique classique dans le golf.pptx
Inha 1-métadonnées
1. INHA - InVisu
Paris – mardi 29 mai 2012
Images numériques et métadonnées
Patrick Peccatte
Chercheur associé au Laboratoire d'histoire visuelle contemporaine
(Lhivic/EHESS)
peccatte@softexperience.com
Twitter: @ppeccatte
Facebook: patrick.peccatte
Google+: Patrick Peccatte
Flickr: patrickpeccatte et photosnormandie
Tumblr: dubruitausignal.tumblr.com
http://culturevisuelle.org/dejavu
2. Deux parties
Métadonnées
un peu technique (mais pas trop...)
Indexation collaborative, redocumentarisation,
crowdsourcing
exemple sur une collection historique,
applicabilité à l'image d'actualité
4. Une histoire
ancienne Il était une fois...
et bien connue L'album de photos
wenzday01/Flickr
Creative Commons
5. on ajoutait des légendes
aux photos...
lizjones112/Flickr
Creative Commons
6. mais attention
au déclassement...
Yume Photo/Flickr
Creative Commons
7. la solution ?
la légende au verso
Guanatos Gwyn/Flickr
Creative Commons
8. Documenter Le panneau titre inclus
"au plus près" dans cette photographie
de la photo, a été posé par l'opérateur
une préoccupation lui-même pour
constante la prise de vue
Détail d'un tirage de
Suzuki Shin.ichi II,
années 1880.
(c) collection Claude Estèbe
9. Le système Autographic
permettait au photographe
d’ajouter des informations écrites
sur le film au moment
de l’exposition
Mario Groleau/Flickr
Creative Commons
10. Photo légendée selon le procédé
Autographic (Nico Redlich, 1931).
Trois-Rivières, Canada
Mario Groleau/Flickr
Creative Commons
11. Avec le numérique...
Légendes Métadonnées
Une métadonnée est littéralement une donnée sur
une donnée
✔
Dans le domaine des métadonnées [metadata], on parle de
données sur une ressource
✔
Mais une ressource n'est pas toujours sous forme numérique
Plus précisément, c'est un ensemble structuré de
données décrivant une ressource quelconque
Une métadonnée peut être utilisée à des fins
diverses…
✔
la description et la recherche de ressources
✔
la gestion de collections de ressources
✔
la préservation des ressources
12. Métadonnées "métiers" [1/2]
Les ressources décrites par des métadonnées
ne sont pas nécessairement sous forme digitale
✔
un catalogue de bibliothèque ou de musée contient
aussi des métadonnées qui référencent des objets
physiques
De nombreuses communautés s'intéressent aux
métadonnées
✔
bibliothécaires, documentalistes, archivistes,
iconographes, conservateurs de musées, …
✔
…gèrent de nombreux types de ressources
13. Métadonnées "métiers" [2/2]
ressources: monographies, publications en série, articles, photos,
archives, pièces de musée, séquences audio ou vidéo, etc.
✔
on ne décrit pas toutes ces variétés de ressources de la même façon
apparition de standards de métadonnées "métiers"…
images
IPTC/IIM (Information Interchange Model)
Exif (Exchangeable Image File Format)
MARC (Machine-readable cataloging)
bibliothèques
ISBD (International Standard Bibliographic Description) catalogage (Marc)
indexation (ISBD)
Dewey Decimal Classification system classification (Dewey)
EAD (Encoded Archival Description)
archives
CIMI consortium (Computer Interchange of Museum Information) musées
RKMS (Recordkeeping Metadata Schema)
MPEG-7 (Multimedia Content Description Interface)
audio
LOM (IEEE - Learning Object Metadata) éducation
SCORM (Sharable Content Object Reference Model)
14. nom ≈ description
Où sont les métadonnées ? chemin d'accès ≈ plan de classement
Considérons la ressource suivante :
http://www.liberation.fr/medias,62
Cette ressource contient plusieurs métadonnées
✔
site liberation.fr
✔
page Web de la rubrique medias
Les noms informatiques sont des métadonnées
✔
Plus généralement :
nom, chemin d'accès, extension, taille, attributs, date de
création, date de modification, propriétaire, droits d'accès, etc.
sont des métadonnées
Mais cela ne suffit pas, d'autres informations sont
nécessaires :
description longue, mots-clés, copyright, etc.
15. Où sont les métadonnées ?
Dans une base de données ou un fichier indépendant
associé aux données (sidecar file).
Les métadonnées sont externes aux ressources.
Fichier El Greco.jpg Fichier El Greco.doc
Titre principal: El Greco, Begräbnis des Conde de
Orgaz
Description: El Greco, Domenikos Theotokopoulos,
dit ; 1541-1614. .- 'L'Enterrement du comte d'Orgaz',
v. 1586. (Saint Augustin et saint Etienne enterrent Don
Gonzalo Ruyz de Toledo, Conde de Orgáz, mort en
1327). Huile sur toile, H. 4,60 ; L. 3,60. Tolède, église
Santo Tomé. Année de l'évènement: 1586. Année de
l'oeuvre: 1586.
Mots-clés: 16E SIECLE; AME; ANGE; ART; ART
ESPAGNOL; CHRIST; ENTERREMENT;
ESPAGNE; GRECO, LE; HUILE SUR TOILE;
INHUMATION; MANIERISME; MORT; ORGAZ,
DON GONZALO RUYZ; PEINTURE; PERSONNE;
ROYAUME DES CIEUX; SAINT AUGUSTIN
D'HIPPONE; SAINT ETIENNE; SAINT JEAN-
BAPTISTE; TABLEAU; TOLEDE; VIERGE
MARIE; DEESIS, vertical
16. Où sont les métadonnées ?
Dans les données elles-mêmes.
Les métadonnées sont internes, "embarquées"
dans les ressources numériques.
Les informations EXIF (et GPS) et IPTC/IIM des
images numériques sont des métadonnées
internes
Les métadonnées XMP peuvent être
soit internes, soit externes
17. Où sont les métadonnées ?
contexte de
publication
(sans métadonnées)
Fichier image numérique informations
externes
explicites
exploitation
Exif IPTC/IIM XMP XMP
copie externe
GPS
Autres informations...
Vignette
intégrée
19. Contexte de publication ... pas besoin de
métadonnées [really ?]
Les informations du contexte
de publication ne suffisent pas
20. Contexte de publication ... pas besoin de
métadonnées [really ?]
C'est mieux.
Mais même avec le Sort by subject
les informations générées
à partir du contexte de publication
ne suffisent pas!
22. Où sont les métadonnées ?
Avantage des métadonnées internes :
l'échange est facilité; la ressource numérique
transporte avec elle ses propres métadonnées
lorsqu'elle est téléchargée, copiée, renommée,
compactée, etc.
Inconvénient des métadonnées internes :
il est nécessaire de copier les métadonnées
dans une base de données pour exploiter une
grande collection de ressources numériques.
23. Lire les métadonnées internes des images
Pour lire les métadonnées internes des images, pas besoin
d'outils onéreux ou compliqués
●
En local : il existe des outils gratuits, par exemple XnView
●
Sur le Web, il n'est même pas nécessaire de télécharger
l'image, utiliser Jeffrey's Exif Viewer http://regex.info/exif.cgi
Image de Wikimedia Commons
http://commons.wikimedia.org/wiki/File:Statue_Berthold-Brecht-Platz_(Mitte)_Berthold_Brecht.jpg
26. Une métadonnée n'est pas obligatoirement
textuelle
Vignette
Métadonnées textuelles
intégrée
Une vignette intégrée peut (parfois)
fournir beaucoup d'informations.
C'est une métadonnée...
27. Ce que les métadonnées
ne sont pas....
●
Contrôle des usages et droits,
DRM [Digital Rights Management]
●
Tatouage invisible [watermarking]
●
Stéganographie: dissimuler un message dans un
autre message (en particulier une image
numérique)
●
Digital forensics: analyse technique des
retouches, examen de l'authenticité
["diplomatique numérique"]
28. Métadonnées et images – EXIF
EXIF est une abréviation de EXchangeable Image File. Ce format définit les
informations d'ordre technique contenues dans les fichiers des images.
Ce sont donc des métadonnées de type interne.
Le format EXIF a été développé en octobre 1995 par le JEIDA
(Japan Electronic Industry Development Association).
La version 2.0 date de novembre 1997, la révision 2.1 de juin 1998 et la révision 2.2
d'avril 2002.
Ce n'est pas un standard, mais il est supporté par tous les fabricants d'APN
(avec des variantes propriétaires)
Les informations EXIF concernent les paramètres de prise de vue et les
réglages de l'appareil au moment de la capture numérique :
✔ fabricant et modèle de l'appareil
✔ hauteur et largeur de l'image
✔ date et heure de la prise de vue
✔ orientation
✔ résolution, temps d'exposition, ouverture
✔ présence d'un flash
✔ coordonnées GPS sur certains appareils hauts de gamme récents
✔ etc. [30 éléments environ]
29. Géolocalisation des images ? Très simple...
Opérations
documentaires
équivalentes ?
localisation
adresse postale
Le Mont-Saint-Michel, 50116, Manche, France
latitude / longitude
48° 38' 10'' N, 1° 30' 41'' W geotags
30. Géolocalisation des images ? Pas si simple...
Crédit El Guanche sur Flickr
Licence Creative Commons
Le Mont-Saint-Michel et le rocher de Tombelaine vus d'avion
Pour exprimer en geotags cette localisation:
✔
Distinguer entre localisation du sujet et localisation de la prise de vue
✔
Utiliser d'autres geotags également indispensables: altitude et direction
31. Géolocalisation des images ? Pas si simple...
Crédit mafleen sur Flickr
Licence Creative Commons
La tour de Tokyo (35° 41' N, 139° 46' E)
et le mont Fuji (35° 21' 29" N, 138° 43' 52" E)
Sujet : descriptions multiples
(ici avant-plan et arrière-plan distants de 100 km environ)
32. (Géo)localisation des images ? Pas si simple...
Sujet / localisation:
Detroit, Michigan, USA localisations
Prise de vue / localisation: très différentes
Riverside Park, Windsor, Ontario, Canada
33. Géolocalisation des images ? Pas si simple...
les sujets peuvent
être multiples
Sujet / localisation
Sujet / geotags
≈ adresse: voie, ville, pays
latitude, longitude, altitude, direction
précisions sur la localisation du sujet
Relations "floues"
(non biunivoques)
Prise de vue / localisation
Prise de vue / geotags
≈ adresse: voie, ville, pays latitude, longitude, altitude, direction
précisions sur la localisation du photographe
34. Geotags Exif
Plus de 30 champs
seuls 5 ou 6 sont couramment
utilisés
Source: ExifTool by Phil Harvey
35. Géocodage des images
Méthodes les plus répandues
APN pourvu d'un GPS intégré
Saisir les coordonnées GPS à la main
✔
voir les sites www.geonames.org et www.tageo.com
Associer une image à une localisation sur une carte telle
que Google Earth
✔
programmes: Geotag, RoboGeo, Picasa, Panorado Flyer (extension
de l'explorateur Windows), etc.
Exploiter par interpolation les tracks d'un GPS actif lors
des prise de vues en fonction des timestamps des images
fournis par l'APN; les horloges de l'APN et du GPS
doivent être aussi synchrones que possible.
✔
programmes: Geotag (GPL), RoboGeo, etc.
36. Démonstration : "hacker" les
métadonnées Exif
●
Sur le dossier Exemples IPTC XMP Exif
●
Afficher les métadonnées de la photo
ColloqueVisualStudies.jpg
●
Modifier
Non recommandé....
sauf parfois pour corriger:
date/heure de prise de vue
et/ou
coordonnées GPS
37. Exif – autre exemple d'application
Recherche de photos selon le numéro de
caméra Exif
www.stolencamerafinder.com
Exemples de photos sur le groupe Flickr
www.flickr.com/groups/stolencamerafinder/
Numéros: 2131301027, 2321301928
38. Indexation des photos
Deux grandes catégories
Photos d'actualités
Editorial, News
✔
titre, description/légende, (parfois mots-clés)
Photos d'illustration
Creative, Illustration, Documentaire, Stock
en général atemporelles
✔
Mots-clés, (parfois légendes)
Les historiques sont traitées comme l'éditorial
44. Métadonnées et images – IPTC/IIM
L'IPTC (International Press and Telecommunications
Council) est une organisation internationale qui développe
des standards d'échange de données pour la presse
L'IPTC et la NAA (Newspaper Association of America) ont
créé en 1991 le modèle global de données appelé
Information Interchange Model [IIM]
Sous-ensemble de l'IIM utilisé par Adobe dès 1994 pour
définir dans Photoshop les informations associées à une
image
C'est ce sous-ensemble composé de 33 champs qui est
communément appelé métadonnées IPTC
45. Métadonnées et images – IPTC/IIM
Métadonnées IPTC = ensemble de champs
textuels (Titre, Légende, Mots-clés, Copyright,
etc.) stockés dans le fichier image
Très utilisé dans la presse et l'édition
46. Métadonnées et images – IPTC/IIM
Privilégier un ensemble restreint de champs gérés par la
plupart des programmes d'édition IPTC. Par exemple:
✔
n° 25, Keywords (Mots-clés) champ répétable
✔
55, Date Created (Date de création)
✔
80, By-line (Auteur)
✔
90, City (Ville)
✔
101, Country/Primary Location Name (Pays)
✔
105, Headline (Titre)
✔
120, Caption/Abstract (Description/Légende)
le plus long champ du standard (2000 caractères maximum)
Respecter le standard en ce qui concerne la répétabilité et
la longueur maximale des champs
Afficher le document
Champs IPTC - préconisations et correspondances.pdf
47. Métadonnées et images – IPTC/IIM
Inconvénients majeurs
La structure IPTC/IIM est figée
Longueurs limitées des champs
Problèmes de caractères accentués
(Windows / Macintosh)
Inadaptée à la rédaction des descriptions
multilingues
48. Métadonnées et images – IPTC/IIM et Exif
IPTC/IIM : métadonnées ayant trait à la sémantique ou au
droit de l'image et nécessitant l'intervention d'un opérateur
humain pour être renseignées :
By-line, Headline, Caption/Abstract, Copyright, etc.
EXIF : métadonnées techniques relatives à la prise de vue
et fournies automatiquement par un appareil numérique.
Conséquences :
Prohiber l'usage des champs EXIF ImageDescription,
Artist et Copyright.
Privilégier la date EXIF par rapport à la date IPTC/IIM
(puisque la date de prise de vue est fournie
automatiquement par l'appareil numérique)
50. Systèmes de vocabulaires contrôlés
Liste indicative, non exhaustive et non prescriptive
Les DAM (Digital Asset Management)
●
Algoba Orphea Studio
●
Armadillo
●
Orkis Ajaris
●
ConfessMedia
●
Profium Metadata Server & News Solution
●
Xinet
The Controlled Vocabulary Keyword Catalog
http://www.controlledvocabulary.com/products/index.html
Pour: Apple Aperture 1.5 or later, AntZero AtomicView 1.2 or later, Breeze Systems
Breezebrowser 1.5 or later, Adobe Bridge 2.1 or later, FotoWare FotoStation, IDimager
Systems, Inc. IDimager 4.0 or later, BlueBox Image Info Toolkit, iView Media Pro
3/Expression Media 1.0 or later, Adobe Lightroom 1.1 or later, Camera Bits Photo Mechanic
4.5 or later, HindSight Ltd. StockView 5 & METAMachine 1.0 or later
51. Dublin Core Metadata Initiative [1/3]
Prolifération de besoins "métiers" variés (musées,
bibliothèques, archives, etc.)
Diversité et non-interopérabilité des nomenclatures, des
structures, des techniques de stockage
Recherche d'un standard
NCSA (National Center for Supercomputing Applications)
OCLC (Online Computer Library Center)
réunis en 1995 au siège de l'OCLC à Dublin, Ohio
Définition d'un ensemble de métadonnées communes à
diverses communautés : le Dublin Core Metadata Initiative
(DCMI).
52. Dublin Core Metadata Initiative [2/3]
Le Dublin Core est un ensemble de 15
éléments de métadonnées ayant trait :
✔
au Contenu
Title, Description, Subject, Source,
Coverage, Type, Relation
Creator et non pas Author
✔
à la Propriété intellectuelle
Creator, Contributor, Publisher, Rights
✔
à la Version
Date, Format, Identifier, Language
DC définit un vocabulaire de métadonnées
commun à plusieurs communautés
53. Dublin Core Metadata Initiative [3/3]
Le Dublin Core ne prétend pas répondre aux
besoins et à la complexité de tous les métiers
Le Dublin Core est un ensemble simple et très
utilisé de métadonnées, mais il n'est pas
suffisant
Dans la plupart des besoins professionnels, il
doit être complété par d'autres schémas de
métadonnées
Le Dublin Core est une norme ISO (n° 15836)
Pour en savoir plus: www.dublincore.org
54. XMP – Extensible Metadata Platform
Créé par Adobe (septembre 2001)
Utilise une version simplifiée de RDF
(Resource Description Framework)
●
Développé par le W3C, base du Web sémantique
●
Permet d'encoder, échanger et réutiliser des métadonnées
structurées
●
Peut s'exprimer en XML
Utilise le schéma Dublin Core comme fondation
(préfixe de l'espace de noms XML: dc:)
Standardisation ISO (DIS 16684-1) en cours de
finalisation
55. XMP – Extensible Metadata Platform
Les espaces de noms XMP sont des conteneurs
Source: Fotoware
56. XMP – Extensible Metadata Platform
Les champs appartiennent à un espace de noms
Source: Fotoware
57. XMP – Extensible Metadata Platform
Les espaces de noms permettent d'éviter les collisions
Source: Fotoware
59. Bien connaître vos outils dans les workflows
complexes
Ne pas utiliser des outils non XMP
après avoir travaillé avec des outils XMP
IPTC n°120: Chatons IPTC n°120: Deux chatons IPTC n°120: Deux chatons
XMP dc:description: Chatons XMP dc:description: Chatons XMP dc:description: Chatons
Indexation avec un outil XMP Modification à l'aide d'un outil Retour à un outil XMP
uniquement IPTC/IIM (non XMP)
60. Perspectives ouvertes par XMP
En quoi XMP est-il plus performant que l'IIM ?
IPTC/IIM XMP
Binaire (non facilement lisible) Lisible (XML)
Statique Extensible et évolutif
Extensibilité non documentée Extensibilité documentée
(champs non standards) (Namespaces)
Pas de types de données Types de données et types
structurés
Problèmes d'accents Pas de problèmes d'accents
(codage Unicode)
Inadapté aux légendes Adapté aux légendes
multilingues multilingues
61. Démonstration
Extensibilité (démonstration sur Photoshop)
Observer le panneau Avancé
Ajouter les Custom panels contenus dans le dossier
Custom panels XMPAVM (Astronomy Visualization
Metadata Standard)
62. Panneaux standards sur Photoshop [version CS ; semblable sur les versions plus récentes]
70. Flickr et les métadonnées
Métadonnées de la haute définition (taille: originale)
Renseignement automatique de champs Flickr à partir des
champs IPTC lors du téléchargement d'une photo
71. Flickr et les métadonnées
Afficher les métadonnées des photos à l'aide du suffixe meta
72. Avantages de la méthode de codage des
métadonnées dans les photos
La description textuelle de l'image est
toujours disponible avec l'image et
facilement réutilisable
L'utilisateur reste libre de la technologie de
base de données utilisée pour l'exploitation
de son corpus d'images
Les données vous appartiennent,
elles n'appartiennent pas à votre prestataire de service
73. Analyser la circulation des images
sur Internet
Distinguer les images d'actualité ... et les autres
Pour les "autres" images
✔
TinEye et Google Search By Images
✔
Banques d'images générales: Getty, Corbis, Flickr,
etc.
✔
Et/ou banques d'images spécialisées
74. Analyser la circulation des images
sur Internet
Pour les images d'actualité, recherche avec Google News
Puis rechercher le nom du photographe ou la légende de
l'agence (très souvent reproduite par les médias)
avec Google Images et Google News
Dans tous les cas (actualités ou non), cela demande:
✔
Un peu de méthode
✔
Un peu de chance
✔
Du temps (et parfois beaucoup de temps)
82. Images d'actualité: Recherche de "In this picture taken May 26, 2011
cucumbers from Spain, tomatoes and other vegetables are on display on
a market in Hamburg northern Germany"
83. Pour en savoir plus
Métadonnées: une initiation
peccatte.karefil.com/software/Metadata.htm
Le site de l'IPTC
www.iptc.org
Adobe Extensible Metadata Platform (XMP)
www.adobe.com/products/xmp/main.html
Controlled Vocabulary
www.controlledvocabulary.com