[Workflow numérique] IPTC et métadonnées, Part I : Définition et utilisation

10/01/2007 6 commentaires par Cédric G. +

En matière de photographie numérique, l’un des aspects pratiques les plus difficiles à gérer par l’utilisateur régulier d’un grand nombre de photographies (photographe, iconographe, graphiste, agence…) réside dans la classification et la recherche des photographies.

Pour cela, un certain nombre d’outils ont été mis en place dans le passé et ont été appliqués aux fichiers numériques de toute origine : les métadonnées. Définition et intérêt de ces « données servant à décrire une autre donnée quelque soit son support » !


Petit historique

Dans le passé, la gestion documentaire (quelle qu’en soit la forme) passait par la tenue d’un registre décrivant, pour chaque document, les informations qui le caractérisent : titre, auteur, classification, description, mots-clés éventuels… Lorsque la G.E.D (Gestion Électronique des Documents) est apparue avec l’informatisation et que les formats documentaires l’ont permis, ces informations furent directement intégrées dans les documents eux-mêmes, pour des raisons de « facilités » : ce sont ces données descriptives intégrées que l’on appelle métadonnées.

C’est en 1979 que l’I.P.T.C. (International Press Telecommunications Council) lance le premier « standard » de description de documents textes pour les partages d’information au sein de la Presse Internationale. En 1991, l’I.I.M (Information Interchange Model) est proposé comme entête électronique intégré, pour les documents électroniques multimédia, et en 1994, donne naissance à la première norme dédiée aux images numérique : les IPTC Headers (littéralement : entêtes IPTC), très largement utilisées depuis sur les formats JPEG et TIF notamment pour la description des images.

Parallèlement à la spécification initiale de l’IPTC, et avec l’apparition des premiers appareils photonumériques « grand public », la JEIDA (la Japan Electronic Industry Development Association, qui regroupe les principaux fabricants d’appareils photonumériques) propose dans les années 1990 une nouvelle spécification destinée à décrire les informations relatives aux données techniques de l’image : l’EXIF (Exchangeable image file format). Cette spécification, initialement prévue pour les formats JPEG et TIFF, propose de stocker dans des entêtes de métadonnées, toutes les informations relatives à la prise de vue (ouverture de diaphragme, vitesse, sensibilité ISO, correction d’exposition, mode d’exposition, etc…) mais aussi des informations pratiques (marque, modèle d’appareil, date et heure de prise de vue…).

En 2001, Adobe propose un système propriétaire pour permettre le stockage des IPTC Headers aussi bien sur des formats de fichiers supportant IPTC que ne les supportant pas (dans un fichier texte externe) : le format XMP (eXtensible Metadata Platform). Basé sur la technologie XML (eXtended Markup Language), cette spécification présente un certains nombre d’avantages sur les autres solutions d’enregistrement des métadonnées :

  • Stocker les métadonnées au sein même du fichier permet de garantir l’association métadonnées-fichier et facilite les échanges, tout en permettant pour les formats propriétaires (par exemple les fichiers RAW) le stockage dans un fichier externe de ces informations
  • Grâce à XML, le format est aisément extensible sans créér de problème de compatibilité
  • L’usage d’Unicode (qui est une norme informatique permettant de donner à tout caractère de n’importe quel système d’écriture de langue, une identification et une codification unique) permet l’intégration de texte en n’importe quelle langue (ce qui n’est pas le cas avec la version initiale d’IPTC, ou avec la spécification EXIF)

La spécification XMP propose aussi le support de nouveaux formats de fichiers : JPEG, JPEG 2000, GIF, PNG, HTML, TIFF, Adobe Illustrator, PSD, PostScript, etc… ce qui présente donc à sa sortie un avantage indéniable sur la spécification IPTC initiale. De plus, de part sa structure, XMP prend en charge le stockage des informations EXIF !

En 2002, une nouvelle déclinaison d’EXIF propose la prise en charge des informations de géolocalisation GPS (fonctionnalité disponible sur certains boîtiers professionnels très haut de gamme seulement à l’époque, et encore actuellement d’ailleurs !…)

Les informations EXIF ne sont pas destinées à être modifiées après la prise de vue : elles sont renseignées par le dispositif de prise de vue (photoscope, reflex numérique) et sont utilisées généralement à des fins techniques ou statistiques. De ce fait, nous n’aborderons pas leur gestion dans le cadre de cet article !

En 2004, Adobe et l’I.P.T.C. rapprochent leurs travaux, ce qui donne naissance un an plus tard à la norme IPTC Core (qui prévoit la prise en charge, au travers d’un framework pour les développeurs, du format XMP étendu avec Headers IPTC, EXIF, etc… en utilisant tous les avantages d’XMP avec quelques fonctionnalités supplémentaires, dont la gestion du versioning… d’ailleurs largement utilisée par Adobe Version Cue, outil de gestion de versioning fourni dans la dernière Creative Suite d’Adobe !)

Intérêt des métadonnées pour le photographe

La gestion dite « documentaire » des images numériques passe obligatoirement par l’utilisation des IPTC (nb : à partir d’ici, je nommerai « IPTC » la spécification de stockage des métadonnées de description IPTC Core). Elles proposent 4 grands groupes d’informations relatives à la description de l’image :

  • Les informations relatives à l’auteur (on y trouve divers champs renseignant les coordonnées du photographe : adresses postale, téléphonique et électronique)
  • Les informations relatives au contenu de l’image proprement dite (au travers de 2 types de champs : les champs dits « fixes » – comme la description, qui peut aller jusqu’à 2000 caractères, et le titre, qui peut aller jusqu’à 256 caractères – et les champs dits « extensibles » – comme les mots-clés ou les catégories de classification)
  • Les informations de classification de l’image (date de création, genre, catégories de classification – les mêmes que ci-dessus – et géolocalisation éventuelle de la scène…)
  • Enfin, les informations relatives aux conditions d’utilisation de l’image et à son statut (informations relatives au Copyright)

Correctement renseignées et utilisées, ces informations permettent de disposer d’une base documentaire globale (sur la photothèque entière) avec un potentiel énorme en matière de recherche/classification ! En effet, nombreux sont les outils informatiques permettant nativement d’effectuer des recherches sur tel ou tel type de champs, et par ce biais de se constituer des « collections d’images » liées entre elles par des critères multiples et variés.

Accessoirement, lorsque le photographe commence à travailler avec des gestionnaires extérieurs sur ses images (agences d’illustration, agences de news, banques d’images…) l’utilisation des IPTC prend alors toute son importance, et j’oserais dire : devient primordiale ! D’une part parce que la majorité de ce type d’entreprise utilise grandement ces métadonnées, et d’autre part parce qu’elles permettent au photographe d’organiser de manière efficace sa propre photothèque.

La seule contrainte étant de trouver « son » organisation (au niveau des thématiques de classification par exemple, ou du choix des mots-clés) et surtout, de l’appliquer de manière régulière !

Outils permettant la gestion des métadonnées IPTC

Il existe actuellement diverses solutions pour la gestion des IPTC (norme IPTC Core) : la principale et la plus intéressante reste celle proposée par Adobe au travers de ses outils (Photoshop, Illustrator, InDesign, mais aussi et surtout Bridge ! C’est cette dernière solution qui fera l’objet de futurs articles sur la mise en oeuvre pratique de la gestion des IPTC, sur ce blog 😉 )

Il existe des solutions alternatives et gratuites, et notamment :

  • Pixvue qui permet une gestion « intégrée » à l’Explorateur Windows, très élégante par ailleurs, mais que je trouve personnellement fort intrusive dans le système d’exploitation, la base de registres étant fortement chargée après l’installation (ndlr : ce logiciel a cessé d’être supporté par son auteur et n’est donc plus disponible) !
  • Microsoft Photo Info, outil gratuit récemment mis sur le marché par Microsoft et qui permet simplement via l’explorateur, d’accéder aux données IPTC d’un certain nombre de fichiers images avec une gestion de certains formats RAW (mais qui n’implémente malheureusement pas la norme IPTC Core et se limite à IPTC 🙁 et engendre sur certaines images issues d’appareils anciens, la perte de certains champs EXIF spécifiques – dommage car il est bien pratique !)
  • XnView que j’utilise personnellement (c’est un clône gratuit et français du célèbre ACDSee, compatible avec Windows, Mac OS X, mais aussi une multitude de déclinaisons de Linux et d’Unix !), et qui permet une gestion simple des IPTC – son auteur, Pierre-Emmanuel Gougelet, reste très dynamique et ouvert à toute proposition et fait évoluer son outil de manière très régulière !

Enfin, une dernière catégorie d’outils permet une gestion plus spécifique des IPTC, celle des catalogueurs spécialisés : on y retrouve IView Media Pro (devenu Microsoft Expression Media suite au rachat de la société éditrice par le géant de Redmond), Imatch ou encore Fotostation. Je trouve personnellement ces outils trop « génériques » et pas assez orientés « photographie » pour justifier leur acquisition pour un photographe indépendant ou amateur expert : une bonne gestion « manuelle » des IPTC avec les outils précédemment cités permet de s’en sortir correctement !

À noter : les futures versions de Windows (je ne sais pas si Windows Vista l’inclus, n’ayant pas encore testé cet OS, mais c’est tout-à-fait possible), géreront nativement le support du format XMP dans l’explorateur et intégreront un moteur d’indexation basé sur SQL Server et XML au système, garant de performances élevées d’autant que le futur système de gestion de fichiers WinFS (pour le moment repoussé à une date ultérieure d’après mes dernières informations) permettra la classification « virtuelle » des fichiers dans plusieurs répertoires et la gestion du versioning !!!

, ,

L'auteur : Cédric G.

Auteur photographe animalier, informaticien et passionné d'animaux et de nature. Administrateur du blog Aube Nature

6 réponses sur [Workflow numérique] IPTC et métadonnées, Part I : Définition et utilisation

  1. Rémi a écrit

    Bravo pour cet article qui en appelle d’autres tout aussi passionnants.
    Après m’être focalisés sur les logiciels de traitement des images, je me rends aujourd’hui compte de l’importance énorme d’une bonne gestion de sa base photo. Je m’en sortais jusqu’alors avec DigiKam, mais je me suis "enfermé" dans ce logiciel jusqu’à ce que je passe à Bridge et que… ma base DigiKam disparaisse.
    Je me mords aujourd’hui les doigts de ne pas avoir utilisé de formats standards comme IPTC, qui auraient facilité l’interopérabilité entre logiciels. Et je le ferai jusqu’à avoir ré-indexé toutes mes photos (pfff… d’un autre côté, c’est l’occasion de les parcourir à nouveau).

    Par contre, je ne partage pas ton avis sur l’intérêt limité de logiciels comme iView (aujourd’hui M$ :-(). Je ne connais aujourd’hui aucun équivalent qui soit aussi efficace pour naviguer dans sa base image. Car, c’est bien joli d’indexer, mais le but, c’est tout de même de retrouver ses petits. Mais je ne suis pas prêt non plus à payer 350 € pour ça.

  2. Cédric Girard a écrit

    Salut Rémi

    Hi hi je savais que j’allais avoir une remarque à propos de cela… En fait ce que je reproche le plus à ce genre de logiciel, c’est de proposer des fonctionnalités dont on n’a que faire (gestion des formats bureautique, des vidéos et fichiers multimédias, fonctions de retouches basiques d’images, etc…) : AUCUN ne va à l’essentiel avec une interface simple et une ergonomie digne de ce nom !

    Dans l’absolu avec Bridge, on répond à tous les besoins d’un photographe amateur expert (et même d’un photographe pro ayant une photothèque relativement modeste – moins de 10 000 photos – et bien organisée !…)

    Il ne fait aucun doute qu’arrivé à un certain seuil il faut absolument passer sur ce type de logiciels, mais je persiste à dire qu’à l’heure actuelle, aucun de répond parfaitement aux besoins réels des photographes.

    J’avais commencé à développer un truc (en VB.Net), un clône simplifié mais fonctionnel d’ACDSee, mais je n’ai jamais trouvé d’infos exploitables et simplement exposées concernant la gestion des métadonnées, ce qui m’a quelque peu freiné dans mon élan… Et désormais je n’ai plus le temps de m’y coller ! Mais peut-être qu’un jour je prendrai mon courage à deux mains et je replongerai dans la programmation !

  3. Cédric Girard a écrit

    Je rajouterai que le jour où je passerai à Vista et WinFS, je pense que je pourrai définitivement me passer de tels logiciels, car les fonctionnalités de gestion des métadonnées seront intégrées à l’O.S. et bénéficieront de toute la puissance de recherche de l’indexation des fichiers (ps : pour bosser essentiellement sur SQL Server dans le cadre de mon boulot, j’en connais un peu la puissance 😉 )

  4. benoitJ a écrit

    Salut Cédric, comme je me réinstalle à Tours, en ce moment, le net c’est où et quand je peux… mais comme tu vois j’oublie pas de passer de temps en temps sur mes blogs préférés 🙂 Surtout que je sais d’expérience le temps que prend la rédaction d’article de ce genre.

    Bref, super article. Surtout l’historique. Je suis impatient de lire les suivant 🙂

    Pas grand chose à redire… j’ai appris pleins de choses dans ton historique, tu as bien décris les formats et je suis à 90% de ton avis en ce qui concerne les logiciels.
    Mais là où tu aurais du plus appuyer est sur le fait que ce n’est pas le choix logciel le plus dur mais d’arriver à créer un flux de travail suffisament strict et adapté aux travaux de chacun pour que le classement soit efficace.

    Donc dans un prochain article un exemple de procédure de la saisie des métadonnées jusqu’à la recherche et l’exportation d’un lot d’image ? 😉

    ++
    Benoit

  5. LeCelte a écrit

    Salut,

    Très instructif cette première partie, je me susi intéressé aussi à ces metadonnées mais je n’avais pas abordé l’historique.
    Je te rejoint sur les softs "à tout faire" qui ne répondent pas à nos besoins "basiques".
    Par contre, Bridge me donne de l’urticaire … J’ai vraiement du mal avec cette usine à gaz !

    J’ajouterai qu’il y a un outil formidable pour voir/modifier quasiment toutes ces méta-données, c’est Exiftool. Le seul problème c’est qu’il est écrit Perl et donc en ligne de commande (cf tuto sur mon site). Je teste actuellement une interface graphique que m’a codé un ami en VB pour le rendre utilisable sous windows.

    A+
    Yann

  6. Cédric Girard a écrit

    Petite précision : Pixvue n’est plus maintenu et de fait, n’est plus disponible… On pourra installer Microsoft Photo Info (cf l’article sur ce blog qui lui est consacré) mais attention, il ne gère pas IPTC Core intégralement, et semble altérer certaines entêtes EXIF (sans conséquences néanmoins sur l’utilisation des images). Dommage, il est bien pratique !

Laisser un commentaire