Outils & Ressources en ligne, Réflexions

Conférence – Can I Use It (2)

Toujours dans le cadre du programme Images/Usages, l’institut national d’Histoire de l’art (INHA) organisait le 24 avril 2018 une nouvelle conférence consacrée à l’illustration patrimoniale en ligne. Trois intervenants, trois thèmes :

  • Laurent Manœuvre, chef du Bureau de la diffusion numérique des collections et de l’unité de documentation, Direction générale des patrimoines ;
  • Jean-François Depelsenaire, directeur de Vidéomuseum ;
  • Elli Doulkaridou, chargée de projet au sein du programme Images/Usages à l’INHA/Fondation de France.

Le premier nous a présenté le portail Joconde, le second nous a parlé de Videomuseum et plus particulièrement de la gestion des droits des images sur ce portail, et la session s’est terminée avec la présentation des collections en ligne sur la page Ressources du site Iconautes. Cette session était donc majoritairement consacrée à des présentations de programmes et d’outils, que nous retranscrivons ici, et les erreurs sont bien évidemment nôtres.

Joconde

Le portail et son histoire

Le portail présente le catalogue collectif des collections des musées de France, des fiches, des ressources pour professionnels du patrimoine et de la documentation en ligne. L’initiative est ancienne : il fallait trouver une alternative à la publication papier des inventaires. La question de l’image ne se posait pas vraiment à l’époque, les moteurs de bases de données ne permettant pas de les gérer, mais le projet était poussé par des visionnaires comme Jean-Louis de Cénival : on savait qu’on se lançait dans une entreprise de long terme.

Cette ancienneté est l’une des caractéristiques premières de Joconde, qui était accessible sur Minitel en 1992, moins de vingt ans après la création des bases patrimoniales en 1975.

Minitel
Minitel à Futur en Seine en 2012 (photo Lionel Allorge). Tout ceci ne nous rajeunit pas.

L’enrichissement de la base se fait selon une méthode old school mais qui a fait ses preuves : les musées fournissent régulièrement des fichiers extraits de leurs propres bases, qui sont intégrés à Joconde. Le portail est donc très dépendant de la bonne volonté et des capacités de traitement des musées, nous aurons l’occasion d’y revenir dans un billet futur. Et, depuis toutes ces années, peu à peu, le répertoire des collections nationales se construit.

La première exposition virtuelle est mise en production en 1994 après une collaboration avec l’INRIA (Institut national de recherche en informatique et automatique), sur le thème des peintures du siècle des Lumières (on pourra lire un historique rapide des musées virtuels ici sur le site du réseau Canopé). Un plan national de numérisation est lancé, avec l’aide de l’État aux musées. Petit à petit, les bases sont fusionnées (entre départements du Louvre, puis entre musées). Le nom du portail, Joconde, pose alors problème : très connoté « beaux-arts », il n’évoque pas l’énorme volume d’objets ethnographiques ou scientifiques dans les collections… mais c’est fait.

Voir et savoir : quelques chiffres

Les chiffres sont élevés sur le papier : 590 000 notices environ, des mises à jour permanentes, 17 vocabulaires scientifiques, 390 000 fiches ayant une ou des images associées. Mais le calcul effectué en 2011, avec pourtant quatre millions d’objets numérisés, est déprimant : à ce rythme, il faudra deux mille trois cents ans pour s’en sortir. La mise en place du récolement décennal accélère les choses, et fin 2015 ce sont plus de treize millions d’œuvres qui sont numérisées : dans vingt-cinq ans, on pourrait en voir le bout. Quant à la fréquentation du site, elle est calculée entre autres sur les images ouvertes en plein écran, partant du principe qu’elles montrent que le visiteur s’intéresse pour de bon à l’objet.

Que mettre dans Joconde ? Que laisser « dehors » ?

Plusieurs stratégies sont possibles, de l’intégration totale à la hiérarchie de liens. Joconde se situe plus du côté de cette deuxième solution, avec le choix d’une base « sèchement descriptive » (sic) mais qui pointe vers des sites qui lui sont complémentaires, entre autres :

  • les agences photo pour les commandes d’images en haute définition ;
  • le  répertoire des musées français pour les fiches de ces derniers (le site est plutôt mal référencé dans les moteurs de recherche, heureusement qu’on a… Joconde pour le retrouver) ;
  • la base Arcade des archives des commandes de l’État, qui comporte des informations sur les artistes entre autres ;
  • les sites des musées et des fédérations de musées ;
  • le RÉTIF (Répertoire des tableaux italiens dans les collections publiques françaises) le cas échéant.
Capture d'écran : résultat de recherche plein texte sur Joconde
Capture d’écran : résultat de recherche plein texte sur Joconde

Dans « l’autre sens », le contenu de Joconde est aspiré par le moteur Collections, lui-même moissonné par Europeana, répertoire des collections européennes. Ainsi, si la vie de la donnée entre le musée et Joconde peut apparaître comme s’appuyant sur des techniques rudimentaires (mais robustes), l’autre partie de la chaîne est quant à elle conforme à l’attendu contemporain.

Par ailleurs, à travers le projet JocondeLab et l’usage qu’il fait des données offertes par Wikipédia, certains termes peuvent être automatiquement traduits dans les quatorze langues les plus utilisées sur l’encyclopédie en ligne, puisqu’ils sont connectés entre eux dans le jeu de données généré à partir de Wikipédia. D’autres projets sont en cours comme Iconolab (annotation collective d’images) et MonaLia [NDLA : je n’ai pas trouvé de site décrivant ce projet, il est possible que j’en aie mal noté le nom] avec l’INRIA pour la reconnaissance de formes. L’objet est d’indexer et de mettre en ligne de nouveaux fonds pour les rendre accessibles, par exemple les archives d’Ingres, riches d’informations concernant plusieurs domaines artistiques et historiques.

À l’arrivée, les données sont partiellement ouvertes, et les images ne le sont pas. Le site data.culturecommunication.gouv.fr, qui expose les données issues de Joconde, donne accès aux éléments essentiels de la notice.

Videomuseum

Le besoin et la réponse

Cette histoire-là commence en 1987, dans un temps de foisonnement soudain après l’augmentation du budget de la culture : beaucoup d’acquisitions, et avec elles la nécessité de vérifier la cohérence de l’enrichissement des collections, et de coordonner la politique de dépôts. Il faut donc regrouper les informations et, en passant, donner une visibilité au réseau des fonds d’art contemporain.

L’équilibre de cet écosystème est différent de celui de Joconde, car c’est Videomuseum qui traite toute la chaîne depuis la saisie, ce qui impose d’amener tous les intervenants à utiliser les mêmes outils. De son côté, Joconde les laisse bien faire ce qu’ils veulent, tant qu’ils fournissent des extractions au bon format.

Page d'accueil de Videomuseum
Page d’accueil de Videomuseum

Au total (début mai 2018), on compte donc 64 collections et 377 000 œuvres environ, malheureusement sans illustration systématiquement accessible sur Internet. Videomuseum le voudrait mais le coût, estimé à 80 000 € par an, rend la chose impossible : ce n’est pas le droit qui l’interdit, mais la gestion actuelle des droits patrimoniaux qui l’empêche de facto. Et, la période concernée débutant avec le XXe siècle, rares sont les œuvres qui seraient tombées dans le domaine public… ce qui, on a pu le voir par ailleurs, ne résout pas tous les problèmes et ne fabrique pas magiquement des images gratuites.

Gérer les droits, naviguer dans les données

Le compromis adopté par Videomuseum est de prendre en charge la diligence requise, cette bonne volonté mise à identifier aussi exhaustivement les gestionnaires de droits quels qu’ils soient : l’artiste, des ayants droit, un estate, une société de gestion collective (ces dernières, donnant accès à un guichet unique, sont l’un des « cas simples »). Les choses bougent, mais lentement : l’ADAGP (Société des auteurs dans les arts graphiques et plastiques) a par exemple fini par admettre que les bases de données constituent un cas juridique à part, ce qui a permis de baisser le coûts pour les publications en nombre. Le modèle n’est pas encore complètement adapté, les droits étant payés annuellement pour une publication en ligne, ce qui multiplie les coûts par rapport à l’imprimé et fait de ces coûts des frais de fonctionnement récurrents, et non pas un investissement ponctuel.

Videomuseum fournit donc un fichier d’artistes commun à l’ensemble de ses membres, leur permettant de partager un même référentiel qui contient également les informations liées aux droits. Charge aux institutions partenaires ensuite de négocier comme elles l’entendent (ou le peuvent) les droits, et de saisir leurs propres fiches collections, qui sont stockées dans des bases distinctes. Une fonctionnalité de recherche transversale a donc été mise en place pour lister les œuvres d’un artiste de manière transversale, entre les différentes collections, avec une navigation par filtres également.

Comme Joconde, Videomuseum encourage les musées et les FRAC (fonds régionaux d’art contemporain) à contextualiser les œuvres en ajoutant de la documentation numérique pour enrichir la base. L’outil de recherche (NavigArt) permet également de découvrir les expositions et dépôts d’une institution, avec un système de filtres cumulatifs.

Pour la partie technique, les données sont exportables au format JSON (JavaScript Object Notation, un langage de description standardisé qui permet de donner les caractéristiques d’un objet sous forme de texte structuré). Elles sont indexées avec un moteur ElasticSearch et accessibles via une API (interface de programmation applicative : c’est une « porte ouverte » pour que des programmes extérieurs puissent interroger directement Videomuseum et y récupérer des informations) développée à l’aide de Ruby on Rails.

De ce qu’on peut en voir donc, autant le site Internet lui-même offre un design sobre voire rudimentaire (on apprécierait une section d’informations plus facilement navigable que la plaquette de présentation PDF à télécharger), autant d’un point de vue technique il cherche à passer le message que l’avenir est dans la donnée ouverte, offerte, accessible et compréhensible, et ça, on aime.

Quelques remarques comparatives et prospectives

(issues d’une séance de questions-réponses)

Ces deux présentations montrent que plusieurs choix sont possibles, certains low-tech et d’autres plus modernes. Videomuseum propose un entrepôt de données moissonnable (c’est-à-dire dans lequel des programmes peuvent venir récupérer automatiquement des données) et une API pour exposer ces données à des tiers ou des institutions participantes (ce qui permet de développer des programmes qui utilisent des informations récupérées, en temps réel, en réponse à une « question » à la base de données de Videomuseum). Ainsi, un musée peut s’appuyer sur cette collection en ligne pour mettre en place des applications de médiation, ou le Medialab (Sciences-Po) peut effectuer une étude des collections en faisant appel à des développeurs pour une semaine d’ateliers interactifs et de questionnements sur les données.

Du côté de la loi, on note des évolutions pas toujours abouties, par exemple les exceptions mises en place par la Commission Européenne mais jamais transposées dans le droit français. Les calculs des prix ne sont pas toujours adaptés, selon qu’on calcule en nombre de vues ou en nombre d’images. L’ADAGP, qui majore au-delà d’un seuil de vues, pourrait y renoncer à terme, simplifiant le travail des musées.

Des questions subsistent pour les notices également, que Joconde ne « possède » pas. Les laisser en accès libre sur Europeana est possible pour les musées nationaux, mais il n’est pas réaliste d’imaginer négocier un à un avec les responsables de musées en régions. Europeana n’offrant pas de financement qui serait nécessaire pour cette opération, l’action se borne à l’envoi de lettres, auxquelles seule la ville de Toulouse a répondu favorablement pour le moment.

Pour ce qui est des images, Joconde ne présente que de petits clichés en basse définition, y compris pour les œuvres libres de droits. Les tensions sont très fortes actuellement, avec des musées à qui les photographes réclament des droits quand le gouvernement lui-même diffuse parfois des messages incohérents, entre Bercy (de l’argent !) et Matignon (des données !). Les faibles moyens disponibles incitant au recours ponctuel à des photographes privés, c’est le droit d’auteur qui prime, une loi originellement conçue d’abord pour permettre aux auteurs de subsister, mais insuffisamment actualisée depuis. À l’arrivée, la qualité de la recherche en pâtit : elle produit des résultats biaisés puisqu’elle s’appuie majoritairement sur les images accessibles gratuitement, y compris pour un usage commercial. Certaines collections dominent donc les publications, en particulier celles du monde anglo-saxon au sein duquel on peut acquérir plus simplement tous les droits sur une œuvre (ce qui reste possible également en France, ou cependant la paternité est inaliénable).

Dans d’autres pays d’Europe, les signaux sont inquiétants : si la pinacothèque de Brera en Italie était ces dernières années un cas exemplaire de mise à disposition d’images en haute définition avec de faibles contraintes, le ministère de la culture italien a depuis passé contrat avec une agence photo (Bridgemann) pour plusieurs années, ce qui ne fait pas imaginer une plus grande disponibilité d’autres images à l’avenir.

La_nascita_di_Venere_(Botticelli)
Botticelli, c’est fini

Ressources iconographiques – Iconautes

THE liste

Le programme Images/Usages met à disposition des internautes une liste, maintenue avec soin, de sites qui peuvent servir de sources d’images. Cette liste se trouve sur la page Ressources du site Iconautes.

Elle regroupe environ un tiers du total des cas étudiés, en fonction des informations qui ont pu être réunies : droits, type d’images que l’utilisateur peut reprendre, mentions légales, nombre d’images. L’une des constatations premières est que la notion d’usage « commercial » est extrêmement vague et que chaque institution semble avoir sa propre définition, ce qui rend difficile à savoir, pour l’utilisateur, ce qu’il a le droit de faire ou non. Ce point sera abordé dans un livre blanc résultant du projet.

Capture d'écran d'Iconautes
« Les sites marqués d’un * contiennent des images sous différentes licences Creative Commons ou indiquées comme disponibles pour le Fair Use. » Hmmmm…

Les agences d’images sont citées en premier, parce qu’elles sont inévitables et parce qu’on voit à quel point elles sont minoritaires dans cette liste. La typologie est sommaire de l’aveu d’E. Doulkaridou : il est difficile de signaler les ressources libres, car souvent il s’agit d’une ouverture partielle des collections. Et il est difficile de maintenir cette liste parfaitement à jour, car (heureusement) de nouveaux dépôts s’ouvrent chaque semaine.

Qu’a-t-on ou pas le droit de faire et quelles en sont les conséquences ?

L’éclaircissement de la question du copyright et de la licence est prévu dans le livre blanc, car le sujet était trop compliqué pour être résumé dans une fiche méthodologique qui aurait été mise à disposition sur le site. Mais cette question revient souvent, par exemple dans les réponses à l’enquête faite pour le programme Images/Usages. À terme, elle sera probablement illustrée d’exemples concrets issus de musées dont la collection est en ligne.

Les contrats de photographes interdisent certains usages et sont parfois antérieurs aux questions qui se posent aujourd’hui. Par exemple, la ville de Toulouse est un modèle d’ouverture de données et verse sur les Communs de Wikipédia un grand nombre d’images, mais ces dernières ne peuvent pas être en haute définition car le cas n’est pas prévu dans les contrats historiques passés avec les photographes. Les institutions font face à tous les cas de figure possibles, souvent à leur désavantage en raison du manque de moyens, qui les conduit à préférer des contrats moins onéreux, mais plus contraignants pour elles.

L’un des buts du programme Images/Usages est de montrer à quel point l’histoire de l’art est une discipline contrainte par ces difficultés, et de pointer les injustices. Et les chercheurs des différents États européens ne sont pas égaux, car les règles sont émises sous forme de propositions non contraignantes par la Commission Européenne, ce qui permet aux États d’adopter à leur rythme ce qu’ils estiment approprié. Le traitement des copyrights est différent : l’Europe émet des directives qu’il faut transposer en droit national, y compris pour les conditions d’utilisation en contexte de recherche ou d’enseignement.

Les institutions françaises sont tenues d’utiliser la licence Etalab, mais la licence CC-BY-SA, plus directement compréhensible (lisez les deux pages en lien pour voir !) et mieux connue, est utilisée par de nombreuses institutions dont la ville de Toulouse déjà citée. Dans tous les cas, un point crucial est de mieux communiquer sur ce que l’utilisateur a le droit ou pas de faire. Les institutions qui, comme l’Art Institute de Chicago, affichent en accès direct un guide d’utilisation, sont minoritaires. De telles conditions sont introuvables sur le site de la RMN (Réunion des musées nationaux).

Capture
Barre de menus du site de l’Art Institute of Chicago. Ce n’est pas si compliqué !

De nouveaux modèles sont sans doute à définir et à expérimenter : aujourd’hui, la RMN envoie des photographes dans les institutions, mais vend les photos. Les musées doivent alors avoir leurs propres agents photographes pour disposer librement de clichés, à moins de négocier un contrat plus permissif avec la RMN. L’un comme l’autre de ces cas semble difficilement accessible à des structures de taille moyenne. Des institutions anglaises comme la Bodleian library ou la bibliothèque de Manchester expérimentent d’autres modèles. Par exemple, pour la numérisation, un système dit de « sponsoring individuel » signifie que le premier usager paie, mais qu’ensuite l’image est mise à disposition du public.

L’ouverture a aussi un coût humain et financier : le Metropolitan Museum aurait licencié vingt personnes depuis la décision d’ouverture des images, quant au musée des beaux-arts de Québec, il estime le coût d’une prise de vue à 1 500$.

Pour aller plus loin

Sur ce dernier point du coût, je m’interroge personnellement. J’ai lu des comptes-rendus et des études de cas de musées qui avaient choisi la politique d’ouverture des données et des images. On peut citer par exemple :

  • « MKG Collection Online: The Potential of Open Museum Collections » (Schmidt, Antje, Hamburger Journal Für Kulturanthropologie (HJK)  0 (2018), p. 25–39) qui fait un retour d’expérience sur un musée en particulier, accessible ici [consulté le 30 avril 2018] ;
  • « The Impact of Open Access on Galleries, Libraries, Museums, & Archives · Copyright Cortex » (Kapsalis, Effie, Smithsonian Institution Archives, 2016), dossier complet avec de nombreux cas, accessible ici [consulté le 30 avril 2018].

L’une des conclusions de ce dernier est que nombre d’institutions faisant le choix de l’ouverture des données en bénéficient largement car, d’une part, les retombées sont supérieures aux recettes perdues, d’autre part ces dernières sont en général très inférieures à ce qu’on suppose, nombre de services de gestion des droits remboursant à peine leurs coûts de fonctionnement. Un petit musée qui ouvre ses images peut alors en sortir gagnant : moins de coûts, plus de simplicité, des agents qui peuvent être affectés à d’autres tâches, et des collections mieux diffusées et reconnues (et la fin du Yellow Milkmaid syndrome).

Mais les modèles étudiés sont majoritairement anglo-saxons et germaniques, et une telle flexibilité évoque des structures de petite taille aux intervenants polyvalents. Je me demande dans quelle mesure le modèle s’appliquerait à nos poids lourds et leurs armées de juristes, mais peut-être me fais-je une idée fausse de l’industrie de l’image dans les collections publiques. Qu’en pensez-vous ?