Réflexions

Pour une histoire des Humanités numériques avec Johanna Drucker

Le 7 février 2018 avait lieu à l’Ecole des Chartes une rencontre avec Johanna Drucker, professeur à l’université de Californie, dans le cadre du Séminaire « Critique des Digital Humanities » de l’Ecole des hautes études en sciences sociales (EHESS).

(Les exemples de cet article sont issus de ma propre culture générale.)

Johanna Drucker distingue 6 piliers dans l’histoire des Humanités numériques.

1)      De 1950 à 1990 : L’automatisation dans le traitement des données a permis d’une part de changer d’échelle et de manier des jeux de données très importants ; et d’autre part, de faciliter grandement le tri, les comparaisons, et la recherche d’information. Cela n’entraîne aucun changement épistémologique majeur, seulement un changement d’échelle. Les techniques d’OCR (reconnaissance de caractère) permettent ainsi d’analyser la grammaire et le lexique de corpus entier en très peu de temps par des simples statistiques d’occurrence des termes quand une personne ou même une équipe de chercheurs devraient y passer de très longues (et laborieuses) années.

2)      Le développement de l’enregistrement électronique des données, qui doivent être lisibles par des machines, a entraîné la standardisation de la structuration de l’information. Cette tendance se confronte aux idiosyncrasies de chaque discipline qui comporte des particularités par rapport aux autres et ne peut se réduire aux critères de descriptions des autres pour un même objet (par exemple, on ne décrit pas un son de la même façon en physique et en musique). On entend ici la crainte d’un appauvrissement du savoir.

Afin de pouvoir partager et trouver l’information, les données ont du être complétées par des métadonnées qui les décrivent. En effet, comment trouver une image de chat si le mot ne lui est pas associé ? Aujourd’hui du moins, c’est indispensable. Les mots-clés sont devenus une sorte de succédané à l’objet lui-même. Les métadonnées mettent en relation la structure de la connaissance (classification du monde, etc) et son usage.

Ces standards, à bien des égards, sont comparables avec les tentatives du XVIIe siècle de créer un langage universel pour les peuples européens.

3)      L’émergence des balises, typique des langages XML, et des étiquettes (tags) structurant les publications électroniques pour y donner accès plus facilement, du MARC au TEI.

4)      La possibilité de mettre en ligne et de traiter des images a ouvert un monde de possibilités, et notamment en histoire de l’art, celle de recréer virtuellement des collections aujourd’hui dispersées, comme celle de François Roger de Gaignières sur le site Collecta à la suite du travail d’Anne Ritz Guilbert, ou encore les tentatives de Lev Manovich, plus discutées, d‘évaluer le style et l’originalité d’un artiste. Ou encore, cette application amusante par Google Arts & Culture : rapprocher des images d’œuvres d’art par leur couleur et leur forme.

5)      Le développement d’outils d’analyse, de « data mining » ou traitement de données en masse.

6)      Le développement d’outils de visualisation : en réseau, en frises, en cartes qui permet parfois de déceler de nouveaux liens, des tendances que l’on avait pas perçues. (Voir à ce sujet cette page de l’exposition virtuelle conçue par la bibliothèque patrimoniale numérique de l’Ecole des Ponts.)


Pour une autre vision de l’histoire des Humanités numériques, consulter la bonne synthèse de Lou Bunard dans Read/Write Book 2 sur OpenEditions.

Dans la même série de l’intervention de Johanna Drucker :