Appel à candidature sur un contrat doctoral en humanités numériques à Sorbonne Université
Projet doctoral CERES (Sorbonne Université)
Titre : Édition, exploration et exploitation numériques des registres d’assemblées de la Comédie-Française (1680-1921)
Durée : 3 ans (2023-2026)
Rémunération : environ 2300 € bruts par mois.
Contacts : florence.naugrette@sorbonne-universite.fr / saraharvey@uvic.ca
Porteuse de projet : Florence Naugrette (PR, Sorbonne Université, École Doctorale 019 « Littérature française et comparée », laboratoire CELLF UMR 8599, ObTIC). Co-tutelle avec l’Université Victoria (Canada) : Sara Harvey (PR, French and Francophones studies)
Le programme des Registres de la Comédie-Française (RCF, accessible sur ce lien : https://www.cfregisters.org) est une initiative de recherche internationale (France, États-Unis, Canada) en humanités numériques et histoire du théâtre. Centré sur l’exploration des registres journaliers de la première institution théâtrale française depuis sa fondation en 1680 jusqu’au début du 20e siècle, RCF entend approfondir et renouveler connaissances et méthodes en histoire du théâtre ancien à partir des nouvelles technologies. Les archives de la Comédie-Française permettent non seulement d’explorer la programmation quotidienne du théâtre, jusqu’à ses recettes, ses dépenses, ses distributions, mais aussi d’ouvrir à une meilleure compréhension de l’administration d’une entreprise culturelle qui oscille entre les intérêts professionnels et économiques de la troupe et sa dépendance à l’État. Les archives permettent en outre d’améliorer la visibilité des professionnels qui circulent autour de la Comédie-Française – auteurs et artisans, souffleurs et comptables, et de mieux appréhender l’extrême diversité du répertoire. Parce que notre recherche est fondée sur le récit et l’administration au jour le jour du théâtre, elle décentre l’histoire institutionnelle et monumentale de la Comédie-Française par une approche multipliant les contextes de lecture du passé. Les premières phases du programme (accessibles sur https://www.cfregisters.org), axées sur la création et l’exploitation de bases de données relationnelles, s’inscrivent dans une approche pleinement computationnelle et quantitative en raison des premières sources exploitées : la programmation, la distribution et les finances. Or un autre corpus de registres de toute première importance reste encore à éditer et explorer : ceux des Assemblées (comités de lecture et d’administration, où l’on délibère sur la programmation, le recrutement, les conflits entre artistes, la politique artistique du théâtre) qui traversent les 17e, 18e et 19e siècles et qui constituent une collection d’archives qualitatives. L’écart entre la source et les possibilités d’une représentation numérique dans le cas des Assemblées exige une approche critique mettant l’accent sur la nuance et les contrastes entre la construction de savoirs humanistes et scientifiques. L’Intelligence artificielle apparaît ici comme la piste la plus prometteuse et féconde pour aborder ce corpus.
Les registres des Assemblées constituent une source qualitative précieuse parce qu’elle représente un exemple unique de la constitution progressive du modèle administratif de la Comédie-Française tout en mettant au jour les mécanismes, les conflits et la politique interne à la troupe. Archives de la vie administrative et témoignages des relations interpersonnelles qui régissent l’institution, les Assemblées ouvrent de nombreuses pistes pour une compréhension originale de la vie des acteurs et actrices à cette période dans leurs rapports au pouvoir politique, mais aussi au sein d’un corps professionnel et humain. La source qui s’échelonne sur plus de deux siècles est également digne d’intérêt sur le plan numérique en tant que manuscrit riche et nuancé qui compte une grande variété de formats et de types de contenu (anecdotes, plaintes, rappels de la règlementation, discussions contradictoires, délibérations, prises de décision). La diversité des sujets abordés et leur complexité représentent un défi important et utile à l’avancée des connaissances.
Les pistes potentielles du projet doctoral :
- L’analyse de région et segmentation de documents à des fins d’extraction de données et l’étude de l’évolution de la structure et de la fonction des documents ainsi que de possibles catégories et hiérarchies ;
- La création ou l’enrichissement d’un modèle de reconnaissance de l’écriture manuscrite (HTR), la transcription et transformation automatisée en TEI/XML et la création d’outils et d’une d’interface d’exploitation adaptée à la recherche humaniste, c’est-à-dire des interfaces fortement contextualisées et critiques ;
- L’extraction des entités nommées et la modélisation des rapports entre documents – y compris les autres ressources du programme – l’étude des réseaux de pouvoir et d’influence (par ex. : l’érosion du pouvoir des femmes du XVIIe au XIXe siècle, la nature des rapports entre la société et les auteurs, les humanités médicales en regard des contraintes professionnelles de la troupe, etc.).
Tout système de traitement et d’analyse des données doit surtout viser à intégrer les logiques et épistémologies des deux domaines constitutifs des humanités numériques engagés dans ce projet (histoire du théâtre et intelligence artificielle). Si le projet doctoral doit faire avancer le domaine de l’application des techniques numériques pour l’étude du patrimoine culturel, il doit également exposer et explorer ses limites et la manière dont ils influent et façonnent – parfois de manière implicite – nos visions et interprétations de l’histoire.
Le projet doctoral vise donc l’exploitation des Assemblées dans une perspective technologique et critique. Il s’agit d’une exploration résolument transdisciplinaire et la recherche devra autant être au service des avancées en histoire du théâtre qu’en intelligence artificielle ; les deux domaines doivent être mis en valeur, à travers les tensions naissant de leur unification. Il s’agit donc d’une démarche critique des humanités numériques.
Dans le cadre du CERES (Centre d’expérimentation en méthodes numériques pour les recherches en Lettres et Sciences Humaines et Sociales), la thèse sera inscrite à l’École doctorale de Littérature française et comparée, adossée au Centre d’études de la Langue et de la Littérature française (Unité mixte de recherche Sorbonne Université-CNRS) ; elle bénéficiera aussi à la Sorbonne de l’environnement informatique de l’ObTIC (Observatoire des Textes, des Idées et des Corpus) sur la reconnaissance des entités nommées et l’analyse de réseaux, du soutien de ses ingénieurs, de ses rapports étroits avec le centre d’Intelligence Artificielle (SCAI) et le BnF DataLab, et de son programme de formations en humanités numériques.
La co-tutelle entre Sorbonne Université et l’Université Victoria (Canada) permettra de nouer des liens entre le CERES et les trois laboratoires d’humanités numériques canadien (ETCL, DSC, HCMC) de l’Université de Victoria qui travaille déjà sur le programme RCF depuis son ouverture, et de mutualiser les forces. La thèse se fera en partie dans chacun des deux pays.
Le profil du candidat recherché est orienté du côté de la technologie (profil en humanités numériques ou sciences de l’informatique). Une connaissance en histoire du théâtre, en archivistique est un atout considérable.
—
Bibliographie indicative
D’ignazio, Catherine, & Lauren F. Klein. Data feminism. MIT press, 2020.
Drucker, Johanna. « Humanities approaches to graphical display. » Digital Humanities Quarterly 5.1 (2011): 1-21.
Filgueira, Rosa, et al. « Extending defoe for the Efficient Analysis of Historical Texts at Scale. » 2021 IEEE 17th International Conference on eScience (eScience). IEEE, 2021.
Harvey, Sara & Agathe Sanjuan. « Les Humanités numériques, dialogue entre le monde de la recherche et de la documentation : le projet des registres journaliers de la Comédie-Française », Bulletin des Bibliothèques de France, 2016, p. 102-109.
Shen, Zejiang, et al. « LayoutParser: A unified toolkit for deep learning based document image analysis. » International Conference on Document Analysis and Recognition. Springer, Cham, 2021.
Terras, Melissa. « Towards a Reading of the Vindolanda Stylus Tablets: Engineering Science and the Papyrologist. » Human IT: Journal for Information Technology Studies as a Human Science 4.2-3 (2000).
Verhoeven, Deb, et al. « Controlling for openness in the male-dominated collaborative networks of the global film industry. » PloS one 15.6 (2020): e0234460.