Ce projet de thèse, à la jonction des humanités médicales et des Lettres, propose une étude pluridisciplinaire dont l’objectif est la valorisation du fonds patrimonial de Jean-Martin Charcot, fondateur de la neurologie moderne au XIXe siècle en France. La première contribution de ce travail est la constitution d’un corpus numérique à partir des archives en question déjà numérisées. Comme deuxième contribution, nous proposons la mise en place d’une chaîne de traitement semi-automatique consistant en l’océrisation, la correction de sortie OCR, la structuration des données au format XML-TEI, la fouille sémantique et l’alignement des textes pour étudier le transfert interdisciplinaire du discours médical de Charcot dans les écrits réalisés en collaboration et dans ceux de ses continuateurs et disciples. Ces traitements nous permettront de produire une transcription interrogeable dans notre cadre de recherche. Au-delà des finalités de ce projet de thèse, ce modèle généralisable sera aussi applicable à d’autres projets de numérisation et de valorisation des fonds patrimoniaux.
Mots-clef : humanités numériques, valorisation du patrimoine, Jean-Martin Charcot, traitement automatique des langues, circulation des savoirs, fouille de textes
Le projet a reçu en juin 2021 le financement d’un contrat doctoral OPUS (Observatoire des Patrimoines).
Doctorante: Ljudmila Petkovic
Directeur de thèse: Glenn Roe
Co-encadrant: Motasem Alrahabi