Ingénieur·e d’étude en humanités numériques CELLF / ObTIC
Co-financé par le projet européen ERC ModERN et l’ObTIC, ce poste a pour objectif de renforcer le déploiement de la politique numérique des deux équipes. Au sein du projet ModERN, la personne recrutée travaillera en étroite collaboration avec le PI et les autres membres de l’équipe. Son travail l’amènera aussi à collaborer avec divers services et partenaires de Sorbonne Université. La personne recrutée aura pour mission principale de développer la politique de traitement et d’exploitation des données contenues dans la base de données principale du projet ModERN. Les exploitations visées sont principalement l’application informatique de la théorie des graphes sur des réseaux qui se tissent à partir de réemplois textuels ; l’analyse textométrique et la visualisation de données textuelles.
Il/elle fera des propositions en matière d’outils numériques pertinents et envisagera si besoin des développements spécifiques. Il/elle saura également accompagner techniquement l’équipe ObTIC dans ses projets de recherche et d’analyse et de fouille textuelle, et de réaliser le développement et la maintenance de solutions autour des technologies informatiques pour les humanités numériques. La personne recrutée aura un rôle de formation vis-à-vis de l’ensemble des acteurs ModERN et ObTIC en matière des outils mis en place.
Activités principales :
• Concevoir et construire la base de données principale du projet ModERN.
• Développer et implémenter la politique de traitement et d’exploitation des données contenues dans cette base textuelle pour l’alignement de corpus, la fouille de données et l’analyse de réseaux. Accompagner les projets de recherche soutenus par l’équipe ObTIC, notamment par le développement ponctuel de solutions d’analyse textuelle, de fouille de textes et d’édition.
• Accompagner le développement des outils numériques et de la production documentaire : environnement, données, outils et procédures.
• Participer à la rédaction des spécifications de projets de fouille et analyse textuelle.
• Participer à la vie scientifique des deux équipes : formations, séminaires et ateliers.
Compétences recherchées :
• Maîtrise d’outils d’analyse de réseaux, de graphes et de représentations visuelles.
• Maîtrise d’un langage de script (Python…) et des bases de données.
• Bonnes connaissance des outils de TAL, de l’apprentissage automatique et des modèles de langue (BERT, CamemBERT…).
• Connaissance des standards patrimoniaux (XML, TEI, IIIF…), des langages d’interrogation et de transformation (Xpath, XSLT…), des métadonnées et des normes d’interopérabilité.
• Autres connaissances appréciées : moteurs de recherche (Solr ou ElasticSearch…), édition d’archives numériques (Omeka…).
Candidature
Envoyer un CV et une lettre de motivation aux porteurs du projet avant le 3 juin 2022.
- Glenn Roe: glenn.roe@sorbonne-universite.fr
- Motasem Alrahabi: motasem.alrahabi@sorbonne-universite.fr
Offre détaillée : Fiche_de_poste_IGE_ObTIC_ERC