The ERC-funded ModERN project is recruiting a Research Software Engineer in digital humanities. This is a 2-year fixed-term post (24 months) based at Sorbonne University in Paris. The successful candidate will have a background in database design and implementation, a strong knowledge of digital humanities applications and methods, and a strong knowledge of semantic web technologies. The candidate will be part of both the ModERN team as well as the ObTIC project-team at Sorbonne University. Full description in French below.
Mission :
Co-financé par le projet européen ERC ModERN et l’ObTIC, ce poste a pour objectif de renforcer le déploiement de la politique numérique des deux équipes. Au sein du projet ModERN, la personne recrutée travaillera en étroite collaboration avec le PI et les autres membres de l’équipe. Son travail l’amènera aussi à collaborer avec divers services et partenaires de Sorbonne Université. La personne recrutée aura pour mission principale de concevoir et administrer une base de données avec des réemplois textuels dans des textes littéraires pour le projet ModERN, ainsi que de développer la politique de traitement et d’exploitation des données de cette BDD. Les exploitations visées sont principalement la conception et la gestion de la BDD du projet ModERN, l’analyse textométrique et la visualisation de données textuelles, mais aussi la gestion générale des serveurs (sécurité, installation du logiciel, configuration).
Il/elle fera des propositions en matière d’outils numériques pertinents et envisagera si besoin des développements spécifiques. Il/elle saura également accompagner techniquement l’équipe ObTIC dans ses projets de recherche et d’analyse et de fouille textuelle, et de réaliser le développement et la maintenance de solutions autour des technologies informatiques pour les humanités numériques. La personne recrutée aura un rôle de formation vis-à-vis de l’ensemble des acteurs ModERN et ObTIC en matière des outils mis en place.
Cette mission sera décomposée de la manière suivante :
Activités principales :
- Concevoir, modéliser et construire la base de données principale du projet ModERN.
- Développer et implémenter la politique de traitement et d’exploitation des données contenues dans cette base textuelle pour l’alignement de corpus, la fouille de données et l’analyse de réseaux.
- Établir le modèle de données permettant l’interrogation croisée de la totalité du corpus tout en respectant son hétérogénéité et la spécificité des différents sous-ensembles, afin de permettre des recherches croisées
- Encoder les données et metadonnées selon le modèle de données établi.
- Proposer des solutions informatiques en matière de logiciels et d’outils numériques pour et envisager des développements ponctuels si besoin.
- Accompagner les projets de recherche soutenus par l’équipe ObTIC, notamment par le développement ponctuel de solutions d’analyse textuelle et de fouille de textes.
- Accompagner le développement des outils numériques et de la production documentaire : environnement, données, outils et procédures.
- Participer à la rédaction des spécifications de projets de fouille et analyse textuelle.
- Participer à la vie scientifique des deux équipes : formations, séminaires et ateliers.
Savoir-faire transversaux :
Nous recherchons une personne de formation supérieure (Ingénieur, Master…), avec ce type de compétences :
- Maîtrise de la conception et de l’administration des bases de données relationnelles et/ou orientée graphe.
- Connaissance de langages de programmation (Python) et plus spécifiquement de langages de traitement de données (SQL, XML, RDF, SPARQL).
- Maîtrise d’un langage de script (Python).
- Connaissance des standards patrimoniaux (XML, TEI, RDF…), des langages d’interrogation et de transformation (Xpath, XSLT), des métadonnées, des normes d’interopérabilité et de la science ouverte.
- Connaissance des outils de traitement automatique du langage, de l’apprentissage automatique et des modèles de langue (BERT, CamemBERT).
- Expérience de gestion de serveurs : installation de logiciel, sécurité.
- Autres connaissances appréciées : moteurs de recherche (Solr ou ElasticSearch), édition d’archives numériques (Omeka), outils de visualisation.
- Expérience basique de la gestion des serveurs.
Rémunération : Rémunération selon le barème de rémunération au recrutement des contractuels BIATSS de Sorbonne Université.
Prise de fonction : septembre 2023. Contrat de 12 mois renouvelable.
Documents requis :
- Une lettre de motivation (en français et/ou en anglais) à l’attention de la responsable du projet (Glenn Roe) expliquant l’intérêt du/de la candidat(e) pour cette recherche et les compétences qu’il/elle envisage de mobiliser pour la mener à bien.
- Un CV détaillé.
- Une copie du document certifiant le niveau d’étude requis.
- Les noms et adresses email de deux référents.
Critères de sélection :
- Formation supérieure (Ingénieur ou Master) ou équivalent en informatique ou humanités numériques.
- Compétences démontrées en modélisation et construction des bases de données (relationnelles et/ou sémantiques).
- Connaissance des humanités numériques.
- Un intérêt pour la littérature et langue française.
- D’excellentes capacités de communication.
- Une bonne maîtrise du français et de l’anglais.
- Un grand sens de l’organisation.
Procédure de sélection :
Les documents requis doivent être envoyés au responsable du projet Glenn Roe (glenn.roe@sorbonne-universite.fr) ainsi que le Coordinateur scientifique de l’ObTIC Motasem Alrahabi (motasem.alrahabi@sorbonne-universite.fr).
Tous les documents doivent être soumis avant le 15 juin 2023, au format PDF. Les candidatures incomplètes ou soumises après l’échéance ne seront pas prises en compte.
Les candidat(e)s retenu(e)s seront informé(e)s par email au plus tard le 20 juin 2023 et invité(e)s à prendre part à des entretiens organisés à Paris (ou en distanciel) début juillet 2023.