Annonce:
Le laboratoire STIH et l’équipe projet OBTIC, au sein desquels nous sommes doctorants contractuels, mènent un travail conjoint pour déterminer quels sont les usages des chercheurs et des institutions dans les domaines de l’extraction d’informations de documents patrimoniaux.
Dans le cadre de nos projets de recherche respectifs, nous nous intéressons particulièrement aux outils de reconnaissance optique de caractères (OCR) et de reconnaissance d’entités nommées (NER).
Un système OCR permet la transformation d’images de textes (par exemple, des numérisations de lettres ou de journaux au format .jpg) en texte brut. Un outil de NER rend possible l’identification automatique des noms propres : personnes, toponymes, mais aussi les organisations, les institutions, les dates cités dans des textes.
Afin de cerner au mieux les attentes des usagers et de développer un outil cohérent avec les pratiques inhérentes au milieu qu’il tend à servir, nous proposons un workshop tutoriel sur l’OCR et la NER. A l’issu de ce workshop-tutoriel se déroulera une table ronde. L’atelier aura lieu le lundi 14 juin 2021, de 15h à 18h, à la Maison de la Recherche (28, rue Serpente, 75006 Paris) en salle D223.Pour participer, envoyer un mail à :
jean-baptiste.tanguy@sorbonne-universite.fr et
caroline.parfait@sorbonne-universite.fr
jean-baptiste.tanguy@sorbonne-universite.fr et
caroline.parfait@sorbonne-universite.fr