developpement

menu développement

Gallica-Obvie

Gallica-Obvie est un prototype en ligne qui permet de collecter des données textuelles à partir de Gallica, et de les indexer directement dans la plateforme Obvie. Il suffit de saisir quelques identifiants de Gallica (les arks) pour obtenir les résultats. Cet outil est en phase d’expérimentation, et il y aura bientôt de nouvelles mises à …

Gallica-Obvie Lire la suite »

Teinte

Teinte est un outil de conversion automatique de documents qui permet de traiter différents formats: TEI, DOCX, HTML, EPUB, MARKDOWN. Lien: Teinte.

Summarizer

Résumé automatique d’articles scientifiques Les articles scientifiques sont de plus en plus diffusés sous forme numérique, facilitant ainsi le flux des échanges d’idées et d’informations. Dans ce contexte, le résumé automatique représente une opportunité importante, en fournissant un aperçu général de l’article, et d’orienter le lecteur dans sa compréhension, avant même de le lire. Il …

Summarizer Lire la suite »

Pandore Toolbox

Le projet Pandore Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels. Cette suite inclut des scripts prêt à l’utilisation pour des chercheurs, enseignants ou étudiants en Humanités numériques. Aucune connaissance informatique préalable n’est nécessaire pour l’exécution des outils, tout passe par les interfaces utilisateur. Parmi les fonctionnalités disponibles: …

Pandore Toolbox Lire la suite »

PhiloLogic

PhiloLogic est un logiciel libre de publication et de recherche plein texte pour corpus XML/TEI développé par le projet ARTFL, au sein de l’Université de Chicago. Le logiciel, dont le développement à commencé dans les années 1990, a permis d’analyser de nombreux et importants corpus, notamment Frantext, l’Encyclopédie, ou Perseus. Conçu initialement par Mark Olsen, …

PhiloLogic Lire la suite »

Tanagra Mapping Tool

Ce développement vise à mettre en place une interface web pour l’identification, la géolocalisation et la cartographie des noms de lieux dans les textes en plusieurs langues. À partir d’un corpus de textes, l’application permet d’identifier les noms de lieu à l’aide de la librairie Spacy (différents modèles disponibles: français, allemand, anglais…). Ensuite, les lieux …

Tanagra Mapping Tool Lire la suite »

Interface Elicom

L’objectif de ce développement est de réaliser une interface web pour interroger les correspondances éditées dans le cadre du projet Elicom. Lien vers l’application: cliquer ici. Idée et initiative: Glenn Roe. Conception: Motasem Alrahabi et Glenn Roe. Développement: Frédéric Glorieux. Contributeurs: Camille Koskas.

Textolab

Ce développement en cours vise la création d’un outil à base de règles pour l’annotation de textes. Via une interface simple, Textolab permet d’annoter les textes en s’appuyant sur des motifs linguistiques (patrons de surface) préalablement construits. Deux formats d’entrée sont pris en charge: XML et texte brut. L’outil permet la segmentation en phrases et …

Textolab Lire la suite »

Ariane

Ariane est un dispositif de fouille de textes et de lecture guidée. Elle permet à l’utilisateur de rechercher des termes au sein de passages préalablement annotés selon une ontologie linguistique: jugement, appréciation, opinion émotion… Idée et conception: Motasem Alrahabi. Lien: http://obtic.huma-num.fr/ariane Guide: https://frama.link/Ariane Vidéo: https://frama.link/Ariane_Video Publication: https://hal.archives-ouvertes.fr/hal-03167271  

OBVIE

OBVIE est un moteur de recherche offrant des fonctionnalités avancées de recherche d’information (avec lemmatisation) et de comparaison de documents. Idée et conception: Motasem Alrahabi. Contributeurs: Glenn Roe et Marine Riguet. Développement: Frédéric Glorieux. Lien :  http://obtic.huma-num.fr/obvie/ Guide: https://frama.link/OBVIE Vidéo: https://frama.link/OBVIE_Video