Toolbox (Pandore)

Le projet Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels.

Cette suite inclut des scripts prêt à l’utilisation pour des chercheurs, enseignants ou étudiants en Humanités numériques. Aucune connaissance informatique préalable n’est nécessaire pour l’exécution des outils, tout passe par les interfaces utilisateur.

Parmi les fonctionnalités disponibles: la numérisation de documents (OCR/HTR), la conversion au format XML-TEI, la reconnaissance d’entités nommées et la visualisation de données.

Cet outil reste ouvert aux contributions externes !

Lien: toolbox.