Le projet Pandore Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels.
Cette suite inclut des scripts prêt à l’utilisation pour des chercheurs, enseignants ou étudiants en Humanités numériques. Aucune connaissance informatique préalable n’est nécessaire pour l’exécution des outils, tout passe par les interfaces utilisateur.
Parmi les fonctionnalités disponibles: la numérisation de documents (OCR/HTR), la conversion au format XML-TEI, la reconnaissance d’entités nommées et la visualisation de données.
Cet outil reste ouvert aux contributions externes !