Jeudi 25
Des outils informatiques pour transcrire et indexer

› 14:30 - 15:00 (30min)
› Amphithéâtre de la Maison de l'Université
Transcrire le passé à l'aide d'outils du présent
Stéphane Nicolas  1, *@  
1 : Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes  (LITIS)  -  Site web
Université de Rouen : EA4108, Université du Havre, Institut National des Sciences Appliquées de Rouen
Avenue de l'Université UFR des Sciences et Techniques 76800 Saint-Etienne du Rouvray -  France
* : Auteur correspondant

Qu'il s'agisse de transcriptions diplomatiques ou semi-diplomatiques de manuscrits de Gustave Flaubert, ou de la transcription d'un ouvrage médiéval constitué d'une collection de manuscrits écrits entre le Xe et le XIIIe siècle, le travail de description et d'interprétation de documents modernes ou anciens commence souvent pour les chercheurs par un travail fastidieux et difficile de transcription, réalisé manuellement à l'aide d'outils non nécessairement adaptés à cette tâche. Ce travail de description et de transcription est également important pour permettre l'indexation et la recherche d'information dans les images numériques de ces documents dans le cadre de la constitution de vastes bibliothèques numériques et d'archives numérisées afin de transposer ces témoins de notre Histoire, dans le monde numérique qui est le notre aujourd'hui. Dans ce contexte d'accès et de partage de la connaissance, l'enjeu des laboratoires de recherche travaillant dans le domaine du document numérique et de l'analyse des documents numérisés, est de développer en collaboration avec les acteurs de la valorisation du patrimoine des outils adaptés répondant aux besoins actuels dans ce domaine. Nous présentons dans cette intervention l'état actuel des avancées dans ce domaine, et nous montrons, à travers l'exemple de différents projets menés au LITIS, que l'analyse automatique de documents peut apporter une aide adaptée à cette problématique, en permettant d'analyser la structure des documents (agencement des parties textuelles ou détection de ratures dans les manuscrits de Flaubert, ou structuration logique en articles dans des journaux anciens), et de détecter automatiquement des entités textuelles ou graphiques par exemple.


Personnes connectées : 1