Qu'il s'agisse de transcriptions diplomatiques ou semi-diplomatiques de manuscrits de Gustave Flaubert, ou de la transcription d'un ouvrage médiéval constitué d'une collection de manuscrits écrits entre le Xe et le XIIIe siècle, le travail de description et d'interprétation de documents modernes ou anciens commence souvent pour les chercheurs par un travail fastidieux et difficile de transcription, réalisé manuellement à l'aide d'outils non nécessairement adaptés à cette tâche. Ce travail de description et de transcription est également important pour permettre l'indexation et la recherche d'information dans les images numériques de ces documents dans le cadre de la constitution de vastes bibliothèques numériques et d'archives numérisées afin de transposer ces témoins de notre Histoire, dans le monde numérique qui est le notre aujourd'hui. Dans ce contexte d'accès et de partage de la connaissance, l'enjeu des laboratoires de recherche travaillant dans le domaine du document numérique et de l'analyse des documents numérisés, est de développer en collaboration avec les acteurs de la valorisation du patrimoine des outils adaptés répondant aux besoins actuels dans ce domaine. Nous présentons dans cette intervention l'état actuel des avancées dans ce domaine, et nous montrons, à travers l'exemple de différents projets menés au LITIS, que l'analyse automatique de documents peut apporter une aide adaptée à cette problématique, en permettant d'analyser la structure des documents (agencement des parties textuelles ou détection de ratures dans les manuscrits de Flaubert, ou structuration logique en articles dans des journaux anciens), et de détecter automatiquement des entités textuelles ou graphiques par exemple.