Apprentissage peu supervisé efficace pour l’analyse du layout de documents manuscrits à précision au niveau du pixel

L’analyse de mise en page est une tâche d’une importance capitale dans l’analyse des documents manuscrits anciens et constitue une étape fondamentale visant à simplifier les tâches ultérieures telles que la reconnaissance optique de caractères et la transcription automatique. Toutefois, de nombreuses approches proposées pour résoudre ce problème reposent sur un paradigme d’apprentissage entièrement supervisé. Bien que ces systèmes atteignent des performances très élevées sur cette tâche, leur principal inconvénient réside dans le fait que l’étiquetage pixel-par-pixel de l’ensemble de l’ensemble d’entraînement est un processus extrêmement long, ce qui rend ce type d’information rarement disponible dans un contexte réel. Dans ce travail, nous abordons ce problème en proposant un cadre d’apprentissage par peu d’exemples (few-shot learning) efficace, capable d’atteindre des performances comparables à celles des méthodes actuelles les plus avancées basées sur une supervision complète sur le jeu de données public DIVA-HisDB.