HyperAIHyperAI
il y a 16 jours

Compétition ICDAR 2024 sur la segmentation de disposition en peu de exemples et en nombreux exemples de manuscrits anciens (SAM)

{Claudio Piciarelli, Emanuela Colombi, Gian Luca Foresti, Axel De Nardin, Silvia Zottin}
Résumé

L’analyse de mise en page constitue un aspect fondamental de l’analyse d’images de documents, en particulier dans le cas des manuscrits anciens. Elle représente une étape préalable essentielle permettant d’optimiser les tâches ultérieures telles que la reconnaissance optique de caractères (OCR) et la transcription automatique. Toutefois, un défi majeur réside dans le manque de vérités terrain disponibles, celles-ci étant extrêmement coûteuses en temps à produire. Malgré cela, de nombreuses approches proposées pour relever ce défi s’appuient fortement sur un paradigme d’apprentissage entièrement supervisé, une situation rare dans un contexte réel. C’est pourquoi, dans le cadre de cette compétition, nous proposons de relever cette tâche via une approche d’apprentissage à très peu d’exemples (few-shot learning), en utilisant uniquement trois images pour l’entraînement. Le jeu de données de la compétition, baptisé U-DIADS-Bib, comprend quatre manuscrits anciens distincts, présentant des structures de mise en page hétérogènes, des niveaux de dégradation variés et des langues différentes. Cette diversité ajoute à la fois de l’intérêt et une complexité accrue au défi. En outre, nous avons également autorisé les participants à utiliser des approches traditionnelles d’apprentissage à plusieurs exemples (many-shot learning), pour lesquelles l’intégralité de l’ensemble d’entraînement de U-DIADS-Bib a été mise à disposition.

Compétition ICDAR 2024 sur la segmentation de disposition en peu de exemples et en nombreux exemples de manuscrits anciens (SAM) | Articles de recherche récents | HyperAI