HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Compétition ICDAR 2024 sur la segmentation de disposition en peu de exemples et en nombreux exemples de manuscrits anciens (SAM)

{Claudio Piciarelli Emanuela Colombi Gian Luca Foresti Axel De Nardin Silvia Zottin}

Résumé

L’analyse de mise en page constitue un aspect fondamental de l’analyse d’images de documents, en particulier dans le cas des manuscrits anciens. Elle représente une étape préalable essentielle permettant d’optimiser les tâches ultérieures telles que la reconnaissance optique de caractères (OCR) et la transcription automatique. Toutefois, un défi majeur réside dans le manque de vérités terrain disponibles, celles-ci étant extrêmement coûteuses en temps à produire. Malgré cela, de nombreuses approches proposées pour relever ce défi s’appuient fortement sur un paradigme d’apprentissage entièrement supervisé, une situation rare dans un contexte réel. C’est pourquoi, dans le cadre de cette compétition, nous proposons de relever cette tâche via une approche d’apprentissage à très peu d’exemples (few-shot learning), en utilisant uniquement trois images pour l’entraînement. Le jeu de données de la compétition, baptisé U-DIADS-Bib, comprend quatre manuscrits anciens distincts, présentant des structures de mise en page hétérogènes, des niveaux de dégradation variés et des langues différentes. Cette diversité ajoute à la fois de l’intérêt et une complexité accrue au défi. En outre, nous avons également autorisé les participants à utiliser des approches traditionnelles d’apprentissage à plusieurs exemples (many-shot learning), pour lesquelles l’intégralité de l’ensemble d’entraînement de U-DIADS-Bib a été mise à disposition.

Benchmarks

BenchmarkMéthodologieMétriques
document-layout-analysis-on-u-diads-bibL3i++
Class Average IoU (Few-shot setting): 61.10
document-layout-analysis-on-u-diads-bibCNKI
Class Average IoU: 77.80
Class Average IoU (Few-shot setting): 65.90
document-layout-analysis-on-u-diads-bibVAI-OCR
Class Average IoU: 70.70
Class Average IoU (Few-shot setting): 70.00
document-layout-analysis-on-u-diads-bibCV-Group
Class Average IoU: 83.40
Class Average IoU (Few-shot setting): 78.40

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Compétition ICDAR 2024 sur la segmentation de disposition en peu de exemples et en nombreux exemples de manuscrits anciens (SAM) | Articles de recherche | HyperAI