HyperAIHyperAI

Command Palette

Search for a command to run...

Compétition ICDAR 2024 sur la segmentation de disposition en peu de exemples et en nombreux exemples de manuscrits anciens (SAM)

Claudio Piciarelli Emanuela Colombi Gian Luca Foresti Axel De Nardin Silvia Zottin

Résumé

L’analyse de mise en page constitue un aspect fondamental de l’analyse d’images de documents, en particulier dans le cas des manuscrits anciens. Elle représente une étape préalable essentielle permettant d’optimiser les tâches ultérieures telles que la reconnaissance optique de caractères (OCR) et la transcription automatique. Toutefois, un défi majeur réside dans le manque de vérités terrain disponibles, celles-ci étant extrêmement coûteuses en temps à produire. Malgré cela, de nombreuses approches proposées pour relever ce défi s’appuient fortement sur un paradigme d’apprentissage entièrement supervisé, une situation rare dans un contexte réel. C’est pourquoi, dans le cadre de cette compétition, nous proposons de relever cette tâche via une approche d’apprentissage à très peu d’exemples (few-shot learning), en utilisant uniquement trois images pour l’entraînement. Le jeu de données de la compétition, baptisé U-DIADS-Bib, comprend quatre manuscrits anciens distincts, présentant des structures de mise en page hétérogènes, des niveaux de dégradation variés et des langues différentes. Cette diversité ajoute à la fois de l’intérêt et une complexité accrue au défi. En outre, nous avons également autorisé les participants à utiliser des approches traditionnelles d’apprentissage à plusieurs exemples (many-shot learning), pour lesquelles l’intégralité de l’ensemble d’entraînement de U-DIADS-Bib a été mise à disposition.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp