HyperAIHyperAI

Command Palette

Search for a command to run...

U-DIADS-Bib : un jeu de données complet et à quelques exemples pour l'analyse de la mise en page de manuscrits anciens

Silvia Zottin Axel De Nardin Emanuela Colombi Claudio Piciarelli Filippo Pavan Gian Luca Foresti

Résumé

L'analyse de la mise en page des documents, qui consiste à identifier différentes régions sémantiques au sein d'une page de document, est un sujet d'un grand intérêt pour les informaticiens et les chercheurs en sciences humaines. Pour les premiers, elle représente une étape fondamentale vers des tâches d'analyse plus avancées, tandis que pour les seconds, elle constitue un outil puissant pour améliorer et faciliter l'étude des documents. Cependant, nombre de travaux actuellement présents dans la littérature, en particulier en ce qui concerne les jeux de données disponibles, ne répondent pas aux besoins des deux mondes et penchent souvent davantage vers ceux et les pratiques courantes du côté informatique, aboutissant ainsi à des ressources qui ne sont pas représentatives des véritables besoins des sciences humaines.C'est pourquoi cet article présente U-DIADS-Bib, un nouveau jeu de données d'analyse de la mise en page des documents développé avec une précision pixel par pixel, sans chevauchement et exempt de bruit, en étroite collaboration entre des spécialistes en vision par ordinateur et en sciences humaines. De plus, nous proposons un nouveau pipeline de segmentation assistée par ordinateur afin d'alléger le fardeau que représente le processus fastidieux d'annotation manuelle nécessaire à la génération des cartes de segmentation de référence.Enfin, nous présentons une version standardisée du jeu de données adaptée aux situations où peu d'exemples sont disponibles (U-DIADS-BibFS), dans le but d'encourager le développement de modèles et de solutions capables d'aborder cette tâche avec un nombre minimal d'échantillons. Cela permettrait une utilisation plus efficace dans des scénarios réels où il n'est pas toujours possible de collecter un grand nombre de segmentations.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp