HyperAIHyperAI
il y a 16 jours

DocUNet : Déformation inverse d’images de documents par un U-Net empilé

{Jue Wang, Xue Bai, Zhixin Shu, Ke Ma, Dimitris Samaras}
DocUNet : Déformation inverse d’images de documents par un U-Net empilé
Résumé

La numérisation d’images de documents est une méthode courante pour numériser et archiver des documents physiques, en raison de la ubiquité des caméras intégrées aux appareils mobiles. Afin de faciliter la reconnaissance de texte, il est souvent souhaitable de platifier numériquement une image de document lorsque la feuille physique est pliée ou incurvée. Dans cet article, nous proposons la première méthode fondée sur l’apprentissage automatique pour atteindre cet objectif. Nous introduisons un réseau U-Net empilé doté d’une supervision intermédiaire, capable de prédire directement la carte de transformation du document déformé vers sa version rectifiée. Étant donné que les données réelles à grande échelle, accompagnées d’étiquettes de déformation exactes, sont difficiles à obtenir, nous avons construit un jeu de données synthétique comprenant environ 100 000 images, générées en déformant des images de documents non déformés. Le réseau est entraîné sur ce jeu de données, en utilisant diverses techniques d’augmentation de données afin d’améliorer sa capacité de généralisation. Nous avons également établi une base d’évaluation complète couvrant une large gamme de conditions réelles. Nous évaluons de manière quantitative et qualitative le modèle proposé sur cette base d’évaluation, et le comparons à des méthodes antérieures non basées sur l’apprentissage.

DocUNet : Déformation inverse d’images de documents par un U-Net empilé | Articles de recherche récents | HyperAI