HyperAIHyperAI

Command Palette

Search for a command to run...

DocUNet : Déformation inverse d’images de documents par un U-Net empilé

Jue Wang Xue Bai Zhixin Shu Ke Ma Dimitris Samaras

Résumé

La numérisation d’images de documents est une méthode courante pour numériser et archiver des documents physiques, en raison de la ubiquité des caméras intégrées aux appareils mobiles. Afin de faciliter la reconnaissance de texte, il est souvent souhaitable de platifier numériquement une image de document lorsque la feuille physique est pliée ou incurvée. Dans cet article, nous proposons la première méthode fondée sur l’apprentissage automatique pour atteindre cet objectif. Nous introduisons un réseau U-Net empilé doté d’une supervision intermédiaire, capable de prédire directement la carte de transformation du document déformé vers sa version rectifiée. Étant donné que les données réelles à grande échelle, accompagnées d’étiquettes de déformation exactes, sont difficiles à obtenir, nous avons construit un jeu de données synthétique comprenant environ 100 000 images, générées en déformant des images de documents non déformés. Le réseau est entraîné sur ce jeu de données, en utilisant diverses techniques d’augmentation de données afin d’améliorer sa capacité de généralisation. Nous avons également établi une base d’évaluation complète couvrant une large gamme de conditions réelles. Nous évaluons de manière quantitative et qualitative le modèle proposé sur cette base d’évaluation, et le comparons à des méthodes antérieures non basées sur l’apprentissage.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DocUNet : Déformation inverse d’images de documents par un U-Net empilé | Articles | HyperAI