il y a 7 mois

Résumé

La numérisation d’images de documents est une méthode courante pour numériser et archiver des documents physiques, en raison de la ubiquité des caméras intégrées aux appareils mobiles. Afin de faciliter la reconnaissance de texte, il est souvent souhaitable de platifier numériquement une image de document lorsque la feuille physique est pliée ou incurvée. Dans cet article, nous proposons la première méthode fondée sur l’apprentissage automatique pour atteindre cet objectif. Nous introduisons un réseau U-Net empilé doté d’une supervision intermédiaire, capable de prédire directement la carte de transformation du document déformé vers sa version rectifiée. Étant donné que les données réelles à grande échelle, accompagnées d’étiquettes de déformation exactes, sont difficiles à obtenir, nous avons construit un jeu de données synthétique comprenant environ 100 000 images, générées en déformant des images de documents non déformés. Le réseau est entraîné sur ce jeu de données, en utilisant diverses techniques d’augmentation de données afin d’améliorer sa capacité de généralisation. Nous avons également établi une base d’évaluation complète couvrant une large gamme de conditions réelles. Nous évaluons de manière quantitative et qualitative le modèle proposé sur cette base d’évaluation, et le comparons à des méthodes antérieures non basées sur l’apprentissage.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Réseau De Neurones Convolutif

Apprentissage Profond

Domaine De Recherche

Approche/Framework

Vision Par Ordinateur

Tâche

Jue Wang Xue Bai Zhixin Shu Ke Ma Dimitris Samaras

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Réseau De Neurones Convolutif

Apprentissage Profond

Domaine De Recherche

Approche/Framework

Vision Par Ordinateur

Tâche

Jue Wang Xue Bai Zhixin Shu Ke Ma Dimitris Samaras

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

DocUNet : Déformation inverse d’images de documents par un U-Net empilé

Jue Wang Xue Bai Zhixin Shu Ke Ma Dimitris Samaras

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DocUNet : Déformation inverse d’images de documents par un U-Net empilé

Jue Wang Xue Bai Zhixin Shu Ke Ma Dimitris Samaras

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DocUNet : Déformation inverse d’images de documents par un U-Net empilé

Jue Wang Xue Bai Zhixin Shu Ke Ma Dimitris Samaras

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters