HyperAIHyperAI

Command Palette

Search for a command to run...

Classification d'images de documents avec le transfert d'apprentissage intra-domaine et la généralisation empilée des réseaux neuronaux convolutifs profonds

Arindam Das; Saikat Roy; Ujjwal Bhattacharya; Swapan Kumar Parui

Résumé

Dans cette étude, un cadre de réseau neuronal convolutif profond (Deep Convolutional Neural Network) basé sur les régions est proposé pour l'apprentissage de la structure des documents. La contribution de ce travail concerne l'entraînement efficace de classifieurs basés sur les régions et le regroupement efficace pour la classification d'images de documents. Un premier niveau d'apprentissage par transfert « inter-domaine » est utilisé en exportant les poids d'une architecture VGG16 pré-entraînée sur le jeu de données ImageNet pour entraîner un classifieur de documents sur des images de documents entiers. En exploitant la nature du modèle d'influence basé sur les régions, un deuxième niveau d'apprentissage par transfert « intra-domaine » est utilisé pour l'entraînement rapide de modèles d'apprentissage profond pour des segments d'images. Enfin, une méthode de regroupement basée sur la généralisation empilée est utilisée pour combiner les prédictions des modèles neuronaux profonds de base. La méthode proposée atteint une précision à l'état de l'art de 92,2 % sur le jeu de données populaire RVL-CDIP, dépassant les références établies par les algorithmes existants.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp