HyperAIHyperAI
il y a 2 mois

Classification d'images de documents avec le transfert d'apprentissage intra-domaine et la généralisation empilée des réseaux neuronaux convolutifs profonds

Arindam Das; Saikat Roy; Ujjwal Bhattacharya; Swapan Kumar Parui
Classification d'images de documents avec le transfert d'apprentissage intra-domaine et la généralisation empilée des réseaux neuronaux convolutifs profonds
Résumé

Dans cette étude, un cadre de réseau neuronal convolutif profond (Deep Convolutional Neural Network) basé sur les régions est proposé pour l'apprentissage de la structure des documents. La contribution de ce travail concerne l'entraînement efficace de classifieurs basés sur les régions et le regroupement efficace pour la classification d'images de documents. Un premier niveau d'apprentissage par transfert « inter-domaine » est utilisé en exportant les poids d'une architecture VGG16 pré-entraînée sur le jeu de données ImageNet pour entraîner un classifieur de documents sur des images de documents entiers. En exploitant la nature du modèle d'influence basé sur les régions, un deuxième niveau d'apprentissage par transfert « intra-domaine » est utilisé pour l'entraînement rapide de modèles d'apprentissage profond pour des segments d'images. Enfin, une méthode de regroupement basée sur la généralisation empilée est utilisée pour combiner les prédictions des modèles neuronaux profonds de base. La méthode proposée atteint une précision à l'état de l'art de 92,2 % sur le jeu de données populaire RVL-CDIP, dépassant les références établies par les algorithmes existants.

Classification d'images de documents avec le transfert d'apprentissage intra-domaine et la généralisation empilée des réseaux neuronaux convolutifs profonds | Articles de recherche récents | HyperAI