HyperAIHyperAI

Command Palette

Search for a command to run...

CDeC-Net : Réseau en cascade déformable composé pour la détection de tableaux dans les images de documents

Madhav Agarwal Ajoy Mondal C. V. Jawahar

Résumé

Localiser des éléments ou objets de page tels que des tableaux, des figures, des équations, etc., constitue la première étape essentielle pour extraire des informations à partir d’images de documents. Nous proposons un nouveau réseau profond entraînable end-to-end, nommé CDeC-Net, destiné à la détection de tableaux présents dans les documents. Le réseau proposé repose sur une extension multistade de Mask R-CNN, intégrant un double squelette (backbone) doté de convolutions déformables, permettant une détection précise des tableaux à différentes échelles, même avec des seuils élevés d’indice d’intersection sur union (IoU). Nous évaluons empiriquement CDeC-Net sur l’ensemble des jeux de données de référence publiques disponibles : ICDAR-2013, ICDAR-2017, ICDAR-2019, UNLV, Marmot, PubLayNet et TableBank, à l’aide d’expérimentations approfondies.Notre approche présente trois caractéristiques essentielles : (i) un unique modèle entraîné, CDeC-Net‡, se distingue par des performances solides sur l’ensemble des jeux de données de référence les plus utilisés ; (ii) nous rapportons des performances exceptionnelles sur plusieurs seuils d’IoU, y compris des seuils élevés ; (iii) en suivant strictement le protocole des travaux récents pour chaque jeu de données, nous démontrons de manière cohérente une performance quantitative supérieure. Le code source ainsi que les modèles entraînés seront publiés afin de garantir la reproductibilité des résultats.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
CDeC-Net : Réseau en cascade déformable composé pour la détection de tableaux dans les images de documents | Articles | HyperAI