HyperAIHyperAI

Command Palette

Search for a command to run...

LGPMA : Reconnaissance de structures de tableaux complexes avec l'alignement pyramidal masqué local et global

Liang Qiao Zaisheng Li Zhanzhan Cheng Peng Zhang Shiliang Pu Yi Niu Wengqi Ren Wenming Tan Fei Wu

Résumé

La reconnaissance de la structure des tableaux est une tâche complexe en raison des diverses structures et des relations de fusion de cellules compliquées. Les méthodes précédentes abordaient le problème en partant d'éléments de différentes granularités (lignes/colonnes, régions textuelles), ce qui les amenait parfois à des problèmes tels que des règles heuristiques imparfaites ou l'ignorance de la division des cellules vides. En nous appuyant sur les caractéristiques de la structure des tableaux, nous avons constaté que l'obtention de boîtes englobantes alignées pour les régions textuelles permet d'effectivement maintenir l'intégralité du champ pertinent de différentes cellules. Cependant, ces boîtes englobantes alignées sont difficiles à prédire avec précision en raison des ambiguïtés visuelles. Dans cet article, nous visons à obtenir des boîtes englobantes alignées plus fiables en exploitant pleinement les informations visuelles provenant à la fois des régions textuelles dans les caractéristiques locales et des relations entre cellules dans les caractéristiques globales. Plus précisément, nous proposons un cadre de correspondance pyramidal masquée locale et globale (Local and Global Pyramid Mask Alignment), qui adopte le mécanisme d'apprentissage masqué pyramidal doux dans les cartes de caractéristiques locales et globales. Ce cadre permet aux frontières prédites des boîtes englobantes de dépasser les limites des propositions initiales. Un module de ré-évaluation par masque pyramidal est ensuite intégré pour concilier les informations locales et globales et affiner les frontières prédites. Enfin, nous proposons une pipeline robuste pour la reconstruction de la structure du tableau afin d'obtenir la structure finale, dans laquelle nous résolvons également efficacement les problèmes de localisation et de division des cellules vides. Les résultats expérimentaux montrent que notre méthode proposée atteint une performance compétitive et même nouvelle référence sur plusieurs benchmarks publics.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp