HyperAIHyperAI

Command Palette

Search for a command to run...

Un décodeur structuré en arbre pour la génération de balisage à partir d'images

Li-Rong Dai Yi-Zhe Song Yongxin Yang Si Wei Jun Du Jianshu Zhang

Résumé

Les approches récentes basées sur l’encodage-décodage utilisent généralement des décodeurs de chaînes pour convertir les images en chaînes sérialisées dans le cadre de la reconnaissance d’images vers le balisage. Toutefois, pour un balisage représentant une structure arborescente, les représentations sous forme de chaîne peinent à gérer la complexité structurelle. Dans ce travail, nous montrons tout d’abord, à l’aide d’un ensemble de problèmes simples, que les décodeurs de chaînes éprouvent des difficultés à déchiffrer des structures arborescentes, notamment lorsque la complexité structurelle augmente. Nous proposons ensuite un décodeur structuré en arbre, spécifiquement conçu pour générer un balisage de structure arborescente. Notre décodeur fonctionne de manière séquentielle, où à chaque étape, un nœud enfant et son nœud parent sont générés simultanément afin de former un sous-arbre. Ce sous-arbre est ensuite utilisé de manière récurrente pour construire la structure arborescente finale. La clé du succès de notre décodeur repose sur deux aspects fondamentaux : (i) il respecte strictement la relation parent-enfant propre aux arbres, et (ii) il produit explicitement une structure arborescente, contrairement à une chaîne linéaire. Évalué sur la reconnaissance de formules mathématiques et de formules chimiques, le décodeur arborescent proposé s’avère nettement supérieur aux modèles de décodeurs de chaînes performants.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp