HyperAIHyperAI

Command Palette

Search for a command to run...

CoVA : Attention visuelle contextuelle pour l'extraction d'informations sur les pages web

Anurendra Kumar* [email protected] Keval Morabia* [email protected] Jingjin Wang [email protected] Kevin Chen-Chuan Chang [email protected] Alexander Schwing [email protected]

Résumé

L'extraction d'informations à partir de pages web (WIE) est une étape cruciale pour la création de bases de connaissances. Pour ce faire, les méthodes classiques de WIE s'appuient sur l'arbre du modèle objet document (DOM) d'un site web. Cependant, l'utilisation de l'arbre DOM présente des défis importants car le contexte et l'apparence sont codés de manière abstraite. Afin de relever ce défi, nous proposons de reformuler la WIE en tant que tâche de détection d'objets sur les pages web prenant en compte le contexte. Plus précisément, nous développons un pipeline de détection basé sur une attention visuelle contextuelle (CoVA), qui combine les caractéristiques d'apparence avec la structure syntaxique issue de l'arbre DOM. Pour étudier cette approche, nous avons collecté un nouveau jeu de données à grande échelle composé de sites web e-commerce, pour lesquels nous avons manuellement annoté chaque élément web avec quatre étiquettes : prix du produit, titre du produit, image du produit et arrière-plan. Sur cet ensemble de données, nous montrons que l'approche CoVA proposée constitue une nouvelle base de référence stimulante qui améliore les méthodes précédentes considérées comme étant à l'état de l'art.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp