HyperAIHyperAI

Command Palette

Search for a command to run...

CoVA: コンテキストに応じた視覚的注意のウェブページ情報抽出への適用

Anurendra Kumar* [email protected] Keval Morabia* [email protected] Jingjin Wang [email protected] Kevin Chen-Chuan Chang [email protected] Alexander Schwing [email protected]

概要

ウェブページ情報抽出(WIE)は、知識ベースの作成において重要なステップです。これには、従来のWIE手法がウェブサイトのドキュメントオブジェクトモデル(DOM)ツリーを利用します。しかし、DOMツリーの使用は、コンテキストと外観が抽象的な方法で符号化されているため、大きな課題をもたらします。この課題に対処するため、私たちはWIEをコンテキストに配慮したウェブページオブジェクト検出タスクとして再定式化することを提案します。具体的には、コンテキストに配慮した視覚的注意に基づく(CoVA)検出パイプラインを開発し、外観特徴とDOMツリーから得られる文法構造を組み合わせます。このアプローチを研究するために、私たちは電子商取引サイトの新しい大規模データセットを収集し、各ウェブ要素に対して製品価格、製品タイトル、製品画像、および背景という4つのラベルを手動で注釈付けました。このデータセット上で実験を行い、提案されたCoVAアプローチが新たな挑戦的な基準となり、既存の最先端手法よりも性能が向上することを示しました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています