HyperAIHyperAI

Command Palette

Search for a command to run...

TallyQA: 複雑なカウント質問への回答

Manoj Acharya; Kushal Kafle; Christopher Kanan

概要

視覚質問応答(VQA)データセットにおける大部分の数え上げに関する質問は単純であり、物体検出以上の処理を必要としません。本研究では、物体間の関係性、属性識別、推論などを含む複雑な数え上げ質問に焦点を当てたアルゴリズムを考察します。そのため、私たちは世界最大のオープンエンド型数え上げデータセットであるTallyQAを作成しました。本稿では、領域提案を使用する関係ネットワークを用いた新しい数え上げアルゴリズムを提案します。当方法により、高解像度画像において関係ネットワークを効率的に利用することが可能となりました。TallyQAおよびHowMany-QAベンチマークにおいて、ベースラインシステムや最近のシステムと比較して最先端の結果を得ています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています