2ヶ月前
日常シーンにおける日常物体のカウント
Prithvijit Chattopadhyay; Ramakrishna Vedantam; Ramprasaath R. Selvaraju; Dhruv Batra; Devi Parikh

要約
私たちは、自然な日常の画像における物体クラスのインスタンス数をカウントすることに興味を持っています。従来のカウント手法は、監視ビデオでの歩行者数のカウントなど、限定的なドメインで問題に対処していました。また、物体検出などの他のビジョンタスクの出力からカウントを推定することも可能です。本研究では、自然環境で見られる物体の数、外観、スケールに大きな変動があることを考慮し、専用のモデルを構築してカウント問題に取り組んでいます。私たちのアプローチは、サビタイジング(subitizing)という現象に着想を得ています。これは、人間が知覚信号に基づいて小さな数値に対して迅速な評価を行う能力です。自然なシーンが与えられた場合、私たちのアプローチはシーン全体でのコンテキストを取り入れながら、「分けて統治する」戦略を用いてサビタイジングのアイデアをカウントに適用します。このアプローチは、PASCAL VOC 2007およびCOCOデータセットでのカウントにおいて多くのベースライン手法よりも一貫した改善を提供しています。その後、カウントがどのように物体検出の改善に役立つかについて調査しました。さらに、VQAおよびCOCO-QAデータセット内の「いくつ?」という質問に対する概念実証アプリケーションとして、私たちのカウント手法を視覚的質問応答タスクに適用する方法を示しています。