2ヶ月前
ProNet: オブジェクト固有のボックスを提案するカスケード型ニューラルネットワークの学習
Chen Sun; Manohar Paluri; Ronan Collobert; Ram Nevatia; Lubomir Bourdev

要約
本論文は、バウンディングボックスのアノテーションを使用せずに、物体を正確かつ効率的に分類および位置特定することを目指しています。野生の環境下では、物体が任意の位置に現れ、異なるスケールで存在するため、この課題は非常に困難です。本論文では、畳み込みニューラルネットワークに基づく新しい分類アーキテクチャであるProNetを提案します。ProNetは計算効率の高いニューラルネットワークを使用して、物体が含まれている可能性のある画像領域を提案し、その提案された領域に対してより強力だが遅いネットワークを適用します。基本的な構成要素は、異なる位置とスケールのボックスに物体信頼度スコアを割り当てる多スケール完全畳み込みネットワークです。我々は、このようなネットワークが画像レベルのアノテーションを使用して効果的に学習できることを示し、さらに効率的な物体分類のためにカスケードやツリーに接続できることが確認できました。ProNetはPASCAL VOC 2012およびMS COCOデータセットにおいて物体分類とポイントベースの位置特定で従来の最先端技術を大幅に上回る性能を発揮しました。