2ヶ月前

バウンディングボックス注釈を用いた多ラベル物体認識の活用

Hao Yang; Joey Tianyi Zhou; Yu Zhang; Bin-Bin Gao; Jianxin Wu; Jianfei Cai
バウンディングボックス注釈を用いた多ラベル物体認識の活用
要約

畳み込みニューラルネットワーク(CNNs)は、物体認識アプリケーションにおける一般的な特徴表現として優れた性能を示しています。しかし、異なるカテゴリ、スケール、位置に複数の物体が含まれるマルチラベル画像に対しては、グローバルなCNN特徴が最適ではありません。本論文では、局所情報を組み込むことで特徴の識別力を向上させる方法を提案します。具体的には、まず各画像から物体候補を抽出します。各画像をバッグとし、その中から抽出された物体候補をインスタンスとすることで、マルチラベル認識問題をマルチクラス・マルチインスタンス学習問題に変換します。次に、各提案から一般的なCNN特徴表現を抽出するだけでなく、局所領域の最近傍関係を使用して多視点パイプラインを形成するために、地面実バウンディングボックス注釈(強ラベル)を利用することを提案します。提案する多視点・マルチインスタンスフレームワークは弱ラベルと強ラベル双方を効果的に利用し、より重要なことに他のカテゴリからの部分的な強ラベルによって未見のカテゴリの性能さえ向上させる一般化能力を持っています。我々のフレームワークは、2つのマルチラベルベンチマークデータセットで最新の手作り特徴量ベースの手法やCNNベースの手法と広範囲に比較されました。実験結果は、提案したフレームワークの識別力と一般化能力を検証しています。強ラベルを使用することで、我々のフレームワークは両方のデータセットで最先端の結果を得ることができました。

バウンディングボックス注釈を用いた多ラベル物体認識の活用 | 最新論文 | HyperAI超神経