17日前
SpotNet:自己注意機構を用いたマルチタスクネットワークによるオブジェクト検出
Hughes Perreault, Guillaume-Alexandre Bilodeau, Nicolas Saunier, Maguelonne Héritier

要約
人間は、さまざまな種類の物体を検索する際、関連する領域に視覚的注意を向けられる能力に優れている。たとえば、車を捜索する際には、建物の屋上ではなく道路を注視する。本論文の目的は、マルチタスク学習アプローチを用いて、ネットワークに対しても同様の視覚的注意の導向を学習させることにある。視覚的注意の学習を実現するために、背景差分法や光流(optical flow)を用いた半教師あり方式により、前景/背景のセグメンテーションラベルを生成する。これらのラベルを用いて、オブジェクト検出モデルを学習させ、同時に前景/背景セグメンテーションマップとバウンディングボックスの両方を出力する。この際、モデルの大部分のパラメータを共有する。生成されたセグメンテーションマップをネットワーク内部で自己注意機構(self-attention mechanism)として利用し、バウンディングボックスを生成する際に用いる特徴マップの重みを調整することで、関連性の低い領域の信号を低減する。本手法を用いることで、2つの交通監視データセットにおいて顕著なmAP(mean Average Precision)の向上が得られ、特にUA-DETRACおよびUAVDTの両データセットにおいて、最先端(state-of-the-art)の性能を達成した。