18日前
方向性かつ密集配置されたオブジェクト検出のためのダイナミックリファインメントネットワーク
Xingjia Pan, Yuqiang Ren, Kekai Sheng, Weiming Dong, Haolei Yuan, Xiaowei Guo, Chongyang Ma, Changsheng Xu

要約
過去10年間、オブジェクト検出は顕著な進展を遂げてきた。しかし、回転方向が異なるかつ密集して配置されたオブジェクトの検出は、以下の根本的な理由から依然として困難である:(1)ニューロンの受容野はすべて軸方向に整列しており、形状も同一である一方で、実際のオブジェクトは多様な形状を持ち、さまざまな方向に配置されている;(2)検出モデルは一般的な知識に基づいて学習されることが多く、テスト時に特定のオブジェクトに対応する能力に乏しい可能性がある;(3)関連するデータセットが限られていることが、このタスクの発展を阻害している。上記の1および2の問題を解決するため、本研究では、特徴選択モジュール(FSM)と動的精緻化ヘッド(DRH)という2つの新規モジュールから構成される動的精緻化ネットワーク(DRN)を提案する。本研究のFSMは、ターゲットオブジェクトの形状や方向に応じてニューロンの受容野を動的に調整可能にし、DRHはオブジェクトに特化した意識を持つ形で予測を動的に精緻化する能力をモデルに与える。また、関連するベンチマークの不足に対処するため、SKU110Kをもとに回転方向を考慮したバウンディングボックスで再ラベルした、広範かつ完全にアノテーションされたデータセット「SKU110K-R」を収集した。本研究では、DOTA、HRSC2016、SKU110K、および自ら構築したSKU110K-Rを含む複数の公開ベンチマーク上で定量評価を実施した。実験結果から、従来手法と比較して、本手法が一貫して顕著な性能向上を達成していることが明らかになった。コードおよびデータセットは、https://github.com/Anymake/DRN_CVPR2020 にて公開されている。