{ Xuelong Li Jungong Han Yanwei Pang Jiale Cao}

要約
シングルショット検出器(Single Shot Detector)は、デフォルトボックスのオブジェクトカテゴリと回帰オフセットを同時に予測する。高い効率性を発揮する一方で、いくつかの不適切な設計を含んでいる。第一に、推論時にデフォルトボックスの分類結果が回帰後のボックスに不適切に割り当てられる点である。第二に、一度の回帰では、正確なオブジェクト検出には不十分である。第一の問題を解決するため、新たなレグ・オフセット・クラス分類(reg-offset-cls, ROC)モジュールを提案する。このモジュールは、ボックス回帰、特徴サンプリング位置の予測、およびオフセット位置の特徴を用いた回帰後ボックスの分類という3段階の階層構造を持つ。第二の問題をさらに解決するため、2つのROCモジュールと1つの特徴強化モジュールをスタックした階層的ショット検出器(hierarchical shot detector, HSD)を提案する。2番目のROCモジュールは、1番目のROCモジュールの回帰後ボックスおよび特徴サンプリング位置を入力として扱う。一方、2つのROCモジュールの間に配置された特徴強化モジュールは、局所的および非局所的なコンテキストを抽出することを目的としている。MS COCOおよびPASCAL VOCデータセットにおける実験結果から、提案するHSDの優位性が示された。特別な追加技術を用いずに、HSDはリアルタイム速度で、すべてのワンステージ検出手法を上回る性能を達成した。
コードリポジトリ
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| object-detection-on-coco | HSD (Rest101, 768x768, single-scale test) | AP50: 61.2 AP75: 46.9 APL: 55.9 APM: 47.3 APS: 22.8 Hardware Burden: Operations per network pass: box mAP: 42.3 |
| object-detection-on-pascal-voc-2007 | HSD (VGG16, 512x512, single-scale test) | MAP: 83.0% |
| object-detection-on-pascal-voc-2007 | HSD (VGG16, 320x320, single-scale test) | MAP: 81.7% |