2ヶ月前

物体検出におけるスケール不変性の分析 - SNIP

Bharat Singh; Larry S. Davis
物体検出におけるスケール不変性の分析 - SNIP
要約

極端なスケール変動下での物体認識および検出技術の分析が行われた。スケール固有の検出器設計とスケール不変の検出器設計を、異なる入力データ構成で訓練することで比較した。ImageNet上の小さな物体の分類性能を評価することにより、CNN(畳み込みニューラルネットワーク)がスケール変動に対して堅牢でないことを示した。この分析に基づき、画像ピラミッドの同じスケールで検出器を訓練およびテストすることを提案する。小さな物体は小さなスケールで、大きな物体は大きなスケールで認識するのが難しいため、異なるサイズの物体インスタンスの勾配を選択的に逆伝播させる新しい訓練手法である「画像ピラミッド用スケール正規化(Scale Normalization for Image Pyramids: SNIP)」を提示する。COCOデータセットにおいて、単一モデルの性能は45.7%であり、3つのネットワークのアンサンブルではmAP(平均精度)が48.3%であった。既存のImageNet-1000事前学習モデルを使用し、バウンディングボックス監督のみで訓練を行った。当該提出はCOCO 2017チャレンジにおいて最優秀学生賞を受賞した。コードは\url{http://bit.ly/2yXVg4c}にて公開予定である。