要約
オブジェクト検出は成熟した技術であり、人間の視覚性能に近づきつつある。本論文では、物体の検出可能性を低下させる視覚的要因に着目することで、残存する検出能力のギャップをさらに縮小する手法を提案する。これらの要因の一部は実際のセンサデータでは測定が困難または不可能であるため、合成データ上で検出器を学習させ、大規模に正確な測定値および真値データを入手する。得られた検出器を用いて、実際の訓練データのサンプルおよびそれらに対応する検出性能低下要因を重みづけする経験的重み付き損失(empirical detection impairment weighting loss)を調整する。本手法は交通シーンにおける歩行者検出タスクに適用された。CityPersonsデータセット上で学習された検出器を用いた実験により、経験的検出妨害重み付き損失(DIW損失)の有効性が実証され、このベンチマークにおいて新たな最良性能を達成し、従来の結果から1.88%の向上を実現した。