
要約
歩行者検出は、都市での自動運転における安全性に大きな影響を与えるコンピュータビジョンの重要な課題です。本研究では、セマンティックセグメンテーションを用いて歩行者検出の精度を向上させつつ、ネットワーク効率にほとんど影響を与えない方法を探ります。私たちは、セマンティックセグメンテーションと歩行者検出の共同監督を可能にするセグメンテーション注入ネットワークを提案します。適切な位置に配置することで、追加の監督が共有層の特徴量をより洗練され、下流の歩行者検出器にとって有用なものに導くことが可能です。この手法を使用して、弱いアノテーションボックスでも大幅な性能向上が得られることを見出しました。私たちは詳細な分析を行い、共有層がセグメンテーション監督によってどのように形成されるかを示します。その結果、得られた特徴マップはより意味的に豊かで、形状や遮蔽に対して堅牢性が高まることを確認しました。全体として、私たちの同時検出とセグメンテーションフレームワークはCaltech歩行者データセットにおいて最先端技術よりも大幅な改善を達成し、KITTIデータセットでも競合する性能を発揮し、競合する手法よりも2倍速い実行速度を実現しています。