17日前

混雑したシーンにおける検出:1つの提案、複数の予測

Xuangeng Chu, Anlin Zheng, Xiangyu Zhang, Jian Sun
混雑したシーンにおける検出:1つの提案、複数の予測
要約

我々は、混雑したシーンにおける高度に重複するインスタンスの検出を目的として、シンプルかつ効果的な提案ベースのオブジェクト検出器を提案する。本手法の核となるアイデアは、従来の提案ベースのフレームワークが各提案に対して単一のインスタンスを予測するのに対し、本手法では各提案が一連の相関するインスタンスを同時に予測する点にある。EMD損失やSet NMSといった新たな技術を導入することで、高度に重複する物体の検出という困難な課題に対して効果的に対応可能となる。FPN-Res50ベースライン上で、本検出器は挑戦的なCrowdHumanデータセットにおいて4.9%のAP向上を達成し、CityPersonsデータセットでは1.0%の$\text{MR}^{-2}$改善を実現した。なお、これらはあらゆる補足技術(bells and whistles)を用いない状態での結果である。さらに、COCOのような混雑度が低いデータセットにおいても、本手法は中程度の性能向上を示しており、検出性能が混雑度に強く依存しない堅牢性を持つことが示された。コードおよび事前学習済みモデルは、https://github.com/megvii-model/CrowdDetection にて公開される予定である。

混雑したシーンにおける検出:1つの提案、複数の予測 | 最新論文 | HyperAI超神経