6ヶ月前

オブジェクト検出

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Xuangeng Chu Anlin Zheng Xiangyu Zhang Jian Sun

概要

我々は、混雑したシーンにおける高度に重複するインスタンスの検出を目的として、シンプルかつ効果的な提案ベースのオブジェクト検出器を提案する。本手法の核となるアイデアは、従来の提案ベースのフレームワークが各提案に対して単一のインスタンスを予測するのに対し、本手法では各提案が一連の相関するインスタンスを同時に予測する点にある。EMD損失やSet NMSといった新たな技術を導入することで、高度に重複する物体の検出という困難な課題に対して効果的に対応可能となる。FPN-Res50ベースライン上で、本検出器は挑戦的なCrowdHumanデータセットにおいて4.9%のAP向上を達成し、CityPersonsデータセットでは1.0%の $\text{MR}^{-2}$ 改善を実現した。なお、これらはあらゆる補足技術（bells and whistles）を用いない状態での結果である。さらに、COCOのような混雑度が低いデータセットにおいても、本手法は中程度の性能向上を示しており、検出性能が混雑度に強く依存しない堅牢性を持つことが示された。コードおよび事前学習済みモデルは、https://github.com/megvii-model/CrowdDetection にて公開される予定である。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

オブジェクト検出

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Xuangeng Chu Anlin Zheng Xiangyu Zhang Jian Sun

概要

我々は、混雑したシーンにおける高度に重複するインスタンスの検出を目的として、シンプルかつ効果的な提案ベースのオブジェクト検出器を提案する。本手法の核となるアイデアは、従来の提案ベースのフレームワークが各提案に対して単一のインスタンスを予測するのに対し、本手法では各提案が一連の相関するインスタンスを同時に予測する点にある。EMD損失やSet NMSといった新たな技術を導入することで、高度に重複する物体の検出という困難な課題に対して効果的に対応可能となる。FPN-Res50ベースライン上で、本検出器は挑戦的なCrowdHumanデータセットにおいて4.9%のAP向上を達成し、CityPersonsデータセットでは1.0%の $\text{MR}^{-2}$ 改善を実現した。なお、これらはあらゆる補足技術（bells and whistles）を用いない状態での結果である。さらに、COCOのような混雑度が低いデータセットにおいても、本手法は中程度の性能向上を示しており、検出性能が混雑度に強く依存しない堅牢性を持つことが示された。コードおよび事前学習済みモデルは、https://github.com/megvii-model/CrowdDetection にて公開される予定である。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています