HyperAIHyperAI

Command Palette

Search for a command to run...

C-MIDN:セグメンテーションガイダンスを有するカップリング多重インスタンス検出ネットワークによる弱教師付きオブジェクト検出

Dongrui Fan Haihang You Fang Wan Xiaochun Ye Nan Guo Boxiao Liu Yan Gao

概要

最近、画像レベルのラベルのみを必要とする弱教師付き物体検出(Weakly Supervised Object Detection: WSOD)が注目を集めている。畳み込みニューラルネットワーク(CNN)と複数インスタンス学習(Multiple Instance Learning: MIL)を組み合わせたMultiple Instance Detection Network(MIDN)は、WSOD問題に対処する最も一般的な手法となり、多くの研究で初期モデルとして採用されている。本研究では、MIDNが最も判別力の高い物体部分に収束しやすい傾向にあることにより、その上位に構築された手法の性能が制限されていると指摘する。この問題に対処するために、本論文では新たな「結合型複数インスタンス検出ネットワーク(Coupled Multiple Instance Detection Network: C-MIDN)」を提案する。具体的には、提案領域を除去する機構を備えた補完的な働きをする2つのMIDNを用いる。さらに、これらのMIDNの局在情報を利用し、よりタイトなバウンディングボックスを獲得するとともに、複数の物体を同時に局在化する。また、提案領域除去後のMIL制約を保証し、C-MIDNのロバスト性を確保するため、セグメンテーション誘導型提案領域除去(Segmentation Guided Proposal Removal: SGPR)アルゴリズムを導入する。オンライン検出器の精緻化を伴うシンプルなC-MIDNの実装により、挑戦的なPASCAL VOC 2007および2012ベンチマークにおいて、それぞれ53.6%および50.3%のmAPを達成し、従来の最先端手法を顕著に上回った。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています