11日前

インスタンスに意識的で、コンテキストに焦点を当て、メモリ効率の良い弱教師ありオブジェクト検出

Zhongzheng Ren, Zhiding Yu, Xiaodong Yang, Ming-Yu Liu, Yong Jae Lee, Alexander G. Schwing, Jan Kautz
インスタンスに意識的で、コンテキストに焦点を当て、メモリ効率の良い弱教師ありオブジェクト検出
要約

弱教師あり学習は、学習過程における強力な教師信号の必要性を低減することで、物体検出において魅力的な手法として浮上している。しかし、依然として以下の主要な課題が残っている:(1)物体インスタンスの区別が曖昧になることがある;(2)検出器が物体全体ではなく特徴的な部分に注目しがちである;(3)真のラベル(ground truth)が存在しないため、高い再現率を達成するために物体候補を冗長に生成する必要があり、結果としてメモリ消費が著しく増大する。これらの課題に取り組むことは困難であり、しばしば不確実性や単純なトリビアルな解法を排除する必要がある。こうした問題に対処するため、本研究ではインスタンスに敏感かつ文脈に焦点を当てた統合型フレームワークを提案する。本フレームワークは、インスタンスに敏感な自己学習アルゴリズムと学習可能なConcrete DropBlockを採用するとともに、メモリ効率の高い順次バッチ逆伝播法を設計した。提案手法はCOCO(AP: 12.1%、AP₅₀: 24.8%)、VOC 2007(AP: 54.9%)、VOC 2012(AP: 52.1%)において、既存のベースラインを大幅に上回る最先端の性能を達成した。さらに、本手法はResNetをベースとするモデルおよび弱教師あり動画物体検出のベンチマークを初めて実施した。コード、モデル、詳細情報は以下のURLで公開される予定である:https://github.com/NVlabs/wetectron。

インスタンスに意識的で、コンテキストに焦点を当て、メモリ効率の良い弱教師ありオブジェクト検出 | 最新論文 | HyperAI超神経