11日前

エンドツーエンド半教師付きオブジェクト検出におけるソフトティーチャー

Mengde Xu, Zheng Zhang, Han Hu, Jianfeng Wang, Lijuan Wang, Fangyun Wei, Xiang Bai, Zicheng Liu
エンドツーエンド半教師付きオブジェクト検出におけるソフトティーチャー
要約

本稿では、従来のより複雑なマルチステージ手法とは対照的に、エンドツーエンド型の半教師あり物体検出アプローチを提案する。エンドツーエンド学習により、カリキュラムの進行に伴って偽ラベル(pseudo label)の品質が段階的に向上し、その精度の向上した偽ラベルが再び物体検出の学習に良い影響を与える。また、本フレームワーク内において、シンプルでありながら効果的な2つの技術を提案する。1つは「ソフトティーチャー機構」であり、各未ラベルバウンディングボックスの分類損失を、ティーチャーネットが生成する分類スコアによって重み付けするものである。もう1つは「ボックスジッター法(box jittering)」であり、ボックス回帰の学習に信頼性の高い偽ボックスを選定するための手法である。COCOベンチマークにおいて、本手法は1%、5%、10%という異なるラベル付きデータ比率の下で、従来手法を大きく上回る性能を示した。さらに、ラベル付きデータ量が比較的多い状況でも本手法の優れた性能が確認された。例えば、COCOの全トレーニングセットを用いて学習したベースライン検出器(40.9 mAP)に対して、COCOに含まれる123,000枚の未ラベル画像を活用することで、+3.6 mAPの向上(44.5 mAP)を達成した。また、最先端のSwin Transformerベースの物体検出器(テストデブで58.9 mAP)に対しても、検出精度を+1.5 mAPまで向上(60.4 mAP)させるとともに、インスタンスセグメンテーション精度も+1.2 mAP(52.4 mAP)向上させた。さらにObject365で事前学習されたモデルを組み合わせることで、検出精度は61.3 mAP、インスタンスセグメンテーション精度は53.0 mAPに達し、新たな最先端(SOTA)性能を達成した。

エンドツーエンド半教師付きオブジェクト検出におけるソフトティーチャー | 最新論文 | HyperAI超神経