コンシステント・ティーチャー:半教師付きオブジェクト検出における一貫性のない擬似ターゲットの低減に向けて

本研究では、半教師あり物体検出(SSOD)における偽ラベル(pseudo-target)の不整合性に深く迫る。我々の核心的な観察は、振動する偽ラベルが正確な検出器の学習を損なうことであり、これは学生ネットワークの学習にノイズを注入し、深刻な過学習を引き起こす要因となる。この問題に対処するため、不整合性を低減する体系的な解決策である「ConsistentTeacher」を提案する。まず、静的なIoUベースのアサインメント戦略に代わり、適応型アノンアサインメント(ASA)を導入することで、学生ネットワークがノイズを含む偽バウンディングボックスに対して耐性を持つようになる。次に、3次元特徴一致モジュール(FAM-3D)を設計し、各分類特徴が任意のスケールおよび位置で回帰タスクに最適な特徴ベクトルを適応的に取得できるようにすることで、サブタスク予測を補正する。最後に、ガウス混合モデル(GMM)を用いて偽バウンディングボックスのスコア閾値を動的に再調整することで、初期段階での正解ラベル数の安定化と、学習過程における信頼性の低い監視信号の是正を実現する。ConsistentTeacherは、広範なSSOD評価設定において強力な性能を示す。ResNet-50をバックボーンとして、MS-COCOデータセットの10%のみをアノテーション付きで使用した場合、40.0 mAPを達成し、従来の偽ラベルを用いたベースラインを約3 mAP上回る。完全にアノテーションされたMS-COCOデータに加えて無監督データを用いて学習した場合、性能はさらに向上し、47.7 mAPを達成する。本研究のコードは、\url{https://github.com/Adamdad/ConsistentTeacher} にて公開されている。