2ヶ月前
擬ラベルを使用した半教師ありビデオ注目物体検出
Pengxiang Yan; Guanbin Li; Yuan Xie; Zhen Li; Chuan Wang; Tianshui Chen; Liang Lin

要約
深層学習を基盤とする動画の注目物体検出は、その性能が他の非監督手法を大幅に上回るという点で最近大きな成功を収めています。しかし、既存のデータ駆動型アプローチは、このような有望な結果を得るために大量のピクセル単位でのアノテーションが必要となっています。本論文では、疑似ラベルを使用した半教師付き動画注目物体検出タスクに取り組んでいます。具体的には、空間リファインメントネットワークと時空間モジュールから構成される効果的な動画画像注目度検出器を提案します。同じリファインメントネットワークと光学フローによる運動情報を基に、さらに疎なアノテーションフレームからピクセルレベルの疑似ラベルを生成する新しい方法を提案します。生成された疑似ラベルと一部の手動アノテーションを利用することで、当社の動画画像注目度検出器は対照推論と一貫性強化のための空間的および時間的ヒントを学習し、正確な注目度マップを作成します。実験結果は、提案した半教師付き手法がVOS、DAVIS、FBMSという3つの公開ベンチマークにおいて全ての最先端の完全教師付き手法を大幅に上回ることを示しています。请注意,虽然您的要求中提到了“法语读者”,但根据上下文判断,您需要的是日语翻译,因此我提供了相应的日语译文。如果确实需要法语翻译,请告知,我会进行调整。