2ヶ月前

UniMatch V2: 半教師付き意味分割の限界に挑戦

Lihe Yang; Zhen Zhao; Hengshuang Zhao
UniMatch V2: 半教師付き意味分割の限界に挑戦
要約

半教師ありセマンティックセグメンテーション(Semi-supervised semantic segmentation, SSS)は、安価なラベルなし画像から豊富な視覚的な知識を学習し、セマンティックセグメンテーションの能力を向上させることが目的です。最近の研究では、UniMatchが弱い一貫性正則化から強い一貫性正則化への実践を強化することで、前例を大幅に改善しました。その後の研究も同様のパイプラインに従い、様々な巧妙な設計を提案しています。しかし、多くの強力なビジョンモデルが登場しているこの時代において、不思議なことに、ほとんどすべてのSSS研究は1) 古いResNetエンコーダを使用して小規模なImageNet-1Kで事前学習を行うことと、2) 単純なPascalやCityscapesデータセットでの評価に固執しています。本研究では、SSSのベースラインを古いResNetベースのエンコーダから大規模データで事前学習されたより高性能なViTベースのエンコーダ(例えばDINOv2)に切り替える必要があると主張します。エンコーダの単純な更新(パラメータ数が2倍少ない場合でも)は、慎重な手法設計よりも有意義な改善をもたらす可能性があります。この競争力のあるベースラインに基づいて、我々はアップグレードされ簡素化されたUniMatch V2を提示します。V1から弱い一貫性から強い一貫性への核心的な精神を受け継ぎつつ、学習コストが少なくなり、一貫して優れた結果を提供します。さらに、PascalやCityscapesにおける性能向上が徐々に頭打ちになっていることを踏まえ、ADE20KやCOCOなどの複雑な分類体系を持つより困難なベンチマークに焦点を当てるべきであると提唱します。報告された値に関するコード、モデル、およびログは以下のURLで公開されています: https://github.com/LiheYoung/UniMatch-V2.

UniMatch V2: 半教師付き意味分割の限界に挑戦 | 最新論文 | HyperAI超神経