2ヶ月前

平滑化の重要性:ドメイン適応セマンティックセグメンテーションのためのモーメンタムトランスフォーマー

Runfa Chen; Yu Rong; Shangmin Guo; Jiaqi Han; Fuchun Sun; Tingyang Xu; Wenbing Huang
平滑化の重要性:ドメイン適応セマンティックセグメンテーションのためのモーメンタムトランスフォーマー
要約

コンピュータビジョンにおけるビジョントランスフォーマーの変種(ViTs)の大成功を受け、ドメイン適応セマンティックセグメンテーションにおいても大きな可能性を示しています。しかし、ローカルViTsをドメイン適応セマンティックセグメンテーションに直接適用すると、期待される改善が得られないことが明らかになりました。私たちは、ローカルViTsの問題点が疑似ラベルの構築とターゲットドメインの特徴量合わせの過程で生成される深刻な高周波成分に起因することを見出しました。これらの高周波成分は、ローカルViTsの学習が非常に不安定になり、転移性能を損なう原因となっています。本論文では、ターゲットドメインの特徴量と疑似ラベルの学習動態を滑らかにするために、低域フィルタリングメカニズムであるモーメンタムネットワークを導入します。さらに、サンプルの重要性を評価するための動的な不一致測定法を提案し、ソースドメインとターゲットドメイン間の分布を動的重みによって揃えます。以上の課題に対処した結果、sim2realベンチマークでの広範な実験により、提案手法が最先端手法を上回ることが示されました。私たちのコードは https://github.com/alpc91/TransDA で公開されています。