2ヶ月前
PiPa: ピクセル単位およびパッチ単位の自己監督学習によるドメイン適応型セマンティックセグメンテーション
Mu Chen; Zhedong Zheng; Yi Yang; Tat-Seng Chua

要約
非監督ドメイン適応(Unsupervised Domain Adaptation, UDA)は、学習済みモデルの他のドメインへの汎化性能を向上させることが目的です。ドメイン間で共通する知識が、ラベル付きのソースドメイン(例:ビデオゲーム)で訓練されたモデルから、ラベルなしのターゲットドメイン(例:実世界シナリオ)へと転送され、アノテーションコストを削減します。既存のセマンティックセグメンテーションにおけるUDA手法は、通常、ピクセルレベル、特徴量レベル、予測レベルなど、さまざまなレベルでのドメイン間の差異を最小化することに焦点を当てています。しかし、画像内のコンテキスト相関などの主要なドメイン内知識は十分に研究されていません。このギャップを埋めるために、我々はピクセル単位およびパッチ単位の自己教師あり学習フレームワークであるPiPaを提案します。このフレームワークは、異なるコンテキストに対する画像内のピクセル単位の相関関係とパッチ単位の意味的一貫性を促進します。提案されたフレームワークは、ドメイン内画像の内在的な構造を利用しており:クラス内の一貫性とクラス間の分離性を持つ判別的ピクセル特徴量の学習を明示的に奨励します。異なるコンテキストや変動に対して同一パッチの堅牢な特徴量学習を促進します。広範な実験により、提案手法の有効性が確認されました。GTA to CityscapesおよびSynthia to Cityscapesという2つの広く使用されているUDAベンチマークにおいて競合他社に匹敵する精度(75.6 mIoUと68.2 mIoU)を得ました。さらに、当手法は他のUDAアプローチとの互換性があり、追加のパラメータを導入せずに性能向上が可能です。