11日前

TransAdapter:特徴中心型教師なしドメイン適応のためのVision Transformer

A. Enes Doruk, Erhan Oztop, Hasan F. Ates
TransAdapter:特徴中心型教師なしドメイン適応のためのVision Transformer
要約

教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ラベル付きのソースドメインデータを活用してラベルなしのターゲットドメインにおけるタスクを解決することを目的としており、両ドメイン間の顕著なドメインギャップによってしばしば制限される。従来のCNNベースの手法は、複雑なドメイン間関係を十分に捉えることが困難であり、この課題を克服するため、局所的およびグローバルな依存関係を効果的にモデル化できる視覚変換器(Vision Transformer)への移行が進んでいる。特に、Swin Transformerはその優れた性能により注目されている。本研究では、Swin Transformerを活用した新しいUDAアプローチを提案し、3つの主要モジュールを導入する。まず、グラフ畳み込みを用いてピクセル間の相関を捉え、エントロピーに基づく注目メカニズムで異なるドメイン特徴を区別する「グラフドメイン識別器」により、ドメインの整合性を強化する。次に、「適応的二重注目モジュール」では、ウィンドウおよびシフトウィンドウの注目機構を組み合わせ、動的再重み付けにより長距離依存と局所特徴の効果的な整合を実現する。さらに、「クロス特徴変換モジュール」はSwin Transformerのブロック構造を変更することで、異なるドメイン間での汎化性能を向上させる。広範なベンチマーク評価により、本手法がタスク固有の整合モジュールを一切不要としつつも、最先端の性能を達成することが確認された。これにより、多様な応用分野に柔軟に適応可能な汎用性の高さが示された。

TransAdapter:特徴中心型教師なしドメイン適応のためのVision Transformer | 最新論文 | HyperAI超神経