7日前
圧縮 Attention マッチングを用いたユニバーサルドメイン適応
Didi Zhu, Yincuan Li, Junkun Yuan, Zexi Li, Kun Kuang, Chao Wu

要約
ユニバーサル・ドメイン適応(UniDA)は、ターゲットドメインのラベルセットに関する事前知識を一切持たずに、ソースドメインからターゲットドメインへ知識を転送することを目的としている。この課題の核心は、ターゲットサンプルが共通カテゴリに属するかどうかをいかに判断するかにある。主流の手法はサンプルの特徴に基づいて判断を行うが、これによりグローバルな情報に過度に注目し、画像内の最も重要なローカルなオブジェクト情報を無視してしまうため、精度の向上が限定的となる。この問題に対処するため、我々は視覚変換器(Vision Transformer)における自己注意機構を活用し、重要なオブジェクト情報を捉えるためのユニバーサル・アテンションマッチング(UniAM)フレームワークを提案する。本フレームワークは、アテンションを圧縮的に表現することでコア情報を探索する新たな圧縮的アテンションマッチング(CAM)手法を導入している。さらに、CAMは残差に基づく測定法を組み込み、サンプルの共通性を判定する。この測定法を用いることで、UniAMはドメインごと・カテゴリごとの共通特徴整合(CFA)およびターゲットクラス分離(TCS)を実現する。特に、UniAMは視覚変換器におけるアテンションを直接分類タスクに利用する最初の手法である。広範な実験により、UniAMが複数のベンチマークデータセットにおいて、現在の最先端手法を上回ることを確認した。