G2L:教師なしドメイン適応セマンティックセグメンテーションのためのグローバルからローカルへのアライメント手法
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)におけるセマンティックセグメンテーションは、ラベル付きのソースデータセット(画素単位の詳細なアノテーション付き)からラベルのないターゲットデータセットへ知識を転移することを目的としている。しかし、UDA手法の性能は、ドメイン間の分布差異(ドメインシフト)によって低下しがちである。これは、両ドメインの特徴分布の不一致に起因する。これまでに、画像レベルでの分布マッチングを限定的に試みる研究が複数報告されている。しかし、カテゴリレベルのドメインシフトという課題により、このようなグローバルなアライメントでは、ターゲットドメインから抽出された深層特徴が異なるカテゴリ間で良好に分離されるとは保証されない。その結果、生成された擬似ラベルはノイズを含み、ターゲットドメインにおける学習プロセスを劣化させる(ポイズン化)リスクがある。近年の一部の手法は、カテゴリごとの情報を用いて擬似ラベルのノイズをオンラインで除去することに注力している。本論文では、グローバルな視点から画像レベルのドメインシフトに対処するため、細粒度の adversarial training と新たに提案する「色彩フーリエ変換(chromatic Fourier transform)」を活用する、新たなUDA手法「グローバルからローカルへのアライメント(Global-to-Local alignment, G2L)」を導入する。次に、ローカルな視点でカテゴリレベルのドメインシフトに対処する。具体的には、レアカテゴリ(長尾カテゴリ)を重視するため、長尾カテゴリ評価戦略を提案し、擬似ラベル生成およびノイズ除去の段階で動的信頼度閾値とカテゴリごとの優先重みを導入する。最後に、自己蒸留(self-distillation)を用いて最終的なセグメンテーション結果を向上させる。GTA5 → Cityscapes および SYNTHIA → Cityscapes という代表的なベンチマーク上での実験により、本手法が他の最先端手法を上回る精度を達成することが示された。