
要約
教師なしドメイン適応(Unsupervised Domain Adaptation: UDA)は、大量のラベル付きデータを必要としないように、ラベル付きデータが豊富なソースドメインからラベルなしのターゲットドメインへ知識を転移することを目指す。ターゲットドメインにはラベルが存在しないため、初期段階でのドメイン間の不整合が後続の学習フェーズに伝播し、誤差の蓄積を引き起こす可能性がある。この問題を克服するため、本研究では段階的ソースドメイン拡張(Gradual Source Domain Expansion: GSDE)アルゴリズムを提案する。GSDEは、UDAタスクを複数回、初期化されたネットワーク重みから再び学習を開始するが、各ステージでターゲットデータをソースデータセットに段階的に追加する。具体的には、前回の学習でスコアが最も高いターゲットデータを、その予測ラベル(擬似ラベル)とともに擬似ソースサンプルとして利用する。この戦略により、新しい学習フェーズの初期段階から、前回の学習で抽出された知識が直接導入され、特に初期学習段階において二つのドメイン間の整合性を高める効果が得られる。本研究では、まず強力なベースラインネットワークを構築し、その上でGSDE戦略を適用する。Office-31、OfficeHome、DomainNetの3つのベンチマークで実験およびアブレーションスタディを実施した結果、既存の最先端手法を上回る性能を達成した。さらに、提案するGSDE戦略が、さまざまな最先端UDAアプローチの精度向上にも寄与することを示した。