2ヶ月前

効率的なドメイン汎化のための共通-特異低ランク分解

Vihari Piratla; Praneeth Netrapalli; Sunita Sarawagi
効率的なドメイン汎化のための共通-特異低ランク分解
要約

ドメイン一般化とは、訓練中に見られなかった新しいドメインに一般化するモデルを訓練することを指します。本稿では、CSD(Common Specific Decomposition)を提案します。この手法は、新しいドメインに一般化する共通成分と、訓練ドメインに対して過学習するドメイン固有の成分を同時に学習します。訓練後、ドメイン固有の成分は破棄され、共通成分のみが保持されます。CSDアルゴリズムは非常に単純で、任意のニューラルネットワークアーキテクチャの最終的な線形分類層を変更するだけです。私たちは既存のアプローチを理解するために原理的な分析を行い、CSDの同定結果を提供し、低ランクがドメイン一般化に及ぼす影響について研究しました。実験結果から、CSDはドメイン消去、ドメイン摂動データ拡張、メタラーニングに基づく最新のドメイン一般化手法と同等かそれ以上であることが示されました。さらに、ドメインが解釈可能な回転MNISTでの診断により、CSDが成功裏に共通成分とドメイン固有成分を分離し、より良いドメイン一般化につながるという仮説が確認されました。