17日前

動的ドメイン一般化

Zhishu Sun, Zhifeng Shen, Luojun Lin, Yuanlong Yu, Zhifeng Yang, Shicai Yang, Weijie Chen
動的ドメイン一般化
要約

ドメイン一般化(Domain Generalization, DG)は、機械学習分野における基礎的でありながら極めて挑戦的な研究課題である。従来の手法は、静的モデルにおいて限られたソースドメインからの学習を通じてドメイン不変特徴を抽出することに主眼を置いてきた。しかし、そのようなモデルは、未知のターゲットドメインに一般化された際に、訓練を伴わずにモデルを調整する仕組みを欠いているという課題を抱えている。この問題に対処するため、本研究では新たなDGの変種である「動的ドメイン一般化(Dynamic Domain Generalization, DDG)」を提案する。DDGでは、モデルが異なるドメインからのデータに適応するためにネットワークパラメータを動的に変化させる能力を学習する。具体的には、異なるドメインのデータに応じて静的モデルのパラメータを変形する「メタ調整器(meta-adjuster)」を導入する。この仕組みにより、静的モデルはドメイン共有特徴を学習する一方で、メタ調整器はドメイン固有の特徴を学習するよう設計される。この学習プロセスを実現するために、メタ調整器の学習段階で「DomainMix」を活用し、多様なドメインのデータを模擬することで、将来の未知のターゲットドメインへの適応能力を高める。本手法により、訓練なしにモデルのパラメータを調整することで、さまざまな未知のターゲットドメインへの一般化性能が向上することが示された。広範な実験結果により、本手法の有効性が実証された。実装コードは以下のリンクから公開されている:https://github.com/MetaVisionLab/DDG

動的ドメイン一般化 | 最新論文 | HyperAI超神経