17日前

劣化データセット向け高品質でロバストな拡散フレームワーク

Quan Dao, Binh Ta, Tung Pham, Anh Tran
劣化データセット向け高品質でロバストな拡散フレームワーク
要約

近年、訓練プロセスにおける外れ値に対して頑健な画像生成モデルの開発が、研究コミュニティからの注目を集めている。敵対的枠組み(adversarial framework)に不均衡最適輸送(Unbalanced Optimal Transport: UOT)を容易に統合できる点から、従来の研究は主に生成的敵対ネットワーク(GAN)向けの頑健なフレームワークの構築に注力してきた。一方で、最近の拡散モデル(diffusion models)は、さまざまなタスクやデータセットにおいてGANを凌駕する性能を示しており、その主流地位を確立しつつある。しかし、現時点における我々の知識によれば、それらのモデルは汚損されたデータセットに対しては依然として頑健性を欠いている。DDGANに着想を得て、本研究では、初めて外れ値に対して頑健な拡散モデルを提案する。具体的には、DDGANにおけるGAN向けUOTベースの生成モデルを、逆拡散プロセスの学習に用いるものに置き換える手法を提案する。さらに、本フレームワークにおける発散関数のリプシッツ性(Lipschitz property)が、より安定した訓練収束をもたらすことを実証した。顕著な点として、本手法は汚損されたデータセットに対しても頑健であるだけでなく、クリーンなデータセットにおいても優れた性能を達成している。