HyperAIHyperAI

Command Palette

Search for a command to run...

潜在空間におけるフロー・マッチング

Quan Dao Hao Phung Binh Nguyen Anh Tran

概要

フローマッチングは、従来の拡散モデルと比較して訓練が比較的容易でありながら、驚異的な実証的性能を示す最近の生成モデルの訓練フレームワークである。その優れた特性にもかかわらず、従来の手法はピクセル空間におけるオフザシェルソルバーの高コストな計算と大量の関数評価という課題を抱えている。さらに、近年の潜在空間ベースの生成手法は大きな成功を収めているが、本手法はその分野において依然として十分に検討されていない。本研究では、事前学習済みオートエンコーダの潜在空間にフローマッチングを適用する手法を提案する。これにより、高解像度画像合成における計算効率とスケーラビリティが向上し、制限された計算リソース上でも品質と柔軟性を維持したままフローマッチングの訓練が可能となる。また、本研究は、ラベル条件付き画像生成、画像補完、セマンティックから画像への変換といった条件付き生成タスクにおいて、さまざまな条件をフローマッチングに統合するという先駆的な貢献を果たしている。広範な実験を通じて、CelebA-HQ、FFHQ、LSUN Church & Bedroom、ImageNetなど多様なデータセットにおいて、定量的・定性的な両面で本手法の有効性が確認された。さらに、再構成された潜在フロー分布と真のデータ分布間のワッサースタイン-2距離に対して理論的な制御を提示し、それが潜在フロー・マッチング目的関数によって上から抑えられることを示した。本研究のコードは、https://github.com/VinAIResearch/LFM.git にて公開される予定である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています