
要約
フローマッチングは、特に画像合成において高品質なサンプルを生成するための強力な枠組みである。しかし、特にファインチューニングプロセスおよびサンプリングプロセスにおいて高い計算負荷を要するため、リソースが限られた環境では大きな課題が存在する。本論文では、フローマッチングに基づく生成モデルの知識蒸留を目的とした「ベルマン最適ステップサイズストレートニング(BOSS)」手法を提案する。この手法は、計算リソースの制約のもとで少数ステップでの効率的な画像生成を実現することを目的としており、特にリソース制約下での実用性を重視している。まず、事前学習済みネットワークのステップサイズを最適化するための動的計画法を用いる。次に、最適なステップサイズに一致するように速度ネットワークを再調整し、生成経路をより直線的(ストレート)にすることで、生成品質の向上を図る。画像生成タスクにおける広範な実験評価により、BOSSがリソース利用効率および画像品質の両面で優れた効果を発揮することが確認された。実験結果から、BOSSは競争力あるサンプル品質を維持しつつ、大幅な効率性の向上を達成しており、リソース制約環境とフローマッチング生成モデルの高い要求水準との間に存在するギャップを効果的に埋め合わせていることが明らかになった。さらに、本研究は人工知能の持続的・責任ある開発を推進するものであり、計算コストと環境負荷を低減するより持続可能な生成モデルの実現に貢献している。本研究のコードは、https://github.com/nguyenngocbaocmt02/BOSS にて公開されている。