
要約
拡散モデルは、さまざまな分野において優れた性能を示している。拡散モデルの確率フロー常微分方程式(diffusion ODE)は、連続正規化フロー(CNF)の特別なケースであり、決定論的な推論と正確な尤度評価を可能にする。しかし、拡散ODEによる尤度推定の結果は、最先端の尤度に基づく生成モデルと比べて依然として大きく劣っている。本研究では、拡散ODEにおける最大尤度推定を改善するための複数の技術を提案する。訓練と評価の両側面からアプローチする。訓練の観点では、速度パラメータ化を提案し、収束を高速化するための分散低減技術を検討する。また、微調整用に誤差有界の高次フローマッチング目的関数を導出することで、ODEの尤度を向上させるとともに、軌道の滑らかさを改善する。評価の観点では、従来の拡散ODEにおいてよく見られる訓練・評価のギャップを解消するため、訓練不要な切り捨て正規分布デクォンタイゼーション(truncated-normal dequantization)を新たに提案する。これらの技術を統合した結果、変分デクォンタイゼーションやデータ拡張を用いずに、画像データセットにおいて最先端の尤度推定性能を達成した(CIFAR-10で2.56、ImageNet-32で3.43/3.69)。さらに、データ拡張を適用した場合、CIFAR-10で2.42の結果を達成した。コードは以下のURLから公開されている:\url{https://github.com/thu-ml/i-DODE}。