14 天前

贝尔曼最优步长流匹配模型的平直化

Bao Nguyen, Binh Nguyen, Viet Anh Nguyen
贝尔曼最优步长流匹配模型的平直化
摘要

流匹配(Flow Matching)是一种在多种应用中生成高质量样本的强大框架,尤其在图像合成领域表现突出。然而,这类模型在微调过程及采样过程中均具有极高的计算需求,给资源受限的场景带来了显著挑战。本文提出了一种名为贝尔曼最优步长校正(Bellman Optimal Stepsize Straightening, BOSS)的蒸馏技术,用于优化流匹配生成模型:该方法旨在实现少步高效图像采样,同时严格遵守计算资源预算约束。首先,BOSS采用动态规划算法对预训练网络的步长进行优化,以确定最优的采样步长序列;随后,通过精细化调整速度网络(velocity network),使其与最优步长对齐,从而实现生成路径的“直线化”(straightening),提升生成效率与稳定性。在多个图像生成任务上的大量实验评估表明,BOSS在资源利用率与图像质量方面均展现出显著优势。实验结果表明,BOSS在保持与现有方法相当甚至更优的样本质量的同时,实现了显著的效率提升,有效弥合了资源受限环境与流匹配生成模型高计算需求之间的鸿沟。此外,本研究还致力于推动人工智能的负责任发展,提出了一种更具可持续性的生成模型范式,显著降低了计算成本与环境足迹。相关代码已开源,可访问 https://github.com/nguyenngocbaocmt02/BOSS 获取。