
플로우 매칭(Flow matching)은 이미지 합성을 포함한 다양한 응용 분야에서 고품질 샘플 생성에 있어 강력한 프레임워크이다. 그러나 이러한 모델의 경우, 특히 미세조정(finetuning) 과정과 샘플링 과정에서 높은 계산량이 요구되며, 이는 자원이 제한된 환경에서 큰 도전 과제가 된다. 본 논문에서는 플로우 매칭 생성 모델을 효율적으로 소화하기 위한 ‘벨만 최적 스텝사이즈 스트레이트닝(Bellman Optimal Stepsize Straightening, BOSS)’ 기술을 제안한다. 이 기술은 계산 자원 제약 조건 하에서 소수의 스텝만으로도 효율적인 이미지 샘플링을 달성하는 데 초점을 맞추고 있다. 먼저, BOSS는 사전 학습된 네트워크의 스텝사이즈를 최적화하기 위한 동적 프로그래밍 알고리즘을 적용한다. 이후, 최적의 스텝사이즈에 맞춰 속도 네트워크(velocity network)를 정교화하여 생성 경로를 직선화하는 것을 목표로 한다. 다양한 이미지 생성 작업에 대한 광범위한 실험 평가를 통해 BOSS의 효과성이 자원 활용도와 이미지 품질 측면에서 입증되었다. 실험 결과, BOSS는 경쟁 수준의 샘플 품질을 유지하면서도 효율성 측면에서 상당한 성능 향상을 달성함으로써, 자원 제약 환경과 플로우 매칭 생성 모델의 높은 계산 요구 사항 사이의 격차를 효과적으로 해소함을 보였다. 또한 본 논문은 인공지능의 책임 있는 개발을 강화하며, 계산 비용과 환경적 부담을 줄이는 보다 지속 가능한 생성 모델을 제안한다. 코드는 https://github.com/nguyenngocbaocmt02/BOSS 에서 확인할 수 있다.