Command Palette
Search for a command to run...
온라인 강화 학습 프레임워크인 ReinFlow
ReinFlow는 2025년 9월 카네기 멜론 대학교, 칭화 대학교, 그리고 다른 대학 및 기관의 연구팀에 의해 공동으로 제안되었습니다. 관련 연구 결과는 논문 "..."에 게재되었습니다.ReinFlow: 온라인 강화 학습을 통한 흐름 매칭 정책 미세 조정이 연구는 NeurIPS 2025에 선정되었습니다.
ReinFlow는 연속 로봇 제어에서 특정 클래스의 흐름 매칭 정책에 대해 다양한 흐름 매칭 정책을 안정적으로 미세 조정할 수 있는 최초의 온라인 강화 학습 알고리즘입니다. 엄격한 강화 학습 이론을 기반으로 하는 이 패러다임은 흐름 정책의 결정론적 경로에 학습 가능한 노이즈를 주입하여 흐름을 이산 시간 마르코프 과정으로 변환하고, 이를 통해 정확하고 직접적인 확률 계산을 가능하게 합니다. 이러한 변환은 탐색을 용이하게 하고 학습 안정성을 보장하며, ReinFlow는 특히 매우 적은 노이즈 제거 단계 또는 단 하나의 노이즈 제거 단계만으로도 다양한 흐름 모델 변형을 안정적으로 미세 조정할 수 있습니다.