Command Palette

Search for a command to run...

온라인 강화 학습 프레임워크인 ReinFlow

날짜

4일 전

기관

카네기멜론대학교
칭화대학교

논문 URL

2505.22094

ReinFlow는 2025년 9월 카네기 멜론 대학교, 칭화 대학교, 그리고 다른 대학 및 기관의 연구팀에 의해 공동으로 제안되었습니다. 관련 연구 결과는 논문 "..."에 게재되었습니다.ReinFlow: 온라인 강화 학습을 통한 흐름 매칭 정책 미세 조정이 연구는 NeurIPS 2025에 선정되었습니다.

ReinFlow는 연속 로봇 제어에서 특정 클래스의 흐름 매칭 정책에 대해 다양한 흐름 매칭 정책을 안정적으로 미세 조정할 수 있는 최초의 온라인 강화 학습 알고리즘입니다. 엄격한 강화 학습 이론을 기반으로 하는 이 패러다임은 흐름 정책의 결정론적 경로에 학습 가능한 노이즈를 주입하여 흐름을 이산 시간 마르코프 과정으로 변환하고, 이를 통해 정확하고 직접적인 확률 계산을 가능하게 합니다. 이러한 변환은 탐색을 용이하게 하고 학습 안정성을 보장하며, ReinFlow는 특히 매우 적은 노이즈 제거 단계 또는 단 하나의 노이즈 제거 단계만으로도 다양한 흐름 모델 변형을 안정적으로 미세 조정할 수 있습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
온라인 강화 학습 프레임워크인 ReinFlow | 백과사전 | HyperAI초신경