HyperAIHyperAI

Command Palette

Search for a command to run...

SAC 흐름

날짜

6달 전

조직

카네기멜론대학교

Paper URL

2505.21494

SAC Flow는 2025년 10월 칭화대학교, 카네기 멜론대학교, 그리고 다른 대학 및 기관의 연구팀에 의해 공동으로 제안되었습니다. 관련 연구 결과는 "기능 최적 정렬을 통한 폐쇄형 소스 MLLM에 대한 적대적 공격".

SAC Flow는 흐름 기반 정책 샘플을 위한 효율적이고 고성능의 오프라인 강화 학습 알고리즘입니다. 이 알고리즘은 흐름 기반 모델을 시퀀스 모델로 처리하고 속도 네트워크를 GRU 또는 Transformer로 재매개변수화함으로써 흐름 기반 정책을 학습할 때 발생하는 경사 불안정성 문제를 해결합니다. 연구진은 신규 학습과 오프라인-온라인 학습 환경 모두에서 SAC Flow의 성능을 평가하여 빠른 수렴을 보여주고 여러 동작 및 조작 작업에서 최고 수준의 성능을 달성했습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp