Command Palette
Search for a command to run...
MeanFlow 기반 원스텝 전략 학습 프레임워크 MP1
날짜
2달 전
MeanFlow Tames Policy Learning in 1-step for Robotic Manipulation(MP1)은 2025년 7월 14일 베이징대학교 연구팀이 제안한 새로운 로봇 학습 프레임워크입니다. 이 프레임워크는 3D 포인트 클라우드 입력을 MeanFlow 프레임워크와 결합하여 단일 네트워크 함수 평가 내에서 동작 궤적을 직접 생성할 수 있습니다.
MP1은 MeanFlow 아키텍처를 활용하여 단일 순방향 전파 방식으로 정책 생성을 완료하고, 속도, 정확도, 일반화의 균형을 유지하며 확산 및 흐름 모델 모두의 성능 병목 현상을 해결합니다. 또한, MeanFlow 표현, CFG 조건부 제어, 분산 손실을 혁신적으로 결합하여 빠르고 정확하며 안정적인 로봇 조작 정책을 생성하는 단일 단계 접근 방식을 구현합니다.
