Command Palette
Search for a command to run...
DexFlyWheel 데이터 생성 프레임워크
DexFlyWheel은 2025년 9월 베이징대학교, 하얼빈공업대학, PsiBot에 의해 제안되었으며 관련 연구 결과는 논문 "DexFlyWheel: 민첩한 조작을 위한 확장 가능하고 자체 개선되는 데이터 생성 프레임워크"는 NeurIPS 2025에서 주목을 받는 연구로 선정되었습니다.
DexFlyWheel은 자가 개선 루프를 사용하여 데이터 다양성을 지속적으로 강화하는 확장 가능한 데이터 생성 프레임워크입니다. 이 프레임워크는 두 가지 주요 설계 특징을 가지고 있습니다. 인간과 유사한 다양한 데이터를 생성하기 위한 IL + Residual RL입니다. 특히, IL과 Residual RL은 정책 전개 및 데이터 증강과 결합되어 자가 개선 루프를 형성합니다. 각 반복에서 정책은 궤적을 생성하고, 이 궤적은 점점 더 다양한 시나리오에서 개선되어 다음 반복에 반영됩니다. 이 루프는 플라이휠 효과를 생성하여 데이터 다양성을 점진적으로 확장하고, 정책 일반화 기능을 향상시키며, 강력하고 일반화 가능한 데이터 생성 에이전트로 진화합니다.