Command Palette

Search for a command to run...

25일 전

오미니레타겟: 휴머노이드 전신 운동-조작 및 장면 상호작용을 위한 상호작용 보존형 데이터 생성

Lujie Yang Xiaoyu Huang Zhen Wu Angjoo Kanazawa Pieter Abbeel Carmelo Sferrazza et al

오미니레타겟: 휴머노이드 전신 운동-조작 및 장면 상호작용을 위한 상호작용 보존형 데이터 생성

초록

인간형 로봇에게 복잡한 기술을 가르치는 데 있어 주로 사용되는 패러다임은 인간의 운동을 운동학적 기준으로 재타겟하여 강화학습(RL) 정책을 훈련시키는 것이다. 그러나 기존의 재타겟링 파이프라인은 인간과 로봇 사이의 큰 신체적 차이( embodiment gap )로 인해 물리적으로 타당하지 않은 현상, 예를 들어 발이 미끄러지는 현상이나 침투 현상 등을 유발하는 경향이 있다. 더 중요한 점은, 일반적인 재타겟링 방법들이 표현력 있는 보행 및 보행-조작(로코-매니퓰레이션)에 필수적인 인간-물체 및 인간-환경 간의 상호작용을 간과한다는 것이다. 이를 해결하기 위해, 우리는 인간-지형-조작 대상 간의 중요한 공간적 관계와 접촉 관계를 명시적으로 모델링하고 보존하는 상호작용 메시(Interaction Mesh)를 기반으로 하는, 상호작용을 유지하는 데이터 생성 엔진인 OmniRetarget을 제안한다. 인간과 로봇의 메시 간 라플라시안 변형을 최소화하면서 운동학적 제약 조건을 강제함으로써, OmniRetarget은 운동학적으로 타당한 경로를 생성한다. 또한, 작업에 관련된 상호작용을 유지함으로써, 단일 시범 예제로부터 다양한 로봇 구조, 지형, 물체 구성에 이르는 효율적인 데이터 증강이 가능하다. 우리는 OMOMO, LAFAN1 및 자체 개발한 MoCap 데이터셋에서의 운동 재타겟링을 통해 OmniRetarget을 포괄적으로 평가하였으며, 8시간 이상의 경로를 생성하여 기존에 널리 사용되는 기준 방법들보다 더 뛰어난 운동학적 제약 만족도와 접촉 보존 성능을 달성하였다. 이러한 고품질 데이터는 단지 5개의 보상 항목과 모든 작업에 공유되는 간단한 도메인 랜덤화만을 사용하여, 학습 커리큘럼 없이도 Unitree G1 인간형 로봇에서 최대 30초에 이르는 장기적(롱호라이즌) 퍼커 및 로코-매니퓰레이션 기술을 성공적으로 수행할 수 있도록 하는 체감 정보 기반 강화학습 정책의 훈련을 가능하게 한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
오미니레타겟: 휴머노이드 전신 운동-조작 및 장면 상호작용을 위한 상호작용 보존형 데이터 생성 | 연구 논문 | HyperAI초신경