Discord에서 논의하기

6달 전

Chenhao Li Andreas Krause Marco Hutter

초록

실세계 환경에서 효율적이고 확장 가능한 로봇 제어를 가능하게 하기 위해, 강건하고 일반화 가능한 월드 모델(세계 모델) 학습은 핵심적인 과제이다. 본 연구에서는 복잡하고 부분 관측 가능하며 확률적인 동역학을 정확히 포착할 수 있는 월드 모델 학습을 위한 새로운 프레임워크를 제안한다. 제안된 방법은 이중 자기회귀(dual-autoregressive) 메커니즘과 자기지도 학습(self-supervised training)을 활용하여 도메인 특화된 인도크티브 편향(inductive biases)에 의존하지 않고도 신뢰할 수 있는 장기 예측(long-horizon predictions)을 달성함으로써 다양한 로봇 작업에 대한 적응성을 보장한다. 또한, 상상 속 환경에서 효율적인 학습을 수행하고 실제 시스템에 원활하게 배포할 수 있도록 월드 모델을 활용하는 정책 최적화 프레임워크를 제안한다. 본 연구는 장기 예측, 오차 누적, 시뮬레이션에서 실제 환경으로의 전이(sim-to-real transfer)와 같은 과제를 해결함으로써 모델 기반 강화 학습(model-based reinforcement learning)의 발전을 이룬다. 제안된 방법들은 확장 가능하고 강건한 프레임워크를 제공함으로써, 실세계 응용을 위한 적응성과 효율성을 갖춘 로봇 시스템의 구현을 가능하게 한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Discord에서 논의하기

6달 전

Chenhao Li Andreas Krause Marco Hutter

초록

실세계 환경에서 효율적이고 확장 가능한 로봇 제어를 가능하게 하기 위해, 강건하고 일반화 가능한 월드 모델(세계 모델) 학습은 핵심적인 과제이다. 본 연구에서는 복잡하고 부분 관측 가능하며 확률적인 동역학을 정확히 포착할 수 있는 월드 모델 학습을 위한 새로운 프레임워크를 제안한다. 제안된 방법은 이중 자기회귀(dual-autoregressive) 메커니즘과 자기지도 학습(self-supervised training)을 활용하여 도메인 특화된 인도크티브 편향(inductive biases)에 의존하지 않고도 신뢰할 수 있는 장기 예측(long-horizon predictions)을 달성함으로써 다양한 로봇 작업에 대한 적응성을 보장한다. 또한, 상상 속 환경에서 효율적인 학습을 수행하고 실제 시스템에 원활하게 배포할 수 있도록 월드 모델을 활용하는 정책 최적화 프레임워크를 제안한다. 본 연구는 장기 예측, 오차 누적, 시뮬레이션에서 실제 환경으로의 전이(sim-to-real transfer)와 같은 과제를 해결함으로써 모델 기반 강화 학습(model-based reinforcement learning)의 발전을 이룬다. 제안된 방법들은 확장 가능하고 강건한 프레임워크를 제공함으로써, 실세계 응용을 위한 적응성과 효율성을 갖춘 로봇 시스템의 구현을 가능하게 한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

로봇 월드 모델: 로봇 공학에서 강건한 정책 최적화를 위한 신경망 시뮬레이터 | 문서 | HyperAI초신경