2달 전
피크앤플레이스를 넘어서: 다양한 형태의 로봇 스택킹 처리
Alex X. Lee; Coline Devin; Yuxiang Zhou; Thomas Lampe; Konstantinos Bousmalis; Jost Tobias Springenberg; Arunkumar Byravan; Abbas Abdolmaleki; Nimrod Gileadi; David Khosid; Claudio Fantacci; Jose Enrique Chen; Akhil Raju; Rae Jeong; Michael Neunert; Antoine Laurens; Stefano Saliceti; Federico Casarini; Martin Riedmiller; Raia Hadsell; Francesco Nori

초록
우리는 복잡한 기하학적 구조를 가진 물체의 로봇 쌓기 문제를 연구합니다. 우리는 단순한 '픽-앤-플레이스' 솔루션을 넘어서는 전략이 필요한 물체들을 신중하게 설계하여 도전적이고 다양한 세트를 제안합니다. 우리의 방법은 시각 기반 인터랙티브 정책 축약과 시뮬레이션-현실 이전을 결합한 강화 학습(RL) 접근 방식입니다. 학습된 정책들은 실제 세계에서 여러 물체 조합을 효율적으로 처리할 수 있으며, 다양한 쌓기 기술을 보여줍니다. 대규모 실험 연구를 통해 이러한 일반적인 시각 기반 에이전트를 시뮬레이션에서 학습하는 데 중요한 선택 사항들이 무엇인지, 그리고 실제 로봇으로 최적의 이전에 어떤 요소가 영향을 미치는지 조사합니다. 그런 다음 이러한 정책들로 수집된 데이터를 활용하여 오프라인 RL을 통해 성능을 개선합니다. 본 연구에 대한 동영상과 블로그 게시글이 부록 자료로 제공됩니다.