HyperAI초신경
Back to Headlines

MIT 연구팀, 시뮬레이션 기반 로봇 학습 데이터 개발 성공

14일 전

시뮬레이션 기반 파이프라인으로 유연한 로봇의 훈련 데이터 맞춤 제작 ChatGPT나 Gemini와 같은 인기 있는 생성형 인공지능(AI) 모델이 당신의 질문에 전문가처럼 답할 때, 그들이 얼마나 많은 정보를 바탕으로 답변하는지는 알기 어렵습니다. 이러한 챗봇들은 수십억, 심지어 수조 개의 데이터 포인트를 학습하는 기반 모델(foundation models)에 의존합니다. 각 시뮬레이션은 로봇이 물체를 다루는 다양한 방법을 걸쳐가는 자세한 훈련 데이터 포인트입니다. 이러한 시뮬레이션이 정책(로봇이 따르는 행동 계획)에 적용되면, 로봇은 작업에 접근하는 다양한 방식을 가지고 있으며, 한 방법이 효과적이지 않으면 다른 동작을 시도할 수 있습니다. MIT의 토요타 교수인 러스 테드레이크(Russ Tedrake)는 이 모방 지도 데이터 생성 기술이 인간의 시범과 로봇 운동 계획 알고리즘의 장점을 결합한다고 강조합니다. 테드레이크 교수는 또한 "여러분의 질문에 대한 답변을 보다 쉽게 만들기 위해, 미래에는 기반 모델이 이런 정보를 제공할 수 있을 것이며, 이러한 데이터 생성 기술은 그 모델에 대한 후속 훈련 레시피 역할을 할 수 있을 것"이라고 덧붙였습니다. 테드레이크 교수는 MIT에서 전기공학, 컴퓨터과학, 항공우주공학, 기계공학을 가르치고 있으며, 토요타 연구소의 대형 행위 모델 부사장 및 CSAIL 주임연구원을 맡고 있습니다. 연구진은 실제 로봇 팔 두 개를 이용한 실험에서, 로봇들이 큰 상자를 지정된 위치로 뒤집는 과정에서 유사한 개선을 관찰했습니다. 로봇들이 예상 궤도에서 벗어나거나 물체를 잘못 다룰 때, 그들은 교육 데이터 라이브러리에서 대체 궤도를 참조하여 작업 중에 복구할 수 있었습니다. 미래의 PhysicsGen에 대한 계획 PhysicsGen은 앞으로 새로운 영역으로 확장될 예정입니다. 예를 들어, 식기 정리만 훈련받았던 로봇에게 물을 따르는 방법을 가르치는 것이 목표입니다. 양 양은 "우리 파이프라인은 친숙한 작업에 대해 역동적으로 실행 가능한 동작을 생성하는 데만 국한되지 않습니다. 사람이 직접 시범을 보이지 않은 완전히 새로운 작업을 수행하기 위한 다양하고 물리적으로 상호 작용하는 브릭을 만들 수 있는 잠재력이 있습니다"라고 말했습니다. MIT 연구진은 로봇의 기반 모델을 구축하기 위해 널리 적용 가능한 훈련 데이터를 만드는 것이 궁극적인 목표라고 밝혔지만, 아직은 먼 길을 가야 한다는 점을 경고했습니다. CSAIL이 주도하는 팀은 PhysicsGen이 인터넷 비디오와 같은 거대하고 구조화되지 않은 리소스를 시뮬레이션의 씨앗으로 활용할 수 있는 방법을 조사하고 있습니다. 목표는 일상적인 시각적 콘텐츠를 풍부하고 로봇이 사용할 수 있는 데이터로 변환하여, 아무도 명시적으로 보여주지 않은 작업을 로봇에게 가르치는 것입니다. 양 양과 동료 연구원들은 다양한 형태와 구성을 가진 로봇에게 PhysicsGen을 더욱 유용하게 만들 계획입니다. 이를 위해 실제 로봇의 관절 움직임을 humans의 관절 움직임 대신 캡처하는 데이터셋을 활용할 계획입니다. 또한 연구팀은 강화 학습(reinforcement learning)을 통한 AI 시스템의 학습 방법을 도입하여, 인간이 제공한 예제를 넘어서 PhysicsGen의 데이터셋을 확장할 계획입니다. 고급 인식 기술을 활용하여 로봇이 환경을 시각적으로 인식하고 해석할 수 있도록 파이프라인을 강화할 수도 있습니다. 이는 로봇이 물리 세계의 복잡성에 적응하고 분석할 수 있게 돕습니다. 현재, PhysicsGen은 AI가 같은 범주 내의 다양한 로봇이 물체를 조작하는 방법을 가르치는 데 도움을 줍니다. 특히 강체 물체에 대한 조작에서 효과를 발휘하고 있지만, 과일 같은 부드러운 물체나 점토 같은 변형 가능한 물체와의 상호 작용은 아직 시뮬레이션하기 어려운 부분입니다. 업계 전문가들은 PhysicsGen이 로봇의 훈련 데이터 생성에서 중요한 진전을 이루었다고 평가합니다. 그러나 더 다양한 작업 수행을 위한 기반 모델 구축은 여전히 많은 연구가 필요한 분야입니다. MIT와 CSAIL의 연구는 로봇이 사람의 직접적인 지시 없이도 복잡한 물리적 상호 작용을 학습할 수 있는 가능성을 열어주어, 미래의 로봇 기술 발전에 중요한 단초를 제공하고 있습니다.

Related Links