3차원 세계에서도 로봇팔의 손놀림은 무적이다

Super Neuro에서
많은 사람들이 블록 쌓기 게임인 젠가를 경험했을 것입니다. 왜냐하면 조심하지 않으면, 여러분이 열심히 쌓은 블록 탑이 파괴되기 때문입니다. AI와 로봇이 이런 일을 하게 하면 무슨 일이 일어날까?

인공지능을 연구하는 팀은 항상 게임을 통해 획기적인 발견을 하고 싶어하는 것 같습니다. MIT팀이 개발한 로봇팔 역시 3차원 세계의 게임에서 시작되었습니다.
쌓기 게임에서는 보통 블록을 세 개씩 쌓아 탑을 형성한 다음, 맨 아래의 블록을 가져와 탑 위에 올려 더 높은 탑을 만듭니다.
젠가 게임은 인내심, 균형감, 힘 등 여러 측면을 테스트합니다. 많은 사람들에게 (특히 손이 떨리는 사람들에게) 이 게임은 너무 어렵습니다. MIT에서 개발한 로봇은 감지, 밀기, 당기기, 정렬 작업과 결합된 알고리즘을 통해 이 작업을 쉽게 해결합니다.
정확히 누구일까요?
인간은 항상 자신의 손이 떨린다고 말하는데, 그래서 로봇 팔에 대한 연구는 섬세하거나 위험한 작업을 완료하기 위해 이루어졌습니다. MIT 기계공학과 조교수이자 프로젝트 팀원인 알베르토 로드리게스는 이 로봇의 핵심은 시각과 촉각을 완벽하게 결합했다는 점이라고 지적했습니다.

하지만 겉모습으로 보면 이 로봇은 일반적인 로봇팔처럼 흔히 쓰이는 몇몇 응용 기계와 비슷하지만, 부드러운 이빨이 달린 그리퍼, 힘을 감지하는 손목 밴드, 외부 카메라가 장착되어 있어 손, 촉각, 눈을 가진 것과 마찬가지입니다.
작업할 때 그리퍼는 블록을 조작하고 촉각적 피드백을 제공하는 데 사용됩니다. 센서 손목 밴드는 블록을 조작하는 힘을 제어하는 데 사용됩니다. 카메라는 시각적 이미지를 수집하는 데 사용됩니다.
로봇이 블록을 유연하게 움직일 수 있게 해주는 외관 외에도 가장 중요한 점은 기존 로봇과는 다른 "영혼"을 가지고 있다는 것입니다. 연구자들은 새로운 알고리즘을 사용하여 이 작업을 더 잘 수행할 수 있도록 로봇을 만들었습니다.

MIT 연구진에 따르면, 이 로봇은 기존의 AI 학습 방법을 사용하지 않고 계층적 모델 역학을 창의적으로 활용해 클러스터링 학습 모델을 구축합니다. 이렇게 하는 장점은 더 이상 대량의 데이터에 의존하지 않고 피드백 데이터를 기반으로 실시간 분석을 수행하고 접촉 감지를 수행하는 동안 다음 빌딩 블록을 이동하기 위한 계획을 예측할 수 있다는 것입니다.
젠가 게임은 어떻게 하는 건가요?
실제로 로봇은 겉보기에 복잡해 보이는 젠가 게임을 처리할 수 있으며, 핵심은 클러스터 학습을 사용하는 것입니다.
이 게임을 푸는 전통적인 방법은 블록, 로봇, 블록 타워 간의 모든 관계를 수집한 다음 가장 좋은 방법을 계산하는 것입니다. 하지만 이렇게 하면 당연히 엄청난 양의 데이터가 발생하고 계산의 어려움도 크게 증가하게 됩니다.

이 연구에서는 로봇을 인간이 게임을 하는 방식을 모방하도록 선택했습니다. 첫 번째 단계는 시도를 통해 데이터에 레이블을 지정하고 클러스터링하는 것입니다. 그런 다음 표시된 데이터와 비교하여 새로운 작업의 실행 가능성을 판단합니다.
먼저, 로봇을 빌딩 블록 탑을 마주보게 한 다음, 무작위로 빌딩 블록을 하나 골라 비교적 작은 힘으로 밀어냅니다. 각각의 밀기 및 당기기 작업에 대해 컴퓨터는 해당 시각적 데이터와 힘 데이터를 기록하고 작업 결과와 함께 표시합니다.
이 연구는 충분한 데이터를 축적하기 위해 약 300번의 시도를 거쳤고, 그런 다음 데이터를 처리했습니다. 여기서는 클러스터링이 사용됩니다. 유사한 데이터와 결과를 갖는 작업은 특정 구성 요소 동작을 나타내기 위해 함께 그룹화되어야 합니다.
각 그룹은 서로 다른 수준의 운용성을 나타내며, 이는 각 운용성을 측정하는 기준이기도 합니다. 예를 들어, 한 데이터 세트는 로봇이 옮기기 어려운 블록을 옮기려고 시도한 것을 나타내고, 다른 데이터 세트는 로봇이 옮기기 쉬운 블록을 옮기려고 시도한 것을 나타냅니다.
각각의 다른 데이터 세트에 대해 간단한 모델이 적절히 제공됩니다. 이러한 모델을 결합하면 로봇은 실시간으로 학습할 수 있습니다.

마지막으로 실제 훈련을 실시할 수 있습니다. 로봇 팔이 빌딩 블록을 밀어낼 때, 카메라와 손목 밴드를 사용하여 시각적, 촉각적 정보를 수신한 다음 수신된 피드백을 이전 데이터와 비교합니다. 데이터가 좋은 결과에 해당하면 작업이 수행됩니다. 붕괴의 위험이 있는 경우에는 작업이 중단됩니다.
젠가만이 전부는 아니다
MIT 연구진은 이 연구에서는 로봇이 게임을 할 수 있었지만, 인간 마스터와 경쟁하는 데 사용하려면 몇 가지 개선이 필요할 것이라고 지적했습니다. 왜냐하면 이 연구에서는 AI 로봇이 물리적 상호작용 문제를 해결하는 데 초점을 맞추고, 빌딩 블록을 뽑아서 세울 수 있는지 여부와 같은 문제를 해결했기 때문입니다. 하지만 젠가 게임에는 전략도 필요한데, 이를 위해서는 관련 단계를 생각하고 분석하는 것이 필요합니다.
하지만 MIT 연구팀은 분명히 그런 아이디어를 생각해내지 못했습니다. 아마도 그들에게는 젠가 게임의 달인을 만드는 것이 별로 가치가 없을 것이다. 팀의 연구원인 로드리게스에 따르면, 그들은 제조 조립 라인의 로봇과 같은 실제 작업 환경에서 이 기술을 사용하는 것을 고려하고 있다고 합니다.

잠깐만요, 이건 그냥 간단한 퍼즐 게임일 뿐이에요. 우리가 이 게임을 이길 수 없을지도 모르니까요. 그러니 우리 인간과는 어울리지 않을 거예요. 뭔가 더욱 놀라운 일이 일어날 것 같지만, 뭐, 그만하고, 맛있는 새해 음식에 압도당해 보자.