
초록
본 논문에서는 장면의 n채널 이미지로부터 미지의 물체에 대해 반대편(antipodal) 로봇 그립을 생성하고 수행하는 문제를 해결하기 위한 모듈형 로봇 시스템을 제안한다. 우리는 n채널 입력에서 실시간 속도(~20ms)로 강건한 반대편 그립을 생성할 수 있는 새로운 생성형 잔차 합성곱 신경망(GR-ConvNet) 모델을 제안한다. 제안된 모델 아키텍처는 표준 데이터셋과 다양한 가정용 물체들을 대상으로 평가되었으며, Cornell 및 Jacquard 그립 데이터셋에서 각각 97.7%, 94.6%의 최신 기술 수준(상위 성능) 정확도를 달성하였다. 또한 7자유도(DoF) 로봇 팔을 활용하여 가정용 물체와 대립적(Adversarial) 물체에 대해 각각 95.4% 및 93%의 그립 성공률을 확인하였다.