7일 전

RGB에서 로봇 그립 탐지 및 의미 분할을 위한 엔드투엔드 학습 가능한 심층 신경망

Stefan Ainetter, Friedrich Fraundorfer
RGB에서 로봇 그립 탐지 및 의미 분할을 위한 엔드투엔드 학습 가능한 심층 신경망
초록

본 연구에서는 평행판 그립퍼에 적합한 그립 탐지 및 의미 세분화(semantic segmentation)를 위한 고품질 결과를 제공할 수 있는 새로운 엔드투엔드 학습 가능한 CNN 기반 아키텍처를 제안한다. 이를 바탕으로 기존에 계산된 그립 탐지 및 의미 세분화 결과를 활용하는 새로운 정밀화 모듈을 제안하며, 이는 그립 탐지 정확도를 추가로 향상시킨다. 제안하는 네트워크는 대표적인 두 가지 그립 데이터셋인 Cornell와 Jacquard에서 최신 기준(SOTA, state-of-the-art) 수준의 정확도를 달성한다. 추가적인 기여로, OCID 데이터셋에 대한 새로운 데이터셋 확장(extended dataset)을 제공함으로써 매우 도전적인 환경에서도 그립 탐지 성능을 평가할 수 있도록 했다. 해당 데이터셋을 활용하여 의미 세분화가 장면 내 객체 클래스에 따라 그립 후보를 할당하는 데에도 활용될 수 있음을 보여주며, 이는 특정 객체를 선택적으로 집는 데 응용될 수 있다.

RGB에서 로봇 그립 탐지 및 의미 분할을 위한 엔드투엔드 학습 가능한 심층 신경망 | 최신 연구 논문 | HyperAI초신경