2달 전

PoseCNN: 복잡한 환경에서 객체의 6D 자세를 추정하는 합성곱 신경망

Xiang, Yu ; Schmidt, Tanner ; Narayanan, Venkatraman ; Fox, Dieter
PoseCNN: 복잡한 환경에서 객체의 6D 자세를 추정하는 합성곱 신경망
초록

알려진 물체의 6차원 자세를 추정하는 것은 로봇이 실제 세계와 상호작용하기 위해 중요합니다. 이 문제는 물체의 다양성뿐만 아니라, 물체 간의 잡음과 가림으로 인해 장면이 복잡해지는 것 때문에 도전적입니다. 본 연구에서는 6차원 물체 자세 추정을 위한 새로운 컨볼루션 신경망인 PoseCNN을 소개합니다. PoseCNN은 이미지에서 물체 중심을 위치시키고 카메라로부터의 거리를 예측하여 물체의 3차원 이동을 추정합니다. 물체의 3차원 회전은 쿼터니언 표현으로 회귀를 통해 추정됩니다. 또한, PoseCNN이 대칭물체를 처리할 수 있도록 하는 새로운 손실 함수를 제안합니다. 더불어, 6차원 물체 자세 추정을 위한 대규모 비디오 데이터셋인 YCB-Video 데이터셋을 제공합니다. 우리의 데이터셋은 YCB 데이터셋에서 유래한 21개의 물체가 92개의 비디오(총 133,827 프레임)에 관찰된 정확한 6차원 자세 정보를 포함하고 있습니다. 우리는 YCB-Video 데이터셋과 OccludedLINEMOD 데이터셋에서 광범위한 실험을 수행하여 PoseCNN이 가림에 대해 매우 견고하며, 대칭물체를 처리할 수 있으며, 색상 이미지만으로도 정확한 자세 추정을 제공함을 보여주었습니다. 깊이 데이터를 사용하여 자세를 추가로 개선할 때, 우리의 접근 방식은 어려운 OccludedLINEMOD 데이터셋에서 최신 결과를 달성하였습니다. 우리의 코드와 데이터셋은 https://rse-lab.cs.washington.edu/projects/posecnn/ 에서 확인할 수 있습니다.

PoseCNN: 복잡한 환경에서 객체의 6D 자세를 추정하는 합성곱 신경망 | 최신 연구 논문 | HyperAI초신경