2달 전

실시간 무결점 단일 샷 6D 객체 포즈 예측

Bugra Tekin; Sudipta N. Sinha; Pascal Fua
실시간 무결점 단일 샷 6D 객체 포즈 예측
초록

우리는 RGB 이미지에서 객체를 검출하고 그 객체의 6차원 자세를 예측하는 단일 샷 접근법을 제안합니다. 이 방법은 여러 단계나 여러 가설을 검토할 필요가 없습니다. 최근에 제안된 이 작업을 위한 단일 샷 기술(Kehl et al., ICCV'17)은 대략적인 6차원 자세만 예측하여 추가적인 정교화가 필요하지만, 우리의 방법은 충분히 정확하여 추가적인 후처리가 필요하지 않습니다. 결과적으로, 우리 방법은 훨씬 빠르며(타이탄 X (파스칼) GPU에서 50 fps) 실시간 처리에 더 적합합니다.우리 방법의 핵심 구성 요소는 YOLO 네트워크 설계에서 영감을 받은 새로운 CNN 아키텍처입니다. 이 아키텍처는 객체의 3D 바운딩 박스의 투영된 꼭짓점들의 2D 이미지 위치를 직접 예측합니다. 그런 다음 PnP 알고리즘을 사용하여 객체의 6차원 자세를 추정합니다.LINEMOD 및 OCCLUSION 데이터셋에서 단일 객체와 다중 객체 자세 추정을 위해, 모든 방법이 후처리 없이 사용될 때 우리 접근법은 다른 최근 CNN 기반 접근법들보다 크게 우수한 성능을 보입니다. 후처리 과정에서는 기존 방법들의 정확도를 높이는 자세 정교화 단계를 사용할 수 있지만, 10 fps 미만으로 그들은 우리 방법보다 훨씬 느립니다.

실시간 무결점 단일 샷 6D 객체 포즈 예측 | 최신 연구 논문 | HyperAI초신경