13일 전

EfficientPose: 효율적이고 정확하며 확장 가능한 엔드투엔드 6D 다중 객체 자세 추정 방법

Yannick Bukschat, Marcus Vetter
EfficientPose: 효율적이고 정확하며 확장 가능한 엔드투엔드 6D 다중 객체 자세 추정 방법
초록

본 논문에서는 6차원 물체 자세 추정을 위한 새로운 접근법인 EfficientPose를 제안한다. 본 방법은 높은 정확도와 효율성, 그리고 다양한 계산 자원 환경에서도 확장 가능한 특성을 갖추고 있다. 또한, 단일 스텝 내에서 여러 물체 및 인스턴스의 2차원 경계 박스를 탐지하고, 그들의 완전한 6차원 자세를 동시에 추정할 수 있다. 이는 기존의 다수의 물체를 다룰 때 런타임이 급격히 증가하는 단점을 극복한다. 기존 방법들은 먼저 2차원 타겟(예: 키포인트)을 탐지한 후 각 물체에 대해 Perspective-n-Point(PnP) 문제를 해결하여 6차원 자세를 추정하는 방식을 사용한다. 본 연구에서는 직접적인 6차원 자세 추정 방법의 성능과 일반화 능력을 향상시키기 위해 새로운 증강 기법인 6D 증강(6D augmentation)을 제안한다. 제안한 방법은 RGB 입력을 사용하여 널리 사용되는 6차원 자세 추정 기준 데이터셋인 Linemod에서 ADD(-S) 지표 기준으로 97.35%라는 새로운 최고 성능을 달성하였으며, 동시에 엔드 투 엔드로 27 FPS 이상의 속도로 실행된다. 다수의 물체(최대 8개)를 처리하는 상황에서도 2D 물체 탐지와 6차원 자세 추정을 융합한 단일 스텝 방식을 통해 엔드 투 엔드로 26 FPS 이상의 성능을 유지함으로써, 다양한 실제 응용 시나리오에서 매우 유용한 접근법이 될 수 있다. 코드는 https://github.com/ybkscht/EfficientPose 에 공개될 예정이다.

EfficientPose: 효율적이고 정확하며 확장 가능한 엔드투엔드 6D 다중 객체 자세 추정 방법 | 최신 연구 논문 | HyperAI초신경