포인트 클라우드에서 3D 객체 탐지를 위한 계층적 그래프 네트워크

포인트 클라우드 기반 3D 객체 탐지 기술은 다양한 응용 분야에서 중요한 역할을 한다. 그러나 기존의 주요 포인트 클라우드 객체 탐지 방법들은 포인트 클라우드의 특성(예: 희소성)을 충분히 반영하지 못하여, 핵심적인 의미 정보(예: 형상 정보)가 제대로 포착되지 않는 문제가 있었다. 본 논문에서는 원시 포인트 클라우드를 직접 처리하여 3D 경계 상자(3D bounding box)를 예측하는 새로운 그래프 컨볼루션(GConv) 기반의 계층적 그래프 네트워크(HGNet)를 제안한다. HGNet은 포인트 간의 관계를 효과적으로 포착하고, 다중 수준의 의미 정보를 활용하여 객체 탐지 성능을 향상시킨다. 특히, 점 간의 상대적인 기하학적 위치를 모델링함으로써 객체의 국소적 형상 특징을 효과적으로 추출하는 새로운 형태의 주의 기반 그래프 컨볼루션(SA-GConv)을 제안한다. SA-GConv 기반의 U-형 구조 네트워크는 다중 수준의 특징을 추출하며, 개선된 보팅 모듈을 통해 모든 특징을 동일한 특징 공간으로 매핑한 후, 이를 바탕으로 후보 영역(proposal)을 생성한다. 이후, 새로운 GConv 기반의 Proposal Reasoning Module이 전역 장면의 의미 정보를 고려하여 후보 영역에 대해 추론을 수행하고, 최종적으로 경계 상자를 예측한다. 결과적으로, 제안하는 새로운 프레임워크는 두 개의 대규모 포인트 클라우드 데이터셋에서 최신 기술 대비 우수한 성능을 보였으며, SUN RGB-D에서는 mAP 4% 향상, ScanNet-V2에서는 mAP 3% 향상하는 성과를 달성하였다.