
초록
H3DNet은 색 없는 3D 포인트 클라우드를 입력으로 받아, 방향이 부여된 객체 경계 상자(BB) 및 해당 객체의 의미적 레이블의 집합을 출력하는 모델을 소개한다. H3DNet의 핵심 아이디어는 기하학적 원소의 하이브리드 집합을 예측하는 것으로, 이는 BB 중심점, BB 면 중심점, BB 엣지 중심점으로 구성된다. 우리는 객체와 기하학적 원소 사이의 거리 함수를 정의함으로써 예측된 기하학적 원소들을 객체 후보군으로 변환하는 방법을 제시한다. 이 거리 함수는 객체 후보의 연속적 최적화를 가능하게 하며, 그 국소 최소값이 고정밀도의 객체 후보를 제공한다. 이후 H3DNet은 매칭 및 정밀 조정 모듈을 활용하여 객체 후보를 탐지된 객체로 분류하고, 탐지된 객체의 기하학적 파라미터를 세밀하게 조정한다. 이러한 기하학적 원소의 하이브리드 집합은 단일 유형의 기하학적 원소만을 사용하는 경우보다 더 정확한 신호를 제공할 뿐만 아니라, 최종 3D 레이아웃에 대해 과잉 제약 조건을 제공한다. 따라서 H3DNet은 예측된 기하학적 원소 내에 존재하는 이상치에 대해 높은 내성성을 가지며, 안정적인 성능을 유지할 수 있다. 본 모델은 실제 3D 스캔 데이터를 포함한 두 대규모 데이터셋인 ScanNet과 SUN RGB-D에서 최신 기술 수준의 3D 객체 탐지 성능을 달성하였다.