그래프 신경망을 이용한 3D 포인트 클라우드 처리를 위한 특징 및 그래프 구축을 위한 국소 기하학의 활용

우리는 3차원 포인트 클라우드 처리를 위한 그래프 신경망(GNN)의 일반적 프레임워크 내에서 포인트 표현 및 국소 이웃 그래프 구성에 대해 간단하면서도 효과적인 개선을 제안한다. 첫 번째 기여로, 점들의 중요한 국소 기하학적 정보를 정점 표현에 추가한 후, MLP를 이용한 비선형 투영을 수행하는 방법을 제안한다. 두 번째 기여로, 3차원 포인트 클라우드를 위한 GNN의 그래프 구성 방식을 개선한다. 기존의 방법들은 국소 이웃 그래프를 구성할 때 k-최근접 이웃(k-NN) 기반 접근법을 사용한다. 그러나 우리는 이러한 방식이 장면의 일부 영역에서 센서의 밀도 높은 샘플링 상황에서 그래프의 커버리지 감소를 초래할 수 있다고 주장한다. 제안하는 방법은 이러한 문제를 해결하고, 특히 밀도가 높은 영역에서의 커버리지를 개선하는 데 목적이 있다. 기존의 GNN은 정점이 기하학적 해석을 가지지 않을 수 있는 일반적인 그래프를 대상으로 설계되었기 때문에, 본 연구의 두 가지 제안은 3차원 포인트 클라우드의 기하학적 특성을 반영하도록 일반 그래프를 보강하는 것으로 볼 수 있다. 단순한 구조임에도 불구하고, 다수의 도전적인 벤치마크, 비교적 깨끗한 CAD 모델, 그리고 실제 세계의 노이즈가 있는 스캔 데이터를 대상으로 실험한 결과, 제안된 방법이 3차원 분류(ModelNet40), 부품 세그멘테이션(ShapeNet), 그리고 의미 세그멘테이션(Stanford 3D Indoor Scenes Dataset) 등의 벤치마크에서 최신 기술(SOTA) 성능을 달성함을 입증하였다. 또한 제안된 네트워크가 더 빠른 학습 수렴 속도를 보이며, 분류 작업의 경우 약 40% 적은 에포크 수로 학습이 가능함을 보여주었다. 프로젝트 세부 사항은 다음 웹사이트에서 확인할 수 있다: https://siddharthsrivastava.github.io/publication/geomgcnn/