3D 객체 포인트 클라우드에 대한 보완적 이해를 위한 기하학적 분리 표현 학습

2차원 이미지 처리에서는 일부 연구에서 이미지를 에지 부분과 매끄러운 부분을 각각 설명할 수 있도록 고주파 및 저주파 성분으로 분해하는 접근을 시도한다. 마찬가지로 3차원 객체의 윤곽과 평평한 영역(예: 의자에서 경계부와 좌석 부위)은 서로 다른 구조이지만 보완적인 기하학적 특성을 나타낸다. 그러나 기존의 딥 네트워크는 모든 점 또는 국소 패치를 동일하게 취급함으로써 이러한 구조적 차이를 무시하는 경향이 있다. 이 문제를 해결하기 위해 우리는 기하학적 분리 주의 네트워크(Geometry-Disentangled Attention Network, GDANet)를 제안한다. GDANet은 기하학적 분리 모듈(Geometry-Disentangle Module)을 도입하여 점군을 3차원 객체의 윤곽 부분과 평탄한 부분으로 동적으로 분리하며, 각각 날카로운 변화 성분과 부드러운 변화 성분으로 표현한다. 이후 GDANet은 날카로운-부드러운 보완 주의 모듈(Sharp-Gentle Complementary Attention Module)을 활용하여 날카로운 변화 성분과 부드러운 변화 성분의 특징을 두 가지 종합적인 표현으로 간주하고, 원본 점군 특징과 병합할 때 각각에 대해 서로 다른 주의를 부여한다. 이를 통해 본 연구는 두 개의 서로 다른 분리된 성분에서 종합적이고 보완적인 3차원 기하학적 의미를 포착하고 보정함으로써 국소 정보를 보완한다. 3차원 객체 분류 및 분할 벤치마크에서 실시한 광범위한 실험 결과, GDANet은 더 적은 파라미터 수로 최신 기술 수준(SOTA)의 성능을 달성함을 입증하였다. 코드는 https://github.com/mutianxu/GDANet 에 공개되어 있다.