PointNeXt: PointNet++의 향상된 학습 및 확장 전략 재검토

PointNet++는 포인트 클라우드 이해를 위한 가장 영향력 있는 신경망 아키텍처 중 하나입니다. PointNet++의 정확도는 최근의 PointMLP와 Point Transformer 등의 네트워크에 의해 크게 뛰어넘혔지만, 우리는 성능 향상의 대부분이 아키텍처 혁신보다는 향상된 학습 전략, 즉 데이터 증강 및 최적화 기법과 모델 크기 증가 때문임을 발견했습니다. 따라서, PointNet++의 잠재력은 아직 완전히 탐구되지 않았습니다. 본 연구에서는 모델 학습 및 스케일링 전략에 대한 체계적인 분석을 통해 고전적인 PointNet++을 재검토하고 두 가지 주요 기여를 제공합니다. 첫째, 우리는 PointNet++의 성능을 크게 향상시키는 일련의 개선된 학습 전략을 제안합니다. 예를 들어, 아키텍처를 변경하지 않고 ScanObjectNN 객체 분류에서 PointNet++의 전체 정확도(OA)를 77.9%에서 86.1%로 높일 수 있으며, 이는 최신 PointMLP를 능가하는 결과입니다. 둘째, 우리는 역잔여 병목 설계(inverted residual bottleneck design)와 분리 가능한 MLPs(separable MLPs)를 PointNet++에 도입하여 효율적이고 효과적인 모델 스케일링을 가능하게 하고, 이를 바탕으로 PointNeXt라는 다음 버전의 PointNets를 제안합니다. PointNeXt는 유연하게 확장될 수 있으며 3D 분류와 세그멘테이션 작업 모두에서 최신 방법론들을 능가하는 성능을 보여줍니다. 분류 작업에서는 ScanObjectNN에서 전체 정확도가 87.7%에 달하며, 이는 PointMLP보다 2.3% 우수한 결과이며 추론 속도는 10배 더 빠릅니다. 의미 세그멘테이션 작업에서는 S3DIS(6-폴드 크로스 밸리데이션)에서 평균 IoU가 74.9%인 새로운 최고 성능을 기록하며, 최근의 Point Transformer보다 우수한 결과를 보였습니다. 코드와 모델은 https://github.com/guochengqian/pointnext에서 이용할 수 있습니다.