2달 전

Point-Voxel CNN을 이용한 효율적인 3D 딥러닝

Zhijian Liu; Haotian Tang; Yujun Lin; Song Han
Point-Voxel CNN을 이용한 효율적인 3D 딥러닝
초록

우리는 효율적이고 빠른 3D 딥러닝을 위한 포인트-볼록 CNN (Point-Voxel CNN, PVCNN)를 제시합니다. 이전 연구에서는 볼록 기반 또는 포인트 기반 신경망 모델을 사용하여 3D 데이터를 처리하였습니다. 그러나, 두 접근 방식 모두 계산적으로 비효율적입니다. 볼록 기반 모델의 경우, 입력 해상도에 따라 계산 비용과 메모리 용량이 세제곱으로 증가하여, 해상도를 확대하는 것이 메모리 상에서 매우 어렵습니다. 포인트 기반 네트워크의 경우, 실제 특성 추출이 아닌 희소 데이터의 구조화에 최대 80%의 시간이 낭비되며, 이는 메모리 위치성이 좋지 않기 때문입니다.본 논문에서는 메모리 소비를 줄이기 위해 3D 입력 데이터를 포인트로 표현하면서, 불규칙하고 희소한 데이터 접근을 줄이고 메모리 위치성을 개선하기 위해 볼록에서 합성곱 연산을 수행하는 PVCNN를 제안합니다. 우리의 PVCNN 모델은 메모리와 계산 모두 효율적입니다. 의미 분할 및 부분 분할 데이터셋에서 평가한 결과, 이 모델은 볼록 기반 베이스라인보다 10배의 GPU 메모리를 절약하면서도 훨씬 높은 정확도를 달성하였으며, 또한 평균적으로 측정된 속도가 7배 빠른 최신 포인트 기반 모델들을 능가하였습니다. 특히, 좁은 버전의 PVCNN은 파트 및 장면 분할 벤치마크에서 PointNet (극히 효율적인 모델)보다 훨씬 높은 정확도로 2배의 속도 향상을 보였습니다.우리는 또한 PVCNN의 일반적인 효과성을 3D 객체 검출에서 검증하였습니다: Frustrum PointNet의 기본 요소들을 PVConv로 대체함으로써, 평균적으로 2.4% mAP (mean Average Precision) 향상과 함께 측정된 속도와 GPU 메모리 사용량이 각각 1.5배 감소한 Frustrum PointNet++를 능가하였습니다.

Point-Voxel CNN을 이용한 효율적인 3D 딥러닝 | 최신 연구 논문 | HyperAI초신경