Vote3Deep: 효율적인 컨벌루션 신경망을 사용한 3D 포인트 클라우드에서의 빠른 객체 검출

본 논문은 3D 포인트 클라우드에서 객체를 본래의 형태로 검출하기 위한 계산적으로 효율적인 접근 방식을 제안합니다. 특히, 이는 컨볼루션 신경망(CNNs)을 사용하여 특징 중심 투표 방식을 활용해 새로운 컨볼루션 레이어를 구현함으로써 입력에서 발생하는 희소성을 명시적으로 활용하여 달성됩니다. 이를 위해 우리는 다양한 아키텍처 간의 정확도와 속도 사이의 균형을 분석하고, 중간 표현에서 희소성을 더욱 유도하기 위해 필터 활성화에 L1 패널티를 적용하는 방법을 추가로 제안합니다. 우리 지식范围内, 이는 3D 데이터의 효율적인 대규모 처리를 위해 희소 컨볼루션 레이어와 L1 규제를 제안한 최초의 연구입니다. KITTI 객체 검출 벤치마크에서 우리의 접근 방식의 효과성을 입증하였으며, Vote3Deep 모델은 단 세 개의 레이어만으로도 라이다 기반 및 라이다-비전 기반 접근 방식 모두에서 이전 최신 기술보다 최대 40%까지 성능을 개선하면서 처리 시간 면에서도 매우 경쟁력적임을 보여주었습니다.注: "範圍内" (범위 내) 是中文的表达,正确的韩文表达应该是 "범위 내에서"。修正后的翻译如下:본 논문은 3D 포인트 클라우드에서 객체를 본래의 형태로 검출하기 위한 계산적으로 효율적인 접근 방식을 제안합니다. 특히, 이는 컨볼루션 신경망(CNNs)을 사용하여 특징 중심 투표 방식을 활용해 새로운 컨볼루션 레이어를 구현함으로써 입력에서 발생하는 희소성을 명시적으로 활용하여 달성됩니다. 이를 위해 우리는 다양한 아키텍처 간의 정확도와 속도 사이의 균형을 분석하고, 중간 표현에서 희소성을 더욱 유도하기 위해 필터 활성화에 L1 패널티를 적용하는 방법을 추가로 제안합니다. 우리 지식 범위 내에서는, 이는 3D 데이터의 효율적인 대규모 처리를 위해 희소 컨볼루션 레이어와 L1 규제를 제안한 최초의 연구입니다. KITTI 객체 검출 벤치마크에서 우리의 접근 방식의 효과성을 입증하였으며, Vote3Deep 모델은 단 세 개의 레이어만으로도 라이다 기반 및 라이다-비전 기반 접근 방식 모두에서 이전 최신 기술보다 최대 40%까지 성능을 개선하면서 처리 시간 면에서도 매우 경쟁력적임을 보여주었습니다.