2달 전

SqueezeSeg: 3D LiDAR 포인트 클라우드에서 실시간 도로 객체 분할을 위한 컨볼루션 신경망과 순환 CRF

Bichen Wu; Alvin Wan; Xiangyu Yue; Kurt Keutzer
SqueezeSeg: 3D LiDAR 포인트 클라우드에서 실시간 도로 객체 분할을 위한 컨볼루션 신경망과 순환 CRF
초록

본 논문에서는 3D LiDAR 포인트 클라우드에서 도로 객체의 의미 분할을 다룹니다. 특히 자동차, 보행자, 자전거 타는 사람과 같은 관심 대상의 인스턴스를 감지하고 범주화하는 데 중점을 두고 있습니다. 이 문제를 포인트 단위 분류 문제로 정식화하고, 합성곱 신경망(CNN)을 기반으로 하는 SqueezeSeg라는 이름의 엔드투엔드 파이프라인을 제안합니다: CNN은 변환된 LiDAR 포인트 클라우드를 입력으로 받아 포인트 단위 라벨 맵을 직접 출력하며, 이는 조건부 확률장(CRF)으로 구현된 순환 계층을 통해 개선됩니다. 이후 인스턴스 수준의 라벨은 전통적인 클러스터링 알고리즘을 통해 얻어집니다. 우리의 CNN 모델은 KITTI 데이터셋의 LiDAR 포인트 클라우드에서 훈련되었으며, 포인트 단위 분할 라벨은 KITTI의 3D 바운딩 박스에서 유도되었습니다. 추가적인 훈련 데이터를 얻기 위해, 우리는 인기 있는 비디오 게임 Grand Theft Auto V (GTA-V)에 LiDAR 시뮬레이터를 구축하여 대량의 리얼리티 있는 합성 훈련 데이터를 생성했습니다. 실험 결과 SqueezeSeg는 매우 빠르고 안정적인 실행 시간(프레임당 8.7ms)으로 높은 정확도를 달성하였으며, 이는 자율 주행 응용 프로그램에 매우 적합합니다. 또한 합성 데이터로 추가 훈련하면 실제 세계 데이터에 대한 검증 정확도가 향상되는 것을 확인하였습니다. 우리의 소스 코드와 합성 데이터는 오픈 소스로 제공될 예정입니다.

SqueezeSeg: 3D LiDAR 포인트 클라우드에서 실시간 도로 객체 분할을 위한 컨볼루션 신경망과 순환 CRF | 최신 연구 논문 | HyperAI초신경