
シーン 플로우는 자율 주행 차량이 인접한 시간 단계에서 캡처한 두 개의 LiDAR 스캔 사이의 3D 운동을 특징화합니다. 기존 방법들은 장면 플로우를 사전에 대규모 학습을 통해 또는 추론 시 시간이 많이 소요되는 최적화를 통해 학습할 수 있는 점별 제약 없는 플로우 벡터로 간주합니다. 그러나 이러한 방법들은 자율 주행에서 물체가 종종 강체 운동을 한다는 사실을 고려하지 않습니다. 우리는 이 강체 운동 가정을 설계에 통합하여, 스캔 간 물체를 연관시키고 그 다음으로 국소적으로 강체 변환을 추정하는 것을 목표로 합니다. 우리는 학습이 필요하지 않은 플로우 추정기인 ICP-플로우를 제안합니다. 우리의 설계 핵심은 시간 경과에 따라 물체를 정렬하고 해당 강체 변환을 출력하는 전통적인 반복 가장 가까운 점 (Iterative Closest Point, ICP) 알고리즘입니다. 중요한 것은, ICP를 지원하기 위해 가장 가능성이 높은 번역을 발견하여 ICP의 좋은 시작점을 제공하는 히스토그램 기반 초기화를 제안한다는 것입니다. 그런 다음 완전한 장면 플로우는 강체 변환에서 복구됩니다. 우리는 Waymo 데이터셋에서 최신 기준 모델들을 포함한 감독된 모델들을 능가하며, Argoverse-v2와 nuScenes에서도 경쟁력을 보입니다. 또한, 우리의 모델에서 생성된 의사 라벨(pseudo labels)에 의해 감독되는 피드포워드 신경망(feedforward neural network)을 훈련시키고 실시간 추론이 가능한 모든 모델 중 최상의 성능을 달성했습니다. 우리는 다른 모델들이 의미 있는 결과를 제공하지 못하는 최대 0.4초까지의 더 긴 시간 간격에서 장면 플로우 추정의 우위성을 검증하였습니다.注: "피드포워드 신경망" (feedforward neural network) 和 "의사 라벨" (pseudo labels) 是直接翻译的专业术语,为了确保信息完整,已在括号中标注了原文。在韩语中,“シーン フロウ”(Scene Flow)通常写作“장면 플로우”,但为了保持与原文的一致性和专业性,这里使用了“シーン 플ロウ”。如果需要进一步本地化,可以考虑改为“장면 플로우”。