17일 전

스트리밍 인지를 위한 실시간 객체 탐지

Jinrong Yang, Songtao Liu, Zeming Li, Xiaoping Li, Jian Sun
스트리밍 인지를 위한 실시간 객체 탐지
초록

자율 주행은 안전을 위해 환경을 인지하고 낮은 지연 시간 내에서 즉각적인 반응을 수행할 수 있는 모델을 필요로 한다. 과거의 연구들은 처리 과정 이후 환경이 필연적으로 변화한다는 점을 간과해 왔다. 이에 따라 스트리밍 인지(streaming perception)가 제안되었으며, 영상 온라인 인지에 있어 지연 시간과 정확도를 하나의 지표로 통합하여 공동 평가할 수 있도록 하였다. 본 논문에서는 이전 연구들이 정확도와 속도 사이의 트레이드오프를 탐색하는 방식이 아니라, 실시간 모델이 미래를 예측할 수 있는 능력을 갖추는 것이 이 문제를 해결하는 핵심임을 지적한다. 우리는 스트리밍 인지를 위한 간단하면서도 효과적인 프레임워크를 구축하였으며, 이는 동적 흐름과 정적 흐름을 포함하는 새로운 이중 흐름 인지 모듈(DualFlow Perception, DFP)을 탑재하여, 움직임의 추세와 기초 탐지 특징을 동시에 포착하여 스트리밍 예측을 가능하게 한다. 또한, 다양한 이동 속도를 가진 객체에 대해 적응적인 가중치를 생성하기 위해 추세 인식 손실(Trend-Aware Loss, TAL)과 추세 요소(trend factor)를 결합한 방법을 제안한다. 제안한 간단한 방법은 Argoverse-HD 데이터셋에서 경쟁력 있는 성능을 달성하였으며, 강력한 기준 모델 대비 AP(정밀도)를 4.9% 향상시켜 그 효과를 입증하였다. 본 연구의 코드는 https://github.com/yancie-yjr/StreamYOLO에서 공개될 예정이다.

스트리밍 인지를 위한 실시간 객체 탐지 | 최신 연구 논문 | HyperAI초신경