2달 전

3D-DETNet: 단일 단계 비디오 기반 차량 검출기

Suichan Li
3D-DETNet: 단일 단계 비디오 기반 차량 검출기
초록

최근 10년 동안 비디오 기반 차량 검출에 많은 관심이 쏠렸으며, 이를 위한 다양한 딥러닝 기반 검출 방법들이 제시되었습니다. 그러나 이러한 방법들은 정지 이미지를 대상으로 설계되었기 때문에, 비디오 차량 검출에 직접 적용할 경우 성능이 저하되는 경향이 있습니다. 본 연구에서는 3DCovNet과 포칼 로스(focal loss)를 통합한 새로운 단일 단계 비디오 기반 차량 검출기인 3D-DETNet을 제안합니다. 3차원 컨볼루션 네트워크와 포칼 로스의 지원을 받아, 본 방법은 움직임 정보를 포착할 수 있으며, 정지 이미지를 대상으로 설계된 다른 단일 단계 방법들보다 비디오에서 차량을 검출하는 데 더 적합합니다. 여러 비디오 프레임은 먼저 3D-DETNet에 입력되어 다수의 공간적 특징 맵을 생성합니다. 이후 하위 모델인 3DConvNet은 이 공간적 특징 맵들을 입력으로 받아 시간적 정보를 추출하며, 이 정보는 최종적인 완전 컨볼루션 모델로 전달되어 비디오 프레임 내 차량 위치를 예측합니다. 우리는 UA-DETAC 차량 검출 데이터셋에서 본 방법의 성능을 평가하였으며, 제안된 3D-DETNet은 최고의 성능을 보였으며, 다른 경쟁 방법들과 비교하여 26 fps의 높은 검출 속도를 유지하였습니다.

3D-DETNet: 단일 단계 비디오 기반 차량 검출기 | 최신 연구 논문 | HyperAI초신경