2달 전

3D 랜덤 가림과 다층 투사 기법을 이용한 심층 다중 카메라 보행자 위치 추정

Qiu, Rui ; Xu, Ming ; Yan, Yuyao ; Smith, Jeremy S. ; Yang, Xi
3D 랜덤 가림과 다층 투사 기법을 이용한 심층 다중 카메라 보행자 위치 추정
초록

단일 카메라 보행자 검출을 위한 딥러닝 기반 방법들이 큰 발전을 이뤘음에도 불구하고, 여전히 중복된 가림(occlusions)에 취약한 문제를 가지고 있습니다. 다중 뷰 정보 융합은 이러한 문제를 해결할 잠재적인 방법이지만, 기존의 다중 뷰 데이터셋에서 주석화된 훈련 샘플이 부족하여 적용 범위가 제한적입니다. 이는 과적합(overfitting)의 위험성을 증가시킵니다. 이를 해결하기 위해, 평균적인 보행자의 크기를 갖는 3D 원통형 가림물을 지면 상에서 무작위로 생성하고 이를 여러 뷰에 투영하는 데이터 증강 방법이 제안되었습니다. 이 방법은 훈련 과정에서 과적합의 영향을 완화하는 데 도움이 됩니다. 또한, 각 뷰의 특징 맵은 고도가 다른 여러 평행 평면으로 호모그래피(homographies)를 사용하여 투영됩니다. 이는 CNNs이 각 보행자의 높이 전반에 걸친 특징들을 충분히 활용하여 지면 상의 보행자 위치를 추론할 수 있게 합니다. 제안된 3DROM 방법은 다중 뷰 보행자 검출을 위한 최신 딥러닝 기반 방법들과 비교해 성능이 크게 향상되었습니다.

3D 랜덤 가림과 다층 투사 기법을 이용한 심층 다중 카메라 보행자 위치 추정 | 최신 연구 논문 | HyperAI초신경