T-YOLO: YOLO 및 다중 스케일 컨볼루션 신경망 기반의 소형 차량 탐지
실생활의 다양한 스마트시티 응용 분야, 예를 들어 주차 공간 점유율 탐지와 같은 문제를 해결하기 위해서는 딥 뉴럴 네트워크를 정교하게 최적화하는 것이 필요하다. 대규모 주차장의 경우, 하나의 카메라로 전체 주차 공간 또는 큰 주차 구역을 모니터링할 수 있도록 고지점에 설치된 수평면 카메라를 사용하는 것이 바람직하다. 현재 가장 널리 사용되는 객체 탐지 모델인 YOLO는 실시간 속도에서 뛰어난 정밀도 성능을 보여주고 있다. 그러나 일반적인 데이터셋(예: COCO, ImageNet)과는 다른 자체 데이터를 사용할 경우, 성능 향상 여지가 매우 크다. 본 논문에서는 YOLO-v5 아키텍처를 기반으로 수정 및 경량화한 새로운 딥 객체 탐지 모델을 제안한다. 제안된 모델은 대형, 소형, 미니어처 객체 모두를 탐지할 수 있다. 특히, 다양한 스케일에서 깊이 있는 구분 능력 있는 특징 표현을 학습하고, 장면 내 객체(본 연구에서는 차량) 탐지에 가장 적합한 스케일을 자동으로 결정하는 다중 스케일 기반 메커니즘을 도입한다. 제안된 다중 스케일 모듈은 원래 YOLO-v5 아키텍처 대비 학습 가능한 파라미터 수를 줄였다. 실험 결과에 따르면 정밀도가 크게 향상됨을 확인할 수 있었다. 실제로 실험 결과를 보면, YOLO-v5-S 프로파일의 728만 개 파라미터가 본 모델에서는 726만 개로 약간 감소되었으며, 탐지 속도 역시 YOLO-v5-L/X 프로파일 대비 30 fps로 감소되어 효율성이 향상되었다. 또한, 미니어처 차량 탐지 성능은 YOLO-v5-X 프로파일 대비 33% 향상되는 것으로 나타났다.