11일 전

FishEye8K: 페시아 카메라 객체 탐지를 위한 벤치마크 및 데이터셋

Munkhjargal Gochoo, Munkh-Erdene Otgonbold, Erkhembayar Ganbold, Jun-Wei Hsieh, Ming-Ching Chang, Ping-Yang Chen, Byambaa Dorj, Hamad Al Jassmi, Ganzorig Batnasan, Fady Alnajjar, Mohammed Abduljabbar, Fang-Pang Lin
FishEye8K: 페시아 카메라 객체 탐지를 위한 벤치마크 및 데이터셋
초록

AI의 발전에 따라 도로 객체 탐지(road object detection)는 컴퓨터 비전 분야에서 주목받는 주제가 되었으며, 대부분 페르스펙티브 카메라(perspective camera)를 활용해 왔다. 반면, 피시아 렌즈(fisheye lens)는 적은 수의 카메라로도 도로 교차로를 원형으로 넓게 감시할 수 있는 장점을 지니고 있으나, 시각 왜곡이 발생한다는 단점이 있다. 본 연구에 따르면, 피시아 카메라를 활용한 교통 감시를 위한 기존 오픈 데이터셋은 존재하지 않는다. 본 논문에서는 도로 객체 탐지 작업을 위한 오픈 소스 FishEye8K 벤치마크 데이터셋을 제안한다. 이 데이터셋은 보행자(Pedestrian), 자전거(Bike), 승용차(Car), 버스(Bus), 트럭(Truck) 등 5개 클래스에 걸쳐 총 157,000개의 경계 박스(bounding boxes)를 포함하고 있다. 또한, YOLOv5, YOLOR, YOLO7, YOLOv8 등의 다양한 변형 모델을 포함한 최첨단(State-of-The-Art, SoTA) 모델들의 벤치마크 성능 결과도 제시한다. 본 데이터셋은 대만 허신추(Hsinchu) 지역에서 18대의 피시아 카메라를 활용해 총 22개의 영상에서 촬영한 8,000장의 이미지로 구성되었으며, 이미지 해상도는 1080×1080 및 1280×1280이다. 초광각 원형 및 반구형 피시아 카메라 영상의 큰 왜곡과 다수의 도로 이용자, 특히 스쿠터를 타고 있는 사람들을 포함한 복잡한 시나리오로 인해 데이터 주석화(annotation) 및 검증 과정은 매우 까다롭고 시간이 많이 소요되었다. 편향을 방지하기 위해 특정 카메라에서 촬영한 프레임은 학습 세트 또는 테스트 세트 중 하나로만 할당되었으며, 각 클래스의 이미지 및 경계 박스 수에 대해 약 70:30의 비율을 유지하였다. 실험 결과, YOLOv8은 입력 크기 640×640에서, YOLOR은 1280×1280에서 각각 우수한 성능을 보였다. 본 데이터셋은 PASCAL VOC, MS COCO, YOLO 등 다양한 주석 형식으로 GitHub에서 공개될 예정이다. FishEye8K 벤치마크는 피시아 영상 분석 및 스마트 시티 응용 분야에 중요한 기여를 할 것으로 기대된다.

FishEye8K: 페시아 카메라 객체 탐지를 위한 벤치마크 및 데이터셋 | 최신 연구 논문 | HyperAI초신경