17일 전

정확한 단일 쇼트 객체 탐지를 위한 병렬 잔차 이중 융합 특징 피라미드 네트워크

Ping-Yang Chen, Ming-Ching Chang, Jun-Wei Hsieh, Yong-Sheng Chen
정확한 단일 쇼트 객체 탐지를 위한 병렬 잔차 이중 융합 특징 피라미드 네트워크
초록

이 논문은 빠르고 정확한 단일 스태시(single-shot) 객체 탐지를 위한 병렬 잔차 이중융합 특징 피라미드 네트워크(Parallel Residual Bi-Fusion Feature Pyramid Network, PRB-FPN)를 제안한다. 최근 시각적 객체 탐지 분야에서 특징 피라미드(FP)는 널리 사용되고 있으나, 기존 FP의 상향식 경로(top-down pathway)는 풀링(pooling)에 의해 발생하는 위치 정보 왜곡을 해결하지 못해 정밀한 위치 추정을 보장하지 못한다. 특히, 더 깊은 백본(backbone) 구조를 사용할수록 이러한 문제는 심화되며, FP의 장점이 약화된다. 또한, 작은 객체와 큰 객체를 동시에 정확하게 탐지하는 데 한계가 있다. 이러한 문제를 해결하기 위해, 상향식과 하향식 양방향(fusion) 병렬 구조를 도입하고, 고품질의 특징 정보를 유지할 수 있도록 관련 개선 기법을 제안한다. 본 연구에서 제안하는 주요 설계 개선 사항은 다음과 같다: (1) 하향식 경로와 하향식 경로를 병렬로 결합한 이중융합 특징 피라미드 구조를 도입하였으며, 하향식 융합 모듈(Bottom-up Fusion Module, BFM)을 포함하여 작은 객체와 큰 객체를 동시에 높은 정확도로 탐지할 수 있도록 하였다. (2) 특징 융합을 위한 하향식 경로를 제공하는 연결 및 재구성(Concatenation and Re-organization, CORE) 모듈을 도입함으로써, 하향식과 상향식 양방향 융합 피라미드 구조를 구현하였으며, 낮은 레벨의 특징 맵에서 손실된 정보를 회복할 수 있도록 하였다. (3) CORE 모듈을 통해 추출된 특징은 추가로 정제되어 더 � бог rich한 맥락 정보를 유지할 수 있다. 이러한 CORE 정제 과정은 상향식 및 하향식 경로 모두에서 몇 번의 반복만으로도 효과적으로 수행될 수 있다. (4) CORE 모듈에 잔차(Residual) 설계를 도입하여 새로운 Re-CORE 모듈을 제안하였으며, 이는 다양한 깊이의 더 깊거나 가벼운 백본과의 간편한 학습 및 통합을 가능하게 한다. 제안된 네트워크는 UAVDT17 및 MS COCO 데이터셋에서 최신 기술(SOTA, State-of-the-art) 수준의 성능을 달성하였다. 코드는 다음 링크에서 공개되어 있다: https://github.com/pingyang1117/PRBNet_PyTorch.

정확한 단일 쇼트 객체 탐지를 위한 병렬 잔차 이중 융합 특징 피라미드 네트워크 | 최신 연구 논문 | HyperAI초신경