11일 전

VDDT: 변형 가능 트랜스포머를 활용한 선박 탐지 향상

{Lefan Wang, Zhihui Chen, Ruixin Zheng, Jinhe Su, Yiling Liu, Siyu Chen}
초록

선박 탐지는 객체 탐지 분야에서 널리 주목받고 있으며, 최근 제안된 DETR은 진정한 엔드 투 엔드 객체 탐지 기술을 성공적으로 구현하고 우수한 성능을 보여주고 있다. 그러나 DETR은 소형 객체 탐지에 민감하지 않아 선박 탐지 분야에서 만족스럽지 못한 성능을 보이고 있다. 본 논문에서는 변형 가능 DETR(Deformable DETR)을 기준 모델로 사용하고, 이를 바탕으로 개선을 수행한다. 먼저, 객체 쿼리에 참조 점 정보를 추가함으로써 객체 쿼리가 학습하는 특징을 풍부하게 하여 탐지기 성능을 향상시킨다. 둘째, 디코더의 계산 부담을 줄이기 위해 다중층 퍼셉트론(Multi-Layer Perceptron)을 다중 헤드 자기 주의(Multi-Head Self-Attention) 대신 사용한다. 또한, 85개의 영상에서 4,563개의 이미지를 라벨링하여 선박 데이터셋을 구축하였다. 제안한 모델인 VDDT의 실험 결과는 제안된 데이터셋 기반에서 기준 모델 대비 우수한 성능을 보였다.

VDDT: 변형 가능 트랜스포머를 활용한 선박 탐지 향상 | 최신 연구 논문 | HyperAI초신경