11일 전

변형 DETR: 엔드투엔드 객체 탐지용 변형 트랜스포머

Xizhou Zhu, Weijie Su, Lewei Lu, Bin Li, Xiaogang Wang, Jifeng Dai
변형 DETR: 엔드투엔드 객체 탐지용 변형 트랜스포머
초록

최근 제안된 DETR는 객체 탐지에서 수작업으로 설계된 많은 구성 요소의 필요성을 제거하면서 우수한 성능을 보여주었다. 그러나 Transformer 어텐션 모듈이 이미지 특징 맵을 처리하는 데 한계를 가짐에 따라 수렴 속도가 느리고 특징의 공간 해상도가 제한되는 문제가 있다. 이러한 문제를 완화하기 위해 우리는 참조점 주변의 소수의 핵심 샘플링 포인트에만 주목하는 어텐션 모듈을 가진 Deformable DETR을 제안한다. Deformable DETR은 훈련 에포크 수를 10배 줄이면서도 DETR보다 더 우수한 성능을 달성할 수 있으며, 특히 소형 객체에 대해 뛰어난 성능을 보인다. COCO 벤치마크에서 실시한 광범위한 실험을 통해 제안한 방법의 효과성을 입증하였다. 코드는 https://github.com/fundamentalvision/Deformable-DETR 에 공개되어 있다.

변형 DETR: 엔드투엔드 객체 탐지용 변형 트랜스포머 | 최신 연구 논문 | HyperAI초신경