17일 전

YOLO-Former: YOLO가 ViT와 손을 잡다

Javad Khoramdel, Ahmad Moori, Yasamin Borhani, Armin Ghanbarzadeh, Esmaeil Najafi
YOLO-Former: YOLO가 ViT와 손을 잡다
초록

제안된 YOLO-Former 방법은 트랜스포머와 YOLOv4의 아이디어를 원활하게 통합하여 높은 정확도와 효율성을 갖춘 객체 탐지 시스템을 구축한다. 이 방법은 YOLOv4의 빠른 추론 속도를 활용하면서도, 합성 주의(컨볼루션 애틴션) 모듈과 트랜스포머 모듈의 통합을 통해 트랜스포머 아키텍처의 장점을 효과적으로 반영한다. 실험 결과는 제안된 접근법의 유효성을 입증하며, Pascal VOC 데이터셋에서 평균 정밀도(mAP)가 85.76%에 달하는 동시에 초당 10.85프레임의 높은 예측 속도를 유지함을 보여준다. 본 연구의 기여점은 최신 기술인 두 가지 아키텍처를 혁신적으로 결합함으로써 객체 탐지 분야에서 추가적인 성능 향상이 가능함을 보여준다는 점에 있다.

YOLO-Former: YOLO가 ViT와 손을 잡다 | 최신 연구 논문 | HyperAI초신경