17일 전

ResNeSt: 스플릿-어텐션 네트워크

Hang Zhang, Chongruo Wu, Zhongyue Zhang, Yi Zhu, Haibin Lin, Zhi Zhang, Yue Sun, Tong He, Jonas Mueller, R. Manmatha, Mu Li, Alexander Smola
ResNeSt: 스플릿-어텐션 네트워크
초록

특징맵 주의(attention)와 다중 경로 표현(multi-path representation)이 시각 인식에서 중요한 역할을 한다는 것은 잘 알려져 있다. 본 논문에서는 서로 다른 네트워크 브랜치에 채널별 주의 메커니즘을 적용함으로써, 다양한 특징 간 상호작용을 효과적으로 포착하고 다양한 표현을 학습하는 데 성공한 모듈형 아키텍처를 제안한다. 제안한 설계는 간단하고 통합된 계산 블록을 제공하며, 단지 몇 가지 변수만으로 파라미터화할 수 있다. 본 연구에서 제안한 모델인 ResNeSt는 이미지 분류 작업에서 효율성과 지연 시간의 균형(accuracy-latency trade-off) 측면에서 EfficientNet을 능가한다. 또한 ResNeSt는 공개 벤치마크에서 백본(backbone)으로 사용되었을 때 우수한 전이 학습(transfer learning) 성능을 보였으며, COCO-LVIS 챌린지 우승 팀들에 의해 채택되기도 했다. 전체 시스템 및 사전 학습된 모델의 소스 코드는 공개되어 있다.

ResNeSt: 스플릿-어텐션 네트워크 | 최신 연구 논문 | HyperAI초신경