17일 전
ResNeSt: 스플릿-어텐션 네트워크
Hang Zhang, Chongruo Wu, Zhongyue Zhang, Yi Zhu, Haibin Lin, Zhi Zhang, Yue Sun, Tong He, Jonas Mueller, R. Manmatha, Mu Li, Alexander Smola

초록
특징맵 주의(attention)와 다중 경로 표현(multi-path representation)이 시각 인식에서 중요한 역할을 한다는 것은 잘 알려져 있다. 본 논문에서는 서로 다른 네트워크 브랜치에 채널별 주의 메커니즘을 적용함으로써, 다양한 특징 간 상호작용을 효과적으로 포착하고 다양한 표현을 학습하는 데 성공한 모듈형 아키텍처를 제안한다. 제안한 설계는 간단하고 통합된 계산 블록을 제공하며, 단지 몇 가지 변수만으로 파라미터화할 수 있다. 본 연구에서 제안한 모델인 ResNeSt는 이미지 분류 작업에서 효율성과 지연 시간의 균형(accuracy-latency trade-off) 측면에서 EfficientNet을 능가한다. 또한 ResNeSt는 공개 벤치마크에서 백본(backbone)으로 사용되었을 때 우수한 전이 학습(transfer learning) 성능을 보였으며, COCO-LVIS 챌린지 우승 팀들에 의해 채택되기도 했다. 전체 시스템 및 사전 학습된 모델의 소스 코드는 공개되어 있다.