한 달 전
Res2Net: 새로운 다중 스케일 백본 아키텍처
Shang-Hua Gao; Ming-Ming Cheng; Kai Zhao; Xin-Yu Zhang; Ming-Hsuan Yang; Philip Torr

초록
다양한 비전 작업에서 여러 스케일의 특성을 표현하는 것은 매우 중요합니다. 최근 백본 컨볼루션 신경망(CNNs)의 발전은 지속적으로 더 강력한 다중 스케일 표현 능력을 보여주고 있으며, 이는 다양한 응용 분야에서 일관된 성능 향상을 가져왔습니다. 그러나 대부분의 기존 방법은 층별로 다중 스케일 특성을 표현합니다. 본 논문에서는 단일 잔차 블록 내에서 계층적인 잔차와 유사한 연결을 구축하여 새로운 CNN 구성 요소인 Res2Net을 제안합니다. 제안된 Res2Net은 미세 수준에서 다중 스케일 특성을 표현하며, 각 네트워크 층의 수용 영역 범위를 확장합니다. Res2Net 블록은 최신 백본 CNN 모델들, 예를 들어 ResNet, ResNeXt, 그리고 DLA에 삽입될 수 있습니다. 우리는 이러한 모든 모델에서 Res2Net 블록을 평가하고, 일반적으로 사용되는 데이터셋(예: CIFAR-100 및 ImageNet)에서 기준 모델보다 일관된 성능 향상을 보여줍니다. 또한 대표적인 컴퓨터 비전 작업인 객체 검출, 클래스 활성화 매핑, 그리고 주요 객체 검출에 대한 추가적인 감소 연구와 실험 결과를 통해 Res2Net이 최신 기술 기준 방법론보다 우수함을 더욱 확인하였습니다. 소스 코드와 학습된 모델은 https://mmcheng.net/res2net/에서 제공됩니다.