
초록
우리는 이미지 분류를 위한 간단하고 높은 모듈성의 네트워크 아키텍처를 제시합니다. 우리의 네트워크는 동일한 토폴로지를 가진 변환 집합을 통합하는 빌딩 블록을 반복하여 구성됩니다. 이러한 간단한 설계는 균일하고 다중 분기 구조를 가지며 설정해야 할 하이퍼파라미터가 몇 개뿐입니다. 이 전략은 깊이와 너비의 차원 외에 필수적인 요소인 '카디널리티' (변환 집합의 크기)라는 새로운 차원을 노출시킵니다. ImageNet-1K 데이터셋에서 우리는 복잡성을 유지하는 제약 조건 하에서도 카디널리티를 증가시키면 분류 정확도가 향상된다는 것을 경험적으로 보여주었습니다. 또한 용량을 증가시키는 경우, 더 깊거나 넓게 만드는 것보다 카디널리티를 증가시키는 것이 더 효과적임을 확인하였습니다. 우리 모델은 ResNeXt로 명명되었으며, ILSVRC 2016 분류 작업에서 2위를 차지한 기초가 되었습니다. 우리는 ImageNet-5K 세트와 COCO 검출 세트에서도 ResNeXt를 추가로 조사하였으며, ResNet 대응 모델보다 더 나은 결과를 보였습니다. 코드와 모델은 온라인에서 공개적으로 이용 가능합니다.