
초록
본 연구에서는 대규모 이미지 인식 환경에서 컨볼루션 네트워크의 깊이가 정확도에 미치는 영향을 조사하였습니다. 주요 기여점은 매우 작은 (3x3) 컨볼루션 필터를 사용하는 아키텍처로 점차 깊어지는 네트워크를 철저히 평가한 것입니다. 이 평가는 16-19개의 가중치 층으로 깊이를 늘릴 때 기존 구성을 크게 개선할 수 있음을 보여주었습니다. 이러한 결과는 우리의 ImageNet 챌린지 2014 제출작의 기반이 되었으며, 우리 팀은 각각 로컬라이제이션과 분류 트랙에서 1위와 2위를 차지하였습니다. 또한, 우리의 표현이 다른 데이터셋에서도 잘 일반화됨을 보여주었으며, 이는 최신 성능을 달성하였습니다. 우리는 딥 비주얼 표현을 컴퓨터 비전에서 활용하는 추가 연구를 지원하기 위해 가장 성능이 우수한 두 개의 ConvNet 모델을 공개적으로 제공하였습니다.