
초록
컨벌루션 신경망(CNNs)의 핵심 구성 요소는 컨벌루션 연산자입니다. 이 연산자는 각 층에서 로컬 수용 영역 내에서 공간적 정보와 채널별 정보를 융합하여 유익한 특징을 구축할 수 있게 합니다. 이전 연구의 광범위한 범위에서는 이러한 관계의 공간적 성분에 초점을 맞추어, CNN의 특징 계층 전체에서 공간 인코딩의 품질을 개선함으로써 표현력 강화를 목표로 하였습니다. 본 연구에서는 대신 채널 간 관계에 집중하며, 채널 간 상호 의존성을 명시적으로 모델링하여 채널별 특징 응답을 적응적으로 재조정하는 새로운 아키텍처 단위인 "Squeeze-and-Excitation" (SE) 블록을 제안합니다. 우리는 이러한 블록들이 서로 쌓여서 다양한 데이터셋에서 매우 효과적으로 일반화되는 SENet 아키텍처를 형성할 수 있음을 보여줍니다. 또한 SE 블록이 기존 최고 수준의 CNN들에서 약간의 추가적인 계산 비용으로 성능을 크게 향상시키는 것을 입증하였습니다. Squeeze-and-Excitation 네트워크는 우리 팀이 제출한 ILSVRC 2017 분류 작업의 기반이 되었으며, 1등을 차지하고 상위 5개 오류율을 2.251%로 줄여 2016년 우승작보다 ~25% 개선되었습니다. 모델과 코드는 https://github.com/hujie-frank/SENet 에서 제공됩니다.