
우리는 CNN의 매우 효율적인 빌딩 블록으로 블루프린트 분리형 합성곱(BluePrint Separable Convolutions, BSConv)을 제안한다. 이는 훈련된 모델에서 핵심(커널)의 성질에 대한 정량적 분석에 기반하며, 깊이 축(깊이 방향)을 따라 상관관계가 지배적임을 보여준다. 이러한 발견을 바탕으로, 우리는 표준 레이어만을 사용하여 효율적인 구현을 도출할 수 있는 이론적 기반을 제시한다. 또한 본 연구는 깊이 분리형 합성곱(Depthwise Separable Convolutions, DSCs)이 일반적으로 사용되는 이유에 대한 철학적이고 체계적인 이론적 도출, 해석 및 정당화를 제공한다. DSCs는 현재 많은 현대적 네트워크 아키텍처의 기초가 되어 왔다. 궁극적으로 우리는 MobileNet과 같은 DSC 기반 아키텍처가 암묵적으로 커널 간 상관관계에 의존하고 있음을 밝혀내었으며, 반면 BSConv는 커널 내부의 상관관계에 기반하고 있어 일반 합성곱의 보다 효율적인 분리가 가능함을 보여준다. 대규모 및 세부 분류 데이터셋에서 실시한 광범위한 실험 결과에 따르면, BSConv는 추가적인 복잡성 없이 MobileNet 및 기타 DSC 기반 아키텍처의 성능을 명확하고 일관되게 향상시킨다. 특히 세부 분류 데이터셋에서는 최대 13.7퍼센트 포인트의 성능 향상을 달성하였다. 또한 ResNet과 같은 표준 아키텍처의 경우, BSConv를 즉시 대체할 수 있는 형태로 적용할 경우 ImageNet에서 기존 모델 대비 최대 9.5퍼센트 포인트의 성능 향상을 기록하였다. 코드와 모델은 https://github.com/zeiss-microscopy/BSConv 에서 공개되어 있다.