
우리는 특징이 유사한 표현을 가지는 공간적 영역에 대해 자동으로 여러 필터를 할당할 수 있는 새로운 컨볼루션인 동적 영역 인지 컨볼루션(Dynamic Region-Aware Convolution, DRConv)을 제안한다. 이를 통해 DRConv는 의미적 변동성을 모델링하는 데 있어 기존 표준 컨볼루션보다 우수한 성능을 발휘한다. 표준 컨볼루션은 필터 수를 늘려 더 많은 시각적 요소를 추출할 수 있지만, 이는 높은 계산 비용을 수반한다. 반면 DRConv는 학습 가능한 지도자(learnable instructor)를 통해 채널 차원의 필터 증가를 공간 차원으로 전환함으로써, 계산 비용을 유지하면서도 컨볼루션의 표현 능력을 향상시키고, 표준 컨볼루션과 마찬가지로 역할 불변성(translation-invariance)을 유지한다. DRConv는 복잡하고 변동성이 큰 공간 정보 분포를 처리하는 데 효과적이고 우아한 방법으로, 기존 네트워크 어디에든 즉시 적용 가능한 플러그 앤 플레이(Plug-and-Play) 특성을 갖추고 있어 특히 효율적인 네트워크 내 컨볼루션 계층을 강화하는 데 유용하다. 우리는 DRConv를 다양한 모델(MobileNet 시리즈, ShuffleNetV2 등)과 다양한 작업(분류, 얼굴 인식, 탐지, 세그멘테이션)에 대해 평가하였다. ImageNet 분류 작업에서 DRConv 기반의 ShuffleNetV2-0.5x는 46M의 곱셈-덧셈 연산 수준에서 기존 최고 성능을 상회하는 67.1%의 정확도를 달성하였으며, 상대적 개선률은 6.3%에 달한다.