17일 전

다이나믹 리전 인지 컨볼루션

Jin Chen, Xijun Wang, Zichao Guo, Xiangyu Zhang, Jian Sun
다이나믹 리전 인지 컨볼루션
초록

우리는 특징이 유사한 표현을 가지는 공간적 영역에 대해 자동으로 여러 필터를 할당할 수 있는 새로운 컨볼루션인 동적 영역 인지 컨볼루션(Dynamic Region-Aware Convolution, DRConv)을 제안한다. 이를 통해 DRConv는 의미적 변동성을 모델링하는 데 있어 기존 표준 컨볼루션보다 우수한 성능을 발휘한다. 표준 컨볼루션은 필터 수를 늘려 더 많은 시각적 요소를 추출할 수 있지만, 이는 높은 계산 비용을 수반한다. 반면 DRConv는 학습 가능한 지도자(learnable instructor)를 통해 채널 차원의 필터 증가를 공간 차원으로 전환함으로써, 계산 비용을 유지하면서도 컨볼루션의 표현 능력을 향상시키고, 표준 컨볼루션과 마찬가지로 역할 불변성(translation-invariance)을 유지한다. DRConv는 복잡하고 변동성이 큰 공간 정보 분포를 처리하는 데 효과적이고 우아한 방법으로, 기존 네트워크 어디에든 즉시 적용 가능한 플러그 앤 플레이(Plug-and-Play) 특성을 갖추고 있어 특히 효율적인 네트워크 내 컨볼루션 계층을 강화하는 데 유용하다. 우리는 DRConv를 다양한 모델(MobileNet 시리즈, ShuffleNetV2 등)과 다양한 작업(분류, 얼굴 인식, 탐지, 세그멘테이션)에 대해 평가하였다. ImageNet 분류 작업에서 DRConv 기반의 ShuffleNetV2-0.5x는 46M의 곱셈-덧셈 연산 수준에서 기존 최고 성능을 상회하는 67.1%의 정확도를 달성하였으며, 상대적 개선률은 6.3%에 달한다.

다이나믹 리전 인지 컨볼루션 | 최신 연구 논문 | HyperAI초신경