디커플드 다이내믹 필터 네트워크

컨볼루션은 CNN 아키텍처의 기본 구성 요소 중 하나이다. 비록 널리 사용되고 있지만, 표준 컨볼루션은 두 가지 주요한 한계를 가지고 있다. 즉, 콘텐츠 무관성(content-agnostic)과 계산 부담이 크다는 점이다. 동적 필터(dynamic filter)는 콘텐츠에 따라 적응하는 특성을 지니고 있지만, 계산 부담을 더욱 증가시킨다. 반면, 깊이 분해형 컨볼루션(depth-wise convolution)은 경량화된 변형이지만, 일반적으로 CNN 성능 저하를 초래하거나 더 많은 채널 수를 요구한다. 본 연구에서는 이러한 두 가지 문제를 동시에 해결할 수 있는 '분리형 동적 필터(Decoupled Dynamic Filter, DDF)'를 제안한다. 최근의 어텐션 기법의 발전을 영감으로 받아, DDF는 깊이 분해형 동적 필터를 공간적(dynamic spatial) 및 채널적(dynamic channel) 필터로 분해한다. 이 분해 과정은 파라미터 수를 크게 감소시키며, 계산 비용을 깊이 분해형 컨볼루션과 동일한 수준으로 제한한다. 동시에, 분류 네트워크에서 표준 컨볼루션을 DDF로 대체했을 때 성능이 크게 향상되는 현상을 관찰하였다. ResNet50 및 ResNet101은 top-1 정확도에서 각각 1.9%, 1.3% 향상되었으며, 계산 비용은 거의 절반으로 감소하였다. 탐지 및 복원(upscaling) 네트워크에서의 실험 결과도, DDF의 복원 변형(DDF-Up)이 표준 컨볼루션과 특화된 콘텐츠 적응형 레이어보다 뛰어난 성능을 보임을 입증한다.