17일 전

그룹화된 포인트와이즈 컨볼루션은 EfficientNet에서 파라미터를 상당히 감소시킨다.

{Domenec Puig, Hatem Rashwan, Mohamed Abdel-Nasser, Santiago Romani, Joao Paulo Schwarz Schuler}
초록

EfficientNet은 깊이, 너비 및 해상도 측면에서 비례적으로 확장 가능한 최신 딥 컨볼루션 신경망(DCNN) 아키텍처이다. 다양한 변형을 통해 ImageNet 분류 과제뿐 아니라 기타 전통적인 과제에서도 최상의 정확도를 달성할 수 있다. 비록 이름에서 알 수 있듯이 EfficientNet은 정확도(성능) 대 비용(파라미터 수, FLOPs)의 비율 측면에서 효율성을 중시하지만, 본 연구에서는 원래의 학습 가능한 파라미터 수를 84% 이상 감소시키면서도 매우 유사한 정확도를 유지하는 방법을 제안한다. 제안하는 방법은 입력 채널 수와 필터 수의 곱으로 인해 빠르게 증가하는 1x1 컨볼루션(포인트와이즈 컨볼루션)의 파라미터 수를 줄이는 데 초점을 맞추고 있다. 기본적으로 본 연구의 개선점은 필터를 병렬 브랜치로 그룹화하여 각 브랜치가 입력 채널의 일부만 처리하도록 하는 것이다. 그러나 이러한 방식은 DCNN의 학습 능력을 저하시킬 수 있다. 이를 방지하기 위해, 연속된 포인트와이즈 컨볼루션의 중간 레이어에서 서로 다른 브랜치의 필터 출력을 교차 배치(인터리빙)하는 전략을 제안한다. CIFAR-10 데이터셋을 활용한 실험 결과, 본 연구에서 최적화한 EfficientNet은 초기 구조와 동일한 수준의 학습 능력을 보였으며, 처음부터 학습할 경우에도 유사한 성능을 나타내었다.