8일 전

실용적인 네트워크 압축을 위한 그룹 페셔 프루닝

Liyang Liu, Shilong Zhang, Zhanghui Kuang, Aojun Zhou, Jing-Hao Xue, Xinjiang Wang, Yimin Chen, Wenming Yang, Qingmin Liao, Wayne Zhang
실용적인 네트워크 압축을 위한 그룹 페셔 프루닝
초록

네트워크 압축은 추론 시 메모리 및 계산 비용을 줄일 수 있기 때문에 오랜 기간에 걸쳐 널리 연구되어 왔다. 그러나 기존의 방법들은 복잡한 구조, 예를 들어 잔차 연결(residual connections), 그룹형/깊이-wise 합성곱(depth-wise convolution), 특징 피라미드 네트워크(feature pyramid network)와 같이 여러 층의 채널이 서로 연결되어 동시에 절단되어야 하는 경우를 거의 다루지 못했다. 본 논문에서는 다양한 복잡한 구조에 적용 가능한 일반적인 채널 절단 방법을 제안한다. 특히, 자동으로 연결된 채널을 탐지하기 위한 레이어 그룹화 알고리즘을 제안한다. 이후 피셔 정보(Fisher information)를 기반으로 한 통합적 평가 지표를 도출하여 단일 채널과 연결된 채널의 중요도를 평가한다. 또한, GPU에서의 추론 속도 향상은 FLOPs 감소보다 메모리 감소와 더 밀접한 상관관계를 가짐을 발견하였으며, 따라서 각 채널의 중요도를 정규화하기 위해 메모리 감소량을 활용한다. 본 방법은 연결된 채널을 포함한 어떠한 네트워크 구조에도 적용 가능하다. 우리는 이미지 분류 및 객체 탐지에 대한 광범위한 실험을 수행하였으며, 전통적인 ResNet 및 ResNeXt, 모바일 친화적인 MobileNetV2, 그리고 NAS 기반의 RegNet과 같은 다양한 백본 구조를 대상으로 하였다. 특히 객체 탐지 분야는 이전에 탐구가 부족했던 영역이다. 실험 결과, 본 방법이 복잡한 네트워크를 효과적으로 절단함으로써 정확도를 희생시키지 않고 추론 속도를 크게 향상시킬 수 있음을 입증하였다.

실용적인 네트워크 압축을 위한 그룹 페셔 프루닝 | 최신 연구 논문 | HyperAI초신경