11일 전

HMQ: CNN용 하드웨어 친화적인 혼합 정밀도 양자화 �ブロック

Hai Victor Habi, Roy H. Jennings, Arnon Netzer
HMQ: CNN용 하드웨어 친화적인 혼합 정밀도 양자화 �ブロック
초록

최근 네트워크 양자화 분야의 연구는 혼합 정밀도 양자화를 활용하여 최신 기술 수준의 성능을 달성하였다. 많은 효율적인 엣지 디바이스 하드웨어 구현에 있어 필수적인 요구사항은 양자화기(quantizer)가 균일하고, 2의 거듭제곱 값의 임계치(threshold)를 가져야 한다는 점이다. 본 연구에서는 이러한 요구사항을 충족하기 위해 하드웨어 친화적인 혼합 정밀도 양자화 블록(Hardware Friendly Mixed Precision Quantization Block, HMQ)을 제안한다. HMQ는 Gumbel-Softmax 추정기(Gumbel-Softmax estimator)를 재사용하여 비트 폭(bit-width)과 임계치의 쌍에 대한 부드러운 추정기로 변환하는 혼합 정밀도 양자화 블록이다. 이를 통해 유한한 양자화 방식의 공간 내에서 탐색을 수행한다. 실험적으로 HMQ를 CIFAR10 및 ImageNet에서 학습된 분류 모델의 양자화에 적용하였다. ImageNet에 대한 실험에서는 네 가지 다른 아키텍처를 대상으로 하여, 양자화 방식에 추가적인 제약이 가해졌음에도 불구하고, 경쟁력 있는 성능을 달성하였으며, 일부 경우에서는 최신 기술 수준의 성능을 달성함을 보였다.

HMQ: CNN용 하드웨어 친화적인 혼합 정밀도 양자화 �ブロック | 최신 연구 논문 | HyperAI초신경