11일 전

HPTQ: 하드웨어 친화적인 훈련 후 양자화

Hai Victor Habi, Reuven Peretz, Elad Cohen, Lior Dikstein, Oranit Dror, Idit Diamant, Roy H. Jennings, Arnon Netzer
HPTQ: 하드웨어 친화적인 훈련 후 양자화
초록

신경망 양자화는 모델을 엣지 디바이스에 배포하는 것을 가능하게 한다. 이러한 기술의 하드웨어 효율성을 높이기 위한 핵심 요건은 양자화기가 하드웨어 친화적이어야 한다는 점이다. 즉, 균일성, 대칭성, 그리고 2의 거듭제곱 기준값을 가져야 한다. 현재까지 알려진 후처리 양자화 방법 중에서는 이러한 모든 제약 조건을 동시에 만족하는 것은 없다. 본 연구에서는 이러한 문제를 해결하기 위해 기존의 여러 양자화 기법들을 유기적으로 통합한 하드웨어 친화적인 후처리 양자화(HPTQ) 프레임워크를 제안한다. 우리는 다양한 네트워크 아키텍처를 대상으로 분류, 객체 탐지, 세그멘테이션, 자세 추정이라는 네 가지 주요 작업에 대해 대규모 실험을 수행하였다. 광범위한 실험 결과를 통해 하드웨어 친화적인 제약 조건 하에서도 경쟁력 있는 성능을 달성할 수 있음을 입증하였다.

HPTQ: 하드웨어 친화적인 훈련 후 양자화 | 최신 연구 논문 | HyperAI초신경