2달 전

Zero-shot Adversarial Quantization 제로샷 적대적 양자화

Liu, Yuang ; Zhang, Wei ; Wang, Jun
Zero-shot Adversarial Quantization
제로샷 적대적 양자화
초록

모델 양자화는 딥 뉴럴 네트워크를 압축하고 추론을 가속화하여 모바일 및 엣지 장치에 배포할 수 있게 하는 유망한 접근 방식입니다. 전체 정밀도 모델의 높은 성능을 유지하기 위해 대부분의 기존 양자화 방법은 훈련 데이터셋이 접근 가능하다는 가정 하에 양자화된 모델을 미세 조정(fine-tuning)하는 데 초점을 맞추고 있습니다. 그러나 실제 상황에서는 데이터 보안과 프라이버시 문제로 인해 이 가정이 항상 만족되지 않기 때문에 이러한 양자화 방법들이 적용될 수 없는 경우가 많습니다.훈련 데이터에 접근하지 않고 제로샷(zero-shot) 양자화를 달성하기 위해 일부 양자화 방법들은 사후 훈련 양자화(post-training quantization) 또는 배치 정규화 통계량을 활용한 데이터 생성(batch normalization statistics-guided data generation)을 채택합니다. 그러나 이들 모두 성능 저하를 피할 수 없는데, 전자는 경험적(empirical)인 면이 강하고 초저정밀도 양자화에 대한 훈련 지원이 부족하며, 후자는 원래 데이터의 특성을 완전히 복원하지 못하고 다양한 데이터 생성에서 효율성이 낮기 때문입니다.위와 같은 문제들을 해결하기 위해 우리는 제로샷 적대적 양자화(Zero-Shot Adversarial Quantization, ZAQ) 프레임워크를 제안합니다. 이 프레임워크는 전체 정밀도 모델에서 그 양자화된 모델로 효과적인 차이 추정(discrepancy estimation)과 지식 전달(knowledge transfer)을 촉진합니다. 이를 위해서는 새로운 두 단계 차이 모델링(two-level discrepancy modeling)을 통해 생성기를 구동하여 정보가 풍부하고 다양한 데이터 예제를 합성하여 적대적 학습 방식으로 양자화된 모델을 최적화하는 것이 필요합니다. 우리는 세 가지 기본 시각 작업에서 광범위한 실험을 수행하여 ZAQ의 우수성을 강력한 제로샷 베이스라인들과 비교하며 주요 구성 요소들의 유효성을 검증하였습니다. 코드는 https://git.io/Jqc0y에서 제공됩니다.

Zero-shot Adversarial Quantization 제로샷 적대적 양자화 | 최신 연구 논문 | HyperAI초신경