11日前
HPTQ:ハードウェアフレンドリーなトレーニング後量子化
Hai Victor Habi, Reuven Peretz, Elad Cohen, Lior Dikstein, Oranit Dror, Idit Diamant, Roy H. Jennings, Arnon Netzer

要約
ニューラルネットワークの量子化は、エッジデバイス上でのモデル実装を可能にする。そのハードウェア効率を高めるために不可欠な要件として、量子化器がハードウェアに優しい特性を持つことが求められる。具体的には、均一性、対称性、および2のべき乗のしきい値を持つことが挙げられる。現状の事後訓練量子化(post-training quantization)手法について、本研究者の知る限りでは、これらの制約を同時に満たすものは存在しない。本研究では、複数の既知の量子化手法を連携して活用することで、この課題を解決するハードウェアに優しい事後訓練量子化(HPTQ)フレームワークを提案する。我々は、さまざまなネットワークアーキテクチャを対象に、分類、物体検出、セマンティックセグメンテーション、姿勢推定の4つのタスクにおいて大規模な実験を実施した。広範な実験結果から、ハードウェアに優しい制約のもとでも競争力のある性能が達成可能であることが明らかになった。