8日前

ナップサックプルーニングによる内部蒸留

Yonathan Aflalo, Asaf Noy, Ming Lin, Itamar Friedman, Lihi Zelnik
ナップサックプルーニングによる内部蒸留
要約

ニューラルネットワークの構造削減(プリンティング)は、過剰パラメータ化されたネットワークの計算コストを低減し、効率性を向上させる手法である。代表的な手法には、ℓ₁ノルムに基づくスパース化やニューラルアーキテクチャサーチ(NAS)がある。本研究では、削減後のネットワークの最終的な精度を最適化するとともに、過剰パラメータ化された親ネットワークの内部層から知識を抽出する新たなプリンティング手法を提案する。このアプローチを実現するため、ニューロンの重要度とその関連する計算コストとのトレードオフを最適化するという観点から、ネットワークプリンティングをナップサック問題(Knapsack Problem)として定式化した。その後、ネットワークの高レベルな構造を維持しつつ、チャネル単位でネットワークを削減する。削減後のネットワークは、親ネットワークの内部層から得られる知識を用いて、教師付きの微調整(fine-tuning)を行う。この技術を「内部知識蒸留(Inner Knowledge Distillation)」と呼ぶ。本手法は、ResNetをバックボーンとして用いたImageNet、CIFAR-10、CIFAR-100において、最先端のプリンティング性能を達成した。特に、スキップリンクを有する畳み込み層やディープワイズ畳み込み層といった複雑なネットワーク構造を対象とする場合、ブロックグループ化(block grouping)アプローチを提案し、これらの構造に対応可能とした。これにより、EfficientNet-B0およびMobileNetV3と同等のFLOPs(演算量)で、ImageNetにおいてそれぞれ1%および0.3%の精度向上を達成するとともに、GPU上での実行速度も向上させた。

ナップサックプルーニングによる内部蒸留 | 最新論文 | HyperAI超神経