15日前
LumiNet:知覚的知識蒸留の明るい側面
Md. Ismail Hossain, M M Lutfe Elahi, Sameera Ramasinghe, Ali Cheraghian, Fuad Rahman, Nabeel Mohammed, Shafin Rahman

要約
知識蒸留(knowledge distillation)の分野において、特徴量ベースの手法は、教師モデルの豊富な表現能力を効果的に活用できる点から、長らく主流を占めてきた。これに対し、教師モデルから「ダーク知識(dark knowledge)」を蒸留することを目的とするロジットベースのアプローチは、通常、特徴量ベースの手法に比べて性能が劣ることが多い。このギャップを埋めるために、本研究ではロジットベースの知識蒸留を強化するための新規アルゴリズムであるLumiNetを提案する。我々は「知覚(perception)」という新しい概念を導入し、モデルの表現能力に基づいてロジットを補正することを目指す。この概念により、ロジットベースの蒸留手法における過信(overconfidence)問題を緩和するとともに、教師モデルから知識を蒸留するための新たな手法を実現する。具体的には、バッチ内の他のサンプルとの関係性を考慮して、各サンプルのロジットを再構成する。LumiNetはCIFAR-100、ImageNet、MSCOCOなどの標準ベンチマークにおいて優れた性能を発揮し、最先端の特徴量ベースの手法を上回っている。例えば、ImageNetにおいてResNet18およびMobileNetV2を用いたKDと比較した場合、それぞれ1.5%および2.05%の性能向上を達成している。