16日前

非常に大規模な顔認識のための効率的な訓練アプローチ

Kai Wang, Shuo Wang, Panpan Zhang, Zhipeng Zhou, Zheng Zhu, Xiaobo Wang, Xiaojiang Peng, Baigui Sun, Hao Li, Yang You
非常に大規模な顔認識のための効率的な訓練アプローチ
要約

深層学習時代において、超大規模かつ高品質にラベル付けされたデータセットの活用により、顔認識技術は顕著な進展を遂げてきた。しかし、膨大な規模のデータセットを用いた学習は時間とハードウェアリソースを大量に消費するという課題を抱えており、効率的な学習アプローチの設計が不可欠となっている。この課題の主な要因は、全結合(Fully Connected: FC)層が数百万次元に達する高次元性に起因する計算量およびメモリ消費の増大である。こうした問題に対応するため、本研究では、性能を損なわずに学習時間とコストを軽減する新たな学習手法「Faster Face Classification(F2C)」を提案する。本手法は、顔の識別子特徴を動的に保存・更新可能な「動的クラスプール(Dynamic Class Pool: DCP)」を導入し、FC層の代替として機能させる。DCPは、全顔識別子の集合に依存しない独立した構造であり、そのサイズが小さく、計算およびメモリコストの削減が効果的に実現できる。さらに、複数の顔認識ベンチマークおよびプライベートデータセットを用いた実験により、F2C手法の有効性を検証した結果、従来の最先端のFCベース手法と比較して、同等以上の認識精度を維持しつつ、処理速度の面で顕著な高速化が達成された。また、識別子ベースとインスタンスベースの両方のデータローダーを組み合わせた効果的な二重データローダーの設計により、DCPパラメータの更新効率がさらに向上し、全体的な学習効率が強化された。

非常に大規模な顔認識のための効率的な訓練アプローチ | 最新論文 | HyperAI超神経