9日前
部分FC:単一のマシン上で1000万のアイデンティティを訓練する
Xiang An, Xuhan Zhu, Yang Xiao, Lan Wu, Ming Zhang, Yuan Gao, Bin Qin, Debing Zhang, Ying Fu

要約
顔認識は長年にわたり、コンピュータビジョン分野において活発かつ重要な研究テーマの一つである。これまでの研究は、顔特徴抽出ネットワークに用いられる損失関数に主眼を置いてきた。その中でも、Softmaxに基づく損失関数の改良は、顔認識の性能向上に大きく寄与してきた。しかし、顔の識別者数が急激に増加する一方でGPUメモリの制約が顕在化しており、この二つの間の矛盾はますます解消が困難な状況にまで至っている。本論文では、Softmaxに基づく損失関数の最適化目標と、大規模な識別者数に対する学習の難しさについて徹底的に分析する。その結果、顔表現学習におけるSoftmax関数における負例クラスの重要性は、従来考えられていたほどではないことが明らかになった。実験の結果、主流のベンチマーク上で最先端モデルを用いた場合、Softmaxに基づく損失関数を用いて全クラスで学習する場合と比較して、ランダムに10%のクラスをサンプリングして学習しても、精度の低下が見られなかった。さらに、モデルの精度と学習効率を両立させる高効率な分散サンプリングアルゴリズムを実装しており、わずか8台のNVIDIA RTX 2080 Tiを用いて、数千万クラスに及ぶ分類タスクを完了することが可能となった。本論文のコードは、以下のURLで公開されている:https://github.com/deepinsight/insightface/tree/master/recognition/partial_fc。