2ヶ月前
事前学習の戦略とデータセットについての顔表現学習
Bulat, Adrian ; Cheng, Shiyang ; Yang, Jing ; Garbett, Andrew ; Sanchez, Enrique ; Tzimiropoulos, Georgios

要約
普遍的な顔表現を学習する最良の方法は何か?顔分析分野における最近の深層学習の研究は、特定のタスク(例:顔認識、顔ランドマークの局所化など)に焦点を当てた教師あり学習に重点を置いていますが、複数の顔分析タスクやデータセットに容易に適応できる顔表現を見つけるという全体的な問いには注目が払われていませんでした。この目的のために、以下の4つの貢献を行いました:(a) 初めて、5つの重要な顔分析タスクから構成される包括的な評価ベンチマークを導入しました。(b) 大規模な表現学習の2つの手法、すなわち教師あり事前学習と教師なし事前学習を系統的に調査しました。特に、少量ショット(few-shot)での顔学習の場合に焦点を当てて評価を行いました。(c) 学習データセットの重要な特性であるサイズや品質(ラベル付き、ラベルなし、または未整理)について調査しました。(d) 結論を導き出すために、非常に多数の実験を行いました。主な2つの知見は以下の通りです:(1) 完全に野生で未整理されたデータに対する教師なし事前学習は、考慮したすべての顔タスクにおいて一貫性があり、場合によっては有意な精度向上をもたらします。(2) 既存の多くの顔ビデオデータセットには大量の冗長性があるようです。今後の研究を促進するために、コードおよび事前学習済みモデルを公開します。