非同一多タスク学習のための分布マッチング:大規模顔研究

マルチタスク学習(Multi-Task Learning: MTL)は、複数のタスクを共有の学習アルゴリズム(例えば、深層ニューラルネットワーク(DNN))によって共同で学習する手法として注目を集めています。MTLは、考慮されるタスクが関連しているという前提に基づいており、共有知識を利用して各個別のタスクの性能向上を図ります。一般的に、これらのタスクは均質であるとみなされ、つまり同じ種類の問題に関連すると考えられます。さらに、MTLは通常、タスク間で完全または部分的に重なる真実データ(ground truth annotations)に基づいています。本研究では、検出、分類、回帰問題を同時に扱う異種MTL(heterogeneous MTL)に取り組んでいます。私たちは、弱教師あり方式で少量または全く重複しないアノテーションを持つタスク間での共通訓練のために、タスク関連性を手段として利用しています。タスク関連性は、事前の専門家の知識を通じて明示的に導入されるか、データ駆動型の研究を通じて導入されます。私たちは新たな分布マッチングアプローチを提案し、このアプローチにより予測分布のマッチングを通じてタスク間での知識交換が可能になります。このアプローチに基づき、「FaceBehaviorNet」を開発しました。これは大規模な顔解析を行う最初のフレームワークであり、すべての顔行動タスクを共同で学習します。「FaceBehaviorNet」では以下のケーススタディを開発しています:i) 連続感情推定、アクションユニット検出、基本的な感情認識;ii) 属性検出、顔識別。私たちは実験結果から示していますが、タスク関連性を通じた共通訓練はネガティブトランスファーを緩和します。「FaceBehaviorNet」が顔行動のあらゆる側面を包含する特徴を学習するため、化合物感情認識などの未訓練のタスクについてもゼロショット/ファーウショット学習を行いました。10つのデータベースを利用した非常に大規模な実験研究により、「FaceBehaviorNet」アプローチがすべてのタスクおよびデータベースにおいて大幅に最新技術(state-of-the-art)を超えることを示しています。特にその中には訓練に使用されていないデータベースも含まれています。