2ヶ月前

クロスステッチネットワークを用いた多タスク学習

Ishan Misra; Abhinav Shrivastava; Abhinav Gupta; Martial Hebert
クロスステッチネットワークを用いた多タスク学習
要約

複数タスク学習(マルチタスク学習)は、認識分野において著しい成功を収めています。この成功は、複数の教師タスクから共有表現を学習することに大きく帰因します。しかし、既存のマルチタスクアプローチは、特定のタスクに特化した複数のネットワークアーキテクチャを列挙するものであり、汎化性がありません。本論文では、ConvNets(畳み込みニューラルネットワーク)でマルチタスク学習を使用して共有表現を学習するための原理的な手法を提案します。特に、「クロスステッチ」ユニットという新しい共有単位を提案します。これらのユニットは、複数のネットワークからの活性化を組み合わせることができ、エンドツーエンドで訓練可能です。「クロスステッチ」ユニットを持つネットワークは、共有表現とタスク固有表現の最適な組み合わせを学習することができます。我々が提案する手法は、複数のタスクに対して汎化し、訓練例が少ないカテゴリにおいてベースライン手法よりも劇的に性能が向上することが示されています。

クロスステッチネットワークを用いた多タスク学習 | 論文 | HyperAI超神経