1ヶ月前

深層適応ネットワークを用いた転移可能な特徴の学習

Mingsheng Long; Yue Cao; Jianmin Wang; Michael I. Jordan
深層適応ネットワークを用いた転移可能な特徴の学習
要約

最近の研究では、深層ニューラルネットワークが新しいタスクに適応するための転移可能な特徴を学習できること、そしてこれらの特徴がドメイン適応において良好な一般化性能を示すことが明らかになっています。しかし、深層特徴はネットワークの中で一般的なものから特定のものへと最終的に変化し、ドメイン間の差異が増大するにつれて上位層での特徴転移可能性が大幅に低下します。したがって、データセットバイアスを形式的に削減し、タスク固有の層における転移可能性を向上させることが重要です。本論文では、新たな深層適応ネットワーク(Deep Adaptation Network: DAN)アーキテクチャを提案します。DANは、深層畳み込みニューラルネットワークをドメイン適応のシナリオに一般化します。DANでは、すべてのタスク固有の層の隠れ表現が再生核ヒルベルト空間に埋め込まれます。この空間では、異なるドメイン分布の平均埋め込みを明示的に一致させることができます。さらに、最適な多核選択方法を使用して平均埋め込みの一貫性を高めることで、ドメイン間の差異を低減します。DANは統計的な保証のもとで転移可能な特徴を学習でき、無偏推定によるカーネル埋め込みにより線形スケーリングも可能です。広範な実験結果から、提案されたアーキテクチャは標準的なドメイン適応ベンチマークにおいて最先端の画像分類誤り率を達成することが示されています。