
要約
大規模なラベル付きサンプルで訓練された深層モデルは、多くのタスクの精度を向上させます。さまざまなドメインにこれらのモデルを適用することが重要である理由は、多様なドメインで大量のラベル付きサンプルを集めることが費用がかかるからです。非監督ドメイン適応では、ラベル付きのソースサンプルとラベルなしのターゲットサンプルが提供されたときに、ターゲットドメインで良好に動作する分類器を訓練する必要があります。多くの手法がソースとターゲットサンプルの分布を一致させる目的を持っていますが、単純に分布を一致させることはターゲットドメインでの精度を保証できません。ターゲットドメインに対して判別的な表現を学習するために、人工的にターゲットサンプルにラベルを付けることで良い表現を得られるという仮定を行います。トライトレーニングは、3つの分類器を使用して未ラベルサンプルに疑似ラベルを与える方法ですが、異なるドメインから生成されたサンプルにラベル付けを行うことを前提としていません。本論文では、非監督ドメイン適応向けの非対称トライトレーニング手法を提案します。この手法では、未ラベルサンプルに疑似ラベルを割り当て、それらが真のラベルであるかのようにニューラルネットワークを訓練します。私たちの研究では、3つのネットワークを非対称的に使用します。具体的には、2つのネットワークを使用して未ラベルのターゲットサンプルにラベル付けを行い、1つのネットワークはこれらのサンプルによって訓練され、ターゲット判別的な表現を得ることを目指します。私たちはデジタル認識と感情分析データセットで提案手法の評価を行いました。結果として、提案手法はドメイン適応におけるベンチマークデジタル認識データセットで最先端の性能を達成しました。