
摘要
基于深层模型并使用大量标注样本进行训练可以提高许多任务的准确性。将这些模型应用于不同领域非常重要,因为收集各种领域的大量标注样本成本高昂。在无监督领域适应中,当提供有标注的源样本和未标注的目标样本时,需要训练一个在目标域上表现良好的分类器。尽管许多方法旨在匹配源样本和目标样本的分布,但仅仅匹配分布并不能保证在目标域上的准确性。为了学习目标域的判别表示,我们假设对目标样本进行人工标注可以产生良好的表示。三重训练(Tri-training)利用三个分类器同等对待未标注样本以赋予伪标签,但该方法并不假设这些样本来自不同的领域。在本文中,我们提出了一种用于无监督领域适应的非对称三重训练方法,其中我们将伪标签分配给未标注样本,并像对待真实标签一样训练神经网络。在我们的工作中,我们非对称地使用了三个网络,具体来说,两个网络用于为未标注的目标样本赋标签,而一个网络则通过这些样本来获得目标判别表示。我们在数字识别和情感分析数据集上评估了我们的方法。实验结果表明,我们提出的方法在领域适应的标准数字识别数据集上达到了最先进的性能。