17 天前
多智能体双学习
{Tie-Yan Liu, ChengXiang Zhai, Fei Tian, Yiren Wang, Tianyu He, Tao Qin, Yingce Xia}

摘要
双学习(Dual Learning)在机器学习、计算机视觉和自然语言处理等领域引起了广泛关注。其核心思想是利用原始任务(从域X到域Y的映射)与对偶任务(从域Y到X的映射)之间的对偶性,从而提升两个任务的性能表现。现有的双学习框架通常构建一个由两个智能体组成的系统,即一个原始模型和一个对偶模型,以利用这种对偶关系。本文在此基础上进行拓展,引入多个原始模型与对偶模型,提出了一种多智能体双学习框架。在神经机器翻译和图像翻译任务上的实验结果表明,该新框架具有显著的有效性。具体而言,我们在IWSLT 2014德语到英语翻译任务上取得了35.44的BLEU分数,创下新纪录;在WMT 2014英语到德语翻译任务上达到31.03的BLEU分数,相较于强大的Transformer基线模型提升了超过2.6个BLEU;并在最新的WMT 2018英语到德语翻译任务上,以49.61的BLEU分数再次刷新纪录。