
摘要
虚拟对抗训练(Virtual Adversarial Training, VAT)是一种在监督学习和半监督学习设置下提升模型鲁棒性的强大技术,具有良好的有效性,并可广泛应用于多种图像分类与文本分类任务。然而,其在序列标注任务(如命名实体识别,NER)中的优势尚未得到充分展现,主要原因在于以往方法难以将VAT与条件随机场(Conditional Random Field, CRF)相结合。CRF通过施加标签转移约束,显著提升序列模型的准确率,因此已成为绝大多数先进序列标注模型架构中的核心组件。本文提出SeqVAT,一种可自然地将VAT应用于带有CRF的序列标注模型的方法。实验结果表明,SeqVAT在监督学习设置下显著优于基线模型,在半监督学习设置下也超越了当前最先进的方法。