
摘要
代词消歧一直是自然语言理解中的一个长期挑战。最近的研究表明,最先进的共指消解系统中存在性别偏见问题。例如,谷歌AI语言团队最近发布了一个性别平衡的数据集,并展示了这些共指消解器在该数据集上的性能显著受限。本文提出了一种基于抽取式问答(QA)的代词消歧任务公式,克服了这一限制,并在他们的数据集上表现出更低的性别偏见(0.99)。该系统利用预训练的BERT模型进行微调表示,无需任何手工设计的特征,其F1分数相比现有基线模型有显著提升(绝对提升了22.2%)。即使在不知道代词候选先行词的情况下,该问答框架的表现依然出色。通过结合问答、基于BERT的多项选择和序列分类模型组成的集成模型,进一步提高了F1分数(相对于基线模型绝对提升了23.3%)。该集成模型已提交至首届ACL自然语言处理性别偏见研讨会的共享任务中,并在最终官方排行榜上排名第9位。源代码可在https://github.com/rakeshchada/corefqa 获取。