
摘要
我们将BERT应用于共指消解任务,在OntoNotes(+3.9 F1)和GAP(+11.5 F1)基准测试中取得了显著的性能提升。对模型预测结果的定性分析表明,与ELMo和BERT-base相比,BERT-large在区分相关但不同的实体方面表现尤为出色(例如,总统和首席执行官)。然而,在建模文档级上下文、对话以及提及同义表述方面仍有改进空间。我们的代码和模型已公开发布。
我们将BERT应用于共指消解任务,在OntoNotes(+3.9 F1)和GAP(+11.5 F1)基准测试中取得了显著的性能提升。对模型预测结果的定性分析表明,与ELMo和BERT-base相比,BERT-large在区分相关但不同的实体方面表现尤为出色(例如,总统和首席执行官)。然而,在建模文档级上下文、对话以及提及同义表述方面仍有改进空间。我们的代码和模型已公开发布。