7 个月前

摘要

我们将BERT应用于共指消解任务，在OntoNotes（+3.9 F1）和GAP（+11.5 F1）基准测试中取得了显著的性能提升。对模型预测结果的定性分析表明，与ELMo和BERT-base相比，BERT-large在区分相关但不同的实体方面表现尤为出色（例如，总统和首席执行官）。然而，在建模文档级上下文、对话以及提及同义表述方面仍有改进空间。我们的代码和模型已公开发布。

源 PDF