18 天前

面向文档级关系抽取的自适应铰链平衡损失

{Cailian Chen, Xiaodi Peng, Xinyi Le, Jize Wang}
面向文档级关系抽取的自适应铰链平衡损失
摘要

文档级关系抽取旨在从多句文本中预测实体之间的关系。一种常见的做法是通过设定多标签分类的阈值来判断实体对之间是否存在关系。然而,在文档级任务中,绝大多数实体对实际上并不存在关系,导致正负样本之间存在严重的类别不平衡问题。我们认为,这种不平衡会影响阈值的选择,进而可能导致错误的“无关系”预测。为此,本文提出通过利用分类阈值与每个关系预测得分之间的距离,对容易的负样本进行降权处理。我们提出的新型自适应铰链平衡损失(Adaptive Hinge Balance Loss)基于该距离度量每类关系的难易程度,从而更加关注那些难以分类的、被错误预测的关系,即少数类的正样本关系。在 Re-DocRED 数据集上的实验结果表明,该方法在平衡策略方面优于其他现有方法。源代码已开源,地址为:https://github.com/Jize-W/HingeABL。