HyperAIHyperAI

Command Palette

Search for a command to run...

基于噪声标签的实体中心信息抽取

Wenxuan Zhou Muhao Chen

摘要

近年来的信息抽取方法主要依赖于深度神经网络模型的训练。然而,这类模型容易对噪声标签产生过拟合,导致性能下降。尽管在大规模学习资源中过滤噪声标签成本高昂,但近期研究表明,噪声标签相较于干净标签需要更多的训练步数才能被记忆,且更容易被遗忘,因此在训练过程中具有可识别性。基于这一特性,我们提出了一种面向实体中心信息抽取的简单协同正则化框架。该框架由多个结构相同但参数初始化不同的神经网络模型组成,这些模型在任务特定损失函数下联合优化,并通过一种基于一致性的正则化损失进行约束,促使各模型生成相似的预测结果,从而有效防止对噪声标签的过拟合。在两个广泛使用但存在噪声的信息抽取基准数据集——TACRED 和 CoNLL03 上的大量实验表明,所提框架具有显著有效性。我们已将代码开源,以支持后续研究工作。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供