6 个月前

自然语言处理

多任务学习

自然语言处理

Wenxuan Zhou Muhao Chen

摘要

近年来的信息抽取方法主要依赖于深度神经网络模型的训练。然而，这类模型容易对噪声标签产生过拟合，导致性能下降。尽管在大规模学习资源中过滤噪声标签成本高昂，但近期研究表明，噪声标签相较于干净标签需要更多的训练步数才能被记忆，且更容易被遗忘，因此在训练过程中具有可识别性。基于这一特性，我们提出了一种面向实体中心信息抽取的简单协同正则化框架。该框架由多个结构相同但参数初始化不同的神经网络模型组成，这些模型在任务特定损失函数下联合优化，并通过一种基于一致性的正则化损失进行约束，促使各模型生成相似的预测结果，从而有效防止对噪声标签的过拟合。在两个广泛使用但存在噪声的信息抽取基准数据集——TACRED 和 CoNLL03 上的大量实验表明，所提框架具有显著有效性。我们已将代码开源，以支持后续研究工作。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

多任务学习

自然语言处理

Wenxuan Zhou Muhao Chen

摘要

近年来的信息抽取方法主要依赖于深度神经网络模型的训练。然而，这类模型容易对噪声标签产生过拟合，导致性能下降。尽管在大规模学习资源中过滤噪声标签成本高昂，但近期研究表明，噪声标签相较于干净标签需要更多的训练步数才能被记忆，且更容易被遗忘，因此在训练过程中具有可识别性。基于这一特性，我们提出了一种面向实体中心信息抽取的简单协同正则化框架。该框架由多个结构相同但参数初始化不同的神经网络模型组成，这些模型在任务特定损失函数下联合优化，并通过一种基于一致性的正则化损失进行约束，促使各模型生成相似的预测结果，从而有效防止对噪声标签的过拟合。在两个广泛使用但存在噪声的信息抽取基准数据集——TACRED 和 CoNLL03 上的大量实验表明，所提框架具有显著有效性。我们已将代码开源，以支持后续研究工作。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供