6 个月前

自然语言处理

多任务学习

自然语言处理

Minbyul Jeong Jaewoo Kang

摘要

命名实体识别（Named Entity Recognition, NER）是生物医学文档信息提取中的基础任务。NER的一个显著优势在于其能够在文档上下文中保持对生物医学实体识别的一致性。尽管现有的文档级NER模型能够产生较为一致的预测结果，但仍未能完全满足实际需求。本文研究了实体内部的形容词和介词是否会导致标签一致性降低，从而引发预测不一致的问题。为此，我们提出了一种名为ConNER的新方法，通过增强修饰语（如形容词和介词）的标签依赖性，提升实体标签的一致性，从而实现更高的标签一致率。ConNER通过优化修饰语的初步标签，进一步改进生物医学实体的输出表示。我们在四个主流生物医学NER数据集上验证了该方法的有效性，尤其在两个数据集上取得了7.5%至8.6%的绝对F1分数提升。我们分析认为，ConNER在标签一致性本身较低的数据集上表现尤为显著。通过定性分析，我们展示了该方法如何促使NER模型生成更加一致的预测结果。相关代码与资源已公开，可访问 https://github.com/dmis-lab/ConNER/。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

多任务学习

自然语言处理

Minbyul Jeong Jaewoo Kang

摘要

命名实体识别（Named Entity Recognition, NER）是生物医学文档信息提取中的基础任务。NER的一个显著优势在于其能够在文档上下文中保持对生物医学实体识别的一致性。尽管现有的文档级NER模型能够产生较为一致的预测结果，但仍未能完全满足实际需求。本文研究了实体内部的形容词和介词是否会导致标签一致性降低，从而引发预测不一致的问题。为此，我们提出了一种名为ConNER的新方法，通过增强修饰语（如形容词和介词）的标签依赖性，提升实体标签的一致性，从而实现更高的标签一致率。ConNER通过优化修饰语的初步标签，进一步改进生物医学实体的输出表示。我们在四个主流生物医学NER数据集上验证了该方法的有效性，尤其在两个数据集上取得了7.5%至8.6%的绝对F1分数提升。我们分析认为，ConNER在标签一致性本身较低的数据集上表现尤为显著。通过定性分析，我们展示了该方法如何促使NER模型生成更加一致的预测结果。相关代码与资源已公开，可访问 https://github.com/dmis-lab/ConNER/。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供