17 天前

mgsohrab 在 WNUT 2020 共享任务1中的工作:基于神经网络的全面方法用于湿实验协议中的实体与关系识别

{Hiroya Takamura, Makoto Miwa, Anh-Khoa Duong Nguyen, Mohammad Golam Sohrab}
mgsohrab 在 WNUT 2020 共享任务1中的工作:基于神经网络的全面方法用于湿实验协议中的实体与关系识别
摘要

我们提出了一种基于神经网络的穷举式方法,用于解决湿实验协议共享任务中的命名实体识别(NER)与关系识别(RE)问题。该方法采用基于BERT的神经网络框架,将所有可能的文本片段(span)作为潜在的实体提及项,并通过深度神经网络对这些片段进行分类,判断其所属的实体类型或是否为非实体,从而完成命名实体识别任务。在关系抽取任务中,基于NER的预测结果或提供的真实标注实体提及,我们构建所有可能的触发词-论元对(trigger-argument pairs),并利用分类模型将其划分为具体的关系类型或“无关系”类别。在命名实体识别任务中,我们的系统在所有参赛系统中位列第三,F-score达到76.60%。在关系抽取任务中,我们以80.46%的F-score位居第一,成为该任务中的最优系统。此外,我们还将基于湿实验协议语料库(Wet-Lab Protocols Corpus, WLPC)构建的模型与WLPC基准模型以及基于动态图的信息抽取系统(Dynamic Graph-based Information Extraction, DyGIE)进行了对比分析。