2 个月前

利用事件特定特征和块跨度特征从推文中提取COVID事件

Ayush Kaushal; Tejas Vaidhya
利用事件特定特征和块跨度特征从推文中提取COVID事件
摘要

在灾难和疫情期间,尤其是新冠肺炎(COVID-19)期间,Twitter 一直是一个重要的信息来源。本文描述了我们参加 WNUT 2020 共享任务-3 的系统。该任务旨在自动化从 Twitter 中提取多种与 COVID-19 相关的事件,例如最近感染病毒的个人、出现症状但未获检测的人以及对抗感染的所谓“有效”疗法。系统由用于槽填充子任务和句子分类子任务的独立多任务模型组成,同时利用了对相应事件有用的句子级信息。系统使用 COVID-Twitter-Bert 并结合注意力加权池化的候选槽块特征来捕捉有用的信息片段。该系统在排行榜上排名第一,F1 分数为 0.6598,且未使用任何集成方法或额外数据集。代码和训练好的模型可在以下 https 链接获取。注释:- “槽填充”(slot-filling)是指在自然语言处理中的一种任务类型,用于识别并提取特定类型的实体或信息。- “句子分类”(sentence-classification)是指根据句子的内容将其归类到预定义的类别中的任务。- “注意力加权池化”(attention-weighted pooling)是一种通过赋予不同部分不同权重来提取关键信息的技术。- “槽块特征”(slot-chunk features)是指用于槽填充任务的局部特征或信息片段。