11 天前

多任务半监督学习在类别不平衡话语分类中的应用

{Lingjia Deng, Sz-Rung Shiang, Jonathan May, Alexander Spangher}
多任务半监督学习在类别不平衡话语分类中的应用
摘要

随着标注模式的不断演进,即使细微的差异也可能导致遵循旧标注模式的数据集变得无法使用。这阻碍了研究人员在已有标注工作基础上进一步开展研究,尤其在话语分析领域,导致大量规模较小且类别分布极不均衡的数据集长期存在。本文提出,通过多任务学习方法,可有效整合来自相似及不同领域的多个话语数据集,从而提升话语分类性能。在近期发布且规模较大的NewsDiscourse数据集上,我们的方法相较当前最优基准模型,Micro F1分数提升了4.9%,部分原因在于跨任务标签相关性的利用,显著改善了低频类别的分类表现。此外,本文还系统回顾了自然语言处理领域中针对资源匮乏问题提出的多种技术方案,并验证表明,在本研究设定下,现有各类方法均无法进一步提升分类准确率。

多任务半监督学习在类别不平衡话语分类中的应用 | 最新论文 | HyperAI超神经