2 个月前

俄罗斯立场预测:数据与分析

Nikita Lozhnikov; Leon Derczynski; Manuel Mazzara
俄罗斯立场预测:数据与分析
摘要

立场检测是谣言和假新闻识别的关键组成部分。它涉及从文本中提取特定作者对某一给定主张所持的立场。本文研究了俄语的立场分类问题,介绍了一个新的数据集——RuStance,该数据集包含了来自多个来源的俄语推特和新闻评论,覆盖了多个故事。此外,本文还提出了针对这一语言的数据集进行立场检测的文本分类方法作为基准。除了呈现这个公开可用的数据集(这是俄语领域的首个此类数据集),本文还为俄语的立场预测提供了一个基线模型。