11 天前

基于深度内容特征的波斯语谣言验证模型

{Arash Sharifi, Mohammad-Reza Feizi-Derakhshi, Zoleikha Jahanbakhsh-Nagadeh}
摘要

在社交媒体的发展过程中,社会沟通方式发生了显著转变。尽管社交媒体在人际互动和信息传播方面具有积极应用,但也为谣言的传播提供了理想平台。谣言在正常或危机情境下均可能对社会安全构成威胁。因此,尽早识别与验证谣言具有重要意义。现有研究多聚焦于社交网络中的社会属性以解决谣言检测与验证问题,而对内容特征的关注相对较少。然而,谣言的社会性与结构特征往往随时间演变,在传播初期尚不具备,难以利用。为此,本研究提出一种基于内容的模型,用于早期验证波斯语社交媒体平台(Twitter与Telegram)上的谣言。该模型充分揭示了内容特征在谣言传播中的关键作用,并通过融合语义、语用与句法信息,为每条谣言文本生成更为综合的表示。具体而言,该模型首先基于ParsBERT与并行CapsNets的混合架构,生成谣言文本的上下文词嵌入;随后提取谣言的语用与句法特征,并将其与嵌入表示拼接,以捕获更丰富的信息用于谣言验证。在真实数据集上的实验结果表明,所提出的模型在早期谣言验证任务中显著优于现有最先进模型。此外,该模型可使分类器在Twitter上的性能提升2%至11%,在Telegram上提升5%至23%。这些结果充分验证了该模型在内容信息有限情况下的有效性与优越性。

基于深度内容特征的波斯语谣言验证模型 | 最新论文 | HyperAI超神经