7 天前
SEMI-FND:基于堆叠集成的多模态推理方法实现更快的虚假新闻检测
Prabhav Singh, Ridam Srivastava, K.P.S. Rana, Vineet Kumar

摘要
虚假新闻检测(Fake News Detection, FND)是自然语言处理领域中的一个重要研究方向,旨在识别并验证新闻文章中主要陈述的真实性,从而判断新闻的可信度。FND在防止因事实歪曲而引发的社会、政治及国家层面的损害方面具有重要意义,尤其当虚假信息可能对特定社会群体造成负面影响时。此外,随着社交媒体上虚假新闻的传播呈爆炸式增长,涵盖文本与图像等多种形式,快速且准确地识别虚假新闻已成为迫切需求。为应对这一挑战,本文提出一种新颖的多模态堆叠集成式虚假新闻检测方法(SEMIFND),该方法在保证高效性能的同时,力求减少模型参数量。为提升多模态融合效果,本文对图像模态进行了深入的单模态分析,最终确定NasNet Mobile为最适用于该任务的图像特征提取模型;对于文本模态,则采用BERT与ELECTRA的集成策略。该方法在两个公开数据集——Twitter MediaEval与Weibo语料库上进行了评估,分别取得了85.80%和86.83%的准确率。实验结果表明,所提出框架在性能上优于近期同类研究工作。此外,本文还报告了模型参数量的显著减少:相较于近期相关工作,SEMIFND整体参数量降低了至少20%,其中文本模态的参数压缩率高达60%。综上所述,基于本研究的实证分析,可得出结论:采用堆叠集成策略显著提升了虚假新闻检测的性能,同时兼顾了推理速度与模型轻量化,展现出良好的实际应用潜力。