摘要
虚假新闻与错误信息的传播正对社会造成严重危害,部分原因在于越来越多的人仅阅读新闻标题或摘要,便默认其内容完全可信,而缺乏对信息是否存在扭曲或虚假的审慎分析。具体而言,一则设计得当的新闻标题应准确对应该新闻主要内容的概括。然而,这一原则常常未能实现,因为各类利益驱动——如提升点击量或政治动机——可能导致标题与新闻正文内容脱节,偏离其本应承担的传达核心信息的功能。本文研究了利用自动新闻摘要技术,判断新闻标题相对于其正文内容所持立场(即立场分类)的方法。为此,我们提出一种两阶段方法:将摘要技术生成的摘要内容作为分类器的输入,而非使用新闻正文的完整文本,从而在显著减少需处理信息量的同时,保留关键信息。实验基于Fake News Challenge FNC-1数据集开展,取得了94.13%的准确率,超越了现有最先进水平。尤为突出的是,所提出的方案仅依赖自动提取式摘要所提供的相关核心信息,而非全文内容,仍能实现极具竞争力的立场分类效果。这表明,自动抽取式摘要在判断极短文本(如标题或单句)与其完整内容之间立场关系方面具有积极影响,为高效、精准的虚假信息识别提供了有力支持。