
摘要
在过去的几十年中,社交媒体的重要性显著提升,它使世界最偏远地区的人们也能保持联系。随着新冠疫情的持续蔓延,社交媒体的重要性前所未有地凸显,其使用范围也进一步扩大,与此同时,虚假新闻和误导性推文的传播也显著回升,亟需引起重视。本文介绍了我们参与“CONSTRAINT COVID19 英文虚假新闻检测挑战赛”所开发的虚假新闻检测系统,该系统能够自动识别与新冠疫情相关的推文是“真实”还是“虚假”。我们采用了一种基于预训练模型的集成学习方法,在排行榜上取得了综合第八名的成绩,F1分数达到0.9831,接近最高分0.9869。在竞赛结束后,我们通过引入一种基于用户名标识(username handles)和推文链接域名(link domains)的新型启发式算法,对系统进行了显著优化,F1分数提升至0.9883,达到了该数据集上的最先进水平。