7 个月前

自然语言处理

自然语言处理

Gaurav Bhatt Aman Sharma Shivam Sharma Ankush Nagpal Balasubramanian Raman Ankush Mittal

摘要

识别新闻文章的真实性是一个有趣的问题，而自动化这一过程则是一项具有挑战性的任务。检测新闻文章是否为假新闻仍然是一个开放性问题，因为这取决于许多当前最先进模型未能涵盖的因素。在本文中，我们探讨了假新闻识别的一个子任务，即立场检测。给定一篇新闻文章，任务是确定正文与其声明的相关性。我们提出了一种新颖的方法，该方法结合了神经网络、统计学和外部特征，以提供对此问题的有效解决方案。我们从深度递归模型中计算神经嵌入（neural embedding），从加权n-gram词袋模型中提取统计特征，并通过特征工程启发式方法构建外部特征。最后，通过深度神经层将所有这些特征结合起来，从而将标题-正文新闻对分类为同意、不同意、讨论或无关。我们将所提出的这种方法与当前最先进的模型在假新闻挑战数据集上进行了比较。通过广泛的实验，我们发现所提出的模型优于所有最先进的技术，包括假新闻挑战赛中的提交作品。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

自然语言处理

自然语言处理

Gaurav Bhatt Aman Sharma Shivam Sharma Ankush Nagpal Balasubramanian Raman Ankush Mittal

摘要

识别新闻文章的真实性是一个有趣的问题，而自动化这一过程则是一项具有挑战性的任务。检测新闻文章是否为假新闻仍然是一个开放性问题，因为这取决于许多当前最先进模型未能涵盖的因素。在本文中，我们探讨了假新闻识别的一个子任务，即立场检测。给定一篇新闻文章，任务是确定正文与其声明的相关性。我们提出了一种新颖的方法，该方法结合了神经网络、统计学和外部特征，以提供对此问题的有效解决方案。我们从深度递归模型中计算神经嵌入（neural embedding），从加权n-gram词袋模型中提取统计特征，并通过特征工程启发式方法构建外部特征。最后，通过深度神经层将所有这些特征结合起来，从而将标题-正文新闻对分类为同意、不同意、讨论或无关。我们将所提出的这种方法与当前最先进的模型在假新闻挑战数据集上进行了比较。通过广泛的实验，我们发现所提出的模型优于所有最先进的技术，包括假新闻挑战赛中的提交作品。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供