2 个月前
使用图卷积网络对文档进行定年
Shikhar Vashishth; Shib Sankar Dasgupta; Swayambhu Nath Ray; Partha Talukdar

摘要
文档日期对于许多重要任务至关重要,例如文档检索、摘要生成、事件检测等。现有的这些任务的方法通常假设对文档日期有准确的了解,但在实际应用中,尤其是针对来自互联网的任意文档时,这种假设并不总是成立。文档定年是一个具有挑战性的问题,需要对文档的时间结构进行推理。以往的文档定年系统大多依赖于手工设计的特征,而忽略了文档内部结构。本文提出了一种基于图卷积网络(GCN)的文档定年方法——NeuralDater,该方法以一种系统的方式同时利用了文档的句法和时间图结构。据我们所知,这是首次将深度学习应用于文档定年问题。通过在真实世界数据集上的大量实验,我们发现NeuralDater在绝对准确率上比最先进的基线方法提高了19个百分点(相对准确率提高了45个百分点)。