2ヶ月前
グラフ畳み込みネットワークを用いた文書の年代測定
Shikhar Vashishth; Shib Sankar Dasgupta; Swayambhu Nath Ray; Partha Talukdar

要約
ドキュメントの日付は、ドキュメント検索、要約作成、イベント検出などの多くの重要なタスクにおいて不可欠です。これらのタスクに対する既存のアプローチでは、ドキュメントの日付が正確に知られていると仮定していますが、これは必ずしも利用可能ではなく、特にウェブ上の任意のドキュメントの場合にはそうなりません。ドキュメントDating(日付推定)は、ドキュメントの時間構造を推論する必要がある難問であり、従来のドキュメント日付推定システムは手作業で設計された特徴量に大きく依存しながら、このようなドキュメント内部構造を無視していました。本論文では、文法的および時間的なグラフ構造を原理的に統合して活用するGraph Convolutional Network(GCN)ベースの新しいドキュメント日付推定手法NeuralDaterを提案します。当該研究者らの知る限りでは、これは深層学習を用いた最初のドキュメント日付推定への応用例となります。実世界データセットを用いた広範な実験を通じて、NeuralDaterが最先端の基準モデルに対して絶対値で19%(相対値で45%)高い精度を達成することが確認されました。