تواريخ الوثائق باستخدام شبكات التجميع الرسمية

التاريخ الوثائقي ضروري لمهام عديدة مهمة، مثل استرجاع الوثائق، وإعداد الملخصات، ورصد الأحداث وغيرها. بينما تفترض الطرق الحالية لهذه المهام معرفة دقيقة بالتاريخ الوثائقي، إلا أن هذا التاريخ ليس دائماً متوفراً، خاصة بالنسبة للوثائق العشوائية من الإنترنت. يعد تحديد تاريخ الوثيقة مشكلة معقدة تتطلب الاستدلال على البنية الزمنية للوثيقة. اعتمدت الأنظمة السابقة لتحديد تاريخ الوثيقة بشكل كبير على الخصائص المصممة يدوياً بينما تجاهلت هذه الهياكل الداخلية للوثيقة. في هذا البحث، نقترح نظام NeuralDater (نيورال ديتير)، وهو نهج لتحديد تاريخ الوثيقة يستند إلى شبكات التجميع الرسومية (Graph Convolutional Network - GCN) ويستغل بشكل متكامل الهياكل النحوية والزمنية للوثيقة بطريقة منهجية. حسب علمنا، تعد هذه أول تطبيق للتعلم العميق لمشكلة تحديد تاريخ الوثيقة. من خلال التجارب الشاملة على مجموعات بيانات حقيقية، وجدنا أن نظام NeuralDater يتفوق بشكل كبير على أفضل الطرق التقليدية بـ 19 نقطة مطلقة (45% نسبة نسبية) من الدقة.