HyperAIHyperAI
منذ 2 أشهر

Doc2EDAG: إطار شامل من البداية إلى النهاية لاستخراج الأحداث المالية على مستوى الوثيقة باللغة الصينية

Shun Zheng; Wei Cao; Wei Xu; Jiang Bian
Doc2EDAG: إطار شامل من البداية إلى النهاية لاستخراج الأحداث المالية على مستوى الوثيقة باللغة الصينية
الملخص

معظم الطرق الحالية لاستخراج الأحداث (EE) تقتصر على استخراج حجج الأحداث ضمن نطاق الجملة. ومع ذلك، فإن هذه الطرق المستندة إلى مستوى الجملة تجد صعوبة في التعامل مع الكميات المتزايدة من الوثائق الناتجة عن التطبيقات الناشئة مثل المالية والتشريعية والصحية وغيرها، حيث تتفرق حجج الأحداث عبر جمل مختلفة، وحتى وجود ذكريات متعددة للأحداث نفسها يُشاع في نفس الوثيقة. لمعالجة هذه التحديات، نقترح نموذجاً جديداً متكاملاً يُسمى Doc2EDAG، والذي يمكنه إنشاء رسم بياني غير دوري موجه مستند إلى الكيانات لتحقيق استخراج الأحداث على مستوى الوثيقة (DEE) بكفاءة. علاوة على ذلك، قمنا بإعادة صياغة مهمة DEE باستخدام تصميم بدون كلمات تحفيزية لتخفيف عملية وضع العلامات للأحداث على مستوى الوثيقة. لإظهار فعالية Doc2EDAG، قمنا ببناء مجموعة بيانات واقعية كبيرة تتكون من الإعلانات المالية الصينية التي تحتوي على التحديات المذكورة أعلاه. توضح التجارب الواسعة مع التحليلات الشاملة تفوق Doc2EDAG على أفضل الطرق الحالية. يمكن الوصول إلى البيانات والرموز البرمجية من خلال الرابط: https://github.com/dolphin-zs/Doc2EDAG.

Doc2EDAG: إطار شامل من البداية إلى النهاية لاستخراج الأحداث المالية على مستوى الوثيقة باللغة الصينية | أحدث الأوراق البحثية | HyperAI