HyperAIHyperAI
منذ 2 أشهر

حدث нарратив: مجموعة بيانات كبيرة متمحورة حول الحدث لتقديم النص من الرسم البياني للمعرفة

Anthony Colas; Ali Sadeghian; Yue Wang; Daisy Zhe Wang
حدث нарратив: مجموعة بيانات كبيرة متمحورة حول الحدث لتقديم النص من الرسم البياني للمعرفة
الملخص

نقدم EventNarrative، وهو مجموعة بيانات تحويل الرسوم المعرفية إلى النص من رسوم معرفية عامة متاحة للجميع في العالم المفتوح. بالنظر إلى التطورات الحديثة في استخراج المعلومات القائمة على الأحداث (IE)، وإلى أن البحوث السابقة في مجال تحويل الرسوم المعرفية إلى النص ركزت فقط على الرسوم المعرفية القائمة على الكيانات، فإن هذه الورقة تركز على البيانات القائمة على الأحداث. ومع ذلك، يمكن تعديل نظام إنشاء البيانات لدينا ليناسب أنواعًا أخرى من بيانات الرسوم المعرفية. تعتبر المجموعات الضخمة الحالية في مجال تحويل الرسوم المعرفية إلى النص غير متوازية، مما يعني وجود فجوة كبيرة بين الرسوم المعرفية والنصوص. أما المجموعات التي تحتوي على رسوم معرفية ونصوص متوازية فهي صغيرة الحجم ومُنشأة يدويًا أو دون استخدام تصنيف غني، مما يجعل الرسوم المرتبطة بها نادرة. بالإضافة إلى ذلك، تحتوي هذه المجموعات على العديد من الكيانات غير المرتبطة بين أزواج الرسوم المعرفية والنصوص. يتكون EventNarrative من حوالي 230,000 رسم معرفي ونصوص اللغة الطبيعية المرتبطة بهم، وهو أكبر بست مرات من أكبر مجموعة بيانات متوازية حاليًا. يستخدم هذا النظام تصنيفًا غنيًا، ويتم ربط جميع كيانات الرسوم المعرفية بالنصوص، وقد أكدت شهاداتنا اليدوية جودة عالية للبيانات. هدفنا هو ذو طياتين: المساعدة في فتح آفاق جديدة في البحث القائم على الأحداث حيث يفتقر الأمر إلى البيانات، وتوفير مجموعة بيانات ضخمة ومحددة بشكل جيد للمبحوثين لكي يتمكنوا من تقييم أفضل للنماذج الحالية والمستقبلية لتحويل الرسوم المعرفية إلى النص. كما قمنا بتقييم نوعين من النماذج الأساسية على EventNarrative: نموذج خاص بتحويل الرسوم المعرفية إلى النص ونماذج لغوية متقدمة حديثًا اثنتان، والتي أظهرت الأعمال السابقة أنها قابلة للتكيف مع مجال تحويل الرسوم المعرفية إلى النص.

حدث нарратив: مجموعة بيانات كبيرة متمحورة حول الحدث لتقديم النص من الرسم البياني للمعرفة | أحدث الأوراق البحثية | HyperAI