مجموعة بيانات لاستخراج العلاقات الفائقة ونهج ملء المكعب

استخراج العلاقات له إمكانات في بناء الرسوم البيانية للمعرفة على نطاق واسع، ولكن الطرق الحالية لا تأخذ بعين الاعتبار السمات المؤهلة لكل ثلاثي علاقات، مثل الوقت أو الكمية أو الموقع. هذه المؤهلات تشكل حقائق فائقة العلاقات التي تلتقط بشكل أفضل البنية المعقدة والغنية للرسم البياني للمعرفة. على سبيل المثال، يمكن تخصيص وتوسيع الثلاثي العلائقي (ليونارد باركر، تعلم في، جامعة هارفارد) بإضافة المؤهل (وقت النهاية، 1967). لذلك، نقترح مهمة استخراج العلاقات الفائقة لاستخراج حقائق أكثر تحديدًا وإكمالًا من النص. لدعم هذه المهمة، قمنا ببناء مجموعة بيانات HyperRED على نطاق واسع ومناسبة لأغراض عامة. لا يمكن للنماذج الموجودة أداء استخراج العلاقات الفائقة حيث يتطلب ذلك من النموذج النظر إلى التفاعل بين ثلاثة كيانات. لذلك، نقترح CubeRE، وهو نموذج ملء المكعب مستوحى من طرق ملء الجداول ويأخذ بعين الاعتبار التفاعل بين ثلاثيات العلاقات والمؤهلات بشكل صريح. لتحسين قابلية توسع النموذج وتقليل عدم التوازن في الفئات السلبية، نقترح أيضًا طريقة تقليم المكعب. أظهرت تجاربنا أن CubeRE يتفوق على القواعد الأساسية القوية وكشفت عن اتجاهات محتملة للبحث المستقبلي. رمز البرمجيات ومجموعة البيانات متاحة على github.com/declare-lab/HyperRED.