HyperAIHyperAI
منذ 17 أيام

CompactIE: حقائق مدمجة في استخراج المعلومات المفتوحة

Farima Fatahi Bayat, Nikita Bhutani, H.V. Jagadish
CompactIE: حقائق مدمجة في استخراج المعلومات المفتوحة
الملخص

يُعدّ العيب الرئيسي في أنظمة OpenIE العصبية الحديثة و benchmarks الخاصة بها هو تفضيل التغطية العالية للمعلومات المستخرجة على الكفاءة والاختصار في مكونات هذه الاستخلاصات. ويؤدي هذا إلى تقييد شديد في فائدة الاستخلاصات المُستخرجة في العديد من المهام اللاحقة. ويمكن تحسين فائدة الاستخلاصات إذا تم إنتاج استخلاصات مختصرة ومشتركة في مكوناتها. ولتحقيق ذلك، ندرس مشكلة تحديد استخلاصات مختصرة باستخدام الأساليب القائمة على الشبكات العصبية. نقترح نظام CompactIE، وهو نظام OpenIE يستخدم نهجًا مُنتظمًا جديدًا لإنتاج استخلاصات مختصرة تمتلك مكونات متداخلة. حيث يبدأ النظام بتحديد مكونات الاستخلاصات، ثم يربط هذه المكونات لبناء الاستخلاصات النهائية. ونُدرّب نظامنا على استخلاصات مختصرة تم الحصول عليها من خلال معالجة المعايير الحالية. تُظهر تجاربنا على مجموعتي بيانات CaRB و Wire57 أن CompactIE يُكتشف 1.5 إلى 2 مرة أكثر من الاستخلاصات المختصرة مقارنةً بالنظم السابقة، وبدقة عالية، مما يُرسّخ أداءً جديدًا على مستوى الحد الأقصى في مجال OpenIE.