منذ 2 أشهر
نموذج Span لاستخراج المعلومات المفتوحة من مجموعات بيانات دقيقة
Junlang Zhan; Hai Zhao

الملخص
استخراج المعلومات المفتوح (Open IE) هو مهمة صعبة بشكل خاص بسبب أساس بياناته الهش. يجب تدريب معظم أنظمة استخراج المعلومات المفتوحة على مجموعات بيانات تم بناؤها تلقائيًا وتقييمها على مجموعات اختبار غير دقيقة. في هذا العمل، نخفف أولاً من هذه الصعوبة من كلا الجانبين: مجموعات التدريب واختبار. بالنسبة للجانب الأول، نقترح تصميمًا نموذجيًا محسنًا لاستغلال مجموعة البيانات التدريبية بشكل أكثر كفاءة. أما بالنسبة للجانب الثاني، فنقدم مجموعة الاختبار القياسية التي أعدنا تسميتها بدقة (Re-OIE6) وفقًا لمجموعة من الملاحظات والتحليلات اللغوية. بعد ذلك، نقدم نموذجًا للمسافات بدلاً من الصياغة السابقة للتسمية التسلسلية لـ Open IE الن-اري. حقق النموذج الجديد الذي قدمناه أداءً رائدًا جديدًا في كل من مجموعات البيانات القياسية للتقييم.