HyperAIHyperAI
منذ 2 أشهر

AIFB-WebScience في SemEval-2022 المهمة 12: استخراج العلاقات أولاً -- استخدام استخراج العلاقات لتحديد الكيانات

Nicholas Popovic; Walter Laurito; Michael Färber
AIFB-WebScience في SemEval-2022 المهمة 12: استخراج العلاقات أولاً -- استخدام استخراج العلاقات لتحديد الكيانات
الملخص

في هذا البحث، نقدم نهجًا متكاملًا لاستخراج الكيانات والعلاقات باستخدام نماذج اللغة القائمة على المحولات (transformer-based language models). نطبق النموذج على مهمة ربط الرموز الرياضية بوصفها في وثائق LaTeX. على عكس النهج الحالية التي تجري استخراج الكيانات والعلاقات بشكل متتابع، يدمج نظامنا المعلومات المستخرجة من العلاقات في عملية استخراج الكيانات. وهذا يعني أن النظام يمكن تدريبه حتى على مجموعات بيانات فيها فقط جزء من جميع نطاقات الكيانات الصحيحة المُشَرَّحَة (annotated). نقدم تقييمًا شاملًا للنظام المقترح ومزاياه وعيوبه. ينتج نهجنا تنبؤات ذات دقة عالية ويمكن توسيعه ديناميكيًا في التعقيد الحسابي أثناء الاستدلال. حقق نظامنا المركز الثالث في قائمة الترتيب لـ SemEval-2022 مهمة 12. بالنسبة للمدخلات في مجال الفيزياء والرياضيات، حقق أداءً عاليًا في مؤشر F1 الكلي لاستخراج العلاقات بنسبة 95.43% و79.17% على التوالي. الرمز البرمجي المستخدم لتدريب وتقييم نماذجنا متاح في الرابط التالي: https://github.com/nicpopovic/RE1st

AIFB-WebScience في SemEval-2022 المهمة 12: استخراج العلاقات أولاً -- استخدام استخراج العلاقات لتحديد الكيانات | أحدث الأوراق البحثية | HyperAI