DREEAM: توجيه الانتباه بالدليل لتحسين استخراج العلاقات على مستوى المستند

استخراج العلاقات على مستوى المستند (DocRE) هو المهمة المتمثلة في تحديد جميع العلاقات بين كل زوج من الكيانات في مستند. وقد أظهرت الأدلة، المعرفة بأنها الجمل التي تحتوي على مؤشرات حول العلاقة بين زوج من الكيانات، أنها تساعد أنظمة DocRE على التركيز على النصوص ذات الصلة، وبالتالي تحسين استخراج العلاقات. ومع ذلك، تواجه عملية استرجاع الأدلة (ER) في DocRE مشكلتين رئيسيتين: الاستهلاك العالي للذاكرة، وندرة التسميات المتاحة. تهدف هذه الدراسة إلى معالجة هذه المشكلات لتحسين استخدام استرجاع الأدلة في DocRE. أولاً، نقترح DREEAM، وهي طريقة فعالة من حيث الذاكرة، تعتمد على معلومات الأدلة كإشارات توجيهية، مما يوجه وحدات الانتباه في نظام DocRE إلى تخصيص أوزان عالية للأدلة. ثانيًا، نقترح استراتيجية تدريب ذاتي لـ DREEAM تُمكّنها من تعلّم استرجاع الأدلة من بيانات ضخمة مولدة تلقائيًا دون الحاجة إلى تسميات للأدلة. أظهرت النتائج التجريبية أن نهجنا يحقق أداءً متقدمًا على مستوى الحد الأقصى في معيار DocRED، سواء فيما يتعلق بـ DocRE أو ER. وبقدر معرفتنا، فإن DREEAM هي أول منهجية تستخدم التدريب الذاتي لاسترجاع الأدلة.