ريليكي: استرجاع وربط، ربط الكيانات واستخراج العلاقات بسرعة ودقة وبميزانية أكاديمية

ربط الكيانات (EL) واستخراج العلاقات (RE) هما مهمتان أساسيتان في معالجة اللغة الطبيعية، وتخدمان كمكونات حاسمة في مجموعة واسعة من التطبيقات. في هذا البحث، نقترح نظام ReLiK، وهو بنية مسترجع-قارئ مصممة لكل من EL وRE، حيث يقوم مódول المسترجع، عند تقديم نص إدخالي، بتحديد الكيانات أو العلاقات المرشحة التي قد تظهر ضمن النص. ثم يُكلف مódul القارئ بمهمة تمييز الكيانات أو العلاقات المسترجعة ذات الصلة وإقامة تطابقها مع الأجزاء النصية المقابلة. ومن الجدير بالذكر أننا نقدم تمثيلًا إدخاليًا مبتكرًا يدمج الكيانات أو العلاقات المرشحة إلى جانب النص، مما يجعل من الممكن ربط الكيانات أو استخراج العلاقات في عملية تدفق واحدة والاستفادة الكاملة من قدرات السياق للنماذج اللغوية المدربة مسبقًا، على عكس الأساليب السابقة المستندة إلى بنية المسترجع-القارئ والتي تتطلب عملية تدفق لكل مرشح. صيغتنا لمهام EL وRE تحقق أداءً غير مسبوق في مقاييس الأداء داخل المجال وخارجه بينما يتم استخدامها بميزانية تدريب أكاديمية وبسرعة استدلال تصل إلى 40 مرة أسرع من المنافسين. وأخيرًا، نوضح كيف يمكن استخدام هندستنا بشكل سلس لاستخراج المعلومات (cIE)، أي EL + RE، بإنشاء حالة جديدة غير مسبوقة باستخدام قارئ مشترك يقوم باستخراج الكيانات والعلاقات بشكل متزامن.