ريبل: استخراج العلاقة بواسطة توليد اللغة من الطرف إلى الطرف
{Roberto Navigli Pere-Lluis Huguet Cabot}
الملخص
استخراج ثلاثيات العلاقات من النص الخام يُعد مهمة حاسمة في استخراج المعلومات، حيث يمكّن من تطبيقات متعددة مثل ملء قواعد المعرفة أو التحقق من صحتها، والتحقق من الحقائق، وغير ذلك من المهام اللاحقة. ومع ذلك، فإن هذه المهمة غالبًا ما تتطلب سلسلة خطوات متعددة، مما يؤدي إلى انتشار الأخطاء أو يقتصر على عدد محدود من أنواع العلاقات. ولsuperar هذه التحديات، نقترح استخدام نماذج التوليد التسلسلي (autoregressive seq2seq). وقد أُظهر سابقًا أن هذه النماذج تؤدي بجدارة ليس فقط في توليد اللغة، بل أيضًا في مهام فهم اللغة الطبيعية مثل ربط الكيانات (Entity Linking)، وذلك بفضل صياغتها كمهام تسلسل إلى تسلسل (seq2seq).في هذه الورقة، نوضح كيف يمكن تبسيط استخراج العلاقات من خلال تمثيل الثلاثيات كسلسلة نصية، ونقدّم نموذج REBEL، وهو نموذج تسلسلي تسلسلي مبني على BART، يقوم باستخراج العلاقات بشكل مباشر (end-to-end) لأكثر من 200 نوع مختلف من العلاقات. ونُظهر مرونة نموذجنا من خلال تدريبه المخصص (fine-tuning) على مجموعة متنوعة من مهام استخراج العلاقات وتصنيفها، حيث حقق أداءً متقدمًا (state-of-the-art) في معظمها.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| joint-entity-and-relation-extraction-on-3 | REBEL | Relation F1: 41.8 |
| joint-entity-and-relation-extraction-on-3 | REBEL+pretraining | Relation F1: 47.1 |
| relation-extraction-on-ade-corpus | REBEL (including overlapping entities) | RE+ Macro F1: 82.2 |
| relation-extraction-on-conll04 | REBEL | RE+ Macro F1 : 76.65 RE+ Micro F1: 75.4 |
| relation-extraction-on-nyt | REBEL (no pre-training) | F1: 93.1 |
| relation-extraction-on-re-tacred | REBEL (no entity type marker) | F1: 90.4 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.