ريبل: استخراج العلاقة بواسطة توليد اللغة من الطرف إلى الطرف
استخراج ثلاثيات العلاقات من النص الخام يُعد مهمة حاسمة في استخراج المعلومات، حيث يمكّن من تطبيقات متعددة مثل ملء قواعد المعرفة أو التحقق من صحتها، والتحقق من الحقائق، وغير ذلك من المهام اللاحقة. ومع ذلك، فإن هذه المهمة غالبًا ما تتطلب سلسلة خطوات متعددة، مما يؤدي إلى انتشار الأخطاء أو يقتصر على عدد محدود من أنواع العلاقات. ولsuperar هذه التحديات، نقترح استخدام نماذج التوليد التسلسلي (autoregressive seq2seq). وقد أُظهر سابقًا أن هذه النماذج تؤدي بجدارة ليس فقط في توليد اللغة، بل أيضًا في مهام فهم اللغة الطبيعية مثل ربط الكيانات (Entity Linking)، وذلك بفضل صياغتها كمهام تسلسل إلى تسلسل (seq2seq).في هذه الورقة، نوضح كيف يمكن تبسيط استخراج العلاقات من خلال تمثيل الثلاثيات كسلسلة نصية، ونقدّم نموذج REBEL، وهو نموذج تسلسلي تسلسلي مبني على BART، يقوم باستخراج العلاقات بشكل مباشر (end-to-end) لأكثر من 200 نوع مختلف من العلاقات. ونُظهر مرونة نموذجنا من خلال تدريبه المخصص (fine-tuning) على مجموعة متنوعة من مهام استخراج العلاقات وتصنيفها، حيث حقق أداءً متقدمًا (state-of-the-art) في معظمها.