استخراج العلاقة القائم على التوليد المعزز بالاسترجاع

استخراج المعلومات (IE) هو عملية تحويلية تقوم بتحويل بيانات النص غير المنظمة إلى صيغة منظمة من خلال استخدام منهجيات استخراج الكيانات والعلاقات (RE). ويُعد تحديد العلاقة بين زوج من الكيانات عاملاً محورياً داخل هذا الإطار. وعلى الرغم من وجود تقنيات متعددة لاستخراج العلاقات، فإن كفاءتها تعتمد بشكل كبير على توفر بيانات مُعلَّمة ومصادر حوسبة كبيرة. وفي مواجهة هذه التحديات، تبرز النماذج اللغوية الكبيرة (LLMs) كحلول واعدة؛ إلا أنها قد تُنتج إجابات مُختلَقة نتيجة لبيانات التدريب الخاصة بها. ولتجاوز هذه القيود، تُقدَّم في هذه الدراسة طريقة استخراج العلاقات المدعومة بالاسترجاع والتجسيد (RAG4RE)، التي تُمكّن من تحسين أداء مهام استخراج العلاقات.وقد قُيّمت فعالية نهجنا RAG4RE باستخدام نماذج لغوية كبيرة مختلفة. ومن خلال استخدام معايير معيارية معروفة مثل مجموعات بيانات TACRED وTACREV وRe-TACRED وSemEval RE، يهدف هذا العمل إلى تقييم شامل لفعالية نهجنا RAG4RE. وبشكل خاص، تم استخدام نماذج لغوية بارزة مثل Flan T5 وLlama2 وMistral في هذه الدراسة. وتُظهر نتائج بحثنا أن نهجنا RAG4RE يتفوق على النماذج التقليدية لاستخراج العلاقات التي تعتمد فقط على النماذج اللغوية الكبيرة، وخصوصاً في مجموعة بيانات TACRED ومتغيراتها. علاوةً على ذلك، يُظهر نهجنا أداءً متميزاً مقارنةً بالمنهجيات السابقة لاستخراج العلاقات على كل من مجموعتي بيانات TACRED وTACREV، مما يؤكد فعاليته وإمكاناته الكبيرة في تطوير مهام استخراج العلاقات في معالجة اللغة الطبيعية.