ChatKBQA: إطار إنشائي ثم استرجاعي للإجابة على أسئلة قاعدة المعرفة باستخدام نماذج اللغة الكبيرة المعدلة بدقة

يهدف نظام الإجابة على الأسئلة باستخدام قاعدة المعرفة (KBQA) إلى الإجابة على أسئلة اللغة الطبيعية عبر قواعد معرفة كبيرة الحجم (KBs)، ويمكن تلخيص هذا الهدف في خطوتين حاسمتين: استرجاع المعرفة وتحليل الدلالة. ومع ذلك، لا تزال هناك ثلاث تحديات أساسية: عدم كفاءة استرجاع المعرفة، أخطاء الاسترجاع التي تؤثر سلبًا على تحليل الدلالة، وتعقيد طرق KBQA السابقة. لمواجهة هذه التحديات، نقدم ChatKBQA، وهو إطار جديد وبسيط للإجابة على الأسئلة باستخدام قاعدة المعرفة يتبع منهجية التوليد ثم الاسترجاع، حيث يتم أولاً توليد الشكل المنطقي باستخدام نماذج لغوية كبيرة معدلة بدقة (LLMs)، ثم استرجاع واستبدال الكيانات والعلاقات باستخدام طريقة استرجاع غير مراقبة، مما يحسن بشكل مباشر كلًا من عملية التوليد والاسترجاع. تظهر النتائج التجريبية أن ChatKBQA حقق أداءً جديدًا في الطليعة على مجموعات البيانات القياسية لـ KBQA مثل WebQSP وCWQ. يمكن أيضًا اعتبار هذا العمل نموذجًا جديدًا لدمج النماذج اللغوية الكبيرة مع الرسوم البيانية للمعرفة (KGs) لأجل إجراء الإجابة على الأسئلة القابلة للتفسير والمطلوبة للمعرفة. رمزنا البرمجي متاح للعامة.