HyperAIHyperAI
منذ 17 أيام

بحث-في-السلسلة: تعزيز تفاعلي لنموذجات اللغة الكبيرة باستخدام البحث في المهام المعتمدة على المعرفة

Shicheng Xu, Liang Pang, Huawei Shen, Xueqi Cheng, Tat-Seng Chua
بحث-في-السلسلة: تعزيز تفاعلي لنموذجات اللغة الكبيرة باستخدام البحث في المهام المعتمدة على المعرفة
الملخص

إن ضمان دقة المحتوى الذي تولّده النماذج اللغوية الكبيرة (LLM)، وموثوقيته، وقابلية تتبعه، يُعد أمرًا بالغ الأهمية، خصوصًا في المهام المعقدة التي تستند إلى المعرفة وتحتاج إلى استنتاجات متعددة الخطوات، حيث يتطلب كل خطوة معرفة محددة لحلها. تُظهر تقنية التوليد المدعوم باسترجاع المعلومات (Retrieval-augmented generation) إمكانات كبيرة لحل هذه المشكلة. ومع ذلك، يبقى التحدي الأكبر هو تحديد مكان وطريقة دمج نظام استرجاع المعلومات (IR) مع النموذج اللغوي الكبير. فالمبادرات السابقة تعاني من مشكلات تتمثل في أن المعلومات الخاطئة التي يسترجعها IR قد تُربك النموذج اللغوي الكبير، كما أن التفاعل بين IR وLLM قد يُخلّ بالسياق المنطقي للنماذج، مما يُضعف سلسلة الاستنتاج. تُقدّم هذه الورقة إطارًا جديدًا يُسمّى \textbf{Search-in-the-Chain} (SearChain) لتنظيم التفاعل بين LLM وIR، بهدف التغلب على هذه التحديات. أولاً، يقوم LLM بإنشاء سلسلة استنتاج تُسمّى "سلسلة الاستفسارات" (Chain-of-Query أو CoQ)، حيث يتكوّن كل عقدة فيها من زوج مكوّن من استفسار موجه نحو استرجاع المعلومات والإجابة عليه. ثانيًا، يقوم نظام استرجاع المعلومات (IR) بتحقق من صحة الإجابة الخاصة بكل عقدة في CoQ، ويُصحّح الإجابة في حال لم تتطابق مع المعلومات المسترجعة، شريطة أن يكون IR واثقًا من نتائجه، مما يعزز من موثوقية النتائج. ثالثًا، يمكن لـ LLM التعبير عن نقصه في المعرفة ضمن سلسلة CoQ، واعتماد IR لتزويده بالمعرفة المطلوبة. هذه العمليات تُحسّن من الدقة من حيث الاستنتاج والمعرفة. وأخيرًا، يُولّد SearChain عملية الاستنتاج الكاملة، ويُشير إلى المستندات الداعمة لكل خطوة من خطوات الاستنتاج، ما يُعزز من قابلية التتبع. يشكّل التفاعل مع IR في SearChain مسارًا منطقيًا جديدًا مبنيًا على هيكل شجري، مما يمكّن LLM من تعديل اتجاه الاستنتاج بشكل ديناميكي. أظهرت التجارب أن SearChain تتفوّق على النماذج الرائدة في مجالها في المهام المعقدة التي تستند إلى المعرفة، مثل الإجابة على أسئلة متعددة الخطوات، وملء الحقول (slot filling)، والتحقق من الحقائق (fact checking)، والإجابات الطويلة الشكل (long-form Q&A).