HyperAIHyperAI

Command Palette

Search for a command to run...

بحث-في-السلسلة: تعزيز تفاعلي لنموذجات اللغة الكبيرة باستخدام البحث في المهام المعتمدة على المعرفة

Shicheng Xu Liang Pang Huawei Shen Xueqi Cheng Tat-Seng Chua

الملخص

إن ضمان دقة المحتوى الذي تولّده النماذج اللغوية الكبيرة (LLM)، وموثوقيته، وقابلية تتبعه، يُعد أمرًا بالغ الأهمية، خصوصًا في المهام المعقدة التي تستند إلى المعرفة وتحتاج إلى استنتاجات متعددة الخطوات، حيث يتطلب كل خطوة معرفة محددة لحلها. تُظهر تقنية التوليد المدعوم باسترجاع المعلومات (Retrieval-augmented generation) إمكانات كبيرة لحل هذه المشكلة. ومع ذلك، يبقى التحدي الأكبر هو تحديد مكان وطريقة دمج نظام استرجاع المعلومات (IR) مع النموذج اللغوي الكبير. فالمبادرات السابقة تعاني من مشكلات تتمثل في أن المعلومات الخاطئة التي يسترجعها IR قد تُربك النموذج اللغوي الكبير، كما أن التفاعل بين IR وLLM قد يُخلّ بالسياق المنطقي للنماذج، مما يُضعف سلسلة الاستنتاج. تُقدّم هذه الورقة إطارًا جديدًا يُسمّى \textbf{Search-in-the-Chain} (SearChain) لتنظيم التفاعل بين LLM وIR، بهدف التغلب على هذه التحديات. أولاً، يقوم LLM بإنشاء سلسلة استنتاج تُسمّى "سلسلة الاستفسارات" (Chain-of-Query أو CoQ)، حيث يتكوّن كل عقدة فيها من زوج مكوّن من استفسار موجه نحو استرجاع المعلومات والإجابة عليه. ثانيًا، يقوم نظام استرجاع المعلومات (IR) بتحقق من صحة الإجابة الخاصة بكل عقدة في CoQ، ويُصحّح الإجابة في حال لم تتطابق مع المعلومات المسترجعة، شريطة أن يكون IR واثقًا من نتائجه، مما يعزز من موثوقية النتائج. ثالثًا، يمكن لـ LLM التعبير عن نقصه في المعرفة ضمن سلسلة CoQ، واعتماد IR لتزويده بالمعرفة المطلوبة. هذه العمليات تُحسّن من الدقة من حيث الاستنتاج والمعرفة. وأخيرًا، يُولّد SearChain عملية الاستنتاج الكاملة، ويُشير إلى المستندات الداعمة لكل خطوة من خطوات الاستنتاج، ما يُعزز من قابلية التتبع. يشكّل التفاعل مع IR في SearChain مسارًا منطقيًا جديدًا مبنيًا على هيكل شجري، مما يمكّن LLM من تعديل اتجاه الاستنتاج بشكل ديناميكي. أظهرت التجارب أن SearChain تتفوّق على النماذج الرائدة في مجالها في المهام المعقدة التي تستند إلى المعرفة، مثل الإجابة على أسئلة متعددة الخطوات، وملء الحقول (slot filling)، والتحقق من الحقائق (fact checking)، والإجابات الطويلة الشكل (long-form Q&A).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp