HyperAIHyperAI
منذ 2 أشهر

بحث-و1: نماذج التفكير الكبيرة المعززة بالبحث الوكيل

Xiaoxi Li, Guanting Dong, Jiajie Jin, Yuyao Zhang, Yujia Zhou, Yutao Zhu, Peitian Zhang, Zhicheng Dou
بحث-و1: نماذج التفكير الكبيرة المعززة بالبحث الوكيل
الملخص

نماذج الاستدلال الكبيرة (LRMs) مثل OpenAI-o1 أظهرت قدرات استدلال متتابعة طويلة مثيرة للإعجاب من خلال التعلم التعزيزي على نطاق واسع. ومع ذلك، غالباً ما تعاني عمليات الاستدلال الممتدة لهذه النماذج من نقص في المعرفة، مما يؤدي إلى عدم اليقين المتكرر والأخطاء المحتملة. لمعالجة هذا القيد، نقدم Search-o1، إطار عمل يعزز نماذج الاستدلال الكبيرة بآلية توليد معززة بالاسترجاع (RAG) ذات طابع وكالة وموديول "الاستدلال داخل الوثائق" لتحسين الوثائق المسترجعة. يقوم Search-o1 بدمج سير عمل البحث ذو الطابع الوكالة في عملية الاستدلال، مما يمكّن من استرجاع ديناميكي للمعرفة الخارجية عند مواجهة نقاط معرفية غير مؤكدة من قبل نماذج الاستدلال الكبيرة. بالإضافة إلى ذلك، بسبب الطبيعة الإسهابية للوثائق المسترجعة، صممنا موديول "الاستدلال داخل الوثائق" منفصلًا لتحليل المعلومات المسترجعة بشكل عميق قبل حقنها في سلسلة الاستدلال، مما يقلل الضوضاء ويحافظ على تدفق الاستدلال المتماسك. أثبتت التجارب الشاملة على مهام استدلال معقدة في العلوم والرياضيات والبرمجة وكذلك ستة مقاييس أسئلة وإجابات مفتوحة المجال الأداء القوي لـ Search-o1. هذا النهج يعزز الثقة والقابلية للتطبيق لنماذج الاستدلال الكبيرة في مهام الاستدلال المعقدة، مما يفتح الطريق لأنظمة ذكية أكثر ثقة ومرونة. الرمز البرمجي متاح على الرابط https://github.com/sunnynexus/Search-o1.

بحث-و1: نماذج التفكير الكبيرة المعززة بالبحث الوكيل | أحدث الأوراق البحثية | HyperAI