Command Palette
Search for a command to run...
Search-o1: نماذج تفكير كبيرة مُحسَّنة بالبحث العقلي
Search-o1: نماذج تفكير كبيرة مُحسَّنة بالبحث العقلي
Xiaoxi Li Guanting Dong Jiajie Jin Yuyao Zhang Yujia Zhou Yutao Zhu Peitian Zhang Zhicheng Dou
الملخص
أظهرت النماذج الكبيرة للاستدلال (LRMs) مثل OpenAI-o1 قدرات مبهرة على الاستدلال التدريجي الطويل من خلال التعلم المعزز على نطاق واسع. ومع ذلك، فإن عمليات الاستدلال الممتدة هذه غالبًا ما تعاني من نقص في المعرفة، ما يؤدي إلى تكرار الترددات والاحتمالات الخطأ. وللتغلب على هذا التحدي، نقدّم "Search-o1"، وهو إطار عمل يُحسّن من قدرات النماذج الكبيرة للاستدلال من خلال آلية توليد مدعومة باسترجاع عامل (RAG) ذات طابع عامل (agentic) ووحدة "الاستدلال في الوثائق" (Reason-in-Documents) لتحسين الوثائق المسترجعة. يُدمج إطار Search-o1 تدفق عمل بحث عامل (agentic search workflow) في عملية الاستدلال، ما يمكّن من استرجاع معرفة خارجية ديناميكية عند مواجهة النماذج لنقاط معرفية غير مؤكدة. علاوةً على ذلك، وبسبب الطابع المطوّل للوثائق المسترجعة، قمنا بتصميم وحدة منفصلة تُسمى "الاستدلال في الوثائق" لتحليل عميق للمعلومات المسترجعة قبل دمجها في سلسلة الاستدلال، بهدف تقليل الضوضاء وضمان تدفق منطقي متماسك. أظهرت تجارب واسعة النطاق على مهام استدلال معقدة في العلوم والرياضيات والبرمجة، فضلاً عن ستة معايير مفتوحة النطاق لأسئلة الإجابة (QA)، أداءً قويًا لـ Search-o1. يُعزز هذا النهج موثوقية وقابلية تطبيق النماذج الكبيرة للاستدلال في المهام المعقدة، ممّا يفتح الباب أمام أنظمة ذكية أكثر موثوقية وتنوعًا. يُمكن الاطلاع على الشيفرة المصدرية على الرابط: https://github.com/sunnynexus/Search-o1.