HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

Fathom-DeepResearch: فتح آفاق استرجاع المعلومات وتحليلها على المدى الطويل للنماذج اللغوية الصغيرة

Shreyas Singh Kunal Singh Pradeep Moturi

Fathom-DeepResearch: فتح آفاق استرجاع المعلومات وتحليلها على المدى الطويل للنماذج اللغوية الصغيرة

الملخص

أصبح الاستدلال المُدمج مع الأدوات محورًا رئيسيًا في تمكين التطبيقات الواعية (agentic). ومن بين هذه التطبيقات، لاقت نماذج DeepResearch اهتمامًا كبيرًا بفضل أدائها القوي في المهام المعقدة والمفتوحة ذات الطابع الاستقصائي للمعلومات. نقدم نظامًا واعيًا يُسمى Fathom-DeepResearch، يتكون من نموذجين متخصصين. الأول هو Fathom-Search-4B، وهو نموذج DeepSearch تم تدريبه من Qwen3-4B، وتم تحسينه لإجراء تحقيق مبني على الأدلة من خلال بحث مباشر على الويب واستقصاء موجه للصفحات الإلكترونية. ويشمل التدريب ثلاث تطورات رئيسية: (أ) DUETQA، وهي مجموعة بيانات مكوّنة من 5000 عينة تم إنشاؤها باستخدام منهجية اللعب الذاتي متعدد الوكلاء، والتي تفرض الاعتماد الصارم على البحث عبر الويب والتغذية من مصادر متنوعة؛ (ب) RAPO، وهي امتداد خالٍ من التكلفة الإضافية لـ GRPO، يُحسّن استقرار التعلّم المعزز متعدد الدورات مع المكافآت القابلة للتحقق من خلال تقنيات الترشيح التدريجي، وتعديل المكافأة بناءً على الميزة، وتخزين مكرر لكل سؤال (per-prompt replay buffers)؛ (ج) مكافأة قابلة للضبط على مستوى الخطوة، تصنف كل استدعاء لأداة حسب السلوك المعرفي والمنفعة الحدية، ما يتيح التحكم الصريح في عمق واتساع ونطاق مسار البحث. تُمكّن هذه التحسينات من تمديد استخدام الاستدعاءات الأدواتية إلى ما يزيد عن 20 استدعاءً بشكل موثوق عند الحاجة. أما النموذج الثاني فهو Fathom-Synthesizer-4B، الذي تم تدريبه من Qwen3-4B، ويحول السجلات متعددة الدورات لاستقصاء DeepSearch إلى تقارير بحثية عميقة مُهيكلة وغنية بالاقتباسات (citation-dense) لضمان تجميع شامل. وقد أُجري تقييم النظام على معايير استقصاء DeepSearch (SimpleQA، FRAMES، WebWalker، Seal0، MuSiQue) وعلى DeepResearch-Bench، حيث حقق أداءً متقدمًا على مستوى الحالة الحالية (state-of-the-art) ضمن الفئة المفتوحة الأوزان (open-weights)، مع إظهار قدرة قوية على التعميم على مهام استدلال متنوعة تشمل HLE، AIME-25، GPQA-Diamond، وMedQA.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
Fathom-DeepResearch: فتح آفاق استرجاع المعلومات وتحليلها على المدى الطويل للنماذج اللغوية الصغيرة | الأوراق البحثية | HyperAI