HyperAI

الملخص

لقد صُممت أنظمة استرجاع المعلومات (Information Retrieval - IR) وتدربت تقليديًا لخدمة المستخدمين البشريين، حيث تعتمد أساليب "التعلم من أجل الترتيب" (learning-to-rank) بشكل كبير على سجلات التفاعل البشري واسعة النطاق، مثل النقرات (clicks) ووقت المكوث (dwell time). ومع ذلك، ومع الظهور المتسارع لوكلاء البحث المدعومين بنماذج LLM، أصبح الاسترجاع يُستهلك بشكل متزايد من قبل الوكلاء (agents) بدلاً من البشر، وأصبح جزءًا مدمجًا كمكون أساسي ضمن حلقات الاستدلال والعمل متعددة الخطوات (multi-turn reasoning and action loops). في هذا السياق، تظهر نماذج الاسترجاع المدربة وفق افتراضات تتمحور حول الإنسان عدم توافق جوهري مع الطريقة التي يرسل بها الوكلاء الاستعلامات (queries) ويستهلكون بها النتائج.في هذا العمل، نجادل بأن نماذج الاسترجاع المخصصة للبحث الوكيل (agentic search) يجب أن تُدرب مباشرة من بيانات تفاعل الوكلاء. ونقدم "التعلم من الاسترجاع من مسارات الوكلاء" (learning to retrieve from agent trajectories) كنموذج تدريب جديد، حيث يتم استخلاص الإشراف (supervision) من تفاعلات الوكيل متعددة الخطوات. ومن خلال تحليل منهجي لمسارات وكيل البحث، حددنا إشارات سلوكية رئيسية تكشف عن فائدة المستند، بما في ذلك إجراءات التصفح (browsing actions)، والرفض دون تصفح (unbrowsed rejections)، وآثار الاستدلال ما بعد التصفح (post-browse reasoning traces).واسترشادًا بهذه الرؤى، نقترح إطار عمل LRAT، وهو إطار عمل بسيط وفعال يستخلص إشراف استرجاع عالي الجودة من مسارات الوكيل، ويدمج كثافة الصلة (relevance intensity) من خلال التحسين الموزون (weighted optimization). أظهرت التجارب المكثفة على مقاييس الأداء (benchmarks) للبحث العميق، سواء في النطاق (in-domain) أو خارجه (out-of-domain)، أن المسترجعات (retrievers) المدربة باستخدام LRAT تحسن باستمرار استدعاء الأدلة (evidence recall)، ونجاح المهام من الطرف إلى الطرف (end-to-end task success)، وكفاءة التنفيذ عبر مختلف بنيات وأحجام الوكلاء. تسلط نتائجنا الضوء على مسارات الوكيل كمصدر إشراف عملي وقابل للتوسع، مما يشير إلى اتجاه واعد لعمليات الاسترجاع في عصر البحث الوكيل.

الملخص

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تعلم الاسترجاع من مسارات الـ Agent

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تعلم الاسترجاع من مسارات الـ Agent

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تعلم الاسترجاع من مسارات الـ Agent

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters