Command Palette
Search for a command to run...
أُوبيتير: تحسين قدرات تحليل بيانات نموذج اللغة الكبير من خلال البحث الموجه بالقيمة في مذكرة ووقت الاستنتاج
Shuocheng Li Yihao Liu Silin Du Wenxuan Zeng Zhe Xu, et al

الملخص
أظهرت النماذج اللغوية الكبيرة (LLMs) إمكانات كبيرة في أتمتة سير عمل علوم البيانات، إلا أن النماذج الحالية ما زالت تواجه صعوبات في التفكير متعدد الخطوات واستخدام الأدوات، مما يحد من فعاليتها في المهام المعقدة لتحليل البيانات. ولحل هذه المشكلة، نقترح_pipeline قابلة للتوسع تقوم باستخراج مهام تحليل بيانات مبنية على أدوات ذات جودة عالية، وحلولها المتعددة الخطوات القابلة للتنفيذ، من ملاحظات Jupyter الحقيقية وملفات البيانات المرتبطة بها. وباستخدام هذا الـpipeline، نقدّم "NbQA"، وهو مجموعة بيانات كبيرة الحجم تتكون من أزواج مهام-حلول معيارية تعكس أنماط الاستخدام الفعلية للأدوات في السياقات العملية لعلوم البيانات. ولتعزيز التفكير متعدد الخطوات بشكل أكبر، نقدّم "Jupiter"، وهي إطار عمل يُصوّر تحليل البيانات كمشكلة بحث، ويُطبّق خوارزمية البحث الشجري مونت كارلو (MCTS) لتكوين مسارات حلول متنوعة لتعلم نموذج القيمة. أثناء الاستدلال، يدمج Jupiter نموذج القيمة مع عدد زيارات العقد لجمع خطط متعددة الخطوات القابلة للتنفيذ بكفاءة وبأقل عدد من خطوات البحث. أظهرت النتائج التجريبية أن نماذج Qwen2.5-7B و14B-Instruct عند تطبيقها على NbQA تمكّنت من حل 77.82% و86.38% من المهام على منصة InfiAgent-DABench على التوالي، ما يُوازي أو يفوق أداء نموذج GPT-4o وأطر العمل المتقدمة للوكالات (agents). كما أظهرت التقييمات الإضافية تحسّنًا في القدرة على التعميم وقوة التفكير في استخدام الأدوات عبر مهام التفكير متعددة الخطوات المتنوعة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.