Command Palette
Search for a command to run...
انخفض استخدام الرموز المميزة بمقدار 30%. Eywa، وهو إطار عمل للوكلاء الأذكياء غير المتجانسين مستوحى من "Avatar"، يجمع بكفاءة بين نماذج اللغة والنماذج الأساسية الخاصة بالمجال.

في السنوات الأخيرة، أصبح الذكاء الاصطناعي الوكيل أحد أهم التوجهات التطورية في مجال الذكاء الاصطناعي. فمن البرمجة الآلية واسترجاع المعرفة إلى تخطيط المهام، تتطور نماذج اللغة الكبيرة (LLMs) تدريجيًا من مجرد "برامج محادثة آلية" إلى أنظمة وكلاء ذكية تتمتع بقدرات استدلالية وتصرفية وتعاونية مستقلة. ومع ذلك، تبرز مشكلة واضحة بشكل متزايد أيضًا.جميع أنظمة الوكلاء الأذكياء السائدة تقريباً هي في الأساس أنظمة "تتمحور حول اللغة".سواء كان الأمر يتعلق بتخطيط المهام، أو استدعاء الأدوات، أو التعاون بين العوامل الذكية، فإن كل ذلك مبني على واجهة موحدة للغة الطبيعية.
ينجح هذا النموذج في سيناريوهات مثل الأسئلة والأجوبة عبر الإنترنت وأتمتة المكاتب. مع ذلك، عندما يبدأ الذكاء الاصطناعي بالدخول فعلياً إلى مجال البحث العلمي، تظهر المشكلات سريعاً. ذلك لأن العالم العلمي لا ينتمي بطبيعته إلى اللغة. فالسلاسل الزمنية، وبنى البلورات المادية، وتسلسلات البروتينات، والشبكات المناخية، وبيانات رصد الاستشعار عن بُعد... غالباً ما تكون هذه البيانات شديدة التنظيم، وقد يكون من المستحيل حتى "ترجمتها" إلى نص بشكل فعّال.إن ترجمتها قسراً إلى لغة طبيعية لن تؤدي فقط إلى فقدان المعلومات، بل ستؤدي أيضاً إلى معاناة النماذج الكبيرة من استهلاك عالٍ للغاية للرموز وتكرار الاستدلال.
وفي هذا السياق،اقترح فريق بحثي من جامعة إلينوي في أوربانا-شامبين (UIUC) إطار عمل للوكلاء غير المتجانسين يسمى Eywa لربط وكلاء اللغة بنماذج أساسية خاصة بالمجال.ابتكر الباحثون وكيلاً جديداً يُدعى EywaAgent، وذلك بدمج نموذج أساسي خاص بمجال معين مع نموذج لغوي. يُمكّن هذا التصميم الوكيل اللغوي من توجيه النموذج الأساسي في عمليات الاستدلال والتخطيط واتخاذ القرارات الخاصة بالمهام المتخصصة.
أجرى الباحثون تقييمًا منهجيًا لـ Eywa في مجالات متعددة، تشمل العلوم الفيزيائية والحيوية والاجتماعية. وأظهرت النتائج أن Eywa، مقارنةً بالأنظمة الأساسية التي تعتمد فقط على نماذج اللغة، حسّنت باستمرار المفاضلة بين الفائدة والتكلفة. فمقارنةً بالنظام الأساسي Single-LLM-Agent، حقق EywaAgent تحسنًا متوسطًا في الفائدة بمقدار 71 TP3T تقريبًا، وانخفاضًا في عدد الرموز بمقدار 301 TP3T تقريبًا، وانخفاضًا في وقت التنفيذ بمقدار 101 TP3T تقريبًا في مهام العلوم الفيزيائية والحيوية والاجتماعية. وبالمثل، في سيناريوهات الوكلاء المتعددين، حقق EywaMAS أيضًا فائدة محسّنة مع تقليل استهلاك الرموز ووقت التشغيل.
تم نشر نتائج البحث ذات الصلة، بعنوان "التعاون في نموذج المؤسسة العلمية غير المتجانسة"، كنسخة أولية على موقع arXiv.
أبرز الأبحاث:
* في المهام التي تتضمن بيانات منظمة وبيانات خاصة بالمجال، يمكن لـ Eywa تحسين أداء النظام بشكل فعال.
* من خلال التعاون الفعال مع نموذج أساسي مخصص، تقلل Eywa من اعتمادها على الاستدلال القائم على اللغة.
* يمكن توسيع نطاق Eywa ليشمل سيناريوهات متعددة الوكلاء: في EywaMAS، يمكن لـ EywaAgent أن يحل محل وكيل اللغة في نظام متعدد الوكلاء تقليدي؛ في EywaOrchestra، يمكن للمخطط أن ينسق ديناميكيًا بين وكيل اللغة و EywaAgent لحل المهام المعقدة.

عرض الورقة:
https://hyper.ai/papers/2604.27351
EywaBench: نظام تقييم علمي "متعدد المهام، ومتعدد المجالات، ومتعدد الوسائط".
قبل اقتراح إطار النموذج، أشار فريق البحث أولاً إلى مشكلة قديمة في المعايير العلمية الحالية للذكاء الاصطناعي:بمعنى آخر، فإن معظم المعايير العلمية الحالية عادة ما تغطي نوع واحد فقط من المهام، أو تركز فقط على مجال واحد، أو تدعم تنسيق بيانات واحد فقط.لذلك، غالباً ما يفشل في عكس القدرات المطلوبة حقاً من قبل الأنظمة العلمية العاملة.
يشير فريق البحث تحديدًا إلى أن المعايير الحالية لطالما افتقرت إلى تقييم كافٍ لنمطين أساسيين: السلاسل الزمنية والبيانات الجدولية. يشكل هذان النوعان من البيانات الركيزة الأساسية للحوسبة العلمية والأنظمة الصناعية في العالم الحقيقي. لذلك، تقترح هذه الورقة البحثية إطارًا تقييميًا جديدًا.EywaBench هو معيار قابل للتطوير للاستدلال العلمي غير المتجانس والمتعدد المهام والمتعدد المجالات.
تم بناء EywaBench على مجموعات بيانات متعددة موجودة، بما في ذلك على سبيل المثال لا الحصر:
* ديب برينسيبل
* MMLU-Pro
* fev-bench
* تاب أرينا
يتمتع برنامج EywaBench بقدرات تغطية متعددة المهام ومتعددة المجالات.وهي تتضمن ثلاثة أنماط أساسية للبيانات: اللغة الطبيعية، والسلاسل الزمنية، والبيانات الجدولية.يتم تنظيم جميع المهام في ثلاثة مجالات علمية: الأول هو العلوم الفيزيائية، بما في ذلك المواد والطاقة والفضاء؛ والثاني هو علوم الحياة، بما في ذلك علم الأحياء والطب السريري وتطوير الأدوية؛ والثالث هو العلوم الاجتماعية، التي تغطي سيناريوهات مثل الاقتصاد والأعمال والبنية التحتية.
والأهم من ذلك، أن EywaBench نفسه قابل للتوسع، مما يسمح لفرق البحث بتوسيع نطاق مهامهم باستمرار عن طريق إضافة نوافذ زمنية جديدة، ومجموعات متغيرة، وتكوينات سياقية؛ كما يمكنه الوصول إلى مجموعات بيانات السلاسل الزمنية الجديدة ومجموعات البيانات الجدولية للتوسع في مجالات علمية جديدة.
إيوا: ربط وكلاء اللغة بنماذج أساسية خاصة بالمجال
يستمد إيوا إلهامه الأساسي من مفهوم "تساهيلو" في فيلم أفاتار. ففي باندورا، يستطيع شعب نافي إقامة علاقات تعاون مباشرة مع أنواع مختلفة مثل التنانين وخيول الحرب من خلال روابط عصبية، مما يُمكّن الكائنات المختلفة من تشكيل قدرة عمل موحدة.
يعتقد فريق البحث أن أنظمة الوكلاء الحالية تواجه أيضاً مشاكل مماثلة. تمتلك نماذج LLM قدرات عالية المستوى في التفكير والتخطيط، لكنها ليست بارعة في التعامل مع البيانات العلمية الخام؛ تمتلك النماذج القائمة على المجال قدرات مهنية قوية، لكنها غير قادرة على أداء التفكير المعقد في المهام.لذلك، تقترح الورقة واجهة FM–LLM "Tsaheylu"، والتي تُنشئ بشكل أساسي آلية اتصال ثنائية الاتجاه بين نموذج اللغة ونموذج أساس المجال، كما هو موضح في الشكل أدناه:

الخطوة 1: بناء EywaAgent
تتمثل الخطوة الأولى نحو إطار عمل وكيل Eywa في اقتراح EywaAgent - وهو إطار عمل مجرد موحد يضيف واجهة استدلال قائمة على اللغة إلى النموذج الأساسي، مما يتيح له المشاركة في عمليات الاستدلال عالية المستوى داخل أنظمة الوكلاء.تتمثل فكرتها الأساسية في إقامة رابطة قوية بين نموذج اللغة لتنفيذ التخطيط والتحكم على مستوى عالٍ والنموذج الأساسي الخاص بالمجال الذي يوفر القدرات المهنية.
يجمع برنامج EywaAgent بين الاستدلال القائم على اللغة والحساب الخاص بالمجال من خلال واجهة اتصال ثنائية الاتجاه تسمى سلسلة FM-LLM "Tsaheylu".يتيح هذا الرابط إمكانية تكوين نموذج اللغة بشكل صحيح واستدعاء النموذج الأساسي لإجراء عمليات حسابية متخصصة.وفي الوقت نفسه، يتم إعادة دمج المخرجات بسلاسة في عملية الاستدلال.
تُصاغ واجهة Tsaheylu رسميًا على شكل زوج من الدوال: مُجمِّع الاستعلامات ϕk مسؤول عن ترجمة حالات المهام إلى استدعاءات مُهيكلة للنموذج الأساسي، ومُهايئ الاستجابة ψk مسؤول عن تحويل مُخرجات النموذج الأساسي إلى تمثيل بلغة مُتوافقة. تُمكّن هذه الآلية الاتصالية الوكيل من اتخاذ قرار ديناميكي بشأن ما إذا كان سيُجري العمليات الحسابية داخليًا أو يُفوِّضها إلى النموذج الأساسي، وبالتالي التكيف بمرونة بين الاستدلال العام والتنفيذ المُتخصص.
الخطوة الثانية: التوسع إلى نظام وكيل Eywa
بعد تعريف EywaAgent كوحدة وكيل جاهزة للاستخدام الفوري، قام فريق البحث بتوسيع هذا النموذج ليشمل سيناريوهات متعددة الوكلاء لدعم التعاون الأكثر تعقيدًا وتنوعًا. ولتحقيق هذه الغاية، تقترح الورقة البحثية نموذجين تجريديين متكاملين على مستوى النظام:
EywaMAS
تم توسيع نطاق EywaAgent ليشمل بيئات متعددة الوكلاء موزعة، مما يُمكّن العديد من الوكلاء المتخصصين من التفاعل والتعاون. تتبع ديناميكيات الاتصال وتحديث الحالة في EywaMAS نموذج نظام الوكلاء المتعددين القياسي، حيث يقوم الوكلاء بتحديث حالتهم وإنشاء الرسائل بناءً على المعلومات المُستلمة، ويتم التحكم في التفاعلات من خلال بنية الاتصال. تدعم هذه الطريقة تركيبات مرنة من نماذج اللغة المختلفة، والنماذج الأساسية، وأنواع الوكلاء.

يُعد EywaMAS امتدادًا لأنظمة الوكلاء المتعددين الحالية.
أوركسترا إيوا
لمعالجة متطلبات المهام المتنوعة في العالم الحقيقي، والتي تتطلب تكوينات مختلفة للوكلاء والشبكات، يقدم هذا الإطار نظام EywaOrchestra، وهو نظام تنسيق ديناميكي. يعمل EywaOrchestra كموجه، حيث يقوم بإنشاء أنظمة متعددة الوكلاء غير متجانسة ديناميكيًا بناءً على المهمة المدخلة، وذلك عن طريق اختيار نماذج اللغة والنماذج الأساسية وشبكات الاتصال المناسبة. يتيح هذا التنسيق التكيفي للنظام التغلب على قيود التصميم الثابت، مستفيدًا من قابلية النموذج والبنية للتكيف لاختيار التكوين الأمثل لكل مهمة.
تحقق إيوا تحسناً مستمراً في المفاضلة بين "المنفعة والتكلفة".
اختبر فريق البحث جميع الطرق باستخدام منصة EywaBench وفقًا لبروتوكول تجريبي موحد. يوضح الجدول أدناه الأداء العام لجميع الطرق في المهمة العلمية لمنصة EywaBench، وتكشف النتائج التجريبية عن عدة استنتاجات رئيسية:

مقارنة الأداء العام لبرنامج EywaBench في المهام العلمية
ملاحظة: يقارن الجدول جميع الطرق عبر ثلاثة أبعاد: الفائدة (↑ أعلى، أفضل)، ووقت الاستدلال (↓ أقل، أفضل)، واستهلاك الرموز (↓ أقل، أفضل). تُشير الخطوط العريضة إلى النتائج المثلى، بينما تُشير الخطوط السفلية إلى النتائج الأقل فائدة.
أولاً، يعمل برنامج EywaAgent على تحسين كل من جودة النظام وكفاءته في ظل نفس ظروف البنية الأساسية.بالمقارنة مع نموذج LLM الأساسي ذي العامل الواحد، يُحسّن EywaAgent متوسط الفائدة بمقدار 6.61 TP3T. في الوقت نفسه، وبفضل التفويض الكبير للحسابات إلى النموذج الأساسي الخاص بالمجال، انخفض زمن استدلاله بشكل ملحوظ، كما انخفض استهلاك الرموز المميزة بما يقارب 301 TP3T.
ثانيًا، يتفوق نظام EywaMAS بشكل كبير على أنظمة العوامل المتعددة المتماثلة التقليدية في السيناريوهات العلمية.تُظهر التجارب أن EywaMAS يحقق أعلى فائدة إجمالية بين جميع الطرق. بالمقارنة مع Refine، يتمتع EywaMAS بميزة أداء ملحوظة؛ وبالمقارنة مع Debate، لا يتميز EywaMAS بفائدة أعلى فحسب، بل يتطلب أيضًا عددًا أقل من الرموز في ظل نفس بنية النقاش.
أما النتيجة المهمة الثالثة فهي أن الاعتماد فقط على "نماذج اللغة غير المتجانسة" غير كافٍ لحل المهام العلمية.لم تتفوق طرق النمذجة متعددة العوامل غير المتجانسة التي تعتمد على نماذج اللغة فقط (مثل MoA وX-MAS) والمُقدمة في هذه الورقة البحثية بشكلٍ مُستمر على خط الأساس المتجانس للغاية للنماذج متعددة العوامل. يشير هذا إلى أنه بالنسبة للمهام العلمية، فإن العنصر الحاسم حقًا ليس "الجمع بين نماذج لغة متعددة مختلفة"، بل إدخال "عدم تجانس متعدد الوسائط". بعبارة أخرى، غالبًا ما يكون نموذج السلاسل الزمنية المالية أو نموذج التنبؤ البيولوجي أكثر قيمة من إضافة نموذج لغوي.
تشير الورقة البحثية أيضًا إلى أن التعاون المعقد بين عدة وكلاء لا يُفيد جميع المجالات. ففي مجالات فرعية كالاقتصاد والأعمال، يُعدّ نموذج EywaAgent أحادي الوكيل منافسًا قويًا بالفعل. وهذا يعني أن نماذج الوكلاء المتعددة المعقدة ليست دائمًا الخيار الأمثل. بل قد يُؤدي التعاون المفرط في بعض المهام إلى تكاليف إضافية.
أظهرت التجربة أيضًا أن نظام EywaOrchestra، بتكلفة أقل ودرجة أعلى من الأتمتة، حقق أداءً شبه مثالي مقارنةً بنظام EywaMAS المصمم من قبل خبراء. على عكس نظام EywaMAS، الذي يتطلب تهيئة يدوية،يتم بناء بنية نظام أوركسترا إيوا بشكل آلي بالكامل بواسطة قائد الأوركسترا.ومع ذلك، فإن فائدتها تقترب من فائدة الأنظمة المصممة يدويًا، بل وتتفوق عليها في العديد من المجالات الفرعية. وفي الوقت نفسه، تقلل آلية التنسيق الديناميكي بشكل ملحوظ من زمن استجابة الاستدلال واستهلاك الرموز. وهذا يدل على أن تنسيق النظام المتكيف مع المهام لا يحسن مستويات الأتمتة فحسب، بل يعمل أيضًا على تحسين تكاليف الاستدلال بشكل فعال.
خاتمة
على مدى السنوات القليلة الماضية، تمحور الموضوع الرئيسي لصناعة الذكاء الاصطناعي بشكل شبه دائم حول "النماذج الضخمة" - أي المعايير الأكبر، والسياق الأوسع، وقدرات الاستدلال الأقوى. وتسعى الصناعة بأكملها إلى بناء "نموذج عام قادر على حل جميع المشاكل".
مع ذلك، يُبيّن التوجه الذي تمثله إيوا أن "التعاون الأصيل في مختلف الوسائط" يُمكنه تعزيز قدرات أنظمة الوكلاء المتعددين في السيناريوهات العلمية، ويُوفر مسارًا جديدًا لتطوير الاستدلال التعاوني للنماذج الأساسية غير المتجانسة في المستقبل. بعبارة أخرى، ما سيُهم حقًا في المستقبل ليس "ذكاءً اصطناعيًا مُطلق القدرة"، بل "نظام ذكاء اصطناعي قادر على تنظيم خبراء مُتنوعين للعمل بشكل تعاوني".
مراجع:
https://arxiv.org/abs/2604.27351
https://hyper.ai/cn/papers/2604.27351








