HyperAI
Back to Headlines

باحثون يطورون نظام توجيه ذكي لأسئلة المستخدمين إلى نماذج اللغات الأكبر بدقة تبلغ 93% دون الحاجة لإعادة التدريب المكلفة

منذ 2 أيام

نموذج روتير جديد بحجم 1.5 مليار معلمة يحقق دقة 93% دون الحاجة إلى إعادة التدريب باهظة الثمن 7 يوليو 2025 قام فريق البحث في شركة كاتانيمو لابز بإطلاق "Arch-Router"، وهو نموذج وإطار جديد مصممان لتوجيه طلبات المستخدمين إلى النماذج اللغوية الكبيرة (LLMs) الأكثر ملاءمة بشكل ذكي. تحديات توجيه LLMs مع زيادة عدد النماذج اللغوية الكبيرة، بدأ المطورون في الانتقال من أنظمة تعتمد على نموذج واحد إلى أنظمة متعددة النماذج التي تستفيد من القوة الفريدة لكل نموذج في مهام مختلفة مثل إنشاء الشفرات البرمجية، تلخيص النصوص، أو تحرير الصور. أصبحت تقنية توجيه LLMs حاسمة في بناء ونشر هذه الأنظمة، حيث تعمل بمثابة متحكم في حركة المرور يوجه كل طلب مستخدم إلى النموذج الأكثر ملاءمة. تتراوح الأساليب الحالية للتوجيه بين "التوجيه القائم على المهام" و"التوجيه القائم على الأداء". الأول يوجه الطلبات بناءً على مهام محددة مسبقًا، بينما الثاني يسعى لتحقيق توازن أمثل بين التكلفة والأداء. ومع ذلك، فإن التوجيه القائم على المهام يعاني من صعوبة في التعامل مع نوايا المستخدمين الغامضة أو المتغيرة، خاصة في المحادثات المتعددة الدورات. أما التوجيه القائم على الأداء فيركز بشكل مفرط على درجات المعايير، مما يؤدي غالبًا إلى إغفال تفضيلات المستخدمين الحقيقية وتكييف ضعيف مع النماذج الجديدة دون خضوعها لإعادة تدريب باهظة الثمن. إطار جديد للتوجيه المتناسق مع التفضيلات للتغلب على هذه التحديات، اقترح الباحثون في كاتانيمو لابز إطار "التوجيه المتناسق مع التفضيلات" الذي يتطابق مع الطلبات إلى سياسات التوجيه بناءً على تفضيلات المستخدم المحددة. في هذا الإطار، يعرّف المستخدمون سياسات التوجيه بلغة طبيعية باستخدام "تصنيف النطاق-الإجراء" (Domain-Action Taxonomy). هذا التصنيف ذو مستوىين يعكس كيفية وصف الناس للمهام بشكل طبيعي، بدءًا من موضوع عام (مثل "القانون" أو "المالية") وصولًا إلى مهمة محددة (مثل "تلخيص" أو "إنشاء شفرة"). يرتبط كل من هذه السياسات بنموذج مفضل، مما يتيح للمطورين اتخاذ قرارات التوجيه بناءً على الاحتياجات الحقيقية وليس فقط درجات المعايير. كما يوضح الباحثون في ورقتهم، "يساعد هذا التصنيف المستخدمين في تعريف سياسات التوجيه بوضوح وبشكل منظم." عملية التوجيه في مرحلتين تحدث عملية التوجيه في مرحلتين. أولاً، يقوم نموذج التوجيه المتناسق مع التفضيلات بأخذ طلب المستخدم وكامل مجموعة السياسات واختيار السياسة الأكثر ملاءمة. ثانيًا، تقوم وظيفة التعيين بربط السياسة المختارة بنموذج LLM المحدد لها. بفضل فصل منطق اختيار النموذج عن السياسة، يمكن إضافة أو إزالة أو تبديل النماذج ببساطة من خلال تحرير سياسات التوجيه، دون الحاجة إلى إعادة تدريب أو تعديل الروتير نفسه. يوفر هذا الانفصال المرونة اللازمة للنشر العملي، حيث تتغير النماذج والحالات الاستخدامية باستمرار. قوة السياسات داخل الطلب يقوم Arch-Router، وهو نموذج لغوي مدمج يحتوي على 1.5 مليار معلمة، بتلقي طلب المستخدم وكامل مجموعة وصف السياسات ضمن طلبه. ثم يولد معرف السياسة الأفضل مطابقة. نظرًا لأن السياسات جزء من المدخلات، يمكن للنظام التكيف مع طرق جديدة أو معدلة في وقت الاستدلال من خلال التعلم السياقي دون إعادة التدريب. هذا النهج التوليدي يسمح لـ Arch-Router باستخدام معرفته المدربة مسبقًا لفهم معنى الطلب والسياسات والمعالجة التاريخ الكامل للمحادثة على الفور. مخاوف الكفاءة والتأخير المخاوف الشائعة من تضمين سياسات شاملة في الطلب تتعلق بالتأخير المحتمل. ومع ذلك، صمم الباحثون Arch-Router ليكون فعالًا للغاية. "بينما يمكن أن تكون طول سياسات التوجيه طويلًا، يمكننا زيادة نافذة السياق لـ Arch-Router بتأثير ضئيل على التأخير"، يشرح سلمان بارеча، مؤلف الورقة ومدير عام ومؤسس كاتانيمو لابز. يشير إلى أن التأخير يتأثر بشكل أساسي بطول المخرجات، ولـ Arch-Router، تكون المخرجات مجرد اسم قصير لسياسة التوجيه، مثل "تحرير_صورة" أو "إنشاء_وثيقة". أداء Arch-Router في الاختبارات لبناء Arch-Router، قام الباحثون بتعديل نسخة بحجم 1.5 مليار معلمة من نموذج Qwen 2.5 على مجموعة بيانات مركبة تتكون من 43,000 مثال. ثم اختبروا أدائه ضد النماذج الخاصة الرائدة من OpenAI، Anthropic، وGoogle على أربع مجموعات بيانات عامة مصممة لتقييم أنظمة الذكاء الاصطناعي التفاعلية. أظهرت النتائج أن Arch-Router حقق أعلى درجة في التوجيه الكلية، وهي 93.17%,محققًا تفوقًا بمتوسط 7.71% على جميع النماذج الأخرى، بما في ذلك تلك الرائدة. أظهر النموذج أيضًا قدرة قوية على تتبع السياق عبر دورات متعددة، مما يؤكد فعاليته في المحادثات الطويلة. تطبيقات عملية وفقًا لبارеча، يتم تطبيق هذا النهج بالفعل في عدة سيناريوهات. على سبيل المثال، في أدوات الترميز مفتوحة المصدر، يستخدم المطورون Arch-Router لتوجيه مراحل مختلفة من عملهم، مثل "تصميم الشفرة"، "فهم الشفرة"، وإنشاء الشفرة، إلى LLMs الأكثر ملاءمة لكل مهمة. يمكن للشركات أيضًا توجيه طلبات إنشاء الوثائق إلى نموذج مثل Claude 3.7 Sonnet بينما ترسل مهام تحرير الصور إلى Gemini 2.5 Pro. يشير بارеча أيضًا إلى أن النظام مثالي "للمساعدين الشخصيين في مختلف المجالات، حيث يكون لدى المستخدمين مجموعة متنوعة من المهام من تلخيص النصوص إلى الاستفسارات المعرفية". يضيف أنه "في هذه الحالات، يمكن لـ Arch-Router مساعدة المطورين في توحيد وتحسين تجربة المستخدم بشكل عام". دمج مع Arch يتم دمج هذا الإطار مع Arch، وهو خادم بروكسي مخصص للذكاء الاصطناعي من شركة كاتانيمو لابز، والذي يسمح للمطورين بتنفيذ قواعد تشكيل حركة المرور المعقدة. على سبيل المثال، عند دمج نموذج LLM جديد، يمكن لفريق العمل توجيه جزء صغير من الحركة لسياسة توجيه محددة إلى النموذج الجديد، التحقق من أدائه باستخدام معايير داخلية، ومن ثم انتقال الحركة بالكامل بثقة. تعمل الشركة أيضًا على دمج أدواتها مع منصات التقييم لتبسيط هذه العملية للمطورين في الشركات بشكل أكبر. الهدف النهائي في النهاية، الهدف هو الخروج عن الممارسات المنعزلة لتنفيذ الذكاء الاصطناعي. "يساعد Arch-Router—وArch بشكل أوسع—المطورين والشركات على الانتقال من تنفيذ مجزأ لـ LLMs إلى نظام موحد مدفوع بالسياسات"، يقول بارecha. "في السيناريوهات التي تكون فيها مهام المستخدمين متنوعة، يساعد إطارنا على تحويل هذا التنوع في المهام والنماذج إلى تجربة موحدة، مما يجعل المنتج النهائي يبدو سلسًا للمست用户. تقييم الحدث والشركة يعد Arch-Router تقدمًا كبيرًا في مجال توجيه النماذج اللغوية الكبيرة، حيث يوفر حلًا مرنًا وفعالًا يتناسب مع تفضيلات المستخدمين الحقيقية. يتوقع الخبراء أن هذا الإطار سيثري تجارب المستخدمين ويسهل عملية التحديث والتطوير للشركات، مما يجعله أداة قيمة في بناء منتجات الذكاء الاصطناعي المستقبلية. كاتانيمو لابز هي شركة متخصصة في تطوير التقنيات المتعلقة بالذكاء الاصطناعي، وتعمل على تقديم حلول مبتكرة لتحديات التكنولوجيا الحديثة. تأسست الشركة بهدف توفير أدوات متطورة تسهل اعتماد الذكاء الاصطناعي في التطبيقات العملية، وهو ما يعكسه إطلاق Arch-Router.

Related Links