HyperAI
Back to Headlines

مساعد الذكاء الاصطناعي "CodeSteer" يدرب نماذج اللغة besar على اختيار الوسائل المناسبة لحل المشكلات بين النص والشفرة البرمجية

منذ 5 أيام

مساعد الذكاء الاصطناعي يساعد النماذج اللغوية على اختيار بين النص والرموز البرمجية لحل المشكلات طور باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) مساعدًا ذكيًا يُدعى CodeSteer، يمكنه توجيه النماذج اللغوية الكبيرة (LLMs) لتبديل استخدامها بين النصوص والرموز البرمجية حتى تتمكن من الإجابة بشكل صحيح على الاستفسارات. النموذج الصغير CodeSteer يقوم بإنشاء سلسلة من الرسائل التوجيهية لتعزيز كفاءة النموذج الأكبر، بمراجعة الإجابات السابقة والحالية وتوفير توجيهات لإصلاح أو تحسين الحلول حتى الوصول إلى الإجابة الصحيحة. المشكلة على الرغم من براعة النماذج اللغوية الكبيرة في استخدام المنطق النصي لفهم سياق الوثائق وإعطاء إجابات منطقية حول محتواها، فإنها غالباً ما تواجه صعوبة في حل المسائل الحسابية البسيطة باستخدام النص فقط. هذا ينطبق على المهام الحسابية والخوارزمية، حيث أن النص ليس دائمًا الطريقة المثلى للتفكير في هذه المهام. بعض النماذج اللغوية يمكنها إنتاج رموز برمجية مثل Python لمعالجة الاستفسارات الرمزية، لكنها لا تعرف دائمًا متى وكيفية استخدام هذه الرموز بشكل فعال. الحل CodeSteer، الذي يعتبر نموذجًا لغويًا أصغر، يقوم بمراجعة الاستفسارات ويحدد ما إذا كان النص أو الرموز البرمجية أكثر ملاءمة للمشكلة، وما نوع الرموز البرمجية التي يجب استخدامها. ثم يُرسل الرسائل التوجيهية للنموذج الأكبر، الذي يتابع هذه الرسائل لإعطاء الإجابة ويرسل النتيجة مرة أخرى إلى CodeSteer لمراجعتها. إذا كانت الإجابة غير صحيحة، سيستمر CodeSteer في إرسال الرسائل التوجيهية حتى يصل إلى الإجابة الصحيحة. التجارب والنتائج خلال تجارب الباحثين، اكتشفوا أن إضافة CodeSteer إلى نموذج لغوي كبير يزيد من دقة الإجابات على المهام الرمزية، مثل ضرب الأعداد، لعب Sudoku، وتجميع الكتل، بنسبة تزيد عن 30%. كما مكنت هذه الطريقة النماذج الأقل تطورًا من تجاوز النماذج الأكثر تقدمًا من حيث مهارات التفكير المنطقي. يمكن لهذا التقدم أن يعزز قدرات النماذج اللغوية الكبيرة في حل المهام المعقدة التي تكون صعبة للغاية عند حلها باستخدام المنطق النصي وحده، مثل إنشاء مسارات للروبوتات في بيئات غير مؤكدة أو جدولة الشحنات في سلسلة الإمداد الدولية. تطوير البيانات لم يستطع الباحثون العثور على بيانات رمزية مناسبة لتدريب واختبار النموذج، لذا جمعوا مجموعة من 37 مهمة رمزية معقدة، بما في ذلك المنطق المكاني، الرياضيات، ترتيب الأسباب، والتحسين، وبنوا قاعدة بيانات خاصة بهم تُسمى SymBench. استخدموا طريقة تدريب تعتمد على SymBench لتعظيم أداء CodeSteer. النتائج في تجاربهم، تفوق CodeSteer على جميع الطرق المقارنة التسعة التي تم تقييمها، حيث رفع الدقة المتوسطة من 53.3% إلى 86.4%. يتمتع النموذج بالقدرة على الحفاظ على أدائه حتى في المهام غير المألوفة وعلى مجموعة متنوعة من النماذج اللغوية الكبيرة. بالإضافة إلى ذلك، يمكن لنموذج عام مدعم بـ CodeSteer أن يحقق دقة أعلى من النماذج المتقدمة المصممة خصيصاً للتفكير والتنظيم المعقد، مع الحاجة إلى حساب أقل بكثير. المستقبل يتطلع الباحثون إلى تطوير CodeSteer لتسريع عملية التوجيه التكراري. كما يعملون على دراسة كيفية تدريب نموذج موحد بكفاءة يمكنه التبديل بين التفكير النصي وإنتاج الرموز البرمجية، بدلاً من الاعتماد على مساعد منفصل. تقييم الخبراء يقول جينسونغ يوون، باحث علمي في Google Cloud AI، والذي لم يكن مشاركًا في هذا العمل: "يقدم المؤلفون حلاً أنيقًا للتحدي الأساسي في استخدام الأدوات في النماذج اللغوية الكبيرة. هذه الطريقة البسيطة ولكن ذات الأثر الكبير تمكن النماذج اللغوية الكبيرة المتقدمة من تحقيق تحسينات كبيرة في الأداء دون الحاجة إلى تدريب مباشر." يضيف شي وانغ، باحث علمي رفيع المستوى في Google DeepMind، والذي لم يكن مشاركًا في هذا العمل أيضًا: "نجاحهم في تدريب نموذج أصغر ومُتخصِّص لتوجيه النماذج اللغوية الكبيرة بفعالية له تأثير كبير. هذا التعاون الذكي بين مختلف وكالات الذكاء الاصطناعي يفتح الباب أمام تطبيقات أكثر صلابة وتنوعًا في السيناريوهات المعقدة في العالم الحقيقي." نبذة عن CodeSteer CodeSteer هو مساعد ذكي طوره باحثون من MIT لتحسين قدرات النماذج اللغوية الكبيرة على حل المهام الرمزية والحسابية. يعتمد على تدريب نموذج أصغر يمكنه تقديم توجيهات دقيقة للنموذج الأكبر، مما يعزز دقة الإجابات ويكسر حدود التفكير النصي التقليدي. هذه الطريقة تُعد مكملة لجهود تطوير النماذج اللغوية الكبيرة، وتهدف إلى تعظيم استخدام التقنيات الفعالة الموجودة وتوظيفها لتعزيز القدرات الحالية للنماذج.

Related Links