HyperAIHyperAI

Command Palette

Search for a command to run...

تخمين – فكر – أجب

التاريخ

منذ 11 أيام

المؤسسة

فيفو (شركة فيفو للاتصالات المتنقلة المحدودة)

رابط الورقة البحثية

2509.12108

تم اقتراح خوارزمية Guess–Think–Answer (GTA) من قبل فريق خوارزمية مختبر الذكاء الاصطناعي في vivo في سبتمبر 2025، وتم نشر نتائج البحث ذات الصلة في الورقة البحثية "GTA: التعلم التعزيزي الموجه بالإشراف لتصنيف النصوص باستخدام نماذج لغوية كبيرة".

يعمل إطار عمل GTA بجعل النموذج يُولّد تخمينًا أوليًا (مُحسّنًا من خلال فقدان الإنتروبيا المتقاطعة)، ثم يُفكّر في هذا التخمين لتوليد الإجابة النهائية، مع استخدام مكافآت التعلم التعزيزي (RL) في الوقت نفسه لتشكيل الناتج النهائي وشكل هيكل GTA بأكمله. يُمكّن هذا الإطار النموذج من تعلّم أنماط الاستدلال الفعّالة تلقائيًا من خلال التعلم التعزيزي، مما يُلغي الحاجة إلى الشرح اليدوي لسلسلة الاستدلال، ويجمع بين كفاءة الضبط الدقيق المُشرف (SFT) والقدرات المُحسّنة للتعلم التعزيزي ضمن نموذج تدريب موحّد.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp