HyperAIHyperAI

Command Palette

Search for a command to run...

تخمين – فكر – أجب

Date

منذ 2 أشهر

Organization

فيفو (شركة فيفو للاتصالات المتنقلة المحدودة)

Paper URL

2509.12108

تم اقتراح خوارزمية Guess–Think–Answer (GTA) من قبل فريق خوارزمية مختبر الذكاء الاصطناعي في vivo في سبتمبر 2025، وتم نشر نتائج البحث ذات الصلة في الورقة البحثية "GTA: التعلم التعزيزي الموجه بالإشراف لتصنيف النصوص باستخدام نماذج لغوية كبيرة".

يعمل إطار عمل GTA بجعل النموذج يُولّد تخمينًا أوليًا (مُحسّنًا من خلال فقدان الإنتروبيا المتقاطعة)، ثم يُفكّر في هذا التخمين لتوليد الإجابة النهائية، مع استخدام مكافآت التعلم التعزيزي (RL) في الوقت نفسه لتشكيل الناتج النهائي وشكل هيكل GTA بأكمله. يُمكّن هذا الإطار النموذج من تعلّم أنماط الاستدلال الفعّالة تلقائيًا من خلال التعلم التعزيزي، مما يُلغي الحاجة إلى الشرح اليدوي لسلسلة الاستدلال، ويجمع بين كفاءة الضبط الدقيق المُشرف (SFT) والقدرات المُحسّنة للتعلم التعزيزي ضمن نموذج تدريب موحّد.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تخمين – فكر – أجب | Wiki | HyperAI