HyperAIHyperAI

Command Palette

Search for a command to run...

تعزيز الفكر الموجه

التاريخ

منذ 4 ساعات

المؤسسة

جامعة تسينغهوا
تينسنت

رابط الورقة البحثية

2503.08525

تم اقتراح إطار عمل تعزيز الفكر الموجه (GTR) من قبل باحثين من جامعة تسينغهوا وشركة تينسنت وجامعة بكين في 11 يوليو 2025. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية. GTR: تعزيز الفكر الموجه يمنع انهيار الفكر في تدريب وكيل VLM القائم على التعلم المعزز .

GTR هو إطار عمل بسيط وقابل للتطوير يجمع بين التصحيح التلقائي للأخطاء والتعلم المعزز، وهو مصمم أساسًا لمعالجة مشكلة "انهيار التفكير" لدى وكلاء نموذج اللغة المرئية (VLM) الذين يتخذون قرارات متعددة الخطوات في بيئات بصرية معقدة، والناجمة عن الاعتماد فقط على مكافآت النتائج. يقدم هذا الإطار مصححًا تلقائيًا للأخطاء لتقييم وتحسين استدلال الوكيل في كل خطوة من خطوات التعلم المعزز، مما يتيح التدريب المتزامن للاستدلال والإجراءات دون الحاجة إلى إضافة تعليقات توضيحية يدوية مكثفة نقطة بنقطة. تُظهر نتائج الأبحاث أن GTR يُثبط بشكل فعال انهيار التفكير ويُحسّن بشكل كبير أداء وقدرة التعميم للنماذج (مثل LLaVA-7B) في بيئات بصرية متنوعة؛ في سيناريوهات معقدة مثل لعبة النقاط الـ 24 والمهام المجسدة، يمكّن النماذج من تحقيق معدل نجاح في المهام أعلى من 3 إلى 5 مرات من أحدث النماذج الحالية ذات عدد أقل من المعلمات.




بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp