Command Palette
Search for a command to run...
تعزيز الفكر الموجه
التاريخ
رابط الورقة البحثية
تم اقتراح إطار عمل تعزيز الفكر الموجه (GTR) من قبل باحثين من جامعة تسينغهوا وشركة تينسنت وجامعة بكين في 11 يوليو 2025. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية. GTR: تعزيز الفكر الموجه يمنع انهيار الفكر في تدريب وكيل VLM القائم على التعلم المعزز .
GTR هو إطار عمل بسيط وقابل للتطوير يجمع بين التصحيح التلقائي للأخطاء والتعلم المعزز، وهو مصمم أساسًا لمعالجة مشكلة "انهيار التفكير" لدى وكلاء نموذج اللغة المرئية (VLM) الذين يتخذون قرارات متعددة الخطوات في بيئات بصرية معقدة، والناجمة عن الاعتماد فقط على مكافآت النتائج. يقدم هذا الإطار مصححًا تلقائيًا للأخطاء لتقييم وتحسين استدلال الوكيل في كل خطوة من خطوات التعلم المعزز، مما يتيح التدريب المتزامن للاستدلال والإجراءات دون الحاجة إلى إضافة تعليقات توضيحية يدوية مكثفة نقطة بنقطة. تُظهر نتائج الأبحاث أن GTR يُثبط بشكل فعال انهيار التفكير ويُحسّن بشكل كبير أداء وقدرة التعميم للنماذج (مثل LLaVA-7B) في بيئات بصرية متنوعة؛ في سيناريوهات معقدة مثل لعبة النقاط الـ 24 والمهام المجسدة، يمكّن النماذج من تحقيق معدل نجاح في المهام أعلى من 3 إلى 5 مرات من أحدث النماذج الحالية ذات عدد أقل من المعلمات.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.