HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 14 أيام

تثبيت وكالات استخدام الحاسوب على التمثيل البشري

تثبيت وكالات استخدام الحاسوب على التمثيل البشري

الملخص

لبناء وكالات استخدام الحاسوب الموثوقة، يُعد الترسيخ (grounding) شرطًا أساسيًا: أي الربط الدقيق بين التعليمات باللغة الطبيعية والعناصر الصحيحة على الشاشة. وعلى الرغم من توفر مجموعات بيانات كبيرة لتفاعلات الويب والهاتف المحمول، فإن الموارد عالية الجودة الخاصة ببيئات سطح المكتب محدودة. ولسد هذا الفجوة، نُقدّم "GroundCUA"، وهي مجموعة بيانات واسعة النطاق مخصصة لترسيخ سطح المكتب، تم إنشاؤها من خلال تظاهرات بشرية خبيرة. وتغطي هذه المجموعة 87 تطبيقًا تُصنف ضمن 12 فئة، وتشمل 56 ألف صورة شاشة، مع تسمية دقيقة لكل عنصر مرئي على الشاشة، ما يُنتج ما يزيد عن 3.56 مليون تسمية مُختَبرة بشرية. ومن هذه التظاهرات، نُولِّد تعليمات متنوعة تُمثّل طيفًا واسعًا من المهام الواقعية، مما يوفر بيانات عالية الجودة لتدريب النماذج. وباستخدام GroundCUA، نطوّر عائلة نماذج تُسمى GroundNext، التي تُرَوّج التعليمات إلى العناصر المستهدفة في واجهة المستخدم. وتحقيق GroundNext نتائج متفوقة على مستوى الحالة الراهنة (state-of-the-art) في خمسة معايير معيارية، عند مقياس 3B و7B، باستخدام التدريب المُحدَّد (supervised fine-tuning)، مع اعتماد أقل من عُشر كمية البيانات التدريبية المستخدمة في الدراسات السابقة. كما أن التدريب القائم على التعلم التعلُّمي (reinforcement learning) بعد التدريب يُحسّن الأداء بشكل إضافي، وعند تقييمه في بيئة وكيلية (agentic setting) على معيار OSWorld باستخدام o3 كمُخطِّط، تُظهر GroundNext نتائج مماثلة أو أفضل من نماذج تم تدريبها باستخدام كميات كبيرة من البيانات. تُبيّن هذه النتائج الدور الحاسم للبيانات عالية الجودة المُنتَجة بفضل خبراء في تطوير وكالات استخدام الحاسوب العامة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تثبيت وكالات استخدام الحاسوب على التمثيل البشري | الأوراق البحثية | HyperAI