HyperAIHyperAI

Command Palette

Search for a command to run...

Console
منذ 2 أيام

AutoGLM: وكلاء أساسية ذاتية للواجهات الرسومية للمستخدم

AutoGLM: وكلاء أساسية ذاتية للواجهات الرسومية للمستخدم

الملخص

نقدّم "AutoGLM"، سلسلة جديدة ضمن عائلة ChatGLM، صُمّمت لتكون وكيلًا أساسيًا (Foundation Agent) للتحكم الذاتي في الأجهزة الرقمية من خلال واجهات المستخدم الرسومية (GUI). وعلى الرغم من أن النماذج الأساسية تتفوّق في اكتساب المعرفة البشرية، إلا أنها غالبًا ما تواجه صعوبات في اتخاذ القرارات داخل البيئات الواقعية الديناميكية، مما يحد من تقدّمها نحو الذكاء الاصطناعي العام. ويُبرز هذا التقييد أهمية تطوير وكالات أساسية قادرة على التعلّم من خلال التفاعل الذاتي مع البيئة، وذلك من خلال تعزيز النماذج الحالية. وتركّزنا على المتصفح الويب والهاتف كسيناريوهات تمثيلية لواجهات المستخدم الرسومية، وطوّرنا AutoGLM كنظام عملي للوكالات الأساسية مُصمم للتفاعل مع واجهات المستخدم الواقعية. ويُدمج نهجنا مجموعة شاملة من التقنيات والبنية التحتية لإنشاء أنظمة وكالة قابلة للنشر وتُقدّم فعليًا للمستخدمين. ومن خلال هذا التطوير، استخلصنا رأيين رئيسيين: أولًا، إن تصميم "واجهة وسيطة" مناسبة للتحكم في واجهات المستخدم الرسومية أمر بالغ الأهمية، حيث يُمكّن من فصل سلوكيات التخطيط عن سلوكيات التأصيل (Grounding)، التي تتطلب تحسينات مختلفة من حيث المرونة والدقة على التوالي. ثانيًا، طوّرنا إطارًا تدريبيًا تدريجيًا مبتكرًا يُمكّن AutoGLM من التعلّم التدريجي التلقائي عبر مناهج تدريب تطورية في الوقت الفعلي. وتُظهر تقييماتنا فعالية AutoGLM عبر مجالات متعددة: في تصفّح الويب، حقق AutoGLM معدل نجاح 55.2% على مهام VAB-WebArena-Lite (وأصبح 59.1% عند محاولة ثانية)، و96.2% في مهام تقييم OpenTable. وفي التحكم في الأجهزة الأندرويدية، بلغ معدل نجاح AutoGLM 36.2% على AndroidLab (VAB-Mobile)، و89.7% في المهام الشائعة ضمن تطبيقات أندرويد الشهيرة في الصين.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp