HyperAIHyperAI

Command Palette

Search for a command to run...

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

التاريخ

منذ شهر واحد

المؤسسة

الذكاء الاصطناعي iMean
مجموعة النمل

رابط الورقة البحثية

2512.16501

الترخيص

MIT

VenusBench-GD هي مجموعة بيانات لتحديد مواقع عناصر واجهة المستخدم الرسومية وفهمها، وقد أصدرتها شركة Ant Group بالتعاون مع iMean AI في عام 2025. وتشمل الأبحاث ذات الصلة... فينوس بنش-جي دي: معيار شامل متعدد المنصات بواجهة مستخدم رسومية لمهام التأريض المتنوعةالهدف هو تقييم قدرة النموذج على تحديد وتحديد موقع عناصر واجهة المستخدم المستهدفة بدقة بناءً على تعليمات اللغة الطبيعية عبر واجهات منصات مختلفة.

تحتوي هذه المجموعة من البيانات على 6166 عينة مصنفة يدويًا، تغطي مهمتين: التحديد الأساسي للموقع والاستدلال المتقدم. تتكون كل عينة من لقطة شاشة للواجهة وأمر لغوي طبيعي مطابق. جُمعت البيانات من 97 تطبيقًا وموقعًا إلكترونيًا مختلفًا، تغطي منصات الويب والهواتف المحمولة وأجهزة الكمبيوتر المكتبية، وتشمل واجهات باللغتين الصينية والإنجليزية. تقيّم المهام الأساسية فهم النموذج لأنواع عناصر الواجهة، ومحتوى النصوص، والعلاقات المكانية، والمظهر المرئي. أما المهام المتقدمة فتُضيف الاستدلال، والفهم الوظيفي، والرفض المنطقي للأهداف غير الموجودة، مما يفرض متطلبات أعلى على فهم النموذج الشامل للواجهة وقدراته على الاستدلال الدلالي. من خلال عملية توليد آلية متعددة المراحل ومراجعة يدوية، تُقلل هذه المجموعة من البيانات بشكل فعال من تشويش البيانات والغموض مع الحفاظ على نطاقها، مما يوفر أساسًا موثوقًا لتقييم وكلاء واجهة المستخدم الرسومية والنماذج متعددة الوسائط.

مثال لمجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp