Command Palette
Search for a command to run...
واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات
التاريخ
رابط الورقة البحثية
الترخيص
MIT
VenusBench-GD هي مجموعة بيانات لتحديد مواقع عناصر واجهة المستخدم الرسومية وفهمها، وقد أصدرتها شركة Ant Group بالتعاون مع iMean AI في عام 2025. وتشمل الأبحاث ذات الصلة... فينوس بنش-جي دي: معيار شامل متعدد المنصات بواجهة مستخدم رسومية لمهام التأريض المتنوعةالهدف هو تقييم قدرة النموذج على تحديد وتحديد موقع عناصر واجهة المستخدم المستهدفة بدقة بناءً على تعليمات اللغة الطبيعية عبر واجهات منصات مختلفة.
تحتوي هذه المجموعة من البيانات على 6166 عينة مصنفة يدويًا، تغطي مهمتين: التحديد الأساسي للموقع والاستدلال المتقدم. تتكون كل عينة من لقطة شاشة للواجهة وأمر لغوي طبيعي مطابق. جُمعت البيانات من 97 تطبيقًا وموقعًا إلكترونيًا مختلفًا، تغطي منصات الويب والهواتف المحمولة وأجهزة الكمبيوتر المكتبية، وتشمل واجهات باللغتين الصينية والإنجليزية. تقيّم المهام الأساسية فهم النموذج لأنواع عناصر الواجهة، ومحتوى النصوص، والعلاقات المكانية، والمظهر المرئي. أما المهام المتقدمة فتُضيف الاستدلال، والفهم الوظيفي، والرفض المنطقي للأهداف غير الموجودة، مما يفرض متطلبات أعلى على فهم النموذج الشامل للواجهة وقدراته على الاستدلال الدلالي. من خلال عملية توليد آلية متعددة المراحل ومراجعة يدوية، تُقلل هذه المجموعة من البيانات بشكل فعال من تشويش البيانات والغموض مع الحفاظ على نطاقها، مما يوفر أساسًا موثوقًا لتقييم وكلاء واجهة المستخدم الرسومية والنماذج متعددة الوسائط.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.