Command Palette
Search for a command to run...
واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات
Date
Paper URL
License
MIT
VenusBench-GD هي مجموعة بيانات لتحديد مواقع عناصر واجهة المستخدم الرسومية وفهمها، وقد أصدرتها شركة Ant Group بالتعاون مع iMean AI في عام 2025. وتشمل الأبحاث ذات الصلة... فينوس بنش-جي دي: معيار شامل متعدد المنصات بواجهة مستخدم رسومية لمهام التأريض المتنوعةالهدف هو تقييم قدرة النموذج على تحديد وتحديد موقع عناصر واجهة المستخدم المستهدفة بدقة بناءً على تعليمات اللغة الطبيعية عبر واجهات منصات مختلفة.
تحتوي هذه المجموعة من البيانات على 6166 عينة مصنفة يدويًا، تغطي مهمتين: التحديد الأساسي للموقع والاستدلال المتقدم. تتكون كل عينة من لقطة شاشة للواجهة وأمر لغوي طبيعي مطابق. جُمعت البيانات من 97 تطبيقًا وموقعًا إلكترونيًا مختلفًا، تغطي منصات الويب والهواتف المحمولة وأجهزة الكمبيوتر المكتبية، وتشمل واجهات باللغتين الصينية والإنجليزية. تقيّم المهام الأساسية فهم النموذج لأنواع عناصر الواجهة، ومحتوى النصوص، والعلاقات المكانية، والمظهر المرئي. أما المهام المتقدمة فتُضيف الاستدلال، والفهم الوظيفي، والرفض المنطقي للأهداف غير الموجودة، مما يفرض متطلبات أعلى على فهم النموذج الشامل للواجهة وقدراته على الاستدلال الدلالي. من خلال عملية توليد آلية متعددة المراحل ومراجعة يدوية، تُقلل هذه المجموعة من البيانات بشكل فعال من تشويش البيانات والغموض مع الحفاظ على نطاقها، مما يوفر أساسًا موثوقًا لتقييم وكلاء واجهة المستخدم الرسومية والنماذج متعددة الوسائط.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.