Command Palette
Search for a command to run...
مجموعة بيانات مهام تشغيل سطح المكتب AgentNet
التاريخ
رابط الورقة البحثية
الترخيص
MIT
AgentNet هي أول مجموعة بيانات واسعة النطاق لمسارات الوكلاء الذكية، تعتمد على حاسوب مكتبي، يصدرها مختبر XLANG بجامعة هونغ كونغ في عام ٢٠٢٥، بالتعاون مع Moonshot AI وجامعة ستانفورد ومؤسسات أخرى. نتائج البحث ذات الصلة هي:OPENCUA: أسس مفتوحة لوكلاء استخدام الكمبيوتر"، والذي يهدف إلى دعم وتقييم وكلاء تشغيل واجهة المستخدم الرسومية متعددة الأنظمة ونماذج الرؤية واللغة والفعل (VLA).
تحتوي مجموعة البيانات هذه على 22.6 ألف تتبع لمهام استخدام الحاسوب مُعلّق يدويًا، تغطي أنظمة Windows وmacOS وUbuntu، وأكثر من 200 تطبيق وموقع إلكتروني. تنقسم السيناريوهات إلى أربع فئات: مكتبية، احترافية، يومية، ونظامية. وهي مناسبة لتدريب وتقييم أتمتة سطح المكتب، والعمليات متعددة التطبيقات، والوكلاء متعددي المنصات.
هياكل البيانات والحقول
تحتوي كل عينة على:
- بيانات تعريف المهمة: رقم المهمة (task_id)، التعليمات (instructions)؛
- تقييم الجودة: الإنجاز، والاتساق، والكفاءة، والصعوبة؛
- الوصف الملخص: natural_language_task، actual_task؛
- مصفوفة المسار: traj (خطوات التشغيل المسجلة بالترتيب الزمني).
خطوات المسار (traj)بناء:
- تحتوي كل خطوة على كائنات الفهرس والصورة (لقطة الشاشة) والقيمة:
- الملاحظة (مراقبة المشهد)، والفكر (التفكير/التخطيط)، والعمل (إجراء اللغة الطبيعية)، والكود (الكود القابل للتنفيذ، مثل PyAutoGUI)، وlast_step_correct، وlast_step_redundant، والتأمل.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.