HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات مهام تشغيل سطح المكتب AgentNet

التاريخ

منذ 2 أشهر

المؤسسة

مونشوت الذكاء الاصطناعي
جامعة ستانفورد
جامعة هونغ كونغ

رابط الورقة البحثية

2508.09123

الترخيص

MIT

انضم إلى مجتمع Discord

AgentNet هي أول مجموعة بيانات واسعة النطاق لمسارات الوكلاء الذكية، تعتمد على حاسوب مكتبي، يصدرها مختبر XLANG بجامعة هونغ كونغ في عام ٢٠٢٥، بالتعاون مع Moonshot AI وجامعة ستانفورد ومؤسسات أخرى. نتائج البحث ذات الصلة هي:OPENCUA: أسس مفتوحة لوكلاء استخدام الكمبيوتر"، والذي يهدف إلى دعم وتقييم وكلاء تشغيل واجهة المستخدم الرسومية متعددة الأنظمة ونماذج الرؤية واللغة والفعل (VLA).

تحتوي مجموعة البيانات هذه على 22.6 ألف تتبع لمهام استخدام الحاسوب مُعلّق يدويًا، تغطي أنظمة Windows وmacOS وUbuntu، وأكثر من 200 تطبيق وموقع إلكتروني. تنقسم السيناريوهات إلى أربع فئات: مكتبية، احترافية، يومية، ونظامية. وهي مناسبة لتدريب وتقييم أتمتة سطح المكتب، والعمليات متعددة التطبيقات، والوكلاء متعددي المنصات.

هياكل البيانات والحقول

تحتوي كل عينة على:

  • بيانات تعريف المهمة: رقم المهمة (task_id)، التعليمات (instructions)؛
  • تقييم الجودة: الإنجاز، والاتساق، والكفاءة، والصعوبة؛
  • الوصف الملخص: natural_language_task، actual_task؛
  • مصفوفة المسار: traj (خطوات التشغيل المسجلة بالترتيب الزمني).

خطوات المسار (traj)بناء:

  • تحتوي كل خطوة على كائنات الفهرس والصورة (لقطة الشاشة) والقيمة:
    • الملاحظة (مراقبة المشهد)، والفكر (التفكير/التخطيط)، والعمل (إجراء اللغة الطبيعية)، والكود (الكود القابل للتنفيذ، مثل PyAutoGUI)، وlast_step_correct، وlast_step_redundant، والتأمل.
توزيع حقل مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp