Command Palette
Search for a command to run...
مجموعة بيانات WGO-Bench Robot Video Benchmark
WGO-Bench هي مجموعة بيانات مرجعية لفيديوهات الروبوتات، أصدرتها شركة Macrodata Labs. تهدف هذه المجموعة إلى تقييم قدرة نماذج اللغة المرئية على تحويل فيديوهات الحركة، سواءً كانت من منظور الروبوت أو من منظور الشخص الأول، إلى شروح تفصيلية للمهام الفرعية مُؤرَّخة. تركز هذه المجموعة بشكل أساسي على مهمتين: اكتشاف الحدود وشرح المهام الفرعية. تُركز الشروح التفصيلية على وصف أحداث الحركة الكاملة وتغيرات الحالة الظاهرة في مقاطع الفيديو.
تكوين مجموعة البيانات:
- يحتوي على 100 حلقة فيديو، تشمل 743 مهمة فرعية رئيسية و63 تعليمات للمهام المستقلة.
- تنقسم مصادر البيانات إلى ثلاث فئات: مقاطع فيديو HomER من منظور الشخص الأول (25 مقطع فيديو)، ومقاطع فيديو RoboInter DROID للذراع الروبوتية (50 مقطع فيديو)، ومقاطع فيديو RoboCOIN Galaxea R1 Lite المثبتة على الرأس (25 مقطع فيديو).
- يتم تخزين البيانات بتنسيق Parquet، مع تضمين ملفات الفيديو (بايتات MP4) مباشرة في كل سطر من البيانات.
حقول البيانات:
- المعرف: معرف ثابت وفريد لمقطع فيديو.
- فيديو: بيانات ثنائية بتنسيق MP4 مضمنة مباشرة
- التعليمات: تعليمات المهمة عالية المستوى المقابلة لهذا الجزء
- المقاطع: قائمة بالمقاطع المصنفة بالذهب، يحتوي كل عنصر على start_sec (وقت البدء)، و end_sec (وقت الانتهاء)، و subtask (وصف المهمة الفرعية).
- البيانات الوصفية: معلومات إضافية خاصة بالمصدر بتنسيق JSON
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.