مجموعة بيانات مرجعية متعددة الوسائط ذاتية التوجيه متعددة الوسائط
التاريخ
منذ 9 أشهر
الحجم
3.16 GB
رابط النشر
الترخيص
CC BY-SA 4.0
العلامات

تم إطلاق مجموعة البيانات هذه بشكل مشترك من قبل جامعة تشجيانغ ومعهد البرمجيات التابع للأكاديمية الصينية للعلوم وجامعة شنغهاي للتكنولوجيا ومؤسسات أخرى في عام 2024. نتائج الورقة ذات الصلة هي "التعليم الذاتي متعدد الوسائط: تعليم الصورة المجردة الاصطناعية والاستدلال البصري باستخدام نموذج اللغة".
تحتوي مجموعة البيانات على إجمالي 11,193 صورة مجردة مع أسئلة ذات صلة، تغطي 8 فئات رئيسية بما في ذلك لوحات المعلومات وخرائط الطرق والمخططات والجداول ومخططات التدفق ومخططات العلاقات والألغاز المرئية وخطط الطوابق ثنائية الأبعاد، بالإضافة إلى 62,476 بيانات إضافية لضبط النموذج.
Multi-modal-Self-instruct.torrent
البذر 1التنزيل 1مكتمل 68إجمالي التنزيلات 105