HyperAI

مجموعة بيانات معيارية للاستدلال متعدد الوسائط EMMA

مساعدة التنزيل

EMMA (الاستدلال المتعدد الوسائط المعزز) عبارة عن مجموعة بيانات مرجعية للاستدلال المتعدد الوسائط تم إصدارها في عام 2025 من قبل فرق بحثية من جامعة العلوم والتكنولوجيا الإلكترونية في الصين، وجامعة صن يات صن، وجامعة واشنطن، ومايكروسوفت. نتائج الورقة ذات الصلة هي:هل يمكن لـ MLLMs أن تفكر بطريقة متعددة الوسائط؟ EMMA: معيار مرجعي مُحسَّن متعدد الوسائط"، والذي يهدف إلى توفير منصة اختبار موحدة لتقييم قدرات التفكير المعقدة للنماذج الكبيرة متعددة الوسائط (MLLMs).

ترتكز مجموعة البيانات على مهام التفكير المتعدد الوسائط في مجالات الكيمياء العضوية (42%)، والرياضيات (32%)، والفيزياء (6%)، والبرمجة (20%). ويحتوي على 2788 سؤالاً، منها 1796 عينة تم إنشاؤها حديثًا. ويدعم تقسيم المهام الدقيقة ويهدف إلى تعزيز القدرة على الفهم المشترك للصور والنصوص. تتضمن أنواع مهام البيانات محاكاة التفاعل الكيميائي، والتفكير الرسومي الرياضي، وتتبع المسار الفيزيائي، وتصور البرمجة، وما إلى ذلك.

نسبة التخصصات المختلفة ومهامها الفرعية في مجموعة البيانات