Command Palette
Search for a command to run...
مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات
التاريخ
رابط الورقة البحثية
الترخيص
CC BY 4.0
MCIF هي مجموعة بيانات تقييم متعددة اللغات والوسائط، مُعَلَّمة يدويًا، تستند إلى خطابات علمية، وقد أصدرتها مؤسسة برونو كيسلر عام 2025 بالتعاون مع معهد كارلسروه للتكنولوجيا وشركة Translated. وتشمل الأبحاث ذات الصلة... MCIF: معيار تتبع التعليمات متعدد الوسائط ومتعدد اللغات من المحادثات العلميةالهدف هو تقييم قدرة نماذج اللغة الكبيرة متعددة الوسائط على فهم وتنفيذ التعليمات في سيناريوهات متعددة اللغات، بالإضافة إلى قدرتها على دمج المعلومات الكلامية والمرئية والنصية من أجل الاستدلال.
تحتوي هذه المجموعة من البيانات على 100 عينة صوتية علمية، تغطي ما يقارب 10 ساعات من محتوى الفيديو. وهي توفر ثلاثة أنماط للإدخال: نص، وصوت، وفيديو، وتغطي أربع لغات: الإنجليزية، والألمانية، والإيطالية، والصينية، وتشمل صيغ إدخال طويلة وقصيرة. من بينها، توفر 21 عينة صوتية أساسية نصوصًا بشرية كاملة وعالية الجودة باللغة الإنجليزية، بحجم نص يبلغ حوالي 15500 كلمة؛ أما العينات المتبقية فتُستخدم بشكل أساسي لمهام التلخيص، حيث تُرفق كل عينة بملخص بحثي ومحتوى صوتي ومرئي متوافق. تغطي مجموعة البيانات مهامًا تعليمية مثل التعرف، والترجمة، والإجابة على الأسئلة، والتلخيص، وكلها مدفوعة بتعليمات اللغة الطبيعية، وتُستخدم لتقييم قدرات فهم التعليمات عبر اللغات المختلفة للنماذج متعددة الوسائط.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.