HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

ناقش على Discord

التاريخ

منذ شهر واحد

المؤسسة

مؤسسة برونو كيسلر
عدة
مترجم

رابط الورقة البحثية

2507.19634

الترخيص

CC BY 4.0

MCIF هي مجموعة بيانات تقييم متعددة اللغات والوسائط، مُعَلَّمة يدويًا، تستند إلى خطابات علمية، وقد أصدرتها مؤسسة برونو كيسلر عام 2025 بالتعاون مع معهد كارلسروه للتكنولوجيا وشركة Translated. وتشمل الأبحاث ذات الصلة... MCIF: معيار تتبع التعليمات متعدد الوسائط ومتعدد اللغات من المحادثات العلميةالهدف هو تقييم قدرة نماذج اللغة الكبيرة متعددة الوسائط على فهم وتنفيذ التعليمات في سيناريوهات متعددة اللغات، بالإضافة إلى قدرتها على دمج المعلومات الكلامية والمرئية والنصية من أجل الاستدلال.

تحتوي هذه المجموعة من البيانات على 100 عينة صوتية علمية، تغطي ما يقارب 10 ساعات من محتوى الفيديو. وهي توفر ثلاثة أنماط للإدخال: نص، وصوت، وفيديو، وتغطي أربع لغات: الإنجليزية، والألمانية، والإيطالية، والصينية، وتشمل صيغ إدخال طويلة وقصيرة. من بينها، توفر 21 عينة صوتية أساسية نصوصًا بشرية كاملة وعالية الجودة باللغة الإنجليزية، بحجم نص يبلغ حوالي 15500 كلمة؛ أما العينات المتبقية فتُستخدم بشكل أساسي لمهام التلخيص، حيث تُرفق كل عينة بملخص بحثي ومحتوى صوتي ومرئي متوافق. تغطي مجموعة البيانات مهامًا تعليمية مثل التعرف، والترجمة، والإجابة على الأسئلة، والتلخيص، وكلها مدفوعة بتعليمات اللغة الطبيعية، وتُستخدم لتقييم قدرات فهم التعليمات عبر اللغات المختلفة للنماذج متعددة الوسائط.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp