HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

Discuss on Discord

Date

منذ 8 ساعات

Organization

مؤسسة برونو كيسلر
عدة
مترجم

Paper URL

2507.19634

License

CC BY 4.0

MCIF هي مجموعة بيانات تقييم متعددة اللغات والوسائط، مُعَلَّمة يدويًا، تستند إلى خطابات علمية، وقد أصدرتها مؤسسة برونو كيسلر عام 2025 بالتعاون مع معهد كارلسروه للتكنولوجيا وشركة Translated. وتشمل الأبحاث ذات الصلة... MCIF: معيار تتبع التعليمات متعدد الوسائط ومتعدد اللغات من المحادثات العلميةالهدف هو تقييم قدرة نماذج اللغة الكبيرة متعددة الوسائط على فهم وتنفيذ التعليمات في سيناريوهات متعددة اللغات، بالإضافة إلى قدرتها على دمج المعلومات الكلامية والمرئية والنصية من أجل الاستدلال.

تحتوي هذه المجموعة من البيانات على 100 عينة صوتية علمية، تغطي ما يقارب 10 ساعات من محتوى الفيديو. وهي توفر ثلاثة أنماط للإدخال: نص، وصوت، وفيديو، وتغطي أربع لغات: الإنجليزية، والألمانية، والإيطالية، والصينية، وتشمل صيغ إدخال طويلة وقصيرة. من بينها، توفر 21 عينة صوتية أساسية نصوصًا بشرية كاملة وعالية الجودة باللغة الإنجليزية، بحجم نص يبلغ حوالي 15500 كلمة؛ أما العينات المتبقية فتُستخدم بشكل أساسي لمهام التلخيص، حيث تُرفق كل عينة بملخص بحثي ومحتوى صوتي ومرئي متوافق. تغطي مجموعة البيانات مهامًا تعليمية مثل التعرف، والترجمة، والإجابة على الأسئلة، والتلخيص، وكلها مدفوعة بتعليمات اللغة الطبيعية، وتُستخدم لتقييم قدرات فهم التعليمات عبر اللغات المختلفة للنماذج متعددة الوسائط.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp