Command Palette
Search for a command to run...
مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات
Date
Paper URL
License
CC BY 4.0
MCIF هي مجموعة بيانات تقييم متعددة اللغات والوسائط، مُعَلَّمة يدويًا، تستند إلى خطابات علمية، وقد أصدرتها مؤسسة برونو كيسلر عام 2025 بالتعاون مع معهد كارلسروه للتكنولوجيا وشركة Translated. وتشمل الأبحاث ذات الصلة... MCIF: معيار تتبع التعليمات متعدد الوسائط ومتعدد اللغات من المحادثات العلميةالهدف هو تقييم قدرة نماذج اللغة الكبيرة متعددة الوسائط على فهم وتنفيذ التعليمات في سيناريوهات متعددة اللغات، بالإضافة إلى قدرتها على دمج المعلومات الكلامية والمرئية والنصية من أجل الاستدلال.
تحتوي هذه المجموعة من البيانات على 100 عينة صوتية علمية، تغطي ما يقارب 10 ساعات من محتوى الفيديو. وهي توفر ثلاثة أنماط للإدخال: نص، وصوت، وفيديو، وتغطي أربع لغات: الإنجليزية، والألمانية، والإيطالية، والصينية، وتشمل صيغ إدخال طويلة وقصيرة. من بينها، توفر 21 عينة صوتية أساسية نصوصًا بشرية كاملة وعالية الجودة باللغة الإنجليزية، بحجم نص يبلغ حوالي 15500 كلمة؛ أما العينات المتبقية فتُستخدم بشكل أساسي لمهام التلخيص، حيث تُرفق كل عينة بملخص بحثي ومحتوى صوتي ومرئي متوافق. تغطي مجموعة البيانات مهامًا تعليمية مثل التعرف، والترجمة، والإجابة على الأسئلة، والتلخيص، وكلها مدفوعة بتعليمات اللغة الطبيعية، وتُستخدم لتقييم قدرات فهم التعليمات عبر اللغات المختلفة للنماذج متعددة الوسائط.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.