مجموعة بيانات تفضيلات الاستدلال متعدد الوسائط MMPR
التاريخ
الحجم
رابط النشر
العلامات
MMPR (مجموعة بيانات التفضيلات المتعددة الوسائط) هي مجموعة بيانات تفضيلات متعددة الوسائط واسعة النطاق تم إصدارها بشكل مشترك في عام 2024 من قبل فرق البحث في مختبر الذكاء الاصطناعي في شنغهاي وجامعة فودان وجامعة نانجينغ وجامعة هونج كونج الصينية وجامعة تسينغهوا وSenseTime. "نتائج الورقة ذات الصلة هي"تعزيز القدرة على التفكير في نماذج اللغة الكبيرة متعددة الوسائط من خلال تحسين التفضيلات المختلطةتحتوي مجموعة البيانات على 750,000 عينة بدون إجابات صحيحة واضحة، و2.5 مليون عينة بإجابات صحيحة واضحة. تغطي العينات مجالات متعددة، مثل المؤهلات البصرية (VQA)، والعلوم، والرسومات، والرياضيات، والتعرف الضوئي على الحروف (OCR)، والمستندات، لضمان التنوع. عند بناء مجموعة البيانات، أولى الباحثون اهتمامًا خاصًا لتجنب الاستجابات الإيجابية والسلبية الخاطئة نظرًا لقيود القواعد الاستدلالية، وخاصةً في مجالي المؤهلات البصرية والمستندات. صُممت مجموعة البيانات لتحسين أداء النموذج في مهام الاستدلال متعدد الوسائط، مع تجنب الآثار السلبية المحتملة أثناء التدريب.
