HyperAI

مجموعة بيانات تفضيلات الاستدلال متعدد الوسائط MMPR

التاريخ

منذ 5 أشهر

الحجم

29.29 GB

المؤسسة

مختبر الذكاء الاصطناعي في شنغهاي
جامعة فودان

رابط النشر

github.com

MMPR (مجموعة بيانات التفضيلات المتعددة الوسائط) هي مجموعة بيانات تفضيلات متعددة الوسائط واسعة النطاق تم إصدارها بشكل مشترك في عام 2024 من قبل فرق البحث في مختبر الذكاء الاصطناعي في شنغهاي وجامعة فودان وجامعة نانجينغ وجامعة هونج كونج الصينية وجامعة تسينغهوا وSenseTime. "نتائج الورقة ذات الصلة هي"تعزيز القدرة على التفكير في نماذج اللغة الكبيرة متعددة الوسائط من خلال تحسين التفضيلات المختلطةتحتوي مجموعة البيانات على 750,000 عينة بدون إجابات صحيحة واضحة، و2.5 مليون عينة بإجابات صحيحة واضحة. تغطي العينات مجالات متعددة، مثل المؤهلات البصرية (VQA)، والعلوم، والرسومات، والرياضيات، والتعرف الضوئي على الحروف (OCR)، والمستندات، لضمان التنوع. عند بناء مجموعة البيانات، أولى الباحثون اهتمامًا خاصًا لتجنب الاستجابات الإيجابية والسلبية الخاطئة نظرًا لقيود القواعد الاستدلالية، وخاصةً في مجالي المؤهلات البصرية والمستندات. صُممت مجموعة البيانات لتحسين أداء النموذج في مهام الاستدلال متعدد الوسائط، مع تجنب الآثار السلبية المحتملة أثناء التدريب.

مثال على البيانات من MMPR. بالنسبة للتعليمات التي تحتوي على إجابات صحيحة واضحة، اقترح فريق البحث عملية تعتمد على الصحة والتي تقوم بتجميع عينات من حلول متعددة وتعامل تلك التي تحتوي على إجابات صحيحة كإجابات اختيارية وتلك التي تحتوي على إجابات غير صحيحة كإجابات رفض. بالنسبة للأوامر التي لا تحتوي على إجابة صحيحة واضحة، اقترح فريق البحث استخدام DropoutNTP لتوليد استجابة الرفض. يتم التأكيد على الاختلافات بين الاستجابات المحددة والرفض في النص المائل. تشير العلامات الحمراء إلى إجابات غير صحيحة.

MMPR-OpenGVLab.torrent
البذر 1التنزيل 1مكتمل 46إجمالي التنزيلات 53
  • MMPR-OpenGVLab/
    • README.md
      2.12 KB
    • README.txt
      4.25 KB
      • data/
        • MMPR.zip
          14.63 GB
          • MMPR/
            • README.md
              14.63 GB
            • annotations.zip
              16.03 GB
            • images.zip
              29.29 GB
            • meta.json
              29.29 GB