HyperAI

مجموعة بيانات محاذاة التفضيلات المتعددة الوسائط MM-RLHF

التاريخ

منذ 3 أشهر

الحجم

55.33 GB

المؤسسة

رابط النشر

mm-rlhf.github.io

الترخيص

Apache 2.0

MM-RLHF (التعلم التعزيزي المتعدد الوسائط من ردود الفعل البشرية) عبارة عن مجموعة بيانات متعددة الوسائط عالية الجودة ودقيقة.MM-RLHF: الخطوة التالية نحو محاذاة ماجستير القانون متعدد الوسائطنُشرت لأول مرة على arXiv عام ٢٠٢٥ من قِبل معهد الأتمتة التابع للأكاديمية الصينية للعلوم (CASIA). تهدف هذه المجموعة من البيانات إلى تعزيز أبحاث محاذاة نماذج اللغات الكبيرة متعددة الوسائط (MLLMs)، ومعالجة قضايا مصداقية النموذج وسلامته وتوافقه مع التفضيلات البشرية في التطبيقات العملية.

تحتوي مجموعة البيانات على 120 ألف زوج من بيانات مقارنة التفضيلات الدقيقة والموضحة يدويًا، والتي تغطي ثلاثة مجالات: فهم الصور، وتحليل الفيديو، والأمان المتعدد الوسائط. تتجاوز كمية البيانات الموارد المتاحة بكثير، حيث تغطي أكثر من 100000 حالة مهمة متعددة الوسائط. لقد تم تسجيل كل قطعة من البيانات بعناية وتفسيرها من قبل أكثر من 50 معلقًا، مما يضمن الجودة العالية وتفاصيل البيانات.

مثال لمجموعة البيانات

MM-RLHF.torrent
البذر 1التنزيل 2مكتمل 34إجمالي التنزيلات 34
  • MM-RLHF/
    • README.md
      1.55 KB
    • README.txt
      3.09 KB
      • data/
        • MM-RLHF.zip
          55.33 GB