HyperAI

مجموعة بيانات RLAIF-V مجموعة بيانات تفضيلات متعددة الوسائط واسعة النطاق

التاريخ

منذ عام واحد

الحجم

11.77 GB

المؤسسة

OpenBMB

رابط النشر

huggingface.co

مجموعة بيانات RLAIF-V عبارة عن مجموعة بيانات تفضيلية متعددة الوسائط تم إنشاؤها بواسطة الذكاء الاصطناعي وتغطي مجموعة متنوعة من المهام والمجالات. تحتوي مجموعة البيانات على أكثر من 44757 زوجًا عالي الجودة للتدريب وتقييم نماذج اللغة الكبيرة متعددة الوسائط (MLLMs). تستخدم مجموعة بيانات RLAIF-V نهجًا جديدًا لتفكيك استجابات النموذج باستخدام نموذج كبير مفتوح المصدر وتوفر بيانات ردود فعل عالية الجودة لتقليل ظاهرة الهلوسة في MLLMs المختلفة.

بالإضافة إلى ذلك، يتم استخدام مجموعة بيانات RLAIF-V أيضًا لتدريب نموذج MiniCPM-Llama3-V 2.5، والذي يمثل أول نموذج MLLM17 من البداية إلى النهاية على مستوى GPT-4V. قام مشروع RLAIF-V بإتاحة الكود والأوزان (7B، 12B) والبيانات مفتوحة المصدر للاستخدام والمزيد من البحث من قبل مجتمع البحث.

تتضمن الميزات الرئيسية لمجموعة بيانات RLAIF-V ما يلي:

  1. بيانات ردود الفعل عالية الجودة:الحد الفعال من الهلوسة من خلال MLLMs المختلفة المستخدمة في مجموعة البيانات.
  2. مفتوح المصدر:مجموعة البيانات مفتوحة المصدر بالكامل، مما يسمح للباحثين بالوصول إليها واستخدامها بحرية.
  3. متعدد المهام ومتعدد المجالات:تغطي مجموعة البيانات مجموعة واسعة من المهام والمجالات، وتوفر بيانات تفضيلية متنوعة.

إن ترخيص مجموعة بيانات RLAIF-V هو CC BY NC 4.0، والذي يسمح بالاستخدام غير التجاري فقط، ولا ينبغي استخدام النماذج المدربة باستخدام مجموعة البيانات هذه خارج أغراض البحث.

RLAIF-V-Dataset.torrent
البذر 1التنزيل 1مكتمل 77إجمالي التنزيلات 88
  • RLAIF-V-Dataset/
    • README.md
      1.86 KB
    • README.txt
      3.72 KB
      • data/
        • RLAIF-V-Dataset.zip
          11.77 GB