HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات RLAIF-V مجموعة بيانات تفضيلات متعددة الوسائط واسعة النطاق

التاريخ

منذ 2 أعوام

الحجم

11.77 GB

المؤسسة

OpenBMB

رابط الورقة البحثية

arxiv.org

مجموعة بيانات RLAIF-V عبارة عن مجموعة بيانات تفضيلية متعددة الوسائط تم إنشاؤها بواسطة الذكاء الاصطناعي وتغطي مجموعة متنوعة من المهام والمجالات. تحتوي مجموعة البيانات على أكثر من 44757 زوجًا عالي الجودة للتدريب وتقييم نماذج اللغة الكبيرة متعددة الوسائط (MLLMs). تستخدم مجموعة بيانات RLAIF-V نهجًا جديدًا لتفكيك استجابات النموذج باستخدام نموذج كبير مفتوح المصدر وتوفر بيانات ردود فعل عالية الجودة لتقليل ظاهرة الهلوسة في MLLMs المختلفة.

بالإضافة إلى ذلك، يتم استخدام مجموعة بيانات RLAIF-V أيضًا لتدريب نموذج MiniCPM-Llama3-V 2.5، والذي يمثل أول نموذج MLLM17 من البداية إلى النهاية على مستوى GPT-4V. قام مشروع RLAIF-V بإتاحة الكود والأوزان (7B، 12B) والبيانات مفتوحة المصدر للاستخدام والمزيد من البحث من قبل مجتمع البحث.

تتضمن الميزات الرئيسية لمجموعة بيانات RLAIF-V ما يلي:

  1. بيانات ردود الفعل عالية الجودة:الحد الفعال من الهلوسة من خلال MLLMs المختلفة المستخدمة في مجموعة البيانات.
  2. مفتوح المصدر:مجموعة البيانات مفتوحة المصدر بالكامل، مما يسمح للباحثين بالوصول إليها واستخدامها بحرية.
  3. متعدد المهام ومتعدد المجالات:تغطي مجموعة البيانات مجموعة واسعة من المهام والمجالات، وتوفر بيانات تفضيلية متنوعة.

إن ترخيص مجموعة بيانات RLAIF-V هو CC BY NC 4.0، والذي يسمح بالاستخدام غير التجاري فقط، ولا ينبغي استخدام النماذج المدربة باستخدام مجموعة البيانات هذه خارج أغراض البحث.

RLAIF-V-Dataset.torrent
البذر 1جارٍ التنزيل 0مكتمل 175إجمالي التنزيلات 243
  • RLAIF-V-Dataset/
    • README.md
      1.86 KB
    • README.txt
      3.72 KB
      • data/
        • RLAIF-V-Dataset.zip
          11.77 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp