HyperAI

ShareGPT4V مجموعة بيانات نصية وصور عالية الجودة واسعة النطاق

التاريخ

منذ عام واحد

الحجم

466.32 MB

المؤسسة

جامعة العلوم والتكنولوجيا في الصين
مختبر الذكاء الاصطناعي في شنغهاي

رابط النشر

github.com

الترخيص

CC BY-SA 4.0

特色图像

مجموعة بيانات ShareGPT4V عبارة عن مجموعة بيانات عالية الجودة تتكون من عدد كبير من أزواج الصور والنصوص. يتم استخدامه لتدريب نموذج اللغة المرئية (VLM) لتحسين قدرات النموذج في فهم الصور وتوليد النصوص. تحتوي مجموعة البيانات على 1.2 مليون زوج من الصور والنصوص التي تعمل على محاذاة الميزات البصرية واللغوية بشكل فعال، وتعزز قدرة النموذج على اتباع التعليمات، وتضمين المزيد من المهام الأكاديمية مثل ScienceQA وTextVQA وSBU وما إلى ذلك. ومن خلال تقديم هذه المجموعة من البيانات، يحقق النموذج تحسنًا كبيرًا في قدرة محاذاة الصور والنصوص، وهو جانب أساسي لتعلم التمثيل المتعدد الوسائط.

تم إصدار مجموعة البيانات هذه بواسطة مختبر الذكاء الاصطناعي بجامعة العلوم والتكنولوجيا في الصين، شنغهاي، في عام 2023.

ShareGPT4V.torrent
البذر 1التنزيل 1مكتمل 79إجمالي التنزيلات 115
  • ShareGPT4V/
    • README.md
      1.51 KB
    • README.txt
      3.03 KB
      • data/
        • ShareGPT4V.zip
          466.32 MB