HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الصور والنصوص متعددة الوسائط CapsFusion-120M

التاريخ

منذ 2 أعوام

الحجم

23.21 GB

المؤسسة

جامعة تسينغهوا

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

Featured Image

هذه المجموعة من البيانات هي مجموعة بيانات متعددة الوسائط للصور والنصوص أطلقتها جامعة تسينغهوا و BAAI في عام 2024. نتائج الورقة CapsFusion: إعادة النظر في بيانات الصور والنصوص على نطاق واسعلقد تم قبوله من قبل CVPR 2024.

تُعد مجموعة البيانات هذه موردًا عالي الجودة يمكن استخدامه للتدريب المسبق متعدد الوسائط على نطاق واسع. يتضمن هذا الإصدار تعليقات توضيحية مقابلة من مجموعات البيانات LAION-2B وLAION-COCO، مما يسهل التحليل المقارن والدراسات المتعمقة بشكل أكبر حول جودة بيانات الصور والنصوص.

يحتوي كل إدخال بيانات على أربعة حقول:

  • رابط الصورة
  • عنوان LAION-2B (النص البديل الأصلي من الويب)
  • ترجمات LAION-COCO (تم تركيبها بواسطة BLIP)
  • عنوان CapsFusion (فريق البحث)
CapsFusion-120M.torrent
البذر 1جارٍ التنزيل 0مكتمل 180إجمالي التنزيلات 337
  • CapsFusion-120M/
    • README.md
      1.34 KB
    • README.txt
      2.69 KB
      • data/
        • CapsFusion-120M.zip
          23.21 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp