Command Palette
Search for a command to run...
مجموعة بيانات الصور والنصوص متعددة الوسائط CapsFusion-120M
التاريخ
الحجم
رابط النشر
رابط الورقة البحثية

هذه المجموعة من البيانات هي مجموعة بيانات متعددة الوسائط للصور والنصوص أطلقتها جامعة تسينغهوا و BAAI في عام 2024. نتائج الورقة CapsFusion: إعادة النظر في بيانات الصور والنصوص على نطاق واسعلقد تم قبوله من قبل CVPR 2024.
تُعد مجموعة البيانات هذه موردًا عالي الجودة يمكن استخدامه للتدريب المسبق متعدد الوسائط على نطاق واسع. يتضمن هذا الإصدار تعليقات توضيحية مقابلة من مجموعات البيانات LAION-2B وLAION-COCO، مما يسهل التحليل المقارن والدراسات المتعمقة بشكل أكبر حول جودة بيانات الصور والنصوص.
يحتوي كل إدخال بيانات على أربعة حقول:
- رابط الصورة
- عنوان LAION-2B (النص البديل الأصلي من الويب)
- ترجمات LAION-COCO (تم تركيبها بواسطة BLIP)
- عنوان CapsFusion (فريق البحث)
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.