HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات أزواج الصور والنصوص COYO-700M

التاريخ

منذ 2 أعوام

الحجم

104.46 GB

المؤسسة

عنوان URL للنشر

github.com

Featured Image

COYO-700M عبارة عن مجموعة بيانات كبيرة تحتوي على 747 مليون زوج من الصور والنصوص بالإضافة إلى العديد من السمات الوصفية الأخرى لتحسين قابلية الاستخدام لتدريب النماذج المختلفة. تتبع مجموعة البيانات هذه استراتيجية مماثلة لمجموعات البيانات السابقة الخاصة بالرؤية واللغة، حيث تقوم بجمع العديد من أزواج النصوص البديلة المفيدة في مستندات HTML والصور المرتبطة بها.

عملية جمع البيانات

من أكتوبر 2020 إلى أغسطس 2021، جمع فريق البحث ما يقرب من 10 مليارات زوج من مصادر النصوص والصور البديلة في مستندات HTML في CommonCrawl وقاموا بإزالة الأزواج غير المفيدة بأقل تكلفة من خلال عملية تصفية على مستوى الصورة والنص. يوضح الشكل عملية جمع البيانات التي قام بها فريق البحث.

coyo-700m.torrent
البذر 1جارٍ التنزيل 0مكتمل 164إجمالي التنزيلات 358
  • coyo-700m/
    • README.md
      1.32 KB
    • README.txt
      2.63 KB
      • data/
        • coyo-700m.zip
          104.46 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp