HyperAIHyperAI

Command Palette

Search for a command to run...

Console

مجموعة بيانات أزواج الصور والنصوص COYO-700M

التاريخ

منذ 2 أعوام

الحجم

104.46 GB

المؤسسة

عنوان URL للنشر

github.com

Featured Image

COYO-700M عبارة عن مجموعة بيانات كبيرة تحتوي على 747 مليون زوج من الصور والنصوص بالإضافة إلى العديد من السمات الوصفية الأخرى لتحسين قابلية الاستخدام لتدريب النماذج المختلفة. تتبع مجموعة البيانات هذه استراتيجية مماثلة لمجموعات البيانات السابقة الخاصة بالرؤية واللغة، حيث تقوم بجمع العديد من أزواج النصوص البديلة المفيدة في مستندات HTML والصور المرتبطة بها.

عملية جمع البيانات

من أكتوبر 2020 إلى أغسطس 2021، جمع فريق البحث ما يقرب من 10 مليارات زوج من مصادر النصوص والصور البديلة في مستندات HTML في CommonCrawl وقاموا بإزالة الأزواج غير المفيدة بأقل تكلفة من خلال عملية تصفية على مستوى الصورة والنص. يوضح الشكل عملية جمع البيانات التي قام بها فريق البحث.

coyo-700m.torrent
البذر 1جارٍ التنزيل 0مكتمل 154إجمالي التنزيلات 350
  • coyo-700m/
    • README.md
      1.32 KB
    • README.txt
      2.63 KB
      • data/
        • coyo-700m.zip
          104.46 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية بالذكاء الاصطناعي
وحدات معالجة الرسوميات الجاهزة للاستخدام
أفضل تسعير

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp