مجموعة بيانات الصور والنصوص WIT
التاريخ
منذ 3 أعوام
الحجم
25.2 GB
رابط النشر
رابط الورقة البحثية
الترخيص
أخرى

WIT تعني نص الصورة المستند إلى ويكيبيديا، وهي عبارة عن مجموعة بيانات كبيرة متعددة الوسائط ومتعددة اللغات. تتكون مجموعة البيانات من مجموعة مختارة من 37.6 مليون مثال لصور ونصوص غنية بالكيانات، تحتوي على 11.5 مليون صورة فريدة بـ 108 لغة من لغات ويكيبيديا. حجم هذه المجموعة من البيانات يجعلها مناسبة للاستخدام كمجموعة بيانات تدريب مسبق لنماذج التعلم الآلي المتعددة الوسائط.
تتمتع WIT بأربع مزايا فريدة:
- WIT هي أكبر مجموعة بيانات متعددة الوسائط من حيث عدد أمثلة الصور والنصوص.
- يغطي هذا الكتاب أكثر من 100 لغة (مع ما لا يقل عن 12000 مثال لكل لغة)، كما يتم توفير نص متعدد اللغات للعديد من الصور.
- بالمقارنة مع مجموعات البيانات السابقة، يمثل WIT مجموعة أكثر تنوعًا من المفاهيم والكيانات في العالم الحقيقي.
- يوفر WIT مجموعة اختبارات واقعية صعبة للغاية.
WIT.torrent
البذر 1التنزيل 1مكتمل 570إجمالي التنزيلات 736
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.
البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
Hyper Newsletters
اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp