Command Palette
Search for a command to run...
مجموعة بيانات الصور والنصوص WIT
Date
Size
Publish URL
Paper URL
License
Other

WIT تعني نص الصورة المستند إلى ويكيبيديا، وهي عبارة عن مجموعة بيانات كبيرة متعددة الوسائط ومتعددة اللغات. تتكون مجموعة البيانات من مجموعة مختارة من 37.6 مليون مثال لصور ونصوص غنية بالكيانات، تحتوي على 11.5 مليون صورة فريدة بـ 108 لغة من لغات ويكيبيديا. حجم هذه المجموعة من البيانات يجعلها مناسبة للاستخدام كمجموعة بيانات تدريب مسبق لنماذج التعلم الآلي المتعددة الوسائط.
تتمتع WIT بأربع مزايا فريدة:
- WIT هي أكبر مجموعة بيانات متعددة الوسائط من حيث عدد أمثلة الصور والنصوص.
- يغطي هذا الكتاب أكثر من 100 لغة (مع ما لا يقل عن 12000 مثال لكل لغة)، كما يتم توفير نص متعدد اللغات للعديد من الصور.
- بالمقارنة مع مجموعات البيانات السابقة، يمثل WIT مجموعة أكثر تنوعًا من المفاهيم والكيانات في العالم الحقيقي.
- يوفر WIT مجموعة اختبارات واقعية صعبة للغاية.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.