Command Palette
Search for a command to run...
مجموعة بيانات الصور والنصوص WIT
التاريخ
الحجم
عنوان URL للنشر
رابط الورقة البحثية
الترخيص
Other

WIT تعني نص الصورة المستند إلى ويكيبيديا، وهي عبارة عن مجموعة بيانات كبيرة متعددة الوسائط ومتعددة اللغات. تتكون مجموعة البيانات من مجموعة مختارة من 37.6 مليون مثال لصور ونصوص غنية بالكيانات، تحتوي على 11.5 مليون صورة فريدة بـ 108 لغة من لغات ويكيبيديا. حجم هذه المجموعة من البيانات يجعلها مناسبة للاستخدام كمجموعة بيانات تدريب مسبق لنماذج التعلم الآلي المتعددة الوسائط.
تتمتع WIT بأربع مزايا فريدة:
- WIT هي أكبر مجموعة بيانات متعددة الوسائط من حيث عدد أمثلة الصور والنصوص.
- يغطي هذا الكتاب أكثر من 100 لغة (مع ما لا يقل عن 12000 مثال لكل لغة)، كما يتم توفير نص متعدد اللغات للعديد من الصور.
- بالمقارنة مع مجموعات البيانات السابقة، يمثل WIT مجموعة أكثر تنوعًا من المفاهيم والكيانات في العالم الحقيقي.
- يوفر WIT مجموعة اختبارات واقعية صعبة للغاية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.