HyperAIHyperAI

Command Palette

Search for a command to run...

MASSIVE: مجموعة بيانات متعددة اللغات لفهم اللغة الطبيعية تحتوي على مليون مثال و51 لغة منوعة نحوياً

Jack FitzGerald; Christopher Hench; Charith Peris; Scott Mackie; Kay Rottmann; Ana Sanchez; Aaron Nash; Liam Urbach; Vishesh Kakarala; Richa Singh; Swetha Ranganath; Laurie Crist; Misha Britan; Wouter Leeuwis; Gokhan Tur; Prem Natarajan

الملخص

نقدم مجموعة البيانات الضخمة (MASSIVE)--حزمة الموارد متعددة اللغات لشركة أمازون (SLURP) لملء الفتحات، تصنيف النوايا، وتقييم المساعد الافتراضي. تحتوي مجموعة البيانات MASSIVE على مليون جملة واقعية متوازية ومصنفة للمساعد الافتراضي تغطي 51 لغة، 18 مجالًا، 60 نية، و55 فتحة. تم إنشاء MASSIVE من خلال تكليف مترجمين محترفين بتوطين مجموعة البيانات SLURP التي كانت باللغة الإنجليزية فقط إلى 50 لغة متنوعة من حيث البنية اللغوية من 29 فصيلة. كما نقدم نتائج النمذجة على XLM-R و mT5، بما في ذلك دقة التوافق الدقيق، دقة تصنيف النوايا، ودرجة F1 لملء الفتحات. لقد أطلقنا مجموعة بياناتنا وكود النمذجة والنموذج بشكل عام.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp