HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للمهام الأساسية متعددة اللغات من Multi-LMentry

Discuss on Discord

Date

منذ 2 أشهر

License

CC BY-SA 4.0

Multi-LMentry عبارة عن مجموعة بيانات مرجعية متعددة اللغات تم إصدارها في عام 2025، وهي مصممة لتقييم قدرة التعميم عبر اللغات للنماذج اللغوية الكبيرة (LLMs) بشكل منهجي لفهم اللغة منخفضة المستوى ومهام التفكير الأساسية في البيئات متعددة اللغات.

تغطي هذه المجموعة تسع لغات: الإنجليزية، الكتالانية، الألمانية، الإسبانية، الباسكية، الجاليكية، الكورية، الإيطالية، والبرتغالية البرازيلية. أُعيد تصميم المهام يدويًا بواسطة متحدثين أصليين، وهي مشابهة في شكلها لإطار عمل LMentry الأصلي، ولكن ليس كترجمات مباشرة، لضمان سلاسة وتوافقها الثقافي.

بنية مجموعة البيانات

  • يتم تنظيم مجموعة البيانات في مجلدات حسب اللغة.
  • في كل مجلد لغة، تتوافق كل مهمة مع ملف JSON.
  • يحتوي كل ملف JSON على تلميحات الإدخال والمخرجات المتوقعة للمهمة.
  • تشمل أنواع المهام بناء الجملة البسيطة، واختيار المفردات السياقية، والتفكير في الحروف.
  • بعض المهام خاصة باللغة؛ على سبيل المثال، يتم استبعاد مهام القافية في اللغات التي لا تنطبق عليها.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp