HyperAIHyperAI

Command Palette

Search for a command to run...

إيكا-إيفال: إطار شامل لتقييم النماذج اللغوية الكبيرة في اللغات الهندية

Samridhi Raj Sinha Rajvee Sheth Abhishek Upperwal Mayank Singh

الملخص

التقدم السريع في نماذج اللغات الكبيرة (LLMs) قد زاد الحاجة إلى إطار عمل تقييمي يتجاوز المعايير المركزة على اللغة الإنجليزية ويستجيب لمتطلبات المناطق ذات التنوع اللغوي مثل الهند. نقدم EKA-EVAL، وهو إطار عمل تقييمي موحد جاهز للإنتاج يدمج أكثر من 35 معيارًا، بما في ذلك 10 مجموعات بيانات خاصة باللغات الهندية، ويشمل فئات مثل الاستدلال، الرياضيات، استخدام الأدوات، فهم السياق الطويل والفهم القرائي. مقارنة بأدوات التقييم الحالية للغات الهندية، يقدم EKA-EVAL تغطية أوسع للمعايير، مع دعم مدمج للاستدلال الموزع، التكميم (quantization)، واستخدام متعدد الوحدات المعالجة الرسومية (multi-GPU). يتموضع مقارنتنا المنظمة EKA-EVAL كأول مجموعة تقييمية شاملة وقابلة للتوسيع مصممة لكل من النماذج العالمية والنماذج الخاصة باللغات الهندية، مما يقلل بشكل كبير من العقبات أمام التقييم متعدد اللغات. الإطار متاح كمصدر مفتوح ومتوفر للجمهور على https://github.com/lingo-iitgn/eka-eval وهو جزء من المبادرة المستمرة EKA (https://eka.soket.ai)، التي تستهدف توسيع نطاقها إلى أكثر من 100 معيار وإنشاء نظام بيئي قوي للتقييم متعدد اللغات لنماذج اللغات الكبيرة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
إيكا-إيفال: إطار شامل لتقييم النماذج اللغوية الكبيرة في اللغات الهندية | مستندات | HyperAI