إيكا-إيفال: إطار شامل لتقييم النماذج اللغوية الكبيرة في اللغات الهندية

التقدم السريع في نماذج اللغات الكبيرة (LLMs) قد زاد الحاجة إلى إطار عمل تقييمي يتجاوز المعايير المركزة على اللغة الإنجليزية ويستجيب لمتطلبات المناطق ذات التنوع اللغوي مثل الهند. نقدم EKA-EVAL، وهو إطار عمل تقييمي موحد جاهز للإنتاج يدمج أكثر من 35 معيارًا، بما في ذلك 10 مجموعات بيانات خاصة باللغات الهندية، ويشمل فئات مثل الاستدلال، الرياضيات، استخدام الأدوات، فهم السياق الطويل والفهم القرائي. مقارنة بأدوات التقييم الحالية للغات الهندية، يقدم EKA-EVAL تغطية أوسع للمعايير، مع دعم مدمج للاستدلال الموزع، التكميم (quantization)، واستخدام متعدد الوحدات المعالجة الرسومية (multi-GPU). يتموضع مقارنتنا المنظمة EKA-EVAL كأول مجموعة تقييمية شاملة وقابلة للتوسيع مصممة لكل من النماذج العالمية والنماذج الخاصة باللغات الهندية، مما يقلل بشكل كبير من العقبات أمام التقييم متعدد اللغات. الإطار متاح كمصدر مفتوح ومتوفر للجمهور على https://github.com/lingo-iitgn/eka-eval وهو جزء من المبادرة المستمرة EKA (https://eka.soket.ai)، التي تستهدف توسيع نطاقها إلى أكثر من 100 معيار وإنشاء نظام بيئي قوي للتقييم متعدد اللغات لنماذج اللغات الكبيرة.