HyperAIHyperAI

مجموعة بيانات معيارية متعددة اللغات ومتعددة المهام P-MMEval

التاريخ

منذ 10 أشهر

الحجم

12.72 MB

المؤسسة

رابط النشر

huggingface.co

رابط الورقة البحثية

arxiv.org

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

مجموعة بيانات P-MMEval عبارة عن مجموعة بيانات معيارية متعددة اللغات ومتعددة المهام واسعة النطاق تم إنشاؤها بواسطة مختبر Tongyi التابع لمجموعة Alibaba في عام 2024، والتي تهدف إلى تقييم القدرات المتعددة اللغات لنماذج اللغة الكبيرة (LLMs) بشكل شامل. نتائج الورقة ذات الصلة هيP-MMEVAL: معيار متعدد اللغات ومتعدد المهام متوازي للتقييم المتسق لبرامج الماجستير في القانون"

تحتوي مجموعة البيانات على 3 مجموعات بيانات أساسية لمعالجة اللغة الطبيعية (NLP) و5 مجموعات بيانات متقدمة خاصة بالقدرات، تغطي مهام مثل إنشاء التعليمات البرمجية وفهم المعرفة والاستدلال الرياضي والاستدلال المنطقي واتباع التعليمات. من خلال مراجعة الترجمة من قبل الخبراء، تضمن P-MMEval تغطية متسقة للغات العشر وتقدم عينات متوازية عبر اللغات. وتشمل هذه اللغات الإنجليزية والصينية والعربية والإسبانية واليابانية والكورية والتايلاندية والفرنسية والبرتغالية والفيتنامية.

P-MMEval.torrent
البذر 1التنزيل 0مكتمل 96إجمالي التنزيلات 128
  • P-MMEval/
    • README.md
      1.48 KB
    • README.txt
      2.97 KB
      • data/
        • P-MMEval.zip
          12.72 MB
مجموعة بيانات معيارية متعددة اللغات ومتعددة المهام P-MMEval | مجموعات البيانات | HyperAI