مجموعة بيانات معيارية متعددة اللغات ومتعددة المهام P-MMEval

مجموعة بيانات PanScale للاستشعار عن بعد لتحسين وضوح الألوان

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

استخدم مجموعة البيانات هذه

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

ناقش على Discord

التاريخ

منذ 2 أعوام

الحجم

12.72 MB

المؤسسة

رابط الورقة البحثية

arxiv.org

الوسوم

المعايير

الاستشهاد

@misc{zhang2024pmmevalparallelmultilingualmultitask,
title={P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs},
author={Yidan Zhang and Yu Wan and Boyi Deng and Baosong Yang and Haoran Wei and Fei Huang and Bowen Yu and Junyang Lin and Fei Huang and Jingren Zhou},
year={2024},
eprint={2411.09116},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2411.09116},
}

P-MMEval.torrent

البذر 1جارٍ التنزيل 0مكتمل 173إجمالي التنزيلات 241

P-MMEval/
- README.md
  1.48 KB
- README.txt
  2.97 KB

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

منذ 9 ساعات

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

منذ 5 أيام

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

منذ 22 أيام

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

منذ 13 أيام

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات PanScale للاستشعار عن بعد لتحسين وضوح الألوان

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات