التاريخ

منذ 3 أشهر

الحجم

9.71 GB

المؤسسة

رابط الورقة البحثية

2510.18915

الترخيص

MIT

الوسوم

متعدد الوسائط

الإجابة على الأسئلة البصرية

UNO-Bench هو أول معيار تقييم موحد كامل النموذج يصدره فريق LongCat التابع لشركة Meituan في عام 2025. عنوان الورقة البحثية ذات الصلة هو "UNO-Bench: معيار موحد لاستكشاف قانون التكوين بين أحادي النمط ومتعدد الأنماط في النماذج متعددة الأنماطالهدف هو تقييم قدرات الفهم أحادية النمط ومتعددة الأنماط بكفاءة.

تحتوي هذه المجموعة من البيانات على 1250 عينة كاملة الأنماط مع قابلية حل متعددة الأنماط وفقًا لمعيار 98%، و2480 عينة أحادية النمط، تغطي 44 نوعًا من المهام و5 مجموعات من الأنماط. تتضمن المجموعة أيضًا نموذجًا عامًا للتقييم يدعم التقييم الآلي لستة أنواع من الأسئلة، مما يوفر معيار تقييم موحدًا للمهام متعددة الأنماط. صُممت العينات كاملة الأنماط بعناية من قِبل بشر لتشبه التطبيقات العملية إلى حد كبير، وهي مناسبة بشكل خاص للسياق الصيني؛ وتُكمل العينات أحادية النمط الأبعاد المعرفية والقدرية الأساسية، مما يجعل التقييم الشامل أكثر شمولًا.

هياكل البيانات:

يتم تخزين البيانات بتنسيق Parquet، وتحتوي كل عينة على حقول منظمة:

qid (معرف العينة)، subset_name (اسم المجموعة الفرعية)؛
السؤال (السؤال النصي) والإجابة (الإجابة القياسية)؛
الصور / الصوت / الفيديو (المحتوى متعدد الوسائط، يتم تخزين مسارات الملفات كقاموس، ولا شيء إذا لم يكن موجودًا)؛
المهمة (44 فئة مهمة)، القدرة (نوع القدرة)، المصدر (مصدر البيانات)، نوع النتيجة (طريقة التسجيل).

UNO-Bench.torrent

البذر 1جارٍ التنزيل 0مكتمل 2إجمالي التنزيلات 69

UNO-Bench/
- README.md
  1.97 KB
- README.txt
  3.93 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه

ناقش على Discord

التاريخ

منذ 3 أشهر

الحجم

9.71 GB

المؤسسة

رابط الورقة البحثية

2510.18915

الترخيص

MIT

الوسوم

متعدد الوسائط

الإجابة على الأسئلة البصرية

هياكل البيانات:

يتم تخزين البيانات بتنسيق Parquet، وتحتوي كل عينة على حقول منظمة:

qid (معرف العينة)، subset_name (اسم المجموعة الفرعية)؛
السؤال (السؤال النصي) والإجابة (الإجابة القياسية)؛
الصور / الصوت / الفيديو (المحتوى متعدد الوسائط، يتم تخزين مسارات الملفات كقاموس، ولا شيء إذا لم يكن موجودًا)؛
المهمة (44 فئة مهمة)، القدرة (نوع القدرة)، المصدر (مصدر البيانات)، نوع النتيجة (طريقة التسجيل).

UNO-Bench.torrent

البذر 1جارٍ التنزيل 0مكتمل 2إجمالي التنزيلات 69

UNO-Bench/
- README.md
  1.97 KB
- README.txt
  3.93 KB

مجموعة بيانات IF-Bench المعيارية لفهم صور الأشعة تحت الحمراء

منذ 2 أشهر

معيار تقييم التعلم السياقي CL-bench

منذ 6 أيام

مجموعة بيانات معيارية لفهم المشهد المكاني الزمني من OST-Bench

منذ 3 أشهر

25.58 GB60

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

منذ 2 أشهر

مجموعة بيانات تقييم تحرير الصور EditReward-Bench

منذ 3 أشهر

5.08 GB61

معيار MUVR لاسترجاع الفيديو متعدد الوسائط غير المقصوص

منذ 2 أشهر

مجموعة بيانات معيار أداء الديناميكيات الجزيئية NAMD_Benchmark

منذ 3 أشهر

مجموعة بيانات MMSVGBench المعيارية لتوليد الرسومات المتجهة متعددة الوسائط

منذ 2 أشهر

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

منذ شهر واحد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات معيارية للتقييم الكامل UNO-Bench

هياكل البيانات:

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات معيارية للتقييم الكامل UNO-Bench

هياكل البيانات:

ذات صلة مجموعات بيانات

مجموعة بيانات IF-Bench المعيارية لفهم صور الأشعة تحت الحمراء

معيار تقييم التعلم السياقي CL-bench

مجموعة بيانات معيارية لفهم المشهد المكاني الزمني من OST-Bench

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

مجموعة بيانات تقييم تحرير الصور EditReward-Bench

معيار MUVR لاسترجاع الفيديو متعدد الوسائط غير المقصوص

مجموعة بيانات معيار أداء الديناميكيات الجزيئية NAMD_Benchmark

مجموعة بيانات MMSVGBench المعيارية لتوليد الرسومات المتجهة متعددة الوسائط

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات معيارية للتقييم الكامل UNO-Bench

هياكل البيانات:

ذات صلة مجموعات بيانات

مجموعة بيانات IF-Bench المعيارية لفهم صور الأشعة تحت الحمراء

معيار تقييم التعلم السياقي CL-bench

مجموعة بيانات معيارية لفهم المشهد المكاني الزمني من OST-Bench

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

مجموعة بيانات تقييم تحرير الصور EditReward-Bench

معيار MUVR لاسترجاع الفيديو متعدد الوسائط غير المقصوص

مجموعة بيانات معيار أداء الديناميكيات الجزيئية NAMD_Benchmark

مجموعة بيانات MMSVGBench المعيارية لتوليد الرسومات المتجهة متعددة الوسائط

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة مجموعات بيانات

مجموعة بيانات IF-Bench المعيارية لفهم صور الأشعة تحت الحمراء

معيار تقييم التعلم السياقي CL-bench

مجموعة بيانات معيارية لفهم المشهد المكاني الزمني من OST-Bench

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

مجموعة بيانات تقييم تحرير الصور EditReward-Bench

معيار MUVR لاسترجاع الفيديو متعدد الوسائط غير المقصوص

مجموعة بيانات معيار أداء الديناميكيات الجزيئية NAMD_Benchmark

مجموعة بيانات MMSVGBench المعيارية لتوليد الرسومات المتجهة متعددة الوسائط

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

ذات صلة مجموعات بيانات

مجموعة بيانات IF-Bench المعيارية لفهم صور الأشعة تحت الحمراء

معيار تقييم التعلم السياقي CL-bench

مجموعة بيانات معيارية لفهم المشهد المكاني الزمني من OST-Bench

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

مجموعة بيانات تقييم تحرير الصور EditReward-Bench

معيار MUVR لاسترجاع الفيديو متعدد الوسائط غير المقصوص

مجموعة بيانات معيار أداء الديناميكيات الجزيئية NAMD_Benchmark

مجموعة بيانات MMSVGBench المعيارية لتوليد الرسومات المتجهة متعددة الوسائط

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات