مجموعة بيانات تقييم الاستدلال الصوتي VERA

مجموعة بيانات مضغوطة في ذاكرة سياق OpenMementos

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات أسئلة الصوت البسيطة

مجموعة بيانات GPT-5.4-step-by-step-reasoning

استخدم مجموعة البيانات هذه

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

ناقش على Discord

التاريخ

منذ 8 أشهر

الحجم

2.37 GB

المؤسسة

عنوان URL للنشر

github.com

رابط الورقة البحثية

2509.26542

الترخيص

CC BY 4.0

الوسوم

المعالجة الصوتية والصوتية

الإجابة على الأسئلة الذكية

الاستدلال

الرياضيات (115 مشاركة): مسائل رياضية تنافسية من AIME 2025
الويب (1,107 إدخالات): مهام تصفح الويب واسترجاع المعلومات من BrowseComp
العلوم (161 عنصرًا): أسئلة علمية على مستوى الدراسات العليا بناءً على GPQA Diamond.
السياق الطويل (548 عنصرًا): مهام متعددة الجولات لفهم قراءة النصوص الطويلة من MRCR
حقائق (1000 إدخال): أسئلة وأجوبة واقعية تعتمد على SimpleQA. جميع العينات مُقدمة بصيغة الكلام الأصلي، مع توليف صوتي بواسطة برنامج Boson Higgs Audio 2 لضمان أداء كلامي متسق وواضح وعالي الجودة. يشير حقل audio_file لكل عينة في مجموعة البيانات إلى مسار الصوت المقابل.

هياكل البيانات:

البيانات مُنظَّمة بصيغة JSON، وتحتوي كل حلقة على عينة كاملة لاستنتاج الكلام. تشمل مجالاتها الأساسية ما يلي:

id: معرف فريد
المسار: المسار الذي ينتمي إليه (التفكير الرياضي / الويب / العلوم / السياق الطويل / الواقعي)
الأدوار: عدد من جولات الحوار، بما في ذلك:

الدور (مُثبَّت للمستخدم)
text_content (نص مشفر باستخدام Base64)
audio_file (مسار الصوت المقابل)
prefix_text و postfix_text (يمكن أن يكونا فارغين)

context_documents: المواد السياقية التكميلية (إن وجدت)
المقاطعات: تسجيل أحداث المقاطعة
metadata.expected_answer: إجابة المرجع المشفرة
canary: مفتاح فك التشفير الفريد لهذه العينة.

الاستشهاد

@misc{lin2025vera,
title={Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap},
author={Lin, Yueqian and Hu, Zhengmian and Wang, Qinsi and Liu, Yudong and Zhang, Hengfan and Subramanian, Jayakumar and Vlassis, Nikos and Li, Hai Helen and Chen, Yiran},
year={2025},
eprint={2509.26542},
archivePrefix={arXiv},
primaryClass={eess.AS},
url={https://arxiv.org/abs/2509.26542}
}

VERA.torrent

البذر 2جارٍ التنزيل 0مكتمل 4إجمالي التنزيلات 92

VERA/
- README.md
  2.37 KB
- README.txt
  4.74 KB

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

منذ 35 دقائق

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

بعد 7 ساعات

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

منذ 7 أيام

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

منذ 25 أيام

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

منذ 22 أيام

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات الاستدلال البصري VisCoR-55K

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

سرطان الثدي: مجموعة بيانات الدمج متعددة الوسائط

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات مضغوطة في ذاكرة سياق OpenMementos

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات أسئلة الصوت البسيطة

مجموعة بيانات GPT-5.4-step-by-step-reasoning