مجموعة بيانات تقييم استدعاءات الوظائف المعقدة ComplexFuncBench

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات GPT-5.4-step-by-step-reasoning

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تنزيل

ناقش على Discord

التاريخ

منذ عام واحد

الحجم

5.21 MB

المؤسسة

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

الوسوم

الرياضيات

الاستشهاد

@misc{zhong2025complexfuncbench,
title={ComplexFuncBench: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario},
author={Lucen Zhong and Zhengxiao Du and Xiaohan Zhang and Haiyi Hu and Jie Tang},
year={2025},
eprint={2501.10132},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2501.10132},
}

ComplexFuncBench.torrent

البذر 0جارٍ التنزيل 3مكتمل 133إجمالي التنزيلات 284

ComplexFuncBench/
- README.md
  1.6 KB
- README.txt
  3.2 KB

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

منذ 9 ساعات

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

منذ 7 أيام

مجموعة بيانات EAVSD لقصص الفيديو الإعلانية للتجارة الإلكترونية

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

منذ 13 أيام

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

سرطان الثدي: مجموعة بيانات الدمج متعددة الوسائط

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات GPT-5.4-step-by-step-reasoning