HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم استدعاءات الوظائف المعقدة ComplexFuncBench

Date

منذ عام واحد

Size

5.21 MB

Organization

جامعة تسينغهوا

Publish URL

github.com

Paper URL

arxiv.org

ComplexFuncBench تعني Complex Function Calling Benchmark، وهي مجموعة بيانات معيارية تستخدم لتقييم قدرات نماذج اللغة الكبيرة (LLMs) في سيناريوهات استدعاء الوظائف المعقدة. تم تطوير مجموعة البيانات من قبل باحثين من Zhipu AI وجامعة Tsinghua في عام 2025 لملء الفجوات في المعايير الحالية من حيث مكالمات الوظائف متعددة الخطوات والمقيدة. "نتائج الورقة ذات الصلة هي"ComplexFuncBench: استكشاف استدعاءات الوظائف متعددة الخطوات والمقيدة في سيناريو السياق الطويل".

تغطي مجموعة البيانات 1000 عينة من استدعاءات الوظائف المعقدة في 5 سيناريوهات واقعية، بما في ذلك 600 عينة من نطاق واحد، و150 عينة من كل من الفنادق والرحلات الجوية وتأجير السيارات والمعالم السياحية، و400 عينة من نطاقات متعددة. يحتوي نطاق التاكسي على وظيفتين فقط، لذا يتم استخدامه عبر النطاقات فقط. بالمقارنة مع المعايير المرجعية الحالية، يحتوي ComplexFuncBench على استدعاءات وظيفية مقيدة ومتعددة الخطوات، ويتطلب أرشيفات طويلة للحجج، واستنتاج قيمة المعلمة، وسياق يبلغ طوله 128 كيلو بايت.

ComplexFuncBench.torrent
Seeding 0Downloading 1Completed 72Total Downloads 215
  • ComplexFuncBench/
    • README.md
      1.6 KB
    • README.txt
      3.2 KB
      • data/
        • bench.zip
          5.21 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp