HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم استدعاءات الوظائف المعقدة ComplexFuncBench

التاريخ

منذ 9 أشهر

الحجم

5.21 MB

المؤسسة

جامعة تسينغهوا

رابط النشر

github.com

رابط الورقة البحثية

arxiv.org

ComplexFuncBench تعني Complex Function Calling Benchmark، وهي مجموعة بيانات معيارية تستخدم لتقييم قدرات نماذج اللغة الكبيرة (LLMs) في سيناريوهات استدعاء الوظائف المعقدة. تم تطوير مجموعة البيانات من قبل باحثين من Zhipu AI وجامعة Tsinghua في عام 2025 لملء الفجوات في المعايير الحالية من حيث مكالمات الوظائف متعددة الخطوات والمقيدة. "نتائج الورقة ذات الصلة هي"ComplexFuncBench: استكشاف استدعاءات الوظائف متعددة الخطوات والمقيدة في سيناريو السياق الطويل".

تغطي مجموعة البيانات 1000 عينة من استدعاءات الوظائف المعقدة في 5 سيناريوهات واقعية، بما في ذلك 600 عينة من نطاق واحد، و150 عينة من كل من الفنادق والرحلات الجوية وتأجير السيارات والمعالم السياحية، و400 عينة من نطاقات متعددة. يحتوي نطاق التاكسي على وظيفتين فقط، لذا يتم استخدامه عبر النطاقات فقط. بالمقارنة مع المعايير المرجعية الحالية، يحتوي ComplexFuncBench على استدعاءات وظيفية مقيدة ومتعددة الخطوات، ويتطلب أرشيفات طويلة للحجج، واستنتاج قيمة المعلمة، وسياق يبلغ طوله 128 كيلو بايت.

ComplexFuncBench.torrent
البذر 0التنزيل 1مكتمل 64إجمالي التنزيلات 154
  • ComplexFuncBench/
    • README.md
      1.6 KB
    • README.txt
      3.2 KB
      • data/
        • bench.zip
          5.21 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp