HyperAI

مجموعة بيانات تقييم استدعاءات الوظائف المعقدة ComplexFuncBench

التاريخ

منذ 4 أشهر

الحجم

5.21 MB

المؤسسة

جامعة تسينغهوا

رابط النشر

github.com

ComplexFuncBench تعني Complex Function Calling Benchmark، وهي مجموعة بيانات معيارية تستخدم لتقييم قدرات نماذج اللغة الكبيرة (LLMs) في سيناريوهات استدعاء الوظائف المعقدة. تم تطوير مجموعة البيانات من قبل باحثين من Zhipu AI وجامعة Tsinghua في عام 2025 لملء الفجوات في المعايير الحالية من حيث مكالمات الوظائف متعددة الخطوات والمقيدة. "نتائج الورقة ذات الصلة هي"ComplexFuncBench: استكشاف استدعاءات الوظائف متعددة الخطوات والمقيدة في سيناريو السياق الطويل".

تغطي مجموعة البيانات 1000 عينة من استدعاءات الوظائف المعقدة في 5 سيناريوهات واقعية، بما في ذلك 600 عينة من نطاق واحد، و150 عينة من كل من الفنادق والرحلات الجوية وتأجير السيارات والمعالم السياحية، و400 عينة من نطاقات متعددة. يحتوي نطاق التاكسي على وظيفتين فقط، لذا يتم استخدامه عبر النطاقات فقط. بالمقارنة مع المعايير المرجعية الحالية، يحتوي ComplexFuncBench على استدعاءات وظيفية مقيدة ومتعددة الخطوات، ويتطلب أرشيفات طويلة للحجج، واستنتاج قيمة المعلمة، وسياق يبلغ طوله 128 كيلو بايت.

ComplexFuncBench.torrent
البذر 0التنزيل 1مكتمل 18إجمالي التنزيلات 32
  • ComplexFuncBench/
    • README.md
      1.6 KB
    • README.txt
      3.2 KB
      • data/
        • bench.zip
          5.21 MB