Date

il y a un an

Taille

5.21 MB

Organisation

URL de publication

github.com

URL du document

arxiv.org

Balises

Mathématiques

ComplexFuncBench signifie Complex Function Calling Benchmark, qui est un ensemble de données de référence utilisé pour évaluer les capacités des grands modèles de langage (LLM) dans des scénarios d'appel de fonctions complexes. L'ensemble de données a été développé par des chercheurs de Zhipu AI et de l'Université Tsinghua en 2025 pour combler les lacunes des références existantes en termes d'appels de fonctions multi-étapes et restreints. Les résultats pertinents de l'article sont «ComplexFuncBench : exploration des appels de fonctions multi-étapes et contraints dans un scénario à contexte long". L'ensemble de données couvre 1 000 échantillons d'appels de fonctions complexes dans 5 scénarios réels, dont 600 échantillons à domaine unique, 150 chacun pour les hôtels, les vols, les locations de voitures et les attractions, et 400 échantillons inter-domaines. Le domaine taxi n'a que 2 fonctions, il n'est donc utilisé que sur plusieurs domaines. Comparé aux benchmarks existants, ComplexFuncBench contient des appels de fonctions en plusieurs étapes et contraints, nécessite de longues archives d'arguments, une inférence de valeur de paramètre et un contexte de 128 Ko.

ComplexFuncBench.torrent

Seeding 0Téléchargement 1Terminé 91Total Downloads 238

ComplexFuncBench/
- README.md
  1.6 KB
- README.txt
  3.2 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

il y a 2 mois

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 3 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 4 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 6 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Télécharger

Discuter sur Discord

Date

il y a un an

Taille

5.21 MB

Organisation

URL de publication

github.com

URL du document

arxiv.org

Balises

Mathématiques

ComplexFuncBench.torrent

Seeding 0Téléchargement 1Terminé 91Total Downloads 238

ComplexFuncBench/
- README.md
  1.6 KB
- README.txt
  3.2 KB

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

il y a 2 mois

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 3 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 4 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 6 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données d'évaluation Des Appels De Fonctions Complexes ComplexFuncBench

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Des Appels De Fonctions Complexes ComplexFuncBench

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Des Appels De Fonctions Complexes ComplexFuncBench

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données ToolACE Pour l'apprentissage Des Outils Complexes

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG