Command Palette
Search for a command to run...
Banc d'évaluation De l'apprentissage Contextuel CL-bench
Date
URL du document
Licence
Other
CL-bench est un jeu de données de référence permettant d'évaluer les capacités d'apprentissage contextuel d'un modèle de langage de grande taille. Il a été publié en 2026 par l'équipe Hunyuan de Tencent, en collaboration avec l'université Fudan. Les articles de recherche associés sont les suivants : CL-bench : un banc d’essai pour l’apprentissage contextuelL'objectif est de tester si un modèle peut apprendre de nouvelles règles, de nouveaux concepts ou de nouvelles connaissances du domaine à partir d'un contexte donné sans s'appuyer sur des connaissances pré-entraînées et les appliquer à des tâches ultérieures.
Cet ensemble de données contient 500 scénarios contextuels complexes, couvrant 1 899 tâches spécifiques, et propose 31 607 grilles d'évaluation détaillées. Chaque tâche est organisée sous forme de dialogue à plusieurs tours, couvrant divers scénarios d'apprentissage contextuel tels que le raisonnement sur les règles, l'acquisition de connaissances du domaine et la compréhension d'instructions complexes, afin d'évaluer la capacité du modèle à comprendre, synthétiser et transférer de nouvelles informations dans le contexte.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.