HyperAIHyperAI

Command Palette

Search for a command to run...

Banc d'évaluation De l'apprentissage Contextuel CL-bench

Discuter sur Discord

Date

il y a 5 heures

Organisation

Université Fudan

URL du document

2602.03587

Licence

Other

CL-bench est un jeu de données de référence permettant d'évaluer les capacités d'apprentissage contextuel d'un modèle de langage de grande taille. Il a été publié en 2026 par l'équipe Hunyuan de Tencent, en collaboration avec l'université Fudan. Les articles de recherche associés sont les suivants : CL-bench : un banc d’essai pour l’apprentissage contextuelL'objectif est de tester si un modèle peut apprendre de nouvelles règles, de nouveaux concepts ou de nouvelles connaissances du domaine à partir d'un contexte donné sans s'appuyer sur des connaissances pré-entraînées et les appliquer à des tâches ultérieures.

Cet ensemble de données contient 500 scénarios contextuels complexes, couvrant 1 899 tâches spécifiques, et propose 31 607 grilles d'évaluation détaillées. Chaque tâche est organisée sous forme de dialogue à plusieurs tours, couvrant divers scénarios d'apprentissage contextuel tels que le raisonnement sur les règles, l'acquisition de connaissances du domaine et la compréhension d'instructions complexes, afin d'évaluer la capacité du modèle à comprendre, synthétiser et transférer de nouvelles informations dans le contexte.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp