Utiliser ce jeu de données Discuter sur Discord

Date

il y a 5 mois

Organisation

URL du document

2602.03587

Licence

Other

Balises

LLM

Génération De Texte

Benchmarks

CL-bench est un jeu de données de référence permettant d'évaluer les capacités d'apprentissage contextuel d'un modèle de langage de grande taille. Il a été publié en 2026 par l'équipe Hunyuan de Tencent, en collaboration avec l'université Fudan. Les articles de recherche associés sont les suivants : CL-bench : un banc d’essai pour l’apprentissage contextuelL'objectif est de tester si un modèle peut apprendre de nouvelles règles, de nouveaux concepts ou de nouvelles connaissances du domaine à partir d'un contexte donné sans s'appuyer sur des connaissances pré-entraînées et les appliquer à des tâches ultérieures. Cet ensemble de données contient 500 scénarios contextuels complexes, couvrant 1 899 tâches spécifiques, et propose 31 607 grilles d'évaluation détaillées. Chaque tâche est organisée sous forme de dialogue à plusieurs tours, couvrant divers scénarios d'apprentissage contextuel tels que le raisonnement sur les règles, l'acquisition de connaissances du domaine et la compréhension d'instructions complexes, afin d'évaluer la capacité du modèle à comprendre, synthétiser et transférer de nouvelles informations dans le contexte.

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a 2 mois

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

il y a 2 mois

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

il y a 4 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 4 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 2 mois

Ensemble De Données d'images Google Street View National Street View

il y a 4 mois

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 4 mois

Ensemble De Données d'images De Véhicules OpenImages

il y a 5 mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données Sur Les Émotions Du Visage Humain

il y a 2 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 5 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 5 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 5 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 5 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données Discuter sur Discord

Date

il y a 5 mois

Organisation

URL du document

2602.03587

Licence

Other

Balises

LLM

Génération De Texte

Benchmarks

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a 2 mois

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 3 mois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

il y a 3 mois

Ensemble De Données Du Problème d'inférence Open-RL

il y a 3 mois

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

il y a 2 mois

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

il y a 4 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 4 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 2 mois

Ensemble De Données d'images Google Street View National Street View

il y a 4 mois

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 4 mois

Ensemble De Données d'images De Véhicules OpenImages

il y a 5 mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données Sur Les Émotions Du Visage Humain

il y a 2 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 5 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 5 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 5 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 5 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'images Google Street View National Street View

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données d'images De Véhicules OpenImages

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'images Google Street View National Street View

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données d'images De Véhicules OpenImages

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'images Google Street View National Street View

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données d'images De Véhicules OpenImages

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1