HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Discuter sur Discord

Date

il y a un mois

Licence

Apache 2.0

LongBench-Pro est un jeu de données publié en 2025 pour l'évaluation des modèles de langage à contexte long. Il vise à évaluer systématiquement la capacité du modèle à comprendre et à traiter des textes longs dans des contextes de longueurs variées, selon le type de tâche et les conditions d'utilisation.

Cet ensemble de données contient 1 500 exemples, dont 11 tâches de niveau 1 et 25 tâches de niveau 2. Les tâches sont classées en tâches à contexte complet et tâches à contexte partiel selon leur utilisation du contexte. Il comprend des exemples en anglais et en chinois, avec une répartition équilibrée des données dans les deux langues. La difficulté des tâches est classée en quatre niveaux : facile, moyen, difficile et extrêmement difficile. Concernant la longueur du contexte, les exemples couvrent six intervalles de longueur, allant de 8 000 à 256 000 jetons, et sont répartis de manière homogène.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp