Date

il y a 6 mois

Licence

Apache 2.0

Balises

LongBench-Pro est un jeu de données publié en 2025 pour l'évaluation des modèles de langage à contexte long. Il vise à évaluer systématiquement la capacité du modèle à comprendre et à traiter des textes longs dans des contextes de longueurs variées, selon le type de tâche et les conditions d'utilisation. Cet ensemble de données contient 1 500 exemples, dont 11 tâches de niveau 1 et 25 tâches de niveau 2. Les tâches sont classées en tâches à contexte complet et tâches à contexte partiel selon leur utilisation du contexte. Il comprend des exemples en anglais et en chinois, avec une répartition équilibrée des données dans les deux langues. La difficulté des tâches est classée en quatre niveaux : facile, moyen, difficile et extrêmement difficile. Concernant la longueur du contexte, les exemples couvrent six intervalles de longueur, allant de 8 000 à 256 000 jetons, et sont répartis de manière homogène.

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

il y a 2 mois

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

il y a 2 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 4 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 5 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 6 mois

Licence

Apache 2.0

Balises

Traitement Du Langage Naturel

Benchmarks

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

il y a 2 mois

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

il y a 2 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 4 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 5 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 5 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 5 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 5 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X