Utiliser ce jeu de données Discuter sur Discord

Date

il y a un mois

Licence

CC BY-SA 4.0

Balises

Compréhension De Document

Langue

Réponse Aux Questions Intelligente

Génération De Texte

LongBlocks est un ensemble de données de synthèse multilingue à long contexte publié en 2026 par l'Université de Lisbonne, l'Instituto de Telecomunicações, TransPerfect et d'autres institutions. Cet ensemble de données contient environ 194 000 exemples de questions-réponses à contexte long, couvrant des corpus de documents longs tels que des livres, du texte de pages Web, Wikipédia, des articles arXiv, du code de programmation et des questions-réponses communautaires.

Champs de données:

id : Chaîne de caractères, un identifiant d’instance unique (utilisé uniquement pour récupérer des données de livres restreintes ; nul pour les autres sources).
document : Chaîne de caractères, contenu long du document source (null pour les données de livre limitées).
source : Chaîne de caractères, le nom du corpus source.
Langue : une chaîne de caractères représentant la langue ou le langage de programmation de l’exemple.
Question : Composition de chaînes de caractères, problème du contexte long.
Réponse : Chaîne de caractères, une réponse de référence qui a été filtrée pour vérifier son authenticité.
response_Qwen3-Next-80B-A3B / response_Qwen3.5-27B / response_Nemotron-3-Nano-30B-A3B : Chaînes correspondant aux réponses générées du modèle enseignant.

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 24 jours

Ensemble De Données d'inférence Visuelle VisCoR-55K

il y a un mois

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données De Classification Des Maladies Du Fond d'œil

il y a un mois

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

il y a un mois

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

il y a 2 mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a 6 jours

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

il y a 2 mois

Ensemble De Données De Détection Des Émotions Emotion-probes

il y a 2 mois

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a 6 jours

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a 6 jours

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données Discuter sur Discord

Date

il y a un mois

Licence

CC BY-SA 4.0

Balises

Compréhension De Document

Langue

Réponse Aux Questions Intelligente

Génération De Texte

Champs de données:

id : Chaîne de caractères, un identifiant d’instance unique (utilisé uniquement pour récupérer des données de livres restreintes ; nul pour les autres sources).
document : Chaîne de caractères, contenu long du document source (null pour les données de livre limitées).
source : Chaîne de caractères, le nom du corpus source.
Langue : une chaîne de caractères représentant la langue ou le langage de programmation de l’exemple.
Question : Composition de chaînes de caractères, problème du contexte long.
Réponse : Chaîne de caractères, une réponse de référence qui a été filtrée pour vérifier son authenticité.
response_Qwen3-Next-80B-A3B / response_Qwen3.5-27B / response_Nemotron-3-Nano-30B-A3B : Chaînes correspondant aux réponses générées du modèle enseignant.

undefined

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 24 jours

Ensemble De Données d'inférence Visuelle VisCoR-55K

il y a un mois

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données De Classification Des Maladies Du Fond d'œil

il y a un mois

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

il y a un mois

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

il y a 2 mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a 6 jours

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

il y a 2 mois

Ensemble De Données De Détection Des Émotions Emotion-probes

il y a 2 mois

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a 6 jours

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a 6 jours

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données LongBlocks Pour La Réponse À Des Questions Multilingues À Contexte Long

Champs de données:

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données LongBlocks Pour La Réponse À Des Questions Multilingues À Contexte Long

Champs de données:

undefined

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Détection Des Émotions Emotion-probes

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données LongBlocks Pour La Réponse À Des Questions Multilingues À Contexte Long

Champs de données:

undefined

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Détection Des Émotions Emotion-probes

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Détection Des Émotions Emotion-probes

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

undefined

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Détection Des Émotions Emotion-probes

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4