Ensemble De Données d'évaluation De La Génération d'écriture Arena-Write
Date
URL du document
Licence
Apache 2.0
Arena-Write est un jeu de données de tâches d'écriture destiné à évaluer les modèles de génération de textes très longs. Il a été publié en 2025 par l'Université de technologie et de design de Singapour, en collaboration avec le Laboratoire d'ingénierie des connaissances de l'Université Tsinghua. Les articles de recherche associés sont les suivants : LongWriter-Zero : Maîtriser la génération de textes ultra-longs grâce à l’apprentissage par renforcementL’objectif est d’évaluer systématiquement les capacités globales des grands modèles de langage à générer du contenu long et des tâches d’écriture complexes dans des conditions qui ressemblent étroitement à des scénarios d’utilisation réels.
Cet ensemble de données contient 100 tâches d'écriture utilisateur, chacune consistant en une consigne d'écriture réaliste et étiquetée selon le type de scénario correspondant. Les tâches couvrent divers formats de texte, tels que les publications sur les réseaux sociaux, les articles et les rapports, et présentent des différences significatives de longueur, allant de textes courts de quelques centaines de mots à des textes longs nécessitant la rédaction de plus de 2 000 mots. Outre les consignes d'écriture, l'ensemble de données fournit également les résultats de génération de plusieurs modèles de référence courants pour chaque tâche, permettant ainsi une évaluation comparative des performances des différents modèles.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec co-codage IA gratuit, environnement prêt à l'emploi et meilleur prix de GPU.