HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

Arena-Write Datensatz Zur Evaluierung Der Schreibgenerierung

Auf Discord diskutieren

Datum

vor 18 Stunden

Organisation

Tsinghua-Universität

Paper-URL

2506.18841

Lizenz

Apache 2.0

Arena-Write ist ein Datensatz für Schreibaufgaben zur Evaluierung von Modellen zur Generierung extrem langer Texte. Er wurde 2025 von der Singapore University of Technology and Design in Zusammenarbeit mit dem Knowledge Engineering Lab der Tsinghua-Universität veröffentlicht. Die zugehörigen Forschungsarbeiten sind folgende: LongWriter-Zero: Die Generierung ultralanger Texte durch Reinforcement Learning meisternZiel ist es, die umfassenden Fähigkeiten großer Sprachmodelle bei der Generierung von Langtexten und der Ausführung komplexer Schreibaufgaben unter Bedingungen systematisch zu evaluieren, die realen Anwendungsszenarien möglichst nahekommen.

Dieser Datensatz enthält 100 Schreibaufgaben von Nutzern. Jede Aufgabe besteht aus einer realen Schreibanregung und ist dem entsprechenden Schreibszenario zugeordnet. Die Aufgaben decken verschiedene Textformate ab, darunter Social-Media-Posts, Artikel und Berichte, und weisen erhebliche Unterschiede in der Textlänge auf – von kurzen Texten mit wenigen Hundert Wörtern bis hin zu langen Texten mit über 2.000 Wörtern. Zusätzlich zu den Schreibanregungen enthält der Datensatz die Ergebnisse mehrerer gängiger Basismodelle für dieselbe Aufgabe und ermöglicht so einen Vergleich der Modellausgaben.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-Co-Programmierung
Einsatzbereite GPUs
Bestpreis

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp