HyperAIHyperAI

LongPage-Datensatz Für Neuartiges Denken

Datum

vor 5 Tagen

Organisation

Veröffentlichungs-URL

huggingface.co

Lizenz

CC BY 4.0

Download-Hilfe

LongPage ist der erste umfassende Datensatz, der 2025 von Pageshift-Entertainment veröffentlicht wurde, um künstliche Intelligenzmodelle zu trainieren, damit sie ganze Romane mit komplexen Denkfähigkeiten schreiben können.

Dieser Datensatz enthält derzeit Beispiele aus etwa 300 Büchern mit jeweils 40.000 bis über 600.000 Wörtern, von Novellen bis hin zu epischen Romanen. Die Datenstruktur umfasst mehrstufige Planungshinweise wie Charakterarchetypen, Handlungsbögen, Weltregeln und Szenengliederung sowie strukturelle Metadaten wie Dialogdichte, Tempo und narrativen Fokus. Jedes Beispiel enthält eine Eingabeaufforderung, eine Gedankenkette und die vollständige Romanstruktur (Buch). Es unterstützt Trainingsprozesse von der überwachten Feinabstimmung beim Kaltstart bis hin zum bestärkenden Lernen und eignet sich daher für das Training umfangreicher Sprachmodelle mit hierarchischen Denkfähigkeiten und zur Verbesserung der Kohärenz und Planung längerer Texte.

LongPage-Datensatz Für Neuartiges Denken | Datensätze | HyperAI