Online-Tutorial | Erstellen Sie Einen Spannenden Roman Mit 10.000 Wörtern in 1 Minute. LongWriter-glm4-9b Überwindet Den Engpass Bei Der Ausgabe Langer Texte

In den letzten Jahren haben große Sprachmodelle (LLMs) große Fähigkeiten beim Verstehen und Generieren komplexer Texte gezeigt. Sie können Eingaben von bis zu 100.000 Token verarbeiten, haben jedoch oft Schwierigkeiten, zusammenhängende Ausgaben von mehr als 2.000 Wörtern zu generieren.
Einer der Hauptgründe ist der Mangel an langen Ausgabebeispielen im SFT-Datensatz (Supervised Fine-Tuning).Die Studie zeigt, dass die maximale Ausgabelänge des Modells eine signifikante positive Korrelation mit der Länge der Proben aufweist, denen es in der SFT-Phase ausgesetzt ist. Mit anderen Worten: Die Modelle haben zwar gelernt, lange Texte zu verstehen und zu verarbeiten, aber noch nicht ausreichend, Texte gleicher Länge zu generieren.
Um dieses Problem zu lösen, haben die Tsinghua-Universität und Zhipu AI einen Datensatz namens LongWriter-6k auf Basis der AgentWrite-Technologie erstellt, der 6.000 SFT-Datenproben mit Ausgabelängen von 2.000 bis 32.000 Wörtern enthält.Der Datensatz ist derzeit im Datensatzbereich der offiziellen Website von HyperAI verfügbar und unterstützt die Eingabe per Mausklick.
Datensatzadresse:
Anschließend verwendete das Forschungsteam auch LongWriter-6k und trainierte auf der Grundlage von GLM-4-9B, um ein Modell LongWriter-glm4-9b zu erhalten, das mehr als 10.000 Wörter zusammenhängenden Text generieren kann, wodurch das Ausgabepotenzial großer Sprachmodelle erheblich erweitert wird und eine große Vielseitigkeit in praktischen Anwendungen wie literarischem Schaffen und Nachrichtenberichterstattung gezeigt wird.
Derzeit wurde im Abschnitt „HyperAI Super Neural Tutorial“ die „Ein-Klick-Bereitstellung von LongWriter-glm4-9b“ gestartet.Durch Klonen mit einem Klick kann die Konversation gestartet werden.
Adresse des Tutorials:
Demolauf
1. Melden Sie sich bei hyper.ai an, suchen Sie auf der Seite „Tutorial“ nach „One-Click-Bereitstellung von LongWriter-glm4-9b“ und klicken Sie auf „Dieses Tutorial online ausführen“.


2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Klicken Sie unten rechts auf „Weiter: Hashrate auswählen“.

4. Wählen Sie nach dem Seitenwechsel das Bild „NVIDIA RTX 4090“ und „PyTorch“ aus und klicken Sie auf „Weiter: Überprüfen“.Neue Benutzer können sich über den unten stehenden Einladungslink registrieren, um 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit zu erhalten!
Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):
https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej

5. Klicken Sie nach der Bestätigung auf „Weiter“ und warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 2 Minuten. Wenn sich der Status in „Läuft“ ändert, klicken Sie auf den Sprungpfeil neben „API-Adresse“, um zur Demoseite zu springen.Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.



Effektvorschau
1. Öffnen Sie die Demo-Oberfläche und lassen Sie einen spannenden Roman mit 10.000 Wörtern erstellen.

2. Sie können sehen, dass es schnell einen langen spannenden Roman ausgibt.