Ein-Klick-Erlebnis GLM-4-9B-Chat

Kürzlich hat Zhipu AI Das neueste Open-Source-Ergebnis des großen Basismodells GLM-4, GLM-4-9B, wurde veröffentlicht, das erstmals über multimodale Fähigkeiten verfügt.Offizielle Daten zeigen, dass sich GLM-4-9B im Vergleich zum Llama-3-8B-Modell mit mehr Training bei chinesischen Probanden um 50% verbessert hat und in der Multimodalität mit GPT-4V vergleichbar ist.
In Bezug auf die Kontextlänge hat GLM-4-9B einen Upgrade-Sprung von 128 K auf 1 M erreicht, was der Fähigkeit entspricht, 125 Papiere auf einmal zu verarbeiten! Darüber hinaus wurde sein Modellvokabular von 60.000 auf 150.000 erweitert und die Kodierungseffizienz anderer Sprachen als Chinesisch und Englisch um durchschnittlich 30% verbessert, wodurch Aufgaben in kleinen Sprachen schneller verarbeitet werden können.
Damit jeder dieses Open-Source-Modell, das behauptet, „Llama3-8B zu übertreffen“, so schnell wie möglich erleben kann,OpenBayes Das Modell „GLM-4-9B-Chat“ ist jetzt im öffentlichen Modellbereich der Plattform verfügbar. Es unterstützt die Eingabe per Mausklick, überspringt die lange Download- und Upload-Zeit und ermöglicht den direkten Start der Bereitstellung.
Öffentliche Modelladresse:
https://go.openbayes.com/F7pbS
Darüber hinaus wurde gleichzeitig die „One-Click-Bereitstellung der GLM-4-9B-Chat-Demo“ im öffentlichen Tutorial-Bereich der OpenBayes-Plattform gestartet. Sie können die hervorragende Leistung von GLM-4-9B-Chat sofort erleben, ohne Befehle einzugeben und auf „Klonen“ zu klicken.
Öffentliche Tutorial-Adresse:
https://go.openbayes.com/ulmZe
Verfahren
TEIL 1 Demobetriebsphase
1. Anmelden http://OpenBayes.comWählen Sie auf der Seite „Öffentliches Tutorial“ die Option „Ein-Klick-Bereitstellung der GLM-4-9B-Chat-Demo“ aus.

2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Klicken Sie unten rechts auf „Weiter: Hashrate auswählen“.

4. Wählen Sie nach dem Sprung „NVIDIA GeForce RTX 4090“ aus und klicken Sie auf „Weiter: Überprüfen“.Neue Benutzer können sich über den Einladungslink unten registrieren, um 4 Stunden zu erhalten RTX 4090 + 5 Stunden kostenlose CPU!
Xiaobeis exklusiver Einladungslink (kopieren und im Browser öffnen):https://go.openbayes.com/9S6Dr

5. Klicken Sie auf „Weiter“ und warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 3 Minuten. Wenn sich der Status in „Läuft“ ändert, bewegen Sie die Maus auf „API-Adresse“, kopieren Sie die Adresse und öffnen Sie sie in einem neuen Tab, um zur GLM-4-9B-Chat-Demoseite zu springen.Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.
Wenn das Problem länger als 10 Minuten besteht und sich das System immer noch im Status „Ressourcen werden zugewiesen“ befindet, versuchen Sie, den Container zu stoppen und neu zu starten. Wenn das Problem durch einen Neustart immer noch nicht behoben wird, wenden Sie sich bitte an den Kundenservice der Plattform auf der offiziellen Website.



TEIL 2 Demobetriebsphase
1. Öffnen Sie die GLM-4-9B-Chat-Demoseite, geben Sie Text in das Dialogfeld ein und klicken Sie auf „Senden“, um die Unterhaltung zu beginnen.


2. Das Hyperparameter-Panel auf der rechten Seite stellt dar:
* Maximale Länge: die maximale Anzahl von Wörtern, die das Modell ausgeben kann;
* Top P: steuert den Bereich der Kandidatenwörter, die aus der vom Modell ausgegebenen Wahrscheinlichkeitsverteilung ausgewählt werden. Ein größerer Wert bedeutet, dass bei der Textgenerierung ein größerer Satz von Wörtern berücksichtigt wird.
* Temperatur: Ein Hyperparameter, der die Zufälligkeit steuert. Je größer der Wert, desto zufälliger ist der generierte Text.

Vorteile für neue Benutzer
Vorteile der Registrierung:Klicken Sie unten auf den Einladungslink, um sich zu registrieren und 4 Stunden RTX 4090 + 5 Stunden CPU-freie Rechenzeit zu erhalten, unbegrenzt gültig!
Xiaobeis exklusiver Einladungslink (kopieren und im Browser öffnen):