HyperAI

Online-Tutorials | Vergleichbar Mit O3-mini Hat Das Open-Source-Code-Inferenzmodell DeepCoder-14B-Preview 3.000 Sterne

特色图像

Am frühen Morgen des 9. April veröffentlichten das Agentica-Team und Together AI gemeinsam eine neue Open-Source-Version. DeepCoder-14B-Vorschau  Das Code-Argumentationsmodell,Dieses neue Modell, das nur 14 B benötigt und mit OpenAI o3-Mini vergleichbar ist, hat in der Branche schnell große Aufmerksamkeit erregt.Es hat 3.000 Sterne auf GitHub.

DeepCoders Ergebnisse in mehreren Tests

Konkret handelt es sich bei DeepCoder-14B-Preview um ein DeepSeek-R1-Destilliert-Qwen-14B  Feinabstimmung des Code-Reasoning-LLM, Erweiterung der Kontextlänge durch verteiltes Verstärkungslernen (RL).Das Modell erreichte eine Einzeldurchlaufquote (Pass@1) von 60,6% auf LiveCodeBench v5 (01.08.24-01.02.25).Es übertrifft nicht nur sein Basismodell, sondern erreicht mit nur 14 Milliarden Parametern die gleiche Leistung wie das Originalmodell. OpenAI o3-mini  Ordentliche Leistung.

Derzeit ist das Tutorial „One-Click-Bereitstellung von DeepCoder-14B-Preview“ online verfügbar. HyperAIGeben Sie im Tutorial-Bereich der offiziellen Website nach dem Klonen des Modells die „API-Adresse“ ein, um das Modell schnell kennenzulernen!

Link zum Tutorial:https://go.hyper.ai/0J82f

Demolauf

1. Melden Sie sich bei hyper.ai an, wählen Sie auf der Tutorial-Seite „Ein-Klick-Bereitstellung von DeepCoder-14B-Preview“ und klicken Sie auf „Dieses Tutorial online ausführen“.

2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Wählen Sie "NVIDIA GeForce RTX 4090" und "vLLMSpiegelbild,OpenBayes  Die Plattform bietet 4 Abrechnungsmethoden. Sie können je nach Bedarf zwischen „Pay as you go“ oder „täglich/wöchentlich/monatlich“ wählen und auf „Weiter“ klicken. Neue Benutzer können sich über den unten stehenden Einladungslink registrieren, um 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit zu erhalten!

Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 2 Minuten. Wenn sich der Status in „Läuft“ ändert, klicken Sie auf den Sprungpfeil neben „API-Adresse“, um zur Demoseite zu springen. Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.

Effektanzeige

Sie können das Modell ausprobieren, nachdem Sie die Demoseite aufgerufen haben. Dieses Tutorial verwendet das DeepCoder-14B-Preview-Modell als Demonstrationsfall und übernimmt die von Bitsandbytes bereitgestellte 8-Bit-Quantisierungsmethode, um die Nutzung des Videospeichers zu optimieren.

Geben Sie den Inhalt in die Spalte „Eingabe“ ein und klicken Sie zur Generierung auf „Senden“. Klicken Sie auf „Verlauf löschen“, um den Konversationsverlauf zu löschen.

Hier nehmen wir den klassischen Bubblesort als Beispiel und können sehen, dass das Modell sehr schnell auf die Frage antwortet.