HyperAI

Ein-Klick-Bereitstellung Von DeepSeek-V2-Lite-Chat

Dieses Tutorial ist eine Ein-Klick-Bereitstellungsdemo von DeepSeek-V2-Lite-Chat. Sie müssen nur den Container klonen und starten und die generierte API-Adresse direkt kopieren, um die Inferenz des Modells zu erleben.

1. Einführung in das Modell

DeepSeek-V2, ein leistungsstarkes Sprachmodell mit Expertenmischung (MoE) mit wirtschaftlichem Training und effizienter Inferenz. Es enthält insgesamt 236 Milliarden Parameter, wobei jedes Token 21 Milliarden Parameter aktiviert. Im Vergleich zu DeepSeek 67B erreicht DeepSeek-V2 eine stärkere Leistung, spart dabei 42,51 TP3T Trainingskosten, reduziert 93,31 TP3T KV-Cache und erhöht den maximalen Generierungsdurchsatz auf das 5,76-fache.

2. Ergebnisse der Evaluation

BenchmarkDomainQWen1.5 72B ChatMixtral 8x22BLLaMA3 70B AnweisungDeepSeek-V1-Chat (SFT)DeepSeek-V2-Chat (SFT)DeepSeek-V2-Chat (RL)
MMLUEnglisch76.277.880.371.178.477.8
BBHEnglisch65.978.480.171.781.379.7
C-EvalEnglisch82.260.067.965.280.978.0
CMMLUEnglisch82.961.070.767.882.481.6
Menschliche EvalCode68.975.076.273.876.881.1
MBPPCode52.264.469.861.470.472.0
LiveCodeBench (0901-0401)Code18.825.030.518.328.732.5
GSM8KMathe81.987.993.284.190.892.2
MatheMathe40.649.848.532.652.753.9

3. Wie zu verwenden

In diesem Tutorial wurden das Modell und die Umgebung bereitgestellt. Sie können das große Modell direkt für den Denkdialog gemäß den Anweisungen im Tutorial verwenden. Das spezifische Tutorial lautet wie folgt:

Schritt 1: Klonen und Starten des Containers

Nach dem erfolgreichen Klonen und Starten des Containers wird diese Schnittstelle angezeigt. Warten Sie zwölf Sekunden, bis das Modell geladen ist, und kopieren Sie die API-Adresse rechts in den Browser. 

Schritt 2: Rufen Sie die Website auf

Nach dem Aufrufen der Webseite können Sie mit dem großen Modell kommunizieren (die relevanten Parameter wurden debuggt und es sind keine Anpassungen erforderlich). 

Diskussion und Austausch

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [Tutorial Exchange], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓