Date

il y a un an

Taille

834.02 MB

Ce tutoriel est une démonstration de déploiement en un clic de DeepSeek-V2-Lite-Chat. Il vous suffit de cloner et de démarrer le conteneur et de copier directement l'adresse API générée pour expérimenter l'inférence du modèle.

1. Introduction au modèle

DeepSeek-V2, un puissant modèle de langage de mélange d'experts (MoE) avec une formation économique et une inférence efficace. Il contient 236 B de paramètres au total, où chaque jeton active 21 B de paramètres. Comparé à DeepSeek 67B, DeepSeek-V2 atteint des performances plus élevées tout en économisant 42,5% de coûts de formation, en réduisant 93,3% de cache KV et en augmentant le débit de génération maximal à 5,76 fois.

2. Résultats de l'évaluation

Référence	Domaine	Chat QWen1.5 72B	Mixtral 8x22B	LLaMA3 70B Instruct	Chat DeepSeek-V1 (SFT)	Chat DeepSeek-V2 (SFT)	Chat DeepSeek-V2 (RL)
MMLU	Anglais	76.2	77.8	80.3	71.1	78.4	77.8
BBH	Anglais	65.9	78.4	80.1	71.7	81.3	79.7
C-Éval	Anglais	82.2	60.0	67.9	65.2	80.9	78.0
CMMLU	Anglais	82.9	61.0	70.7	67.8	82.4	81.6
HumanEval	Code	68.9	75.0	76.2	73.8	76.8	81.1
MBPP	Code	52.2	64.4	69.8	61.4	70.4	72.0
LiveCodeBench (0901-0401)	Code	18.8	25.0	30.5	18.3	28.7	32.5
GSM8K	Mathématiques	81.9	87.9	93.2	84.1	90.8	92.2
Mathématiques	Mathématiques	40.6	49.8	48.5	32.6	52.7	53.9

3. Comment utiliser

Ce tutoriel a déployé le modèle et l'environnement. Vous pouvez utiliser directement le grand modèle pour raisonner le dialogue selon les instructions du didacticiel. Le tutoriel spécifique est le suivant :

Étape 1 : Cloner et démarrer le conteneur

Après avoir cloné et démarré le conteneur avec succès, vous verrez cette interface. Attendez une douzaine de secondes pour charger le modèle et copiez l'adresse API à droite dans le navigateur.

Étape 2 : Accédez au site Web

Après avoir accédé à la page Web, vous pouvez communiquer avec le grand modèle (les paramètres pertinents ont été débogués et aucun réglage n'est requis)

Discussion et échange

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutorial Exchange] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook

Date

il y a un an

Taille

834.02 MB

1. Introduction au modèle

2. Résultats de l'évaluation

Référence	Domaine	Chat QWen1.5 72B	Mixtral 8x22B	LLaMA3 70B Instruct	Chat DeepSeek-V1 (SFT)	Chat DeepSeek-V2 (SFT)	Chat DeepSeek-V2 (RL)
MMLU	Anglais	76.2	77.8	80.3	71.1	78.4	77.8
BBH	Anglais	65.9	78.4	80.1	71.7	81.3	79.7
C-Éval	Anglais	82.2	60.0	67.9	65.2	80.9	78.0
CMMLU	Anglais	82.9	61.0	70.7	67.8	82.4	81.6
HumanEval	Code	68.9	75.0	76.2	73.8	76.8	81.1
MBPP	Code	52.2	64.4	69.8	61.4	70.4	72.0
LiveCodeBench (0901-0401)	Code	18.8	25.0	30.5	18.3	28.7	32.5
GSM8K	Mathématiques	81.9	87.9	93.2	84.1	90.8	92.2
Mathématiques	Mathématiques	40.6	49.8	48.5	32.6	52.7	53.9

3. Comment utiliser

Étape 1 : Cloner et démarrer le conteneur

Étape 2 : Accédez au site Web

Après avoir accédé à la page Web, vous pouvez communiquer avec le grand modèle (les paramètres pertinents ont été débogués et aucun réglage n'est requis)

Discussion et échange

Associé Notebooks

Déploiement En Un Clic De DeepSeek-R1-70B

il y a 3 mois

Déploiement En Un Clic Du Modèle SmolLM3-3B

il y a 3 mois

Flux Causal Visuel DeepSeek-OCR 2

il y a 10 jours

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

il y a 3 mois

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

il y a 2 mois

Déploiement En Un Clic De Qwen-Image-Lightning

il y a 2 mois

PaddleOCR-VL : Analyse De Documents Multimodaux

il y a 3 mois

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

il y a 2 mois

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Déploiement En Un Clic De DeepSeek-V2-Lite-Chat

1. Introduction au modèle

2. Résultats de l'évaluation

3. Comment utiliser

Étape 1 : Cloner et démarrer le conteneur

Étape 2 : Accédez au site Web

Discussion et échange

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Déploiement En Un Clic De DeepSeek-V2-Lite-Chat

1. Introduction au modèle

2. Résultats de l'évaluation

3. Comment utiliser

Étape 1 : Cloner et démarrer le conteneur

Étape 2 : Accédez au site Web

Discussion et échange

Associé Notebooks

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic Du Modèle SmolLM3-3B

Flux Causal Visuel DeepSeek-OCR 2

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

PaddleOCR-VL : Analyse De Documents Multimodaux

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Déploiement En Un Clic De DeepSeek-V2-Lite-Chat

1. Introduction au modèle

2. Résultats de l'évaluation

3. Comment utiliser

Étape 1 : Cloner et démarrer le conteneur

Étape 2 : Accédez au site Web

Discussion et échange

Associé Notebooks

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic Du Modèle SmolLM3-3B

Flux Causal Visuel DeepSeek-OCR 2

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

PaddleOCR-VL : Analyse De Documents Multimodaux

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic Du Modèle SmolLM3-3B

Flux Causal Visuel DeepSeek-OCR 2

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

PaddleOCR-VL : Analyse De Documents Multimodaux

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes

Associé Notebooks

Déploiement En Un Clic De DeepSeek-R1-70B

Déploiement En Un Clic Du Modèle SmolLM3-3B

Flux Causal Visuel DeepSeek-OCR 2

Déploiement En Un Clic Du Modèle De Raisonnement Médical MedGemma-27b-text-it

Déploiement En Un Clic De l'instruction Ministry-3-14B-Instruct

Déploiement En Un Clic De Qwen-Image-Lightning

PaddleOCR-VL : Analyse De Documents Multimodaux

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

F5-E2 TTS Clone n'importe Quel Son En Seulement 3 Secondes