HyperAI

Déploiement En Un Clic De Llama-3.3-70B-Instruct

1. Introduction au tutoriel

Llama-3.3-70B-Instruct est un grand modèle de langage lancé par Meta en 2024. C'est le seul modèle open source de la série Llama 3.3 et dispose d'une version de réglage fin des instructions spécialement optimisée. Le modèle prend en charge huit langues, dont l'anglais, l'allemand, le français, l'italien, le portugais, l'hindi, l'espagnol et le thaï, mais ne prend actuellement pas en charge le chinois. Dans l'évaluation des performances, la taille des paramètres de Llama-3.3-70B-Instruct est d'environ 70B, mais divers indicateurs d'évaluation sont approximativement égaux au modèle Llama3.1-405B avec une taille de paramètre de 405B, ce qui signifie que le texte peut être généré plus rapidement avec moins de ressources, et les performances sont similaires à celles d'un modèle plus grand avec près de 6 fois la taille des paramètres. Cela fait de Llama-3.3-70B-Instruct une alternative puissante et rentable qui offre des performances supérieures sur les benchmarks clés tout en restant open source et accessible.

本教程使用 Llama-3.3-70B-Instruct(采取 int4 量化)作为演示,算力资源采用 A6000 。

2. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web (si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est volumineux, veuillez patienter environ 5 minutes et réessayer.)

2. Une fois que vous entrez sur la page Web, vous pouvez démarrer une conversation avec le modèle !

Modèle de flux de dialogue

Échange et discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓