HyperAI

Tongyi Qianwen 72B Chat Int4 Modèle Gradio Démo

Démo Qwen-72B-Chat-Int4

Présentation du modèle

Tongyi Qianwen-72B (Qwen-72B) est un modèle à l'échelle de 72 milliards de paramètres de la série de grands modèles Tongyi Qianwen développé par Alibaba Cloud. Qwen-72B est un grand modèle de langage basé sur Transformer, formé sur des données de pré-formation à très grande échelle. Les types de données de pré-formation sont divers et couvrent un large éventail, y compris une grande quantité de textes en ligne, de livres professionnels, de codes, etc. Dans le même temps, sur la base de Qwen-72B, l'équipe de recherche a utilisé le mécanisme d'alignement pour créer Qwen-72B-Chat, un assistant IA basé sur un grand modèle de langage. Ce référentiel est destiné au modèle quantitatif Int4 de Qwen-72B-Chat. 1

Déploiement en un clic

Ce tutoriel concerne l'exécution du modèle quantifié Int4 de Tongyi Qianwen 72B Chat sur OpenBayes.

Comment courir

  1. Une fois le conteneur cloné démarré, ouvrez une nouvelle page de terminal 2
  2. Entrez la commande python web_ui.py pour exécuter la démo Gradio 3
  3. Suivez les instructions pour ouvrir le lien 4
  4. Vous pouvez commencer à parler au modèle 5