HyperAI

通义千问 72B Chat Int4 模型 Gradio Demo

Qwen-72B-Chat-Int4 demo

模型简介

通义千问-72B (Qwen-72B) 是阿里云研发的通义千问大模型系列的 720 亿参数规模的模型。 Qwen-72B 是基于 Transformer 的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在 Qwen-72B 的基础上,研究团队使用对齐机制打造了基于大语言模型的 AI 助手 Qwen-72B-Chat 。本仓库为 Qwen-72B-Chat 的 Int4 量化模型的仓库。 1

一键部署

该教程为在 OpenBayes 运行 通义千问 72B Chat 的 Int4 量化模型。

运行方法

  1. 克隆容器启动后,打开一个新的终端页面 2
  2. 输入命令 python web_ui.py 运行 Gradio demo 3
  3. 按照提示打开链接 4
  4. 即可开始与模型对话 5