HyperAI

在线运行 CogVLM2-Llama3-Chinese-Chat-19B

模型介绍

与上一代 CogVLM 开源模型相比,CogVLM2 系列开源模型有以下改进:

  • 许多基准测试的显着改进,例如 TextVQA 、 DocVQA 。
  • 支持 8K 内容长度。
  • 支持图像分辨率高达 1344*1344 。
  • 提供开源模型版本,支持中英文。

运行方法

  1. 打开一个新的终端页面
  2. 输入命令
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080

运行程序

  1. 拷贝右侧的 API 地址到浏览器中打开 
  2. 点击下方上传图片,并输入文本提示
  1. 回车,生成回答