在线运行 CogVLM2-Llama3-Chinese-Chat-19B
模型介绍
与上一代 CogVLM 开源模型相比,CogVLM2 系列开源模型有以下改进:
- 许多基准测试的显着改进,例如 TextVQA 、 DocVQA 。
- 支持 8K 内容长度。
- 支持图像分辨率高达 1344*1344 。
- 提供开源模型版本,支持中英文。
运行方法
- 打开一个新的终端页面
- 输入命令
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080
运行程序
- 拷贝右侧的 API 地址到浏览器中打开
- 点击下方上传图片,并输入文本提示

- 回车,生成回答
