一键部署 Qwen2.5-VL-32B-Instruct

一、教程简介
Qwen2.5-VL-32B-Instruct 是阿里巴巴通义千问团队于 2025 年 3 月 24 日开源的多模态大模型,基于 Apache 2.0 协议发布。该模型在 Qwen2.5-VL 系列的基础上,通过强化学习技术优化,以 32B 参数规模实现了多模态能力的突破。
🚀 Qwen2.5-VL-32B 震撼升级!更强的视觉 AI,更聪明的多模态助手! 🌟
🔥 核心特性升级
- 细粒度视觉分析:在医疗影像解析、工程图纸识别等专业领域,模型展现出像素级内容捕捉能力,并支持多图关联推理与时空维度分析
- 输出风格优化:模型的输出内容在格式规范与信息详实度上更贴近人类表达习惯,特别是在复杂场景中能生成结构清晰、逻辑严密的解决方案。
- 数学推理突破:针对包含多变量方程、几何证明等复杂数学问题,模型通过算法优化将解题准确率提升至行业领先水平。
本教程使用 Qwen2.5-VL-32B 作为演示,算力资源采用 A6000*2 。
二、运行步骤
1. 启动容器后点击 API 地址即可进入 Web 界面
若不显示「模型」,这表示模型正在初始化,由于模型较大,请等待约 1-2 分钟后刷新页面。

2. 进入网页后,即可与模型展开对话
本教程支持「联网搜索」,该功能开启后,推理速度会变慢,属于正常现象。

3. 接口调用示例
本容器默认使用 open-webui 调用 Qwen2.5-VL-32B 的 API 服务,如需本地使用,可参考下方调用示例,包含 cURL 和 Python 两种方式的使用示例。
获得 API_PATH 如图所示:

🔹 使用 cURL 调用
你可以使用 curl
命令直接调用 API:
curl {API_PATH}/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer Empty" \
-d '{
"model": "Qwen2.5-VL-32B-Instruct",
"messages": [
{
"role": "user",
"content": [
{"type": "text", "text": "请理解图片中的公式,并做详细解释"},
{"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
]
}
],
"max_tokens": 1024
}'
🐍 使用 Python 调用
请确保安装 openai
库:
pip install openai
然后使用以下 Python 代码:
from openai import OpenAI
client = OpenAI(api_key="Empty", base_url="{API_PATH}/v1/")
response = client.chat.completions.create(
model="Qwen2.5-VL-32B-Instruct",
messages = [
{
"role": "user",
"content": [
{"type": "text", "text": "请理解图片中的公式,并做详细解释"},
{"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
]
}
],
max_tokens=1000
)
print(response.choices[0].message.content)
这样,你就可以在不同环境下使用合适的方式来调用 Qwen2.5-VL-32B API 了! 🚀
交流探讨
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓
