HyperAI超神经

一键部署 Qwen2.5-VL-32B-Instruct

一、教程简介

Qwen2.5-VL-32B-Instruct 是阿里巴巴通义千问团队于 2025 年 3 月 24 日开源的多模态大模型,基于 Apache 2.0 协议发布。该模型在 Qwen2.5-VL 系列的基础上,通过强化学习技术优化,以 32B 参数规模实现了多模态能力的突破。

🚀 Qwen2.5-VL-32B 震撼升级!更强的视觉 AI,更聪明的多模态助手! 🌟

🔥 核心特性升级

  • 细粒度视觉分析:在医疗影像解析、工程图纸识别等专业领域,模型展现出像素级内容捕捉能力,并支持多图关联推理与时空维度分析
  • 输出风格优化:模型的输出内容在格式规范与信息详实度上更贴近人类表达习惯,特别是在复杂场景中能生成结构清晰、逻辑严密的解决方案。
  • 数学推理突破:针对包含多变量方程、几何证明等复杂数学问题,模型通过算法优化将解题准确率提升至行业领先水平。

本教程使用 Qwen2.5-VL-32B 作为演示,算力资源采用 A6000*2 。

二、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面

若不显示「模型」,这表示模型正在初始化,由于模型较大,请等待约 1-2 分钟后刷新页面。

2. 进入网页后,即可与模型展开对话

本教程支持「联网搜索」,该功能开启后,推理速度会变慢,属于正常现象。

3. 接口调用示例

本容器默认使用 open-webui 调用 Qwen2.5-VL-32B 的 API 服务,如需本地使用,可参考下方调用示例,包含 cURL 和 Python 两种方式的使用示例

获得 API_PATH 如图所示:


🔹 使用 cURL 调用

你可以使用 curl  命令直接调用 API:

curl {API_PATH}/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Empty" \
  -d '{
    "model": "Qwen2.5-VL-32B-Instruct",
    "messages": [
      {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式,并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    "max_tokens": 1024
  }'

🐍 使用 Python 调用

请确保安装 openai  库:

pip install openai

然后使用以下 Python 代码:

from openai import OpenAI

client = OpenAI(api_key="Empty", base_url="{API_PATH}/v1/")

response = client.chat.completions.create(
    model="Qwen2.5-VL-32B-Instruct",
    messages = [
        {
        "role": "user",
        "content": [
          {"type": "text", "text": "请理解图片中的公式,并做详细解释"},
          {"type": "image_url", "image_url": {"url": "https://images2018.cnblogs.com/blog/1203675/201805/1203675-20180525100048863-1610672614.png"}}
        ]
      }
    ],
    max_tokens=1000
)
print(response.choices[0].message.content)

这样,你就可以在不同环境下使用合适的方式来调用 Qwen2.5-VL-32B API 了! 🚀

交流探讨

🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓