使用 vLLM +Open WebUI 部署 EXAONE-4.0-32B
一、教程简介

EXAONE-4.0 是由韩国 LG AI Research 研究所于 2025 年 7 月 15 日推出的一个新一代混合推理 AI 模型,也是韩国首个混合推理 AI 模型。该模型融合通用自然语言处理能力与经 EXAONE Deep 验证的高级推理能力,在数学、科学及编程等高难度领域实现突破。该模型支持 MCP 与函数调用功能,为 Agentic AI 提供技术基础,其发布的 32B 专业模型,已通过六项国家专业证照笔试,其全球最新高难度基准测试成绩如下:知识推理:MMLU-Pro 81.8 分,编程能力:LiveCodeBench v6 66.7 分,科学素养:GPQA-Diamond 75.4 分,数学能力:AIME 2025 85.3 分。相关论文成果为「EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes」。
本教程采用资源为双卡 A6000 。
二、项目示例
1. 关闭思考模式

2. 开启思考模式

三、运行步骤
1. 启动容器后点击 API 地址即可进入 Web 界面

2. 进入网页后,即可与模型展开对话
若未显示「模型」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面。
使用步骤

四、交流探讨
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息
本项目引用信息如下:
@article{exaone-4.0,
title={EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes},
author={{LG AI Research}},
journal={arXiv preprint arXiv:2507.11407},
year={2025}
}