HyperAI

AMD 推出的锐龙 AI Max+395 处理器再次刷新本地 AI 推理的边界，实现首个在消费级平台上本地运行 1280 亿参数大模型的突破。该芯片基于 Zen5 架构，搭配 128GB 统一内存（其中 96GB 须分配为显存），并需在 Vulkan llama.cpp 环境下运行，以充分发挥其异构计算能力。此次升级的核心在于对混合专家（MoE）架构的高效支持——仅激活模型中部分专家网络，显著降低内存与计算负载，使原本需云端部署的超大规模模型得以在本地流畅运行。实测显示，该平台可实现每秒 15 个 token 的推理速度，性能表现媲美部分专业 AI 加速卡。在模型支持方面，锐龙 AI Max+395 成为首个可本地运行 1090 亿参数 Meta Llama4Sout 模型的平台，该模型体积达 66GB，具备视觉理解（Vision）与多模态上下文处理（MCP）能力，适用于复杂任务如图像描述生成与跨模态推理。同时，它还能高效运行 68GB、1230 亿参数的 Mistral Large 模型，以及 Qwen3A3B（300 亿参数，18GB）和 Google Gemma（270 亿参数，17GB）等主流模型，覆盖从轻量级到超大规模模型的广泛需求。更令人瞩目的是其上下文处理能力的飞跃：最大支持 256,000 个 token 的上下文长度，远超一般模型 32,000 token 的常规上限。这意味着用户可一次性处理长篇文献、大型代码库或复杂对话历史，极大提升专业场景下的信息整合与分析效率，尤其适用于科研、法律、金融等需要深度语境理解的领域。价格方面，配备锐龙 AI Max+395 与 128GB 内存的迷你 AI 工作站已降至约 1.3 万元人民币，相比此前高端 AI 设备动辄数万元的门槛，性价比大幅提升。这一价格策略显著降低了企业与个人开发者部署本地大模型的门槛，推动 AI 技术从云端走向边缘，实现数据隐私保护与低延迟响应的双重优势。业内专家评价，AMD 此次升级标志着本地 AI 推理进入“桌面级超大模型”时代。相比英伟达依赖 GPU 驱动的生态，AMD 通过 CPU+统一内存+Vulkan 优化路径，构建了更具成本效益的替代方案。尽管在部分并行计算场景仍略逊于专用 AI 芯片，但其在灵活性、内存带宽与能效比上的优势，正吸引越来越多开发者与中小企业关注。锐龙 AI Max+395 的推出，不仅强化了 AMD 在 AI 硬件市场的存在感，也加速了大模型从“云端专属”向“本地可运行”的范式转变。

AMD Ryzen AI Max+ 395: 1280 Mrd. Parameter-Modelle lokal lauffähig

Related Links