AMD锐龙AI Max+ 395重磅发布:1280亿参数大模型本地运行成真
12 天前
AMD近日宣布对锐龙 AI Max+395进行重磅升级,使其成为首个可在本地运行高达1280亿参数大模型的计算平台,标志着个人设备运行超大规模AI模型进入新阶段。该处理器基于Zen5架构,配合128GB统一内存(其中96GB需分配为显存)和Vulkan llama.cpp运行环境,实现高性能本地推理。 此次升级的核心在于引入混合专家(MoE)架构,通过仅激活模型部分参数来显著降低内存与算力消耗,使原本需要云端部署的复杂模型得以在本地运行。实测显示,锐龙 AI Max+395可实现每秒15个Token的处理速度,性能表现强劲。它已成功支持66GB大小、1090亿参数的Meta Llama4Sout模型,该模型具备视觉理解(Vision)和多模态上下文处理(MCP)等高级功能。此外,还可运行68GB、1230亿参数的Mistral Large模型,以及Qwen3A3B(300亿参数,18GB)和Google Gemma(270亿参数,17GB)等多款主流模型。 在上下文处理能力方面,锐龙 AI Max+395实现突破,最大支持256000个Token的上下文长度,远超一般模型32000Token的常规上限,使复杂长文本分析、文档理解、代码生成等任务更加高效。这一能力原本仅限于高端服务器或云平台,如今已下放至消费级设备。 目前,搭载锐龙 AI Max+395与128GB内存的迷你AI工作站价格已降至约1.3万元,性价比大幅提升,极大降低了专业级AI开发与应用的门槛。AMD此次升级不仅巩固了其在边缘AI计算领域的领先地位,也为开发者、研究人员和创意工作者提供了前所未有的本地化大模型运行能力。
Related Links
MIT Technology Review