HyperAI超神经

3 天前

近日，行业首个智能体AI基准测试AgentPerf公布首批结果。测试显示，英伟达Blackwell Ultra NVL72平台在智能体AI工作负载中表现领先，其每兆瓦能耗下可运行的智能体数量较上一代Hopper架构提升20倍。与传统对话式AI不同，智能体AI需通过多次大模型调用与工具交互完成复杂任务，其负载复杂度呈指数级增长。现有评测标准无法准确衡量此类需求。AgentPerf基于真实编程智能体轨迹构建，通过模拟多步推理与工具调用，精准评估系统在响应速度、并发能力及能效方面的实际表现。英伟达GB300 NVL72凭借全栈协同设计实现性能突破。该平台将72颗GPU整合为单机架系统，配合CUDA内核优化与TensorRT LLM推理引擎，有效掩盖跨专家通信延迟，大幅提升并发处理效率。在20与60 tokens每秒的服务级别目标下，GB300 NVL72均展现出显著的能效优势。目前，Baseten、DeepInfra及Together AI等合作伙伴已基于Blackwell平台部署DeepSeek V4 Pro等大模型，为Cursor、Pam.ai等生产级智能体应用提供实时推理支持。随着英伟达Vera Rubin架构全面投产及软件生态持续优化，智能体AI基础设施的算力密度与经济性将进一步跃升，为企业规模化落地AI智能体提供坚实底座。

此资讯由 AI 智能聚合生成，旨在高效传递行业动态，不代表任何观点或建议。

相关链接

相关链接

相关链接

谷歌 DeepMind 最新论文揭秘 AI 终局：从 AGI 到 ASI，有 4 条路和 6 道关

谷歌 DeepMind 最新论文揭秘 AI 终局：从 AGI 到 ASI，有 4 条路和 6 道关

Command Palette

英伟达Blackwell领跑首个智能体AI基础设施基准测试

相关链接

Command Palette

英伟达Blackwell领跑首个智能体AI基础设施基准测试

相关链接

Command Palette

英伟达Blackwell领跑首个智能体AI基础设施基准测试

相关链接

谷歌 DeepMind 最新论文揭秘 AI 终局：从 AGI 到 ASI，有 4 条路和 6 道关

谷歌 DeepMind 最新论文揭秘 AI 终局：从 AGI 到 ASI，有 4 条路和 6 道关