Anthropic发布Claude Sonnet 5模型
Anthropic 今日正式发布 Claude Sonnet 5,号称迄今为止最具智能体(Agentic)能力的 Sonnet 系列模型。它能制定计划、使用浏览器和终端等工具,并自主执行任务——几个月前,这样的能力级别还需要更大、更贵的模型才能实现。 Sonnet 5 大幅缩小了与高端模型 Opus 4.8 的差距。相比前代 Sonnet 4.6,在推理、工具调用、编码和知识工作等智能体关键指标上均有显著提升。安全评估显示,其不良行为率整体低于 Sonnet 4.6,但在自动化行为审计中略高于 Opus 4.8 和 Mythos Preview。 即日起,Sonnet 5 在所有订阅计划中上线:Free 和 Pro 计划默认使用该模型;Max、Team 和 Enterprise 用户均可选用。同时已在 Claude Code 和 Claude Platform 中开放,模型 ID 为 claude-sonnet-5。 定价方面,推出优惠价至 2026 年 8 月 31 日:输入 $2/百万 tokens,输出 $10/百万 tokens;之后调整为输入 $3/百万 tokens、输出 $15/百万 tokens。 Anthropic 未刻意对 Sonnet 5 进行网络安全的针对性训练。评估显示,其在开发软件漏洞利用等危险任务上的能力远低于 Opus 4.8 和 Mythos 5。模型已默认启用网络安全防护,可实时检测和拦截危险的网络使用行为——与 Opus 4.7/4.8 的防护级别相同,低于对 Mythos 5 实施的更严格防护。 Sonnet 5 在幻觉率(减少 45%)、谄媚行为和提示注入攻击抵抗方面均优于 Sonnet 4.6。用户可根据任务复杂度选择不同推理力度,在成本与性能之间灵活平衡。
