HyperAIHyperAI

Command Palette

Search for a command to run...

Anthropic 快速迭代 Opus 4.8:强化“自我纠错”能力

本周四,Anthropic 正式发布了目前最先进的公开模型 Opus 4.8,维持标准定价。此次发布距离上一版本 Opus 4.7 推出仅 41 天,刷新了 Anthropic 的迭代纪录(同期 Sonnet 和 Haiku 分别已运行三个月和七个月)。业内推测,这一超常规的快速推新,部分源于市场对 Opus 4.7 表现的冷淡,以及来自 OpenAI(Codex)和谷歌(Gemini Flash)日益增长的市场压力。 与以往不同,Opus 4.8 的亮点不仅在于顶级的基准测试分数,更在于其对“不确定性”的精准把控。Anthropic 早期测试发现,新模型更倾向于主动标记其分析中的不确定之处,而非做出无根据的断言。来自桥水基金(Bridgewater Associates)的反馈证实了这一点,用户指出 Opus 4.8 会主动排查输入和输出中的潜在问题,有效弥补了其他模型容易遗漏盲区的短板。 此外,Anthropic 同步推出了动态工作流(Dynamic Workflows,处于研究预览阶段),专为大型模型管理跨数百个平行 agent 的复杂任务设计。官方示例显示,Claude Code 配合 Opus 4.8 已能独立完成涵盖十万行代码的大型代码库迁移,实现了从启动到合并的全自动化。 备受关注的顶级模型 Mythos 仍因网络安全顾虑处于限制预览状态,但 Anthropic 在公告中暗示该限制即将解除:“我们正迅速完善相关安全防御措施,预计在未来几周内将具备向所有用户发布 Mythos 级模型的条件。”

相关链接

Anthropic 快速迭代 Opus 4.8:强化“自我纠错”能力 | 热门资讯 | HyperAI超神经