HyperAI超神经
Back to Headlines

o3-pro:性能更强但速度更慢,是否值得升级?

3 days ago

近日,OpenAI 推出了名为 o3-pro 的新版本模型。该模型在原有 o3 基础上进行了升级,能够以更高的算力处理问题,但订阅价格也提高至每月 200 美元。o3-pro 是否物有所值,成为用户讨论的热点话题。 o3-pro 在多个领域表现出了显著的改进,尤其是在科学、教育、编程、数据分析和写作方面,专家评审一致认为 o3-pro 较 o3 有很大提升。o3-pro 能够更好地理解复杂指令,提供更全面的答案,并表现出更强的准确性。然而,这些改进并非没有代价——o3-pro 的处理速度极慢,通常需要等待 15 分钟以上才能得到回答。 多位业界人士分享了他们对 o3-pro 的使用体验。Tyler Cowen 表示,o3-pro 明显减少了幻觉(即错误或编造的信息),特别是在解决经济学问题时表现出色,他认为等待时间可以通过浏览 Twitter 来打发。相比之下,其他人指出,o3-pro 在一些基准测试中并没有显著优于 o3,甚至在某些任务上的表现不如 o3,如工具使用和编程任务。Greg Brockman 强调,o3-pro 在数学、科学和编程方面的表现确实有了大幅提高。 尽管 o3-pro 在处理复杂问题时表现出色,但其慢速和高成本使得它不适合日常使用。许多用户反映,在实际应用中,o3-pro 经常让他们感到不耐烦,并且频繁遇到错误。Dominik Lukes 的测试结果显示,o3-pro 虽然在分析能力上有较大提升,但在简单问题上则显得过于复杂。Matt Shumer 指出,o3-pro 不适合作为日常的编码模型,而是用作超人研究员和结构化思考者,适合处理大量数据并发现用户可能忽略的洞见。 值得一提的是,o3-pro 还支持一些高级功能,如网页搜索、文件分析、视觉输入推理、使用 Python、个性化响应等。不过,这些功能的可用性和效用在实际操作中受到限制,特别是当面对长时间运行的任务时。一些用户表示,o3-pro 在创造性和小说写作方面展现出惊人的能力,能够编写引人入胜的故事,角色塑造和情节构造都非常出色。然而,也有反馈称,o3-pro 在处理技术任务时显得有些“灵魂缺失”,并且在某些情况下无法提供有用的答案。 关于 o3-pro 的安全性和对齐问题,Miles Brundage 提到 OpenAI 未对 o3-pro 进行新的系统卡更新,这引发了对评估过程的质疑。虽然 OpenAI 表示 o3-pro 使用与 o3 相同的基础模型,安全性信息仍沿用 o3 的系统卡,但这在某种程度上显得不够透明。 总体来看,o3-pro 是一个功能强大但使用频率较低的工具。其主要优势在于能够深入处理复杂问题,但在大多数日常任务中,标准版 o3 或其他模型已经足够用。因此,用户是否需要订阅 o3-pro 主要取决于他们是否有特定的高级需求。o3-pro 更适合那些需要解决特别复杂问题的超级研究人员,以及愿意为此付费的专业用户。 从公司角度来看,OpenAI 正在持续推出新版本模型,并不断优化现有模型的性能。此次 o3-pro 的发布是 OpenAI 在技术发展上的又一次尝试,但其高昂的成本和缓慢的速度也让部分用户望而却步。与此同时,OpenAI 近日还大幅降低了 o3 的订阅价格,这被认为是更加重要的举措,因为降价让更多用户能够以更低的成本享受到高质量的 AI 服务。 Aaron Levie 强调,随着 AI 推理成本的快速下降,开发者应更加关注未来的可能性,而不是仅仅局限于当前的经济可行性。这对于构建更具雄心的 AI 代理具有重要意义,意味着可以更多地投入到那些原本因成本过高而无法实现的功能上。因此,尽管 o3-pro 当前存在局限,但它依然是 AI 技术进步的一个重要里程碑。

Related Links

Hacker News