GPT-5未达预期:AI界 hype 浪潮遭遇现实降温
GPT-5的发布未能兑现长期积累的超高期待,被广泛视为“ hype 失败”。尽管OpenAI CEO萨姆·阿尔特曼在发布前大肆渲染,称其为“不可逆的里程碑”,甚至用“死星”图片制造悬念,社交媒体上也充斥着“如圣诞前夜般期待”的情绪,但实际体验却让多数用户感到失望。 人们原本期待一个在智能水平上实现质变的模型,能像“博士级专家”一样对话,但在实际使用中,GPT-5的表现更多是渐进式优化。其主要进步体现在成本降低、运行速度提升、幻觉减少以及更可靠的“我不知道”回应机制。此外,新引入的自动模型路由系统——根据用户问题智能选择最合适的模型处理——也是一大亮点。 然而,公众和专家的反应并不买账。不少用户发现模型在基础认知任务上频频出错,如错误判断“blueberry”中有三个“b”,无法正确识别含“R”的州名,甚至在地图标注中虚构“新杰夫斯特”“米坎”等不存在的州,并错误地将内华达州划归加州。在情感支持场景中,用户批评其回应冷漠、缺乏共情,最终迫使OpenAI重新上线更受欢迎的GPT-4o版本。 知名AI专家加里·马库斯称其“过时、过度炒作、令人失望”;彼得·威尔德福尔德直言“不是我们期待的突破”;博主兹维·莫什沃茨则评价为“尚可但不突出”。Reddit上甚至有用户直言“告诉萨姆,5号就是垃圾”。 尽管如此,随着舆论冷却,共识逐渐形成:GPT-5虽非惊艳,但更实用。其在编码能力上表现突出,目前在主流AI代码榜单中排名第一,超越了Anthropic的Claude。OpenAI展示的AI游戏生成、像素艺术工具、鼓点模拟器等应用虽有瑕疵,但在简单项目上仍具价值,对开发者和企业用户吸引力强。 在医疗领域,GPT-5也宣称有进展,但尚待实践验证。整体来看,其在基准测试中表现优于前代,但提升幅度有限,远未达到“死星”式的震撼。 长远看,这种“低调务实”的升级路径,或许更符合AI企业的商业逻辑——企业客户、政府合作和投资更看重稳定、可靠、可落地的性能,而非炫技式的飞跃。因此,GPT-5的“小步快跑”,或许正是OpenAI在激烈竞争中更可持续的盈利策略。