Back to Headlines

“推理巨鲸”震撼登场,引爆AI编程新热潮

3 天前

AI编程服务正面临一场“推理巨鲸”引发的危机。所谓“推理巨鲸”,指那些大量使用AI编程工具、单月消耗数万美元推理资源的极端用户。这些用户通过订阅“无限使用”套餐,长期运行复杂、耗时的自动化开发任务,导致服务提供商成本飙升,利润空间被严重挤压。 以Anthropic的Claude Code为例,其每月200美元的无限套餐曾吸引大量开发者。但部分用户如瑞典开发者Albert Örwall,每天仅AI推理成本就达500美元,远超订阅费用。有用户甚至在排行榜上创下近110亿token的使用纪录,对应成本接近3.5万美元,而仅支付200美元月费。这种“薅羊毛”行为让Anthropic难以持续,不得不调整策略:从8月28日起,将引入每周使用额度限制,超限需额外付费。 类似问题也出现在另一大AI编程工具Cursor上。其原无限套餐因成本不可控,已转为按使用量计费的分层模式,但因沟通不畅,引发用户不满。许多用户抱怨突然出现高额账单,尤其是运行长周期、高复杂度任务时,成本呈指数级增长。 问题核心在于:AI模型推理成本并未如预期下降。新一代推理模型更复杂,处理任务需分解更多步骤,消耗更多token。而开发者普遍追求“最强模型”,不愿使用旧版本,导致服务方始终面临高成本压力。即便未来单token价格下降,自动化、长周期的“代理式”开发流程仍会大幅增加总消耗。 正如TextQL创始人Ethan Ding所言:“无限订阅在当前AI时代已无可能。模型越强,消耗越大,数学本身已崩坏。”AI编程服务正从“资源转售”模式转向更精细化的计费体系,未来能否盈利,取决于能否在用户体验与成本控制间找到平衡。

Related Links