AI代理难替代人类顾问 但变革即将来临——Mercor首席执行官预言
AI代理尚无法完全取代人类顾问,但这一趋势正在加速。Mercor首席执行官布伦丹·福迪(Brendan Foody)表示,尽管当前AI在复杂咨询任务中表现仍有限,但其进步速度惊人,未来几年内可能实现对低层级咨询岗位的替代。 Mercor近期发布了一项针对AI代理在真实世界咨询、金融和法律任务中表现的测试,即APEX-Agents基准。测试结果显示,AI代理在首次尝试中仅能完成不到25%的任务,即使允许八次尝试,成功率也仅达40%。在管理咨询任务中,OpenAI的GPT-5.2首次尝试成功率为23%,而Anthropic最新发布的Opus 4.6则提升至近33%。相比之下,GPT-3的初始成功率仅为3%。福迪指出,AI在短短数月内性能提升显著,预计到2024年底,成功率有望接近50%。 这些任务模拟了麦肯锡、波士顿咨询、德勤、安永等顶级咨询公司的真实工作流程,涉及复杂分析与战略判断。尽管AI在信息检索和数据分析方面表现尚可,但在需要长期规划、多步骤协作和跨文件系统定位信息的任务中频频失败。福迪形容AI代理如同“实习生”——能完成部分工作,但需人类持续纠错。 前KPMG顾问、现为Mercor专家承包商的弗兰克·琼斯指出,AI难以理解“客户可用”等专业语境中的隐含要求,必须依赖极其精确的提示词。他强调,当前仍需大量人工干预与优化。 尽管如此,AI已深刻影响咨询行业。麦肯锡CEO鲍勃·斯滕费尔表示,公司现有6万名员工中,2.5万人为AI代理,这是其历史上首次实现业务增长而无需扩充人力。 福迪认为,随着训练数据和模型能力的持续提升,AI将逐步取代低阶咨询岗位。他透露,Mercor即将推出新版评估体系,不再仅测试单个分析师,而是评估整个专业服务公司的运作效率,其结果可能对麦肯锡等巨头构成“可怕挑战”。他预测:“未来两年内,我们将拥有堪比顶尖咨询公司的聊天机器人。”
