HyperAI超神经

AI代理尚无法完全取代人类顾问，但这一趋势正在加速。Mercor首席执行官布伦丹·福迪（Brendan Foody）表示，尽管当前AI在复杂咨询任务中表现仍有限，但其进步速度惊人，未来几年内可能实现对低层级咨询岗位的替代。 Mercor近期发布了一项针对AI代理在真实世界咨询、金融和法律任务中表现的测试，即APEX-Agents基准。测试结果显示，AI代理在首次尝试中仅能完成不到25%的任务，即使允许八次尝试，成功率也仅达40%。在管理咨询任务中，OpenAI的GPT-5.2首次尝试成功率为23%，而Anthropic最新发布的Opus 4.6则提升至近33%。相比之下，GPT-3的初始成功率仅为3%。福迪指出，AI在短短数月内性能提升显著，预计到2024年底，成功率有望接近50%。这些任务模拟了麦肯锡、波士顿咨询、德勤、安永等顶级咨询公司的真实工作流程，涉及复杂分析与战略判断。尽管AI在信息检索和数据分析方面表现尚可，但在需要长期规划、多步骤协作和跨文件系统定位信息的任务中频频失败。福迪形容AI代理如同“实习生”——能完成部分工作，但需人类持续纠错。前KPMG顾问、现为Mercor专家承包商的弗兰克·琼斯指出，AI难以理解“客户可用”等专业语境中的隐含要求，必须依赖极其精确的提示词。他强调，当前仍需大量人工干预与优化。尽管如此，AI已深刻影响咨询行业。麦肯锡CEO鲍勃·斯滕费尔表示，公司现有6万名员工中，2.5万人为AI代理，这是其历史上首次实现业务增长而无需扩充人力。福迪认为，随着训练数据和模型能力的持续提升，AI将逐步取代低阶咨询岗位。他透露，Mercor即将推出新版评估体系，不再仅测试单个分析师，而是评估整个专业服务公司的运作效率，其结果可能对麦肯锡等巨头构成“可怕挑战”。他预测：“未来两年内，我们将拥有堪比顶尖咨询公司的聊天机器人。”

相关链接

相关链接

相关链接

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

Command Palette

AI代理难替代人类顾问 但变革即将来临——Mercor首席执行官预言

相关链接

Command Palette

AI代理难替代人类顾问 但变革即将来临——Mercor首席执行官预言

相关链接

Command Palette

AI代理难替代人类顾问 但变革即将来临——Mercor首席执行官预言

相关链接

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

AI代理难替代人类顾问但变革即将来临——Mercor首席执行官预言

AI代理难替代人类顾问但变革即将来临——Mercor首席执行官预言

AI代理难替代人类顾问但变革即将来临——Mercor首席执行官预言