HyperAIHyperAI

Command Palette

Search for a command to run...

喂养机器:人工智能时代的能源革命

在AI技术迅猛发展的背后,一场静默的“数据革命”正在重塑整个产业生态。曾经被视为低门槛、边缘化工作的数据标注,如今正演变为价值数十亿美元的高精尖产业。以Mercor、Surge AI、Scale AI等为代表的新一代数据公司,正通过雇佣顶尖专家、构建复杂评估标准(rubrics)和模拟真实工作环境,为AI模型提供“超级精细化”的训练数据。 2023年,年仅19岁的Brendan Foody创办Mercor,起初只是一个自动化招聘平台,利用语言模型筛选简历并面试程序员。然而,当Scale AI在2024年初提出需要1200名软件工程师来生成AI编程训练数据时,Foody敏锐察觉到趋势转变——AI训练不再依赖海量通用数据,而是转向高质量、专业化、可验证的“专家级数据”。面对Scale平台管理混乱、薪资拖欠等问题,他果断剥离中间环节,直接对接工程师,打造高效数据供应链。仅数月后,Mercor年化营收飙升至5亿美元,估值达100亿美元,成为全球增长最快的公司之一,其三位创始人均为22岁,跻身最年轻自创亿万富翁行列。 与此同时,Surge AI凭借其创始人Edwin Chen对数据质量的极致追求,迅速崛起。该公司拒绝“人海战术”,坚持招募具备专业背景的博士、律师、医生等,提供更高薪酬与更严格质检,去年营收突破10亿美元,远超Scale的8.7亿美元。如今,Surge正寻求10亿美元融资,估值达150亿美元。 这些公司所构建的,不仅是数据工厂,更是AI训练的“认知基础设施”。为了训练模型理解真实世界任务,企业需投入巨资制作“评分细则”——例如,要求AI在处理医疗问题时必须包含检查脉搏、使用除颤器、实施心肺复苏等近50个具体步骤。这些细则往往耗时十小时以上完成,而OpenAI等巨头已订购数十万份,涵盖数百万条标准。 更深层的问题在于:当前AI依赖的“强化学习”机制,依赖清晰的“成功信号”——如代码能否运行、棋局是否获胜。但现实世界任务复杂多变,法律文书、商业咨询、临床诊断并无统一标准。MIT研究显示,95%采用生成式AI的企业尚未获得实际回报。因此,AI公司正转向“人工定义标准+AI试错”的路径,通过大量专家参与,将人类知识“编码”为可学习的规则。 这一趋势催生了“AI数据经济”的全面爆发。从Uber收购比利时标注公司,到Handshake AI、Turing、Labelbox等企业转型,再到Sapien等公司以加密货币支付数据标注费,整个行业正经历“寒武纪大爆发”。这些公司虽面临客户集中、技术迭代等风险,但其商业模式已显现出强韧性:它们不追求“通用智能”,而是成为AI时代不可或缺的“数据矿工”。 正如Mercor创始人Foody所言:“整个经济正变成一个强化学习环境。”在通往AGI的漫长征途上,真正推动AI进步的,或许不是更强大的模型,而是那些在屏幕前逐条编写标准、评估结果、优化流程的“人类专家”。而他们,正成为AI时代最真实、最昂贵的“基础设施”。

相关链接