HyperAI超神经

在AI技术迅猛发展的背后，一场静默的“数据革命”正在重塑整个产业生态。曾经被视为低门槛、边缘化工作的数据标注，如今正演变为价值数十亿美元的高精尖产业。以Mercor、Surge AI、Scale AI等为代表的新一代数据公司，正通过雇佣顶尖专家、构建复杂评估标准（rubrics）和模拟真实工作环境，为AI模型提供“超级精细化”的训练数据。 2023年，年仅19岁的Brendan Foody创办Mercor，起初只是一个自动化招聘平台，利用语言模型筛选简历并面试程序员。然而，当Scale AI在2024年初提出需要1200名软件工程师来生成AI编程训练数据时，Foody敏锐察觉到趋势转变——AI训练不再依赖海量通用数据，而是转向高质量、专业化、可验证的“专家级数据”。面对Scale平台管理混乱、薪资拖欠等问题，他果断剥离中间环节，直接对接工程师，打造高效数据供应链。仅数月后，Mercor年化营收飙升至5亿美元，估值达100亿美元，成为全球增长最快的公司之一，其三位创始人均为22岁，跻身最年轻自创亿万富翁行列。与此同时，Surge AI凭借其创始人Edwin Chen对数据质量的极致追求，迅速崛起。该公司拒绝“人海战术”，坚持招募具备专业背景的博士、律师、医生等，提供更高薪酬与更严格质检，去年营收突破10亿美元，远超Scale的8.7亿美元。如今，Surge正寻求10亿美元融资，估值达150亿美元。这些公司所构建的，不仅是数据工厂，更是AI训练的“认知基础设施”。为了训练模型理解真实世界任务，企业需投入巨资制作“评分细则”——例如，要求AI在处理医疗问题时必须包含检查脉搏、使用除颤器、实施心肺复苏等近50个具体步骤。这些细则往往耗时十小时以上完成，而OpenAI等巨头已订购数十万份，涵盖数百万条标准。更深层的问题在于：当前AI依赖的“强化学习”机制，依赖清晰的“成功信号”——如代码能否运行、棋局是否获胜。但现实世界任务复杂多变，法律文书、商业咨询、临床诊断并无统一标准。MIT研究显示，95%采用生成式AI的企业尚未获得实际回报。因此，AI公司正转向“人工定义标准+AI试错”的路径，通过大量专家参与，将人类知识“编码”为可学习的规则。这一趋势催生了“AI数据经济”的全面爆发。从Uber收购比利时标注公司，到Handshake AI、Turing、Labelbox等企业转型，再到Sapien等公司以加密货币支付数据标注费，整个行业正经历“寒武纪大爆发”。这些公司虽面临客户集中、技术迭代等风险，但其商业模式已显现出强韧性：它们不追求“通用智能”，而是成为AI时代不可或缺的“数据矿工”。正如Mercor创始人Foody所言：“整个经济正变成一个强化学习环境。”在通往AGI的漫长征途上，真正推动AI进步的，或许不是更强大的模型，而是那些在屏幕前逐条编写标准、评估结果、优化流程的“人类专家”。而他们，正成为AI时代最真实、最昂贵的“基础设施”。

相关链接

相关链接

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

Command Palette

喂养机器：人工智能时代的能源革命

相关链接

Command Palette

喂养机器：人工智能时代的能源革命

相关链接

Command Palette

喂养机器：人工智能时代的能源革命

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化