AI初创公司CEO:人工数据难以在数十年内取代真实数据
AI数据标注公司Invisible Technologies的CEO马特·菲茨帕特里克(Matt Fitzpatrick)近日在“20VC”播客中表示,人工智能不会在短期内用合成数据完全取代人类参与的训练过程。他指出,当前产业中一个普遍误解是,未来两三年内合成数据将全面替代人工反馈,但这一观点从基本逻辑上讲并不成立。 菲茨帕特里克强调,现实世界中任务的多样性、语言和文化语境的复杂性,使得AI难以在短期内独立完成高质量训练。以法律行业为例,其涉及大量非公开、高度专业化的信息,仅靠机器生成数据无法准确处理。因此,他断言:“在生成式AI领域,人类参与将长期存在,未来几十年内都不可或缺。” 合成数据是通过算法人工生成的数据,常用于填补真实数据不足或保护隐私的场景。而当前主流的AI训练仍高度依赖真实人类的反馈,如对AI输出进行筛选、排序和打分。Invisible Technologies正通过雇佣数百万名人类标注员,帮助AI学习数学、科学、编程,甚至理解幽默与共情等复杂能力。 菲茨帕特里克曾是麦肯锡高级合伙人,领导其AI研究与开发部门QuantumBlack Labs。他所领导的Invisible Technologies在2023年9月完成1亿美元融资,估值达20亿美元,与Scale AI、Surge AI等公司同属数据标注赛道的头部企业。 该行业正经历结构性变化。此前,Mercor CEO布伦丹·福迪曾强调,数据质量的核心在于“优秀且被善待的人才”。而Job平台Handshake的CEO加勒特·洛德则指出,AI训练对标注人员的要求已从“通才”转向“专才”,如具备数学、科学背景的专家。他称,当前AI已“吸收”了互联网、书籍和视频的全部内容,通用型标注员已不再足够。 多位行业领袖的共识是:人类在AI训练中的角色不会被快速取代,而是正向更高专业度、更深度参与的方向演进。
