Back to Headlines

Thinking Machines Lab发布首篇成果

11 天前

由前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)创立的Thinking Machines Lab,正致力于解决人工智能模型响应不一致的问题。该实验室凭借20亿美元的种子轮融资和一支由前OpenAI核心成员组成的顶尖团队,成为AI界备受关注的新星。 在最新发布的研究博客《击败大语言模型推理中的非确定性》中,实验室研究人员霍拉斯·何(Horace He)指出,当前AI模型在多次回答同一问题时产生不同结果,其根源在于GPU计算过程中“核函数”(GPU kernels)的调度方式。这些小程序运行在Nvidia芯片上,负责模型推理阶段的计算任务。何认为,通过精细控制这一底层流程,可以显著提升AI输出的确定性与可复现性。 目前,主流AI模型被视为“非确定性系统”,即同一输入可能产生不同输出,这一现象被广泛接受。但Thinking Machines Lab认为,这并非不可改变的规律。实现更一致的响应不仅有助于企业与科研机构获得可靠结果,还能提升强化学习(RL)训练效率。由于强化学习依赖对模型输出的准确反馈,若响应波动大,训练数据将变得嘈杂,影响学习效果。而更稳定的输出能让整个训练过程更加“平滑”。 据《信息》(The Information)此前报道,实验室计划利用强化学习技术,为各类企业提供定制化AI模型服务。穆拉蒂表示,其首款产品将在未来几个月内发布,目标用户为研究者和初创企业,但具体形态尚未披露。 此外,Thinking Machines Lab承诺将定期发布研究博客、代码和成果,以推动公共知识共享,并营造开放的研究文化。这一举措与OpenAI早期开放路线相似,但近年来其已趋于封闭。该实验室能否持续践行开放承诺,仍有待观察。 尽管这篇博客未揭示完整技术路径,但已展现出其在AI前沿问题上的深度思考。能否将这些研究转化为实际产品,并支撑其120亿美元的估值,将是未来真正的考验。

Related Links