HyperAI超神经
Back to Headlines

泄露文件揭示 xAI 用僵尸末日和火星生活对话训练语音模型

2 days ago

埃隆·马斯克的xAI正在使用一些非常规的话题来训练其语音模型。根据Business Insider获得的泄露文件,这些话题包括僵尸末日、马斯克的火星殖民梦想以及日常生活中的水管维修等,目的是让AI的声音听起来更加自然和人性化,从而吸引更多用户使用其付费版本。 此前,xAI推出了其聊天机器人Grok的早期语音模式版本。文件显示,xAI通过数据标注公司Scale AI招募自由职业者来进行这一训练项目,项目被称为“Project Xylophone”。Scale AI为xAI运行了至少10个生成式AI项目,其中包括苹果、Google DeepMind和Meta在内的其他公司也在其服务列表中。 Project Xylophone的培训任务分为两个部分:“Conversations”和“Grasslands”。在“Conversations”部分,自由职业者组成三人团队,在Zoom上开展真实的对话,涉及700多个不同类型的话题,从生存技巧、旅行计划到心理健康问题,甚至包括一些科幻主题,如火星定居的文化构建。而在“Grasslands”部分,单人工作者被要求用母语录制自然的、无脚本的对话,背景可以包括各种场景,甚至连噪音也被鼓励保留。 三名不具名的Scale AI合同工透露,任务分配基于他们的技能和专长。他们提到,“Grasslands”项目的报酬最初是每项任务3美元,大约一个月后降到了1美元。每项任务需要在五分钟内完成并上传录音,同时还需手动进行转录。为了使对话更自然,转录时需要保留诸如“嗯”这样的停顿词。 大型语言模型的训练需要大量的优质数据。通过模拟真实世界的情景,如自然流畅的对话,AI公司能够生成更合适的训练数据。Meta和OpenAI等公司也在采取类似的方法,以提高其AI产品的个性和用户体验。xAI特别强调了政治边缘化的特点,希望通过不同的培训方法来区分自己。公司还计划雇佣数千名内部的“AI导师”,并加强对其聊天机器人Grok的安全测试,尤其是在处理敏感和有争议的话题时。

Related Links