HyperAIHyperAI

Command Palette

Search for a command to run...

xAI重磅更新:Grok在《博德之门》相关问题上表现惊艳

对于xAI来说,这是一个好消息:其推出的聊天机器人Grok如今在回答《博德之门》相关问题上已表现出色。尽管不同AI实验室各有侧重——OpenAI专注消费者应用,Anthropic偏向企业市场,而埃隆·马斯克的xAI则特别关注游戏攻略——但Grok在这一领域的进步令人瞩目。 据《商业内幕》记者格蕾丝·凯近日报道,马斯克曾因对Grok在《博德之门》游戏问答上的表现不满,导致一次模型发布推迟数日。当时,多名高级工程师被临时抽调,专门优化Grok对游戏细节的回应。这一事件引发外界对马斯克“过度干预”技术方向的讨论,也让人好奇:他最终是否得到了想要的游戏指导能力? 为验证Grok的实际表现,我们邀请资深RPG玩家拉姆·伊耶尔设计了一组关于《博德之门》的五个通用问题,对Grok与ChatGPT、Claude、Gemini三款主流模型进行了一次非正式对比测试,我们称之为“博德之门基准测试”(BaldurBench)。所有对话记录已公开,可供查阅。 结果显示,Grok表现相当不错。尽管其回答中夹杂大量玩家术语,如“存档刷”(save-scumming)和“DPS”(伤害输出),略显晦涩,但内容准确且信息丰富,尤其擅长用表格呈现复杂策略,符合玩家“理论构筑”(theorycraft)的偏好。 其他模型各有风格:ChatGPT偏好简洁的项目符号列表,Gemini则喜欢加粗关键词;而Claude则展现出“体验保护”意识,当被问及队伍搭配时,它建议“别太较真,玩得开心最重要”,体现了对游戏沉浸感的重视。 需要强调的是,根据此前报道,游戏攻略正是xAI刻意投入的重点领域。因此,Grok在该领域的表现与主流模型持平,说明其在明确目标下具备快速优化能力。尽管不能完全归功于马斯克的“折腾”,但这一进展至少证明:当团队聚焦具体任务时,xAI确实能做出扎实成果。

相关链接

xAI重磅更新:Grok在《博德之门》相关问题上表现惊艳 | 热门资讯 | HyperAI超神经