HyperAI

对于xAI来说，这是一个好消息：其推出的聊天机器人Grok如今在回答《博德之门》相关问题上已表现出色。尽管不同AI实验室各有侧重——OpenAI专注消费者应用，Anthropic偏向企业市场，而埃隆·马斯克的xAI则特别关注游戏攻略——但Grok在这一领域的进步令人瞩目。据《商业内幕》记者格蕾丝·凯近日报道，马斯克曾因对Grok在《博德之门》游戏问答上的表现不满，导致一次模型发布推迟数日。当时，多名高级工程师被临时抽调，专门优化Grok对游戏细节的回应。这一事件引发外界对马斯克“过度干预”技术方向的讨论，也让人好奇：他最终是否得到了想要的游戏指导能力？为验证Grok的实际表现，我们邀请资深RPG玩家拉姆·伊耶尔设计了一组关于《博德之门》的五个通用问题，对Grok与ChatGPT、Claude、Gemini三款主流模型进行了一次非正式对比测试，我们称之为“博德之门基准测试”（BaldurBench）。所有对话记录已公开，可供查阅。结果显示，Grok表现相当不错。尽管其回答中夹杂大量玩家术语，如“存档刷”（save-scumming）和“DPS”（伤害输出），略显晦涩，但内容准确且信息丰富，尤其擅长用表格呈现复杂策略，符合玩家“理论构筑”（theorycraft）的偏好。其他模型各有风格：ChatGPT偏好简洁的项目符号列表，Gemini则喜欢加粗关键词；而Claude则展现出“体验保护”意识，当被问及队伍搭配时，它建议“别太较真，玩得开心最重要”，体现了对游戏沉浸感的重视。需要强调的是，根据此前报道，游戏攻略正是xAI刻意投入的重点领域。因此，Grok在该领域的表现与主流模型持平，说明其在明确目标下具备快速优化能力。尽管不能完全归功于马斯克的“折腾”，但这一进展至少证明：当团队聚焦具体任务时，xAI确实能做出扎实成果。

相关链接

相关链接

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

Command Palette

xAI重磅更新：Grok在《博德之门》相关问题上表现惊艳

相关链接

Command Palette

xAI重磅更新：Grok在《博德之门》相关问题上表现惊艳

相关链接

Command Palette

xAI重磅更新：Grok在《博德之门》相关问题上表现惊艳

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征