HyperAI超神经

7 个月前

DeepMind和OpenAI的AI模型在国际数学奥林匹克竞赛（IMO）中表现出色，达到了顶尖高中生的水平。7月21日，DeepMind宣布其系统在IMO的数学题上获得了金牌分数，虽然表面上仅比去年略有提升，但其背后却发生了重大变化。去年，DeepMind依靠专门设计的AI工具AlphaGeometry和AlphaProof，这些工具需要人类专家将题目翻译成类似编程语言，再将AI的解题过程翻译回英文。而今年，系统直接使用基于Gemini的大型语言模型DeepThink，全程以自然语言处理，实现了端到端的数学推理能力。 DeepThink在本届IMO的6道题中获得了35分（满分42），由与人类选手相同的评委进行评分。与此同时，OpenAI的模型也以金牌水平解出了相同题目，但其答案由独立团队评估。纽约大学神经科学家加里·马库斯（Gary Marcus）称赞这一成果“令人印象深刻”，尽管他一直主张通过手动编码逻辑规则的“神经符号AI”方法，对大语言模型（LLM）的 hype 保持警惕。 DeepMind的团队表示，AI在数学问题解决上的进步表明，LLM正变得越来越强大，但神经符号AI仍在持续发展。两种方法未来可能融合，共同推动AI在数学等复杂领域的应用。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

DeepMind与OpenAI模型数学解题能力媲美顶尖学生

相关链接

Command Palette

DeepMind与OpenAI模型数学解题能力媲美顶尖学生

相关链接

Command Palette

DeepMind与OpenAI模型数学解题能力媲美顶尖学生

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟