DeepMind与OpenAI模型数学解题能力媲美顶尖学生
10 days ago
DeepMind和OpenAI的AI模型在国际数学奥林匹克竞赛(IMO)中表现出色,达到了顶尖高中生的水平。7月21日,DeepMind宣布其系统在IMO的数学题上获得了金牌分数,虽然表面上仅比去年略有提升,但其背后却发生了重大变化。去年,DeepMind依靠专门设计的AI工具AlphaGeometry和AlphaProof,这些工具需要人类专家将题目翻译成类似编程语言,再将AI的解题过程翻译回英文。而今年,系统直接使用基于Gemini的大型语言模型DeepThink,全程以自然语言处理,实现了端到端的数学推理能力。 DeepThink在本届IMO的6道题中获得了35分(满分42),由与人类选手相同的评委进行评分。与此同时,OpenAI的模型也以金牌水平解出了相同题目,但其答案由独立团队评估。纽约大学神经科学家加里·马库斯(Gary Marcus)称赞这一成果“令人印象深刻”,尽管他一直主张通过手动编码逻辑规则的“神经符号AI”方法,对大语言模型(LLM)的 hype 保持警惕。 DeepMind的团队表示,AI在数学问题解决上的进步表明,LLM正变得越来越强大,但神经符号AI仍在持续发展。两种方法未来可能融合,共同推动AI在数学等复杂领域的应用。