OpenAI 新模型在国际数学奥林匹克竞赛中超越顶尖选手,展现强大推理能力
近日,OpenAI 的最新实验模型在国际数学奥林匹克竞赛(IMO)中取得了令人瞩目的成绩,一举获得了金牌水平的表现。 这一成就不仅意味着机器学习领域取得了重要进展,也标志着人工智能在解决复杂问题方面的能力大幅提升。 国际数学奥林匹克竞赛始于1959年的罗马尼亚,是全球最负盛名且难度极高的数学竞赛之一。 每届比赛分为两天,参赛者每天需要在4.5小时内解答三道极其复杂的数学难题。 历史上的一些著名获奖者包括几何学领域作出重要贡献的格里戈里·佩雷尔曼和获得数学界最高荣誉菲尔兹奖的陶哲轩。 今年6月,陶哲轩在接受Lex Fridman的播客采访时曾预测,人工智能短期内无法在IMO上取得高分。 他建议研究人员应尝试一些难度较低的比赛,“有些比赛的答案是一个数字,而不是长篇大论的证明。” 然而,OpenAI的最新模型却在同样的测试条件下解出了6道题中的5道,展示了极高的数学推理能力。 OpenAI的技术人员亚历山大·韦伊在社交平台X上宣布了这一消息:“我们最新的@OpenAI实验推理语言模型已经实现了长期存在于人工智能领域的一个重大挑战:在世界上最著名的数学竞赛——国际数学奥林匹克竞赛中达到金牌级别的表现。” 模型的另一位开发人员诺姆·布朗则表示,该模型在解决问题时展现出了前所未有的持久创造力。“IMO的问题相比以往的标准,需要更高层次的持续创造性思维。这个模型思考的时间非常长。” 韦伊进一步说明,该模型不仅在数学领域表现出色,而且在总体智能方面也有显著提升,尤其是在通用强化学习方面打破了新的纪录。他强调,这不同于DeepMind的AlphaGeometry,后者仅专注于数学问题,而OpenAI 的模型能够处理更广泛的任务。 OpenAI首席执行官山姆·阿尔特曼也在X上分享了这一成功:“我们刚开始OpenAI时,这只是一个梦想,但现在它变得越来越现实。 这是过去十年AI发展的重要标志。” 不过,阿尔特曼表示,具备“金牌级能力”的模型暂时不会向公众开放,“可能还需要几个月的时间”。 这一成就充分展示了人工智能技术的发展速度之快。 两年前,AI实验室还在用小学数学题目来评估模型的表现;而现在,OpenAI的模型已经在顶尖数学竞赛中取得了优异成绩。 彼得·蒂尔也曾预测,至少还需要三年才能实现这一目标,OpenAI的提前实现更是超乎想象。 然而,任何技术突破总会有支持者与质疑者。 人工智能批评家加里·马库斯在X上称这一表现“确实令人印象深刻”,但也提出了一些疑问:模型如何训练?其“通用智能”的范围究竟有多广?这对普通用户有多大的实用价值?以及每解决一个问题的成本是多少?此外,他还指出,IMO尚未独立验证这些结果。 总之,OpenAI的这一成就不仅是该公司的一个重要里程碑,更是人工智能领域的一次重大进步。 OpenAI成立于2015年,是一家非营利性的研究机构,致力于开发安全且惠及人类的人工智能技术。虽然仍有许多问题待解,但此次成绩无疑激发了学术界和技术界的更多兴趣和讨论。