HyperAI超神经
Back to Headlines

DeepMind和OpenAI均宣布拿下IMO金牌,前者获官方认证,后者被批抢风头

14 hours ago

谷歌DeepMind宣布,其Gemini人工智能模型的高级版本在国际数学奥林匹克竞赛中取得了金牌级别的表现,成功解决了六道极为复杂的题目中的五道,并得到了赛事主办方的正式认证。这一胜利标志着AI在推理能力方面取得了重大进展,同时也让谷歌在下一代人工智能的研发竞争中占据领先位置。 国际数学奥林匹克竞赛自1959年起每年举办一次,是全球最负盛名的高中数学比赛。每个参赛国家派出六名顶尖年轻数学家,他们需在四小时半的限定时间内解答涵盖代数、组合数学、几何和数论领域的极难题目。通常情况下,仅有约8%的参赛者能获得金牌。而今年则是有 67 名选手 (约占 11%) 获得了金牌。 谷歌DeepMind的CEO兼创始人Demis Hassabis在社交媒体平台上表示:“官方结果已公布——Gemini达到了国际数学奥林匹克竞赛的金牌级别!它能够解决五个问题。这是一个惊人的进步。”他进一步指出,去年谷歌DeepMind的AlphaProof和AlphaGeometry 2系统仅解决了四个题目,获得了银牌成绩。这表明,AI在处理复杂数学问题时不再需要依赖专用编程语言,而是可以直接理解和解答自然语言描述的问题。 此次Gemini的成功归功于其采用了一种名为“平行思考(parallel thinking)”的增强推理系统,该系统能够在同一时间探索多种可能的解决方案,最终得出一个最佳答案。Gemini通过自然语言端到端操作,直接从官方题目描述生成严谨的数学证明,所有工作均在标准的竞争时间限制内完成。据IMO主席格雷戈博士(Prof. Dr. Gregor Dolinar)评价,Gemini提供的解决方案“令人惊叹”,且大多容易理解。 相比之下,竞争对手OpenAI的行为则引起了争议。该公司在周六宣布其模型同样达到了金牌水平的表现,但在发布前并未经过官方IMO评审团的独立验证。OpenAI内部聘请了三名前IMO金牌得主对AI的解题步骤进行了评估。这种做法被批评为缺乏透明度和可信度,一些用户认为OpenAI对IMO的规定不尊重。谷歌DeepMind则因其遵守IMO理事会原始请求,尊重学生权益后才公布成绩的做法,赢得了业界的好评。 在实际问题解决能力方面,这种自然语言驱动的高级推理模型展示了广泛的前景。谷歌计划向包括数学家在内的值得信赖测试者提供Gemini模型的使用权限,随后再推广给每月支付250美元订阅费的Google AI Ultra用户。这一模型不仅可以处理数学难题,还能在各种领域执行复杂的分析任务,而无需专门的编程或领域知识支持。 然而,尽管取得了显著成就,Gemini仍有不足之处。在面对竞赛难度最高的那道问题时,Gemini基于错误的假设开始解答,未能找到正确答案。只有6名参赛学生成功解答了该题,显示了在某些极端情况下,人类青年数学家仍然具备超越现有AI的能力。 此外,这一进展也反映了AI技术在各个行业的应用潜力。随着AI模型的不断成熟,企业或许可以利用这些技术处理更为复杂和多变的实际问题。不过,如何确保这些推理能力在真实世界的应用中也能保持有效性和可靠性,仍是未来研究的一个重要方向。 国际数学奥林匹克竞赛是面向高中学生的世界顶级数学比赛,每年吸引来自100多个国家的参赛者。此次谷歌DeepMind与OpenAI的竞争不仅是技术竞赛的一部分,也反映了两大公司在全球AI研发中的角力。两公司在此次IMO上的表现均受到了广泛关注,但DeepMind因其更为严谨和透明的态度赢得了不少称赞。AI技术的快速进步正逐渐缩小与人类顶尖水平的距离,预示着未来AI将在更多领域发挥重要作用。

Related Links