HyperAIHyperAI

Command Palette

Search for a command to run...

谷歌 DeepMind 推出 AlphaEvolve:LLM 驱动的算法发现与优化工具

本周,谷歌DeepMind推出了一款名为AlphaEvolve的创新AI编码代理,该系统能够发现和进化新算法,标志着AI在基础性突破方面取得了重要进展。AI在科学研究中的应用尚处于初级阶段,但在软件开发领域正在迅速成熟。OpenAI本周推出了其新的编码代理Codex,而微软则宣布了开源GitHub Copilot Chat扩展的关键组件,进一步将AI融入VS Code的开发工具中。微软的这一举措是对OpenAI Coding等竞争对手迅速发展的及时回应,尤其是 windsurf.ai(近期被OpenAI以30亿美元收购)和Cursor(其创建者Anysphere最近估值约为90亿美元)。这两个平台本身就是基于VS Code的分叉版本,突显了微软决定深度嵌入开放源代码AI的重要性。 AlphaEvolve的独特之处在于它通过与Gemini Pro等LLM、进化搜索框架以及严格的自动评估方法相结合,逐步优化整个代码库,而不仅仅是生成看似合理的代码片段。系统能够在多个性能指标上同时进行优化,通过对实际代码执行结果进行验证,有效规避了幻觉问题,从而确保生成的算法不仅听起来合乎逻辑,还能在实践中超越现有的方法。 AlphaEvolve的成果令人瞩目。它已经优化了谷歌基础设施的关键部分,例如通过改进数据中心调度算法,恢复了约0.7%的全网计算能力;简化了硬件加速器电路设计;加速了其底层LLM的训练。尤为重要的是,AlphaEvolve破解了一个自1969年以来未变的问题,发明了一种仅用48个标量乘法就能更高效地将两个4x4复矩阵相乘的方法,超过了经典的Strassen算法。此外,它还解决了50多个其他开放数学问题,通常都能达到或超越现有先进水平。 与此同时,AI正逐渐成为日常软件工程工作流的一部分,OpenAI的新推出的Codex就是一个典型例子。Codex由调整后的OpenAI o3模型驱动,在安全的云环境中操作,能够处理诸如调试、代码审查、重构和实时用户反馈等实际开发任务。通过集成“询问”和“编码”模式,Codex可以自主克隆仓库、运行测试,并通过差异和拉取请求提出代码改进意见,这一切都在明确的指令下完成。Codex的发展方向是从“聪明的自动完成功能”向“AI副驾”乃至更高的自主性逐步演进,尽管目前仍需要专家指导来有效引导模型。 除了这些进展,中国公司Minimax发布的Speech-02-HD模型在多项评测中超越了OpenAI和ElevenLabs,支持32种以上的语言、原始音频克隆,并能一次处理多达20万个字符。阿里巴巴的Qwen团队也介绍了并行训练的理论缩放法则,展示了如何通过P倍的计算资源在1/P的时间内训练P倍参数规模的模型,这有助于提高大语言模型的训练效率。Stability AI则发布了一款适用于智能手机的音频生成模型,能够直接在智能手机上运行,生成长达11秒的音频仅需不到8秒。 总的来说,本周的进展清楚地表明AI正从纯粹的生产力助推器转变为真正强大的伙伴和独立创新者,既能在基础研究中自主发现重要的突破,也能融入日常的工作流程中,成为不可或缺的助手。

相关链接

谷歌 DeepMind 推出 AlphaEvolve:LLM 驱动的算法发现与优化工具 | 热门资讯 | HyperAI超神经