HyperAI

本周，谷歌DeepMind推出了一款名为AlphaEvolve的创新AI编码代理，该系统能够发现和进化新算法，标志着AI在基础性突破方面取得了重要进展。AI在科学研究中的应用尚处于初级阶段，但在软件开发领域正在迅速成熟。OpenAI本周推出了其新的编码代理Codex，而微软则宣布了开源GitHub Copilot Chat扩展的关键组件，进一步将AI融入VS Code的开发工具中。微软的这一举措是对OpenAI Coding等竞争对手迅速发展的及时回应，尤其是 windsurf.ai（近期被OpenAI以30亿美元收购）和Cursor（其创建者Anysphere最近估值约为90亿美元）。这两个平台本身就是基于VS Code的分叉版本，突显了微软决定深度嵌入开放源代码AI的重要性。 AlphaEvolve的独特之处在于它通过与Gemini Pro等LLM、进化搜索框架以及严格的自动评估方法相结合，逐步优化整个代码库，而不仅仅是生成看似合理的代码片段。系统能够在多个性能指标上同时进行优化，通过对实际代码执行结果进行验证，有效规避了幻觉问题，从而确保生成的算法不仅听起来合乎逻辑，还能在实践中超越现有的方法。 AlphaEvolve的成果令人瞩目。它已经优化了谷歌基础设施的关键部分，例如通过改进数据中心调度算法，恢复了约0.7%的全网计算能力；简化了硬件加速器电路设计；加速了其底层LLM的训练。尤为重要的是，AlphaEvolve破解了一个自1969年以来未变的问题，发明了一种仅用48个标量乘法就能更高效地将两个4x4复矩阵相乘的方法，超过了经典的Strassen算法。此外，它还解决了50多个其他开放数学问题，通常都能达到或超越现有先进水平。与此同时，AI正逐渐成为日常软件工程工作流的一部分，OpenAI的新推出的Codex就是一个典型例子。Codex由调整后的OpenAI o3模型驱动，在安全的云环境中操作，能够处理诸如调试、代码审查、重构和实时用户反馈等实际开发任务。通过集成“询问”和“编码”模式，Codex可以自主克隆仓库、运行测试，并通过差异和拉取请求提出代码改进意见，这一切都在明确的指令下完成。Codex的发展方向是从“聪明的自动完成功能”向“AI副驾”乃至更高的自主性逐步演进，尽管目前仍需要专家指导来有效引导模型。除了这些进展，中国公司Minimax发布的Speech-02-HD模型在多项评测中超越了OpenAI和ElevenLabs，支持32种以上的语言、原始音频克隆，并能一次处理多达20万个字符。阿里巴巴的Qwen团队也介绍了并行训练的理论缩放法则，展示了如何通过P倍的计算资源在1/P的时间内训练P倍参数规模的模型，这有助于提高大语言模型的训练效率。Stability AI则发布了一款适用于智能手机的音频生成模型，能够直接在智能手机上运行，生成长达11秒的音频仅需不到8秒。总的来说，本周的进展清楚地表明AI正从纯粹的生产力助推器转变为真正强大的伙伴和独立创新者，既能在基础研究中自主发现重要的突破，也能融入日常的工作流程中，成为不可或缺的助手。

相关链接

相关链接

相关链接

基于大模型推理与 MCP 工具调用，斯坦福大学 AI X 射线科学家在同步辐射光源自主完成单晶衍射对准

基于大模型推理与 MCP 工具调用，斯坦福大学 AI X 射线科学家在同步辐射光源自主完成单晶衍射对准

Command Palette

谷歌 DeepMind 推出 AlphaEvolve：LLM 驱动的算法发现与优化工具

相关链接

Command Palette

谷歌 DeepMind 推出 AlphaEvolve：LLM 驱动的算法发现与优化工具

相关链接

Command Palette

谷歌 DeepMind 推出 AlphaEvolve：LLM 驱动的算法发现与优化工具

相关链接

基于大模型推理与 MCP 工具调用，斯坦福大学 AI X 射线科学家在同步辐射光源自主完成单晶衍射对准

基于大模型推理与 MCP 工具调用，斯坦福大学 AI X 射线科学家在同步辐射光源自主完成单晶衍射对准