亚马逊发布云端AI工具,加速工程师应对服务中断
亚马逊云服务(AWS)本周二推出一款名为“DevOps Agent”的AI工具,旨在帮助客户更快地诊断和恢复系统故障。该工具利用来自Datadog、Dynatrace等第三方监控平台的数据,通过人工智能技术自动分析故障原因,提升运维效率。 AWS负责代理型AI的副总裁Swami Sivasubramanian表示,DevOps Agent能像现场可靠性工程师(SRE)一样,主动识别问题、提出可能的根因,并建议修复方案。在传统模式下,工程师需手动排查问题,耗时较长;而该工具可在值班人员介入前,自动生成初步调查报告,大幅缩短响应时间。 据AWS介绍,澳大利亚联邦银行已参与测试,该工具在不到15分钟内便定位了一起复杂故障,而人工排查通常需要数小时。这一表现凸显了AI在运维场景中的实际价值。 DevOps Agent通过调用AWS自研AI模型及其他第三方模型,实现智能分析与任务分配。它能自动创建多个分析代理,分别验证不同假设,从而加速问题解决流程。 这并非AWS首次推出AI驱动的开发工具。自2022年ChatGPT引爆生成式AI热潮以来,云巨头纷纷将AI融入开发与运维流程。此前,AWS已推出“Vibe Coding”工具Kiro,支持通过自然语言生成和修改代码;谷歌也推出面向开发者的Antigravity工具,微软则通过GitHub Copilot提供AI编程辅助。 目前,DevOps Agent已开放预览,客户可免费试用,正式收费服务将在未来推出。这一举措标志着AWS正进一步将AI能力深度整合到其云服务生态中,帮助客户提升系统稳定性与开发效率。
