OpenAI Agents SDK全面升级:新增TypeScript支持和实时语音交互,2026年将取代Assistants API
OpenAI 近日发布了一则消息,对其 Agents SDK 进行了重大升级,增加了多项对开发者而言至关重要的新功能。这次升级的核心目标是扩展编程语言支持,并显著提升语音交互的能力。自发布以来,Agents SDK 一直致力于简化 AI 代理的管理和使用,以便开发者能够更加灵活地构建多代理工作流程。如今,OpenAI 的 Agents SDK 不仅支持 Python,还新增了 TypeScript,使得开发者可以在更广泛的技术栈中选择合适的编程语言,实现更加细粒度的控制和人工审批机制,从而更精准地管理 AI 代理的行为。 最引人注目的新功能之一是 RealtimeAgent。这项技术的引入意味着开发者可以创建支持语音打断的 AI 代理,这些代理能够在客户端和服务器端运行,并在对话过程中实时调用各种工具。为了帮助开发者更好地监控这些语音代理的性能,OpenAI 还对 “Traces” 仪表板进行了升级,新增了实时显示音频流状态、工具使用情况和打断次数统计的功能,这无疑为开发者提供了一个全面了解代理运行状态的平台。 支撑这些新功能的是 OpenAI 最新优化的底层语言模型 “GPT-4O-Realtime-Preview-2025-06-03”。该模型已经在指令执行准确性、工具调用的可靠性和中断处理的优雅度等方面取得了显著进展。通过实时和聊天 API,OpenAI 将这一新模型向开发者开放,使其能够在实际应用中体验到这些改进的效果。 除了新增功能和技术进步,OpenAI 还宣布了一个重要的 API 战略调整。根据最新公布的产品路线图,OpenAI 计划在 2026 年中期逐步淘汰现有的 Assistants API,并全面转向新的 Responses API。虽然 Chat Completions API 仍然会继续服务于那些不需要工具集成的应用开发者,但 OpenAI 强烈建议开发者尽早过渡到 Responses API,以便利用其更强大、更具扩展性的功能。 这次升级表明 OpenAI 在 AI 技术和工具开发方面的持续投入,尤其是在语音交互和多代理管理领域。新功能的推出不仅提升了开发者的工作效率,也为未来的 AI 应用带来了更多的可能性。值得注意的是,OpenAI 的这一 SDK 支持与其他遵循 Chat Completions 标准的第三方模型提供商的兼容性,这一特点进一步增加了平台的灵活性,满足了多样化的开发需求。 业内专家认为,OpenAI 此次升级 Agents SDK 是其迈向更加成熟和专业的开发者生态的重要一步。这次技术升级不仅体现了 OpenAI 在 AI 领域的强大实力,也为开发者提供了更多选择和更灵活的工具,有助于推动整个行业的发展。此外,OpenAI 作为全球领先的 AI 研究机构,其产品路线图的调整将对其他公司的技术发展方向产生显著影响。