阿里云发布Qwen3-Coder:最强代理编码模型,性能比肩Claude Sonnet 4
近日,阿里巴巴推出Qwen3-Coder,这是一款具有卓越性能的代码生成模型。该模型有多个版本,但首先向公众推出的最强大版本是Qwen3-Coder-480B-A35B-Instruct,它拥有480亿个参数和35亿个活跃参数,能够支持高达100万个token的上下文长度(通过外推方法)。 Qwen3-Coder-480B-A35B-Instruct 是一个混合专家(Mixture-of-Experts, MoE)模型,专为执行驱动的大规模强化学习设计,不仅在编码任务上表现出色,还在代理任务(Agentic Tasks)中展现了领先能力。它在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 等领域刷新了开源模型的纪录,与 Anthropic 的 Claude Sonnet 4 相当。 与社区普遍关注比赛级代码生成不同,阿里巴巴团队认为所有编码任务都适合用执行驱动的大规模强化学习来解决。为此,他们在更广泛的现实编码任务上进行了大规模的 Code RL 训练。通过自动生成多样化的测试用例,团队创建了高质量的训练实例,显著提升了代码执行的成功率,并在其他任务上也带来了收益。这种方法鼓励团队继续探索“难解但易验证”的任务作为大规模强化学习的研究方向。 在实际的软件工程任务中,模型需要与环境进行多轮互动,涉及到计划、使用工具、接收反馈和做出决策。在 Qwen3-Coder 的后训练阶段,团队引入了长周期强化学习(Agent RL),以增强模型在这些复杂任务中的表现。主要挑战在于环境的扩展,为了解决这个问题,他们构建了一个可在阿里巴巴云基础设施上并行运行20,000个独立环境的系统。这不仅提供了必要的反馈,还支持大规模评估。因此,Qwen3-Coder 在 SWE-Bench 核实任务中达到了开源模型中的最高水平,而无需进行测试时的扩展。 阿里巴巴开源了 Qwen3-Coder 的命令行工具 Qwen Code,这款工具改编自 Gemini Code,增强了 Qwen-Coder 模型的支持功能。用户可以通过安装 Node.js 20+ 并使用 npm 包管理器或从源码安装的方式来安装 Qwen Code。安装完成后,用户只需输入 qwen 即可开始使用该工具,享受高效的编码体验。 除了 Qwen Code,Qwen3-Coder 还可以与 Claude Code 结合使用。用户只需在阿里巴巴云 Model Studio 平台上申请 API 密钥,并安装 Claude Code,即可开始体验。阿里巴巴还提供了两个入口点,方便用户配置 Qwen3-Coder,包括使用 Claude Code 代理 API 和通过 claude-code-config npm 包进行路由器定制。 阿里巴巴团队仍在积极开发,目标是进一步提高 Coding Agent 的性能,使其能够处理更复杂和繁琐的软件工程任务,从而解放人力,提高生产力。未来还将推出更多型号的 Qwen3-Coder,既保持强大的性能,又降低部署成本。此外,团队还在探索 Coding Agent 是否能实现自优化,这是一个令人兴奋的方向。