HyperAIHyperAI

Command Palette

Search for a command to run...

阿里巴巴推出Qwen 3:性能媲美谷歌与OpenAI的“混合”AI推理模型

阿里巴巴于周一发布了Qwen 3,这是一系列被誉为“混合”推理模型的人工智能(AI)产品。根据阿里巴巴的说法,Qwen 3的性能在某些方面可以与谷歌和OpenAI的最佳模型相媲美,甚至超越它们。这些模型从6亿个参数到2350亿个参数不等,大多数已经或即将通过AI开发平台Hugging Face和GitHub以开放许可证形式提供下载。模型的参数数量越多,通常其解决问题的能力越强。 Qwen 3的最大特点是具备“混合”能力,能够在消耗时间和计算资源进行复杂问题推理的同时,也能快速响应简单请求。这种功能使用户能够灵活控制模型的推理预算。根据阿里巴巴的说法,Qwen 3支持119种语言,并基于近36万亿的数据令牌训练而成,相当于约2.7万亿单词的数据量。该模型的训练数据包括教科书、问答对、代码片段等多种类型的内容。 与前代Qwen 2相比,Qwen 3在多个方面取得了显著进步。在编程竞赛平台Codeforces上,最大的Qwen 3模型Qwen-3-235B-A22B已经超越了OpenAI的o3-mini模型。在AIME(数学基准测试)和BFCL(问题推理能力评估)等测试中,Qwen-3-235B-A22B同样表现出色。不过,这一最大模型目前尚未向公众开放。 公开可用的最大Qwen 3模型是Qwen3-32B,其在多个测试中仍能与多种专有和开源AI模型竞争,包括中国AI实验室DeepSeek的R1模型。Qwen3-32B在LiveBench准确率测试中超过了OpenAI的o1模型。 除了模型下载,Qwen 3还提供了工具调用、指令跟随以及特定数据格式复制等功能。阿里云和其他云计算提供商如Fireworks AI和Hyperbolic也开始提供Qwen 3的服务。 尽管美国政府对向中国出售计算芯片和从中国购买芯片实施了限制,但Qwen 3这样的高性能开源模型必然会在国内得到广泛应用。这一趋势反映了企业不仅在自行开发工具,也在购买来自闭源模型公司的现成解决方案,如Anthropic和OpenAI。 业内人士对Qwen 3给予了高度评价。AI云托管公司Baseten的联合创始人兼CEO Tuhin Srivastava表示,Qwen 3是开源模型保持与闭源系统同步发展的又一个里程碑。尽管美国政府试图通过芯片限制对中国AI产业施压,Qwen 3的成功展示了中国在自主研发AI技术方面取得的巨大进展。阿里巴巴作为中国领先的科技公司,在技术研发和产业应用中一直走在国际前列,此次Qwen 3的发布进一步巩固了其在全球AI领域的地位。

相关链接