HyperAI

阿里巴巴于周一发布了Qwen 3，这是一系列被誉为“混合”推理模型的人工智能（AI）产品。根据阿里巴巴的说法，Qwen 3的性能在某些方面可以与谷歌和OpenAI的最佳模型相媲美，甚至超越它们。这些模型从6亿个参数到2350亿个参数不等，大多数已经或即将通过AI开发平台Hugging Face和GitHub以开放许可证形式提供下载。模型的参数数量越多，通常其解决问题的能力越强。 Qwen 3的最大特点是具备“混合”能力，能够在消耗时间和计算资源进行复杂问题推理的同时，也能快速响应简单请求。这种功能使用户能够灵活控制模型的推理预算。根据阿里巴巴的说法，Qwen 3支持119种语言，并基于近36万亿的数据令牌训练而成，相当于约2.7万亿单词的数据量。该模型的训练数据包括教科书、问答对、代码片段等多种类型的内容。与前代Qwen 2相比，Qwen 3在多个方面取得了显著进步。在编程竞赛平台Codeforces上，最大的Qwen 3模型Qwen-3-235B-A22B已经超越了OpenAI的o3-mini模型。在AIME（数学基准测试）和BFCL（问题推理能力评估）等测试中，Qwen-3-235B-A22B同样表现出色。不过，这一最大模型目前尚未向公众开放。公开可用的最大Qwen 3模型是Qwen3-32B，其在多个测试中仍能与多种专有和开源AI模型竞争，包括中国AI实验室DeepSeek的R1模型。Qwen3-32B在LiveBench准确率测试中超过了OpenAI的o1模型。除了模型下载，Qwen 3还提供了工具调用、指令跟随以及特定数据格式复制等功能。阿里云和其他云计算提供商如Fireworks AI和Hyperbolic也开始提供Qwen 3的服务。尽管美国政府对向中国出售计算芯片和从中国购买芯片实施了限制，但Qwen 3这样的高性能开源模型必然会在国内得到广泛应用。这一趋势反映了企业不仅在自行开发工具，也在购买来自闭源模型公司的现成解决方案，如Anthropic和OpenAI。业内人士对Qwen 3给予了高度评价。AI云托管公司Baseten的联合创始人兼CEO Tuhin Srivastava表示，Qwen 3是开源模型保持与闭源系统同步发展的又一个里程碑。尽管美国政府试图通过芯片限制对中国AI产业施压，Qwen 3的成功展示了中国在自主研发AI技术方面取得的巨大进展。阿里巴巴作为中国领先的科技公司，在技术研发和产业应用中一直走在国际前列，此次Qwen 3的发布进一步巩固了其在全球AI领域的地位。

相关链接

相关链接

相关链接

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

Command Palette

阿里巴巴推出Qwen 3：性能媲美谷歌与OpenAI的“混合”AI推理模型

相关链接

Command Palette

阿里巴巴推出Qwen 3：性能媲美谷歌与OpenAI的“混合”AI推理模型

相关链接

Command Palette

阿里巴巴推出Qwen 3：性能媲美谷歌与OpenAI的“混合”AI推理模型

相关链接

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制

全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制