Qwen3.5登場:ハイブリッドアテンションで効率と性能を両立、マルチモーダル・多言語対応で実用性を飛躍的に向上
2026年2月16日、アリババのQwenチームは次世代基礎モデル「Qwen3.5–397B-A17B」を発表した。このモデルは3970億パラメータのMixture-of-Experts(MoE)構造を採用し、1トークンあたり170億パラメータのみがアクティブに働くスパースな設計。API版は「Qwen3.5-Plus」として提供され、100万トークンのコンテキスト窓、組み込みツール、適応型ツール利用機能を備える。主な革新点は、線形AttentionとフルAttentionを3:1の比率で交互に配置する「ハイブリッドAttentionアーキテクチャ」。この設計により、長文処理の効率性が飛躍的に向上。特にGated DeltaNet(線形Attentionの一種)とゲート付きAttentionの組み合わせで、計算コストの増大を抑制しつつ、訓練の安定性も向上。また、ミリオン規模のエージェント環境でスケーラブルな強化学習を実施し、現実世界での適応性を強化。視覚・言語の統合型設計により、Qwen3と別々のモデルだった構造から脱却し、本質的にマルチモーダル。201言語・方言への対応は、オープンモデルの中でも最も広範。 ベンチマークでは、数学と推論(AIME 2026: 91.3、HMMT Feb 25: 94.8)は上位クラスだが、最強モデルに及ばない。一方、指示理解能力(IFBench: 76.5、MultiChallenge: 67.6)はGPT-5.2やClaudeを上回り、突出。エージェント性能(Tau2-Bench: 86.7、BrowseComp: 78.6)も高水準。コード生成(SWE-bench Verified: 76.4)は中堅。視覚理解では、MMMU(85.0)、MathVision(88.6)、OmniDocBench(90.8)で顕著な強みを発揮。特にZEROBench(12点)は極めて困難なタスクで優位。 Qwen3.5は単一分野で最も優れているわけではないが、バランスの取れた性能と強力な指示理解力で、業界の新基準を示している。発表時期はGLM-5、MiniMax-M2.5、Kimi-K2.5と重なり、中国AIの「前年中プレシーズン」戦略を象徴。アーキテクチャの焦点は、もはや「MoEか密度か」ではなく、「Attentionの扱い方」に移行。Qwen3.5のハイブリッドアプローチは、DeepSeekの影響を受ける一方で、独自の進化を示す。今後、より小型のバージョンも登場すると見られ、アーキテクチャの普及が期待される。
