HyperAI超神経

5ヶ月前

2026年2月16日、アリババのQwenチームは次世代基礎モデル「Qwen3.5–397B-A17B」を発表した。このモデルは3970億パラメータのMixture-of-Experts（MoE）構造を採用し、1トークンあたり170億パラメータのみがアクティブに働くスパースな設計。API版は「Qwen3.5-Plus」として提供され、100万トークンのコンテキスト窓、組み込みツール、適応型ツール利用機能を備える。主な革新点は、線形AttentionとフルAttentionを3:1の比率で交互に配置する「ハイブリッドAttentionアーキテクチャ」。この設計により、長文処理の効率性が飛躍的に向上。特にGated DeltaNet（線形Attentionの一種）とゲート付きAttentionの組み合わせで、計算コストの増大を抑制しつつ、訓練の安定性も向上。また、ミリオン規模のエージェント環境でスケーラブルな強化学習を実施し、現実世界での適応性を強化。視覚・言語の統合型設計により、Qwen3と別々のモデルだった構造から脱却し、本質的にマルチモーダル。201言語・方言への対応は、オープンモデルの中でも最も広範。ベンチマークでは、数学と推論（AIME 2026: 91.3、HMMT Feb 25: 94.8）は上位クラスだが、最強モデルに及ばない。一方、指示理解能力（IFBench: 76.5、MultiChallenge: 67.6）はGPT-5.2やClaudeを上回り、突出。エージェント性能（Tau2-Bench: 86.7、BrowseComp: 78.6）も高水準。コード生成（SWE-bench Verified: 76.4）は中堅。視覚理解では、MMMU（85.0）、MathVision（88.6）、OmniDocBench（90.8）で顕著な強みを発揮。特にZEROBench（12点）は極めて困難なタスクで優位。 Qwen3.5は単一分野で最も優れているわけではないが、バランスの取れた性能と強力な指示理解力で、業界の新基準を示している。発表時期はGLM-5、MiniMax-M2.5、Kimi-K2.5と重なり、中国AIの「前年中プレシーズン」戦略を象徴。アーキテクチャの焦点は、もはや「MoEか密度か」ではなく、「Attentionの扱い方」に移行。Qwen3.5のハイブリッドアプローチは、DeepSeekの影響を受ける一方で、独自の進化を示す。今後、より小型のバージョンも登場すると見られ、アーキテクチャの普及が期待される。

このニュースは、業界の最新情報を効率的に提供するため、AIによって自動的に集約されています。内容は意見や助言を構成するものではありません。

関連リンク

関連リンク

関連リンク

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。

Command Palette

Qwen3.5登場：ハイブリッドアテンションで効率と性能を両立、マルチモーダル・多言語対応で実用性を飛躍的に向上

関連リンク

Command Palette

Qwen3.5登場：ハイブリッドアテンションで効率と性能を両立、マルチモーダル・多言語対応で実用性を飛躍的に向上

関連リンク

Command Palette

Qwen3.5登場：ハイブリッドアテンションで効率と性能を両立、マルチモーダル・多言語対応で実用性を飛躍的に向上

関連リンク

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。