Gemma 4 31Bは、最大256Kのコンテキストに対応し、ワンクリックでデプロイ可能。Qwen 3.5 397Bと同等の機能を備えています。

最近、Google DeepMindは、Gemma 4シリーズのモデルをオープンソース化した。Gemini 3と同じ技術システムを活用することで、Arena AIのランキングで世界トップ3に入るだけでなく、競合製品よりもはるかに少ないパラメータ規模で、より大規模なモデルに匹敵、あるいはそれを上回る性能を実現しています。さらに、Apache 2.0ライセンスに基づくオープンソース戦略により、導入のハードルがさらに下がり、実際の運用環境への展開可能性が大幅に向上しています。

製品形態の観点からGemma 4は単一モデルではなく、E2B、E4B、26B、A4Bから31Bまでの複数のサイズをカバーするマルチサイズシステムです。これらのモデルは、モバイルデバイス、ローカル展開、高性能コンピューティング環境など、さまざまなシナリオに対応できるように設計されています。この階層型設計の中核となる考え方は、「規模、性能、コスト」のバランスを取り、多様なニーズを満たすことです。小規模モデルは軽量性とリアルタイム性能を重視し、大規模モデルは複雑な推論と高精度タスクに重点を置いています。

中でも、現行シリーズの性能上限であるバージョン31Bは、Qwen 3.5 397Bに匹敵する能力を備えています。アプリケーションシナリオの観点からは、バージョン31Bは、画像とテキストの入出力に対応し、最大256Kトークンのコンテキストウィンドウを備え、推論、関数呼び出し、システムプロンプトをネイティブにサポートしています。また、140以上の言語に対応しているため、高品質な質問応答、コード支援、エージェントサービスなどのシナリオに最適です。