HyperAI

JetBrains はこのほど、自然言語およびコード処理に最適化された新しいオープンモデル「Mellum2」の公開を発表しました。この 120 億パラメータの混合Expert（MoE）モデルは、ゼロから学習され、トークンごとに 25 億パラメータのみがアクティブ化される設計となっており、低遅延かつ高スループットな推論を可能にします。Mellum の前身はコード補完モデルでしたが、Mellum2 ではその基盤をより広範な自然言語タスクやソフトウェアエンジニアリングの機能へ拡張しつつ、推論効率と展開性の保持に注力しています。同社の発表によると、Mellum2 は同規模の他モデルと同等以上のベンチマーク性能を記録しながら、推論速度は 2 倍以上の高速化を達成しています。これは、コード生成、推論、科学、数学などの幅広い基準で評価され、実用レベルの生産性を示す結果です。モデルはテキストとコードに特化しており、マルチモーダル処理は対象外ですが、これによりソフトウェアエンジニアリングのワークロードに合わせたコンパクトな効率を実現しています。主な用途としては、マルチモデルシステムにおける軽量なルーティングやオーケストレーション、RAG（検索拡張生成）パイプラインにおけるコンテキストの圧縮や要約、そしてエージェントのサブタスクにおける計画や検証などがあります。また、Apache 2.0 ライセンスの下で公開されているため、自前環境でのプライベート展開や機密性の高いデータの取り扱いにも適しています。 JetBrains は現代の AI システムが複数のモデル呼び出しを必要とする中で、全てのタスクに大規模モデルを用いるのではなく、特定の機能に特化した「フォーカルモデル」の導入が効率的であると指摘しています。Mellum2 は、より巨大なモデルや他の専門コンポーネントと組み合わせて動作することで、システム全体をより速く、低コストかつ制御しやすくすることを目的としています。現在、Hugging Face からモデルのダウンロードが可能であり、技術レポートやアーキテクチャの詳細も論文を通じて公開されています。IDE 内の開発、RAG パイプライン、エージェントワークフロー、あるいはプライベートインフラ上で動作する AI システムを構築する開発者にとって、Mellum2 は直ちに実装・検証可能な選択肢となっています。

関連リンク

関連リンク

関連リンク

Command Palette

JetBrains が 12B モデルの Mellum2 を発表

関連リンク

Command Palette

JetBrains が 12B モデルの Mellum2 を発表

関連リンク

Command Palette

JetBrains が 12B モデルの Mellum2 を発表

関連リンク