HyperAIHyperAI

Command Palette

Search for a command to run...

Google、統一エンコーダレスマルチモーダルモデル「Gemma 4 12B」をリリース

Googleはマルチモーダルモデル「Gemma 4 12B」の公開を発表した。本モデルはエンコーダーを不要とする統一アーキテクチャを採用し、単一基盤で多様な処理に対応できる設計となっている。開発者はLM Studio、Ollama、Google AI Edge GalleryおよびEloquentアプリケーション、LiteRT-LM CLIを用いて直感的な試行が可能である。事前学習済みおよびインストラクションチューニング済みチェックポイントはHugging FaceとKaggleから直接提供され、公式開発ドキュメントおよびクイックスタートノートブックによる学習もサポートされている。 開発環境との統合では、Hugging Face Transformers、llama.cpp、MLX、SGLang、vLLMなどのローカル推論フレームワークに対応し、Unslothを活用した効率的なファインチューニングも実装できる。さらにエージェント開発を支援するため、Gemmaモデルを用いたエージェント構築に特化した公式スキルリポジトリを同時にリリースした。これにより開発チームの生産性向上と機能拡張が促進される見込みである。 プロダクション環境への展開はGoogle Cloudエコシステムとシームレスに連携しており、Gemini Enterprise Agent PlatformのModel Garden、Cloud Run、GKE経由で柔軟なデプロイが可能である。本リリースにより、マルチモーダルAIの実装ハードルが低下し、エッジデバイスからクラウド基盤まで一貫した開発フローの確立が進むと期待される。

関連リンク

Google、統一エンコーダレスマルチモーダルモデル「Gemma 4 12B」をリリース | 人気の記事 | HyperAI超神経