谷歌推出轻量级开源嵌入模型 EmbeddingGemma,支持移动端离线运行
グーグルのディープラーニングチームが、モバイルデバイス向けに最適化されたオープンソースのテキスト埋め込みモデル「EmbeddingGemma」を正式に発表した。このモデルは3億800万パラメータと非常に小型ながら、MTEB(大規模テキスト埋め込みベンチマーク)において5億パラメータ未満のモデルの中で最高の性能を達成。多言語対応のテキスト埋め込み機能を備え、検索増強生成(RAG)やセマンティック検索といった用途に最適化されている。 EmbeddingGemmaは、サイズがほぼ2倍の主流モデルと同等の精度を実現しており、高効率と高性能を両立。出力次元は768から128までカスタマイズ可能で、最大2000トークンのコンテキスト窓をサポート。スマートフォン、ノートPC、デスクトップなど、日常的な端末でもスムーズに動作する。また、sentence-transformers、MLX、Ollamaなど、幅広い開発ツールと連携可能で、開発者の導入を容易にしている。 特に注目すべきは、オフラインでの実行が可能であり、ユーザーのデータが外部に流出するリスクを回避。プライバシー保護を重視するアプリケーション開発に最適。RAGパイプラインでは、ユーザー入力を埋め込み表現に変換し、事前に登録されたドキュメントとの類似度を計算。この高精度な埋め込みにより、関連性の高い文書を正確に検索し、信頼性の高い回答を生成できる。 処理速度も優れており、埋め込み推論時間は15ミリ秒未満。リアルタイム対応が可能で、インタラクティブなアプリケーションの構築が現実的になる。開発者は、オフライン対応のチャットボット、ドキュメント検索機能、特定領域向けの迅速なファインチューニングなど、多様なユースケースに活用できる。 EmbeddingGemmaは、高性能と軽量性、プライバシー保護を兼ね備えた次世代モバイルAIモデルとして、開発者コミュニティに大きな期待が寄せられている。
