Command Palette
Search for a command to run...
ジェミナイ:多様なモーダルに対応する高性能モデル群
ジェミナイ:多様なモーダルに対応する高性能モデル群
Gemini Team
概要
本報告では、画像、音声、動画、およびテキスト理解において優れた能力を示す新しいマルチモーダルモデルのファミリー「ジェミナイ」について紹介します。ジェミナイ・ファミリーは、Ultra(ウルトラ)、Pro(プロ)、Nano(ナノ)の3つのサイズで構成されており、複雑な推論タスクからデバイス上のメモリ制約のあるユースケースまで幅広い用途に適しています。多数のベンチマークでの評価結果によると、最も高性能なジェミナイ・ウルトラモデルは32のベンチマーク中の30で最先端技術を更新しており、特に著名な試験ベンチマークMMLU(Multimodal Multiple-Choice Questions)で初めて人間専門家同等の性能を達成しました。また、我々が調査した20のマルチモーダルベンチマーク全てにおいて最先端技術を向上させています。我々は、ジェミナイ・ファミリーがクロスモーダル推論と言語理解における新機能により、多様なユースケースを可能にするものと考えています。また、ジェミナイ・モデルを責任を持ってユーザーに提供するためのアプローチについても説明し、Gemini(ジェミナイ)、Gemini Advanced(ジェミナイ・アドバンスト)、Google AI Studio(グーグルAIスタジオ)、Cloud Vertex AI(クラウド・バーテックスAI)などのサービスを通じて展開することについて述べます。