HyperAI超神経

Gemini 2.5が完全アップデート、Deep ThinkがOpenAIをサポートし圧倒

特色图像

北京時間5月21日の早朝、Google I/O 2025カンファレンスが予定通り開催されました。基調講演で同社CEOのサンダー・ピチャイ氏はいくつかの重要なアップデートを発表し、AI分野におけるGoogleの強力な能力と成長率を十分に示した。

「通常、I/Oの数週間前にはあまり多くの情報を公開しません。最も重要なモデルはカンファレンスでの発表のために残しておくからです。しかし、Gemini時代では、3月の火曜日に最もスマートなモデルを発表したり、AlphaEvolveのような画期的な技術を1週間前に発表したりするかもしれません」とサンダー・ピチャイは述べた。実際、Google をフォローしている読者なら、同社がカンファレンスの直前に画期的な新モデル「AlphaEvolve」を発表し、I/O カンファレンスに対する人々の期待を高めたことはご存じのはずです。

先ほど終わった基調講演で、ピチャイ氏は期待に応えた。また、Gemini の一連のアップデートに加え、Imagen 4、Veo 3 の最新開発、ヘッドセット、XR グラスなどの製品もリリースしました。この記事では主なアップデート内容を紹介します⬇️

ジェミニ 2.5 フルシリーズアップデート

ディープシンクは強力です

Gemini 2.5 のアップデートは予想されていましたが、驚きも満載でした。 Google は 3 月にこれまでで最もスマートなモデルである Gemini 2.5 Pro をリリースし、2 週間前には開発者向けに Gemini 2.5 Pro プレビュー バージョン アップデートを提供しました。その後、多くの大規模モデル評価リストでトップに立つようになりました。

例えば、プログラミングベンチマーク「WebDev Arena」で1415点を獲得し、見事トップに輝きました。

ジェミニの思考能力をさらに探求するために、Google は、「Deep Think」と呼ばれる強化された推論モードのテストを開始しました。このアプローチでは、新しい調査手法を使用して、モデルが応答する前に複数の仮定を考慮できるようにします。

効果の面では、Gemini 2.5 Pro Deep Think バージョンは、複数の難しいベンチマークで優れたパフォーマンスを発揮し、OpenAI o3 および o4-mini を上回ります。これらには次のものが含まれます:

* 2025年USAMO(米国数学オリンピック)テストで優秀な成績を達成しました。

* 競技レベルのプログラミングスキルを測る難しいベンチマークである LiveCodeBench でトップに立つ。

* MMMU(マルチモーダル推論テスト)で84.0%という高得点を獲得し、優れたマルチモーダル推論能力を証明しました。

さらに、Gemma 3シリーズもアップデートされ、モバイルデバイスのAIニーズに対応しました。Googleは、Qualcomm、MediaTek、Samsungなどのメーカーと協力して、新しい最先端のフレームワークであるGemma 3nを提案しました。Google DeepMind の革新的なテクノロジーである Per-Layer Embeddings (PLE) を使用して、メモリ使用量を大幅に最適化します。モデルの元のパラメータ サイズはそれぞれ 50 億 (5B) と 80 億 (8B) ですが、PLE テクノロジを使用すると、これらの大規模なモデルを、20 億 (2B) または 40 億 (4B) のパラメータ モデルに相当するメモリ オーバーヘッドで、モバイル デバイスまたはクラウドからのリアルタイム推論で実行できます。つまり、実行に必要な動的メモリは 2GB または 3GB のみになります。

Veo 3 と Imagen 4、創造性を刺激する

以前の世代と比較して、Veo 3はビデオ品質が大幅に向上しただけでなく、さらに重要なのは、ビデオとオーディオの同時生成が初めて実現されたことです。街の交通音、公園の鳥のさえずり、キャラクター同士の会話など、Veo 3 はテキスト プロンプトやユーザーのニーズに基づいてオーディオ要素を自動的に追加できます。

このモデルは、リップシンクなどのリアルな物理現象にも優れており、複雑なシーンの説明を理解してダイナミックなビデオに変換することができます。現在、Veo 3 はオンラインです。米国の Ultra 加入者は Gemini アプリケーションと Flow でこれを体験できますが、エンタープライズ ユーザーは Vertex AI プラットフォームを通じて使用権を取得する必要があります。

Imagen 4 は、今回のアップグレードのハイライトの 1 つです。高速な画像作成の利点はそのままに、画像のディテール表現がさらに向上しました。複雑な織り、ウォータービーズ、動物の毛など、すべて完璧に再現できます。

さらに、Imagen 4 はフォトリアリスティックな画像や抽象的なスタイルの画像の処理にも優れており、さまざまなニーズに応じて、印刷、表示、その他の用途に適した高品質の画像を生成できます。特に注目すべきは、タイプセッティング機能が大幅に改善され、グリーティング カード、ポスター、さらには漫画本の作成に非常に適したものになったことです。現在、Imagen 4 は、Gemini、Whisk、Vertex AI、Google Workspace のスライド、ビデオ、ドキュメントなど、複数のスイートに統合され、ユーザーが使用できるようになりました。