オンラインチュートリアル | 最大4倍の高速生成速度：DiffusionGemmaは、複数ラウンドの並列ノイズ除去に基づく継続的な最適化により、テキストのブロック全体を同時に生成できます。

6月11日、Googleは離散拡散技術をベースとしたテキスト生成モデル「DiffusionGemma」を正式にオープンソース化しました。このモデルは、業界をリードするGemma 4シリーズのパラメータごとのインテリジェンス機能と最先端のGemini Diffusion研究を活用し、新しい拡散ヘッドを統合することで生成速度を最大化しています。従来のテキストをトークンごとに出力する大規模モデルとは異なり、テキストブロック全体を同時に生成し、複数回の並列ノイズ除去処理によって結果を継続的に最適化できます。これにより、発電速度が最大4倍向上する。

公式データによると、DiffusionGemmaは単一のNVIDIA H100 GPUで1秒あたり1100トークン以上、GeForce RTX 5090で1秒あたり700トークン以上の生成速度を達成でき、同レベルの自己回帰モデルをはるかに凌駕している。

建築的な観点から見ると、DiffusionGemmaは、26Bパラメータレベルのハイブリッドエキスパート（MoE）設計を採用しています。パラメータの総数は約252億個ですが、推論時にアクティブになるのはわずか38億個であるため、強力な推論能力を維持しながら計算オーバーヘッドを大幅に削減できます。このモデルはエンコーダー・デコーダー構造に基づいて構築されており、双方向アテンション機構を組み込んでいるため、256個のトークンを同時に並列処理できます。また、インラインテキスト編集、コード補完、数式構造生成など、グローバルコンテキストに大きく依存するタスクもサポートしています。

さらに、DiffusionGemmaは最大256Kトークンの長いコンテキスト、マルチモーダルなグラフおよびテキスト入力、<|think|>によってアクティブ化される推論モードをサポートしており、開発者に次世代の高効率AIアプリケーションを探求するための新しいテクノロジーオプションを提供します。

Googleは、生成される品質の点で標準のGemma 4が本番環境により適していると依然として強調しているものの、DiffusionGemmaによって実証された拡散ベースのテキスト生成機能は、大規模言語モデルの開発において、注目すべき新たな道を開く可能性がある。

開発者が最小限の労力でDiffusionGemmaを体験できるようにするため、HyperAIはモデルのオープンソース化後すぐに対応し、NVIDIA RTX Pro 6000グラフィックカード1枚だけでモデルの強力な機能を検証できる、簡単に導入できるノートブックをリリースしました。

オンラインで実行:https://go.hyper.ai/879dB

その他のオンラインチュートリアル：

https://hyper.ai/notebooks

デモの実行

1. hyper.ai のホームページにアクセスしたら、「チュートリアル」ページを選択するか、「その他のチュートリアルを見る」をクリックし、「DiffusionGemma: 離散拡散に基づく高速テキスト生成モデル」を選択して、「このチュートリアルを実行する」をクリックします。

2. ページがリダイレクトされたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。

注：ページの右上で言語を切り替えることができます。現在、中国語と英語が利用可能です。このチュートリアルでは英語で手順を説明します。

3. 「NVIDIA RTX Pro 6000」と「vLLM」のイメージを選択し、「ジョブの実行を続行」をクリックします。

4. リソースが割り当てられるのを待ちます。ステータスが「実行中」に変わったら、「ワークスペースを開く」をクリックしてJupyterワークスペースに入ります。

エフェクト表示

1. ページがリダイレクトされたら、左側のREADMEファイルをクリックし、上部の「実行」をクリックします。

2. 処理が完了したら、右側のAPIアドレスをクリックしてデモインターフェースを開きます。

HyperAI

オンラインチュートリアル | 最大4倍の高速生成速度：DiffusionGemmaは、複数ラウンドの並列ノイズ除去に基づく継続的な最適化により、テキストのブロック全体を同時に生成できます。

2ヶ月前

オンラインで実行:https://go.hyper.ai/879dB

その他のオンラインチュートリアル：

https://hyper.ai/notebooks

デモの実行

2. ページがリダイレクトされたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。

注：ページの右上で言語を切り替えることができます。現在、中国語と英語が利用可能です。このチュートリアルでは英語で手順を説明します。

3. 「NVIDIA RTX Pro 6000」と「vLLM」のイメージを選択し、「ジョブの実行を続行」をクリックします。

エフェクト表示

1. ページがリダイレクトされたら、左側のREADMEファイルをクリックし、上部の「実行」をクリックします。

2. 処理が完了したら、右側のAPIアドレスをクリックしてデモインターフェースを開きます。

オンラインチュートリアル | 最大4倍の高速生成速度：DiffusionGemmaは、複数ラウンドの並列ノイズ除去に基づく継続的な最適化により、テキストのブロック全体を同時に生成できます。

2ヶ月前

オンラインで実行:https://go.hyper.ai/879dB

その他のオンラインチュートリアル：

https://hyper.ai/notebooks

デモの実行

2. ページがリダイレクトされたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。

注：ページの右上で言語を切り替えることができます。現在、中国語と英語が利用可能です。このチュートリアルでは英語で手順を説明します。

3. 「NVIDIA RTX Pro 6000」と「vLLM」のイメージを選択し、「ジョブの実行を続行」をクリックします。

エフェクト表示

1. ページがリダイレクトされたら、左側のREADMEファイルをクリックし、上部の「実行」をクリックします。

2. 処理が完了したら、右側のAPIアドレスをクリックしてデモインターフェースを開きます。

Command Palette

オンラインチュートリアル | 最大4倍の高速生成速度：DiffusionGemmaは、複数ラウンドの並列ノイズ除去に基づく継続的な最適化により、テキストのブロック全体を同時に生成できます。

デモの実行

エフェクト表示

Command Palette

オンラインチュートリアル | 最大4倍の高速生成速度：DiffusionGemmaは、複数ラウンドの並列ノイズ除去に基づく継続的な最適化により、テキストのブロック全体を同時に生成できます。

デモの実行

エフェクト表示

関連 ニュース

オンラインチュートリアル | 16GBノートパソコンで約26B MoEのパフォーマンスを実現：テキスト/画像/音声モダリティの統合処理のための革新的なアーキテクチャに基づくGemma 4 12B

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニング サンプルを収録。数学的推論、コード生成、多言語対話を網羅。

Googleは、混合表形式データ向けに設計されたゼロショット予測モデルであるTabFM-1.0.0-PyTorchをリリースしました。NVIDIAは、数千万文字が利用可能な多国籍合成文字データセットをオープンソース化しました。

オンラインチュートリアル｜指示追従／推論／コーディングの詳細ガイド：Mistral Medium 3.5でコーディングエージェントがクラウドへ

ICML 26優秀論文：清華大学JustGRPOがdLLM推論のボトルネックを克服。単純な指示テストに別れを告げる：エージェント最終試験がインテリジェントエージェントの長期的な専門能力を包括的に評価。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

Command Palette

オンラインチュートリアル | 最大4倍の高速生成速度：DiffusionGemmaは、複数ラウンドの並列ノイズ除去に基づく継続的な最適化により、テキストのブロック全体を同時に生成できます。

デモの実行

エフェクト表示

関連 ニュース

オンラインチュートリアル | 16GBノートパソコンで約26B MoEのパフォーマンスを実現：テキスト/画像/音声モダリティの統合処理のための革新的なアーキテクチャに基づくGemma 4 12B

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニング サンプルを収録。数学的推論、コード生成、多言語対話を網羅。

Googleは、混合表形式データ向けに設計されたゼロショット予測モデルであるTabFM-1.0.0-PyTorchをリリースしました。NVIDIAは、数千万文字が利用可能な多国籍合成文字データセットをオープンソース化しました。

オンラインチュートリアル｜指示追従／推論／コーディングの詳細ガイド：Mistral Medium 3.5でコーディングエージェントがクラウドへ

ICML 26優秀論文：清華大学JustGRPOがdLLM推論のボトルネックを克服。単純な指示テストに別れを告げる：エージェント最終試験がインテリジェントエージェントの長期的な専門能力を包括的に評価。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

関連 ニュース

オンラインチュートリアル | 16GBノートパソコンで約26B MoEのパフォーマンスを実現：テキスト/画像/音声モダリティの統合処理のための革新的なアーキテクチャに基づくGemma 4 12B

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニング サンプルを収録。数学的推論、コード生成、多言語対話を網羅。

Googleは、混合表形式データ向けに設計されたゼロショット予測モデルであるTabFM-1.0.0-PyTorchをリリースしました。NVIDIAは、数千万文字が利用可能な多国籍合成文字データセットをオープンソース化しました。

オンラインチュートリアル｜指示追従／推論／コーディングの詳細ガイド：Mistral Medium 3.5でコーディングエージェントがクラウドへ

ICML 26優秀論文：清華大学JustGRPOがdLLM推論のボトルネックを克服。単純な指示テストに別れを告げる：エージェント最終試験がインテリジェントエージェントの長期的な専門能力を包括的に評価。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

関連 ニュース

オンラインチュートリアル | 16GBノートパソコンで約26B MoEのパフォーマンスを実現：テキスト/画像/音声モダリティの統合処理のための革新的なアーキテクチャに基づくGemma 4 12B

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

4段階の画像出力/4K品質/6倍の高速化、PiDはピクセル拡散を使用してデコードと超解像出力を統合します。SA-3DAO：アーティストが手作業で作成した3Dメッシュとペアになった1000組の実画像を含むデータセット。

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニング サンプルを収録。数学的推論、コード生成、多言語対話を網羅。

Googleは、混合表形式データ向けに設計されたゼロショット予測モデルであるTabFM-1.0.0-PyTorchをリリースしました。NVIDIAは、数千万文字が利用可能な多国籍合成文字データセットをオープンソース化しました。

オンラインチュートリアル｜指示追従／推論／コーディングの詳細ガイド：Mistral Medium 3.5でコーディングエージェントがクラウドへ

ICML 26優秀論文：清華大学JustGRPOがdLLM推論のボトルネックを克服。単純な指示テストに別れを告げる：エージェント最終試験がインテリジェントエージェントの長期的な専門能力を包括的に評価。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

関連ニュース

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニングサンプルを収録。数学的推論、コード生成、多言語対話を網羅。

関連ニュース

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニングサンプルを収録。数学的推論、コード生成、多言語対話を網羅。

関連ニュース

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニングサンプルを収録。数学的推論、コード生成、多言語対話を網羅。

関連ニュース

データセットの概要 | NVIDIA オープンソース Nemotron データセット: 10TB を超えるトークンと 4000 万のトレーニングサンプルを収録。数学的推論、コード生成、多言語対話を網羅。