Online-Tutorial | Bis Zu 4x Schnellere Generierungsgeschwindigkeit: DiffusionGemma Kann Ganze Textblöcke Gleichzeitig Generieren, Mit Kontinuierlicher Optimierung Auf Basis Von Mehrstufigem Parallelem Denoising.

Am 11. Juni veröffentlichte Google offiziell DiffusionGemma als Open Source. Das Textgenerierungsmodell basiert auf der Technologie der diskreten Diffusion. Es nutzt die branchenführende Intelligenz der Gemma-4-Serie und die wegweisende Gemini-Diffusionsforschung und integriert einen neuen Diffusionskopf, um die Generierungsgeschwindigkeit zu maximieren. Im Gegensatz zu herkömmlichen großen Modellen, die Text Token für Token ausgeben, kann DiffusionGemma ganze Textblöcke gleichzeitig generieren und die Ergebnisse durch mehrere Runden paralleler Rauschunterdrückung kontinuierlich optimieren.Dies führt zu einer bis zu vierfachen Steigerung der Erzeugungsgeschwindigkeit.

Offizielle Daten zeigen, dass DiffusionGemma auf einer einzelnen NVIDIA H100 GPU eine Generierungsgeschwindigkeit von über 1100 Tokens/s und auf einer GeForce RTX 5090 über 700 Tokens/s erreichen kann und damit autoregressive Modelle der gleichen Leistungsklasse deutlich übertrifft.

Aus der Perspektive der ArchitekturDiffusionGemma verwendet ein hybrides Expertenmodell (MoE) mit 26 Milliarden Parametern.Die Gesamtzahl der Parameter beträgt ca. 25,2 Milliarden, jedoch werden während der Inferenz nur 3,8 Milliarden Parameter aktiviert. Dies reduziert den Rechenaufwand erheblich und erhält gleichzeitig die hohe Leistungsfähigkeit des Modells. Es basiert auf einer Encoder-Decoder-Architektur und verfügt über einen bidirektionalen Aufmerksamkeitsmechanismus, der die parallele Verarbeitung von 256 Token ermöglicht. Darüber hinaus unterstützt es Aufgaben, die stark vom globalen Kontext abhängen, wie z. B. Inline-Textbearbeitung, Codevervollständigung und die Generierung mathematischer Strukturen.

Darüber hinaus unterstützt DiffusionGemma lange Kontexte von bis zu 256.000 Token, multimodale Graph- und Texteingabe sowie durch <|think|> aktivierte Inferenzmodi und bietet Entwicklern damit neue technologische Optionen zur Erforschung hocheffizienter KI-Anwendungen der nächsten Generation.

Obwohl Google weiterhin betont, dass das Standardmodell Gemma 4 hinsichtlich der generierten Qualität besser für Produktionsumgebungen geeignet ist, könnten die von DiffusionGemma demonstrierten Fähigkeiten zur diffusionsbasierten Textgenerierung einen weiteren bemerkenswerten neuen Weg für die Entwicklung großer Sprachmodelle eröffnen.

Um es Entwicklern zu ermöglichen, DiffusionGemma mit minimalem Aufwand zu erleben, hat HyperAI kurz nach der Veröffentlichung des Modells als Open Source ein einfach einzusetzendes Notebook auf den Markt gebracht, mit dem sich die leistungsstarken Fähigkeiten des Modells mit nur einer einzigen NVIDIA RTX Pro 6000 Grafikkarte überprüfen lassen.

Online ausführen:https://go.hyper.ai/879dB

Weitere Online-Tutorials:

https://hyper.ai/notebooks

Demolauf

1. Nachdem Sie die Hyper.ai-Homepage aufgerufen haben, wählen Sie die Seite „Tutorials“ aus oder klicken Sie auf „Weitere Tutorials anzeigen“, wählen Sie „DiffusionGemma: Hochgeschwindigkeits-Textgenerierungsmodell basierend auf diskreter Diffusion“ aus und klicken Sie auf „Dieses Tutorial ausführen“.

2. Nachdem die Seite weitergeleitet wurde, klicken Sie oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

Hinweis: Sie können die Sprache oben rechts auf der Seite ändern. Derzeit sind Chinesisch und Englisch verfügbar. Dieses Tutorial zeigt die Schritte auf Englisch.

3. Wählen Sie die Images „NVIDIA RTX Pro 6000“ und „vLLM“ aus und klicken Sie auf „Auftragsausführung fortsetzen“.

4. Warten Sie, bis die Ressourcen zugewiesen wurden. Sobald sich der Status auf „Wird ausgeführt“ ändert, klicken Sie auf „Arbeitsbereich öffnen“, um den Jupyter-Arbeitsbereich zu betreten.

Effektanzeige

1. Nachdem die Seite weitergeleitet wurde, klicken Sie auf die README-Datei auf der linken Seite und anschließend oben auf Ausführen.

2. Nach Abschluss des Vorgangs klicken Sie auf die API-Adresse auf der rechten Seite, um die Demo-Oberfläche zu öffnen.

HyperAI

Online-Tutorial | Bis Zu 4x Schnellere Generierungsgeschwindigkeit: DiffusionGemma Kann Ganze Textblöcke Gleichzeitig Generieren, Mit Kontinuierlicher Optimierung Auf Basis Von Mehrstufigem Parallelem Denoising.

vor 2 Monaten

Information

Künstliche Intelligenz

Maschinelles Lernen

Tiefes Lernen

Online ausführen:https://go.hyper.ai/879dB

Weitere Online-Tutorials:

https://hyper.ai/notebooks

Demolauf

2. Nachdem die Seite weitergeleitet wurde, klicken Sie oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

Hinweis: Sie können die Sprache oben rechts auf der Seite ändern. Derzeit sind Chinesisch und Englisch verfügbar. Dieses Tutorial zeigt die Schritte auf Englisch.

3. Wählen Sie die Images „NVIDIA RTX Pro 6000“ und „vLLM“ aus und klicken Sie auf „Auftragsausführung fortsetzen“.

Effektanzeige

1. Nachdem die Seite weitergeleitet wurde, klicken Sie auf die README-Datei auf der linken Seite und anschließend oben auf Ausführen.

2. Nach Abschluss des Vorgangs klicken Sie auf die API-Adresse auf der rechten Seite, um die Demo-Oberfläche zu öffnen.

Verwandt Neuigkeiten

Online-Tutorial | Laptop Mit 16 GB RAM Erreicht Fast 26 BPM Leistung: Gemma 4 12B – Basierend Auf Innovativer Architektur Für Die Einheitliche Verarbeitung Von Text-, Bild- Und Tondaten

OpenAI Veröffentlicht GeneBench-Pro, Das Die Forschungskompetenzen Im Bereich KI Anhand Von 129 Fragen Und 10 Domänen bewertet.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Datensatzübersicht | NVIDIA Open Sources Nemotron-Datensätze: Über 10 TB Token + 40 Millionen Trainingsbeispiele, Die Mathematisches Denken, Codegenerierung Und Mehrsprachigen Dialog abdecken.

Google Veröffentlicht TabFM-1.0.0-PyTorch: Ein Zero-Shot-Vorhersagemodell Für Gemischte Tabellarische Daten; NVIDIA Stellt Einen Multinationalen Synthetischen Zeichendatensatz Mit Mehreren Zehn Millionen Zeichen Als Open Source Zur Verfügung.

Online-Tutorial | Ausführlicher Leitfaden Zu Befehlsverarbeitung/Inferenz/Codierung: Mistral Medium 3.5 Bringt Codierungsagenten in Die Cloud

Herausragende Beiträge Der ICML 26: Tsinghua JustGRPO Überwindet Den dLLM-Inferenzengpass; Verabschieden Sie Sich Von Einfachen Instruktionstests: Agents Last Exam Bewertet Umfassend Die Langfristigen Professionellen Fähigkeiten Intelligenter Agenten.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Online-Tutorial | NVIDIA Open Source LocateAnything, Ein 3B-Modell, Das Bild- Und Videozielerkennung, Objekterkennung Mit Offenem Vokabular, Ziellokalisierung, OCR-Textlokalisierung Und Weitere Funktionen ermöglicht.

HyperAI

Online-Tutorial | Bis Zu 4x Schnellere Generierungsgeschwindigkeit: DiffusionGemma Kann Ganze Textblöcke Gleichzeitig Generieren, Mit Kontinuierlicher Optimierung Auf Basis Von Mehrstufigem Parallelem Denoising.

vor 2 Monaten

Information

Künstliche Intelligenz

Maschinelles Lernen

Tiefes Lernen

Online ausführen:https://go.hyper.ai/879dB

Weitere Online-Tutorials:

https://hyper.ai/notebooks

Demolauf

2. Nachdem die Seite weitergeleitet wurde, klicken Sie oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

Hinweis: Sie können die Sprache oben rechts auf der Seite ändern. Derzeit sind Chinesisch und Englisch verfügbar. Dieses Tutorial zeigt die Schritte auf Englisch.

3. Wählen Sie die Images „NVIDIA RTX Pro 6000“ und „vLLM“ aus und klicken Sie auf „Auftragsausführung fortsetzen“.

Effektanzeige

1. Nachdem die Seite weitergeleitet wurde, klicken Sie auf die README-Datei auf der linken Seite und anschließend oben auf Ausführen.

2. Nach Abschluss des Vorgangs klicken Sie auf die API-Adresse auf der rechten Seite, um die Demo-Oberfläche zu öffnen.

Verwandt Neuigkeiten

Online-Tutorial | Laptop Mit 16 GB RAM Erreicht Fast 26 BPM Leistung: Gemma 4 12B – Basierend Auf Innovativer Architektur Für Die Einheitliche Verarbeitung Von Text-, Bild- Und Tondaten

OpenAI Veröffentlicht GeneBench-Pro, Das Die Forschungskompetenzen Im Bereich KI Anhand Von 129 Fragen Und 10 Domänen bewertet.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Datensatzübersicht | NVIDIA Open Sources Nemotron-Datensätze: Über 10 TB Token + 40 Millionen Trainingsbeispiele, Die Mathematisches Denken, Codegenerierung Und Mehrsprachigen Dialog abdecken.

Google Veröffentlicht TabFM-1.0.0-PyTorch: Ein Zero-Shot-Vorhersagemodell Für Gemischte Tabellarische Daten; NVIDIA Stellt Einen Multinationalen Synthetischen Zeichendatensatz Mit Mehreren Zehn Millionen Zeichen Als Open Source Zur Verfügung.

Online-Tutorial | Ausführlicher Leitfaden Zu Befehlsverarbeitung/Inferenz/Codierung: Mistral Medium 3.5 Bringt Codierungsagenten in Die Cloud

Herausragende Beiträge Der ICML 26: Tsinghua JustGRPO Überwindet Den dLLM-Inferenzengpass; Verabschieden Sie Sich Von Einfachen Instruktionstests: Agents Last Exam Bewertet Umfassend Die Langfristigen Professionellen Fähigkeiten Intelligenter Agenten.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Online-Tutorial | NVIDIA Open Source LocateAnything, Ein 3B-Modell, Das Bild- Und Videozielerkennung, Objekterkennung Mit Offenem Vokabular, Ziellokalisierung, OCR-Textlokalisierung Und Weitere Funktionen ermöglicht.

Command Palette

Online-Tutorial | Bis Zu 4x Schnellere Generierungsgeschwindigkeit: DiffusionGemma Kann Ganze Textblöcke Gleichzeitig Generieren, Mit Kontinuierlicher Optimierung Auf Basis Von Mehrstufigem Parallelem Denoising.

Demolauf

Effektanzeige

Command Palette

Online-Tutorial | Bis Zu 4x Schnellere Generierungsgeschwindigkeit: DiffusionGemma Kann Ganze Textblöcke Gleichzeitig Generieren, Mit Kontinuierlicher Optimierung Auf Basis Von Mehrstufigem Parallelem Denoising.

Demolauf

Effektanzeige

Verwandt Neuigkeiten

Online-Tutorial | Laptop Mit 16 GB RAM Erreicht Fast 26 BPM Leistung: Gemma 4 12B – Basierend Auf Innovativer Architektur Für Die Einheitliche Verarbeitung Von Text-, Bild- Und Tondaten

OpenAI Veröffentlicht GeneBench-Pro, Das Die Forschungskompetenzen Im Bereich KI Anhand Von 129 Fragen Und 10 Domänen bewertet.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Datensatzübersicht | NVIDIA Open Sources Nemotron-Datensätze: Über 10 TB Token + 40 Millionen Trainingsbeispiele, Die Mathematisches Denken, Codegenerierung Und Mehrsprachigen Dialog abdecken.

Google Veröffentlicht TabFM-1.0.0-PyTorch: Ein Zero-Shot-Vorhersagemodell Für Gemischte Tabellarische Daten; NVIDIA Stellt Einen Multinationalen Synthetischen Zeichendatensatz Mit Mehreren Zehn Millionen Zeichen Als Open Source Zur Verfügung.

Online-Tutorial | Ausführlicher Leitfaden Zu Befehlsverarbeitung/Inferenz/Codierung: Mistral Medium 3.5 Bringt Codierungsagenten in Die Cloud

Herausragende Beiträge Der ICML 26: Tsinghua JustGRPO Überwindet Den dLLM-Inferenzengpass; Verabschieden Sie Sich Von Einfachen Instruktionstests: Agents Last Exam Bewertet Umfassend Die Langfristigen Professionellen Fähigkeiten Intelligenter Agenten.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Online-Tutorial | NVIDIA Open Source LocateAnything, Ein 3B-Modell, Das Bild- Und Videozielerkennung, Objekterkennung Mit Offenem Vokabular, Ziellokalisierung, OCR-Textlokalisierung Und Weitere Funktionen ermöglicht.

Command Palette

Online-Tutorial | Bis Zu 4x Schnellere Generierungsgeschwindigkeit: DiffusionGemma Kann Ganze Textblöcke Gleichzeitig Generieren, Mit Kontinuierlicher Optimierung Auf Basis Von Mehrstufigem Parallelem Denoising.

Demolauf

Effektanzeige

Verwandt Neuigkeiten

Online-Tutorial | Laptop Mit 16 GB RAM Erreicht Fast 26 BPM Leistung: Gemma 4 12B – Basierend Auf Innovativer Architektur Für Die Einheitliche Verarbeitung Von Text-, Bild- Und Tondaten

OpenAI Veröffentlicht GeneBench-Pro, Das Die Forschungskompetenzen Im Bereich KI Anhand Von 129 Fragen Und 10 Domänen bewertet.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Datensatzübersicht | NVIDIA Open Sources Nemotron-Datensätze: Über 10 TB Token + 40 Millionen Trainingsbeispiele, Die Mathematisches Denken, Codegenerierung Und Mehrsprachigen Dialog abdecken.

Google Veröffentlicht TabFM-1.0.0-PyTorch: Ein Zero-Shot-Vorhersagemodell Für Gemischte Tabellarische Daten; NVIDIA Stellt Einen Multinationalen Synthetischen Zeichendatensatz Mit Mehreren Zehn Millionen Zeichen Als Open Source Zur Verfügung.

Online-Tutorial | Ausführlicher Leitfaden Zu Befehlsverarbeitung/Inferenz/Codierung: Mistral Medium 3.5 Bringt Codierungsagenten in Die Cloud

Herausragende Beiträge Der ICML 26: Tsinghua JustGRPO Überwindet Den dLLM-Inferenzengpass; Verabschieden Sie Sich Von Einfachen Instruktionstests: Agents Last Exam Bewertet Umfassend Die Langfristigen Professionellen Fähigkeiten Intelligenter Agenten.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Online-Tutorial | NVIDIA Open Source LocateAnything, Ein 3B-Modell, Das Bild- Und Videozielerkennung, Objekterkennung Mit Offenem Vokabular, Ziellokalisierung, OCR-Textlokalisierung Und Weitere Funktionen ermöglicht.

Verwandt Neuigkeiten

Online-Tutorial | Laptop Mit 16 GB RAM Erreicht Fast 26 BPM Leistung: Gemma 4 12B – Basierend Auf Innovativer Architektur Für Die Einheitliche Verarbeitung Von Text-, Bild- Und Tondaten

OpenAI Veröffentlicht GeneBench-Pro, Das Die Forschungskompetenzen Im Bereich KI Anhand Von 129 Fragen Und 10 Domänen bewertet.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Datensatzübersicht | NVIDIA Open Sources Nemotron-Datensätze: Über 10 TB Token + 40 Millionen Trainingsbeispiele, Die Mathematisches Denken, Codegenerierung Und Mehrsprachigen Dialog abdecken.

Google Veröffentlicht TabFM-1.0.0-PyTorch: Ein Zero-Shot-Vorhersagemodell Für Gemischte Tabellarische Daten; NVIDIA Stellt Einen Multinationalen Synthetischen Zeichendatensatz Mit Mehreren Zehn Millionen Zeichen Als Open Source Zur Verfügung.

Online-Tutorial | Ausführlicher Leitfaden Zu Befehlsverarbeitung/Inferenz/Codierung: Mistral Medium 3.5 Bringt Codierungsagenten in Die Cloud

Herausragende Beiträge Der ICML 26: Tsinghua JustGRPO Überwindet Den dLLM-Inferenzengpass; Verabschieden Sie Sich Von Einfachen Instruktionstests: Agents Last Exam Bewertet Umfassend Die Langfristigen Professionellen Fähigkeiten Intelligenter Agenten.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Online-Tutorial | NVIDIA Open Source LocateAnything, Ein 3B-Modell, Das Bild- Und Videozielerkennung, Objekterkennung Mit Offenem Vokabular, Ziellokalisierung, OCR-Textlokalisierung Und Weitere Funktionen ermöglicht.

Verwandt Neuigkeiten

Online-Tutorial | Laptop Mit 16 GB RAM Erreicht Fast 26 BPM Leistung: Gemma 4 12B – Basierend Auf Innovativer Architektur Für Die Einheitliche Verarbeitung Von Text-, Bild- Und Tondaten

OpenAI Veröffentlicht GeneBench-Pro, Das Die Forschungskompetenzen Im Bereich KI Anhand Von 129 Fragen Und 10 Domänen bewertet.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Datensatzübersicht | NVIDIA Open Sources Nemotron-Datensätze: Über 10 TB Token + 40 Millionen Trainingsbeispiele, Die Mathematisches Denken, Codegenerierung Und Mehrsprachigen Dialog abdecken.

Google Veröffentlicht TabFM-1.0.0-PyTorch: Ein Zero-Shot-Vorhersagemodell Für Gemischte Tabellarische Daten; NVIDIA Stellt Einen Multinationalen Synthetischen Zeichendatensatz Mit Mehreren Zehn Millionen Zeichen Als Open Source Zur Verfügung.

Online-Tutorial | Ausführlicher Leitfaden Zu Befehlsverarbeitung/Inferenz/Codierung: Mistral Medium 3.5 Bringt Codierungsagenten in Die Cloud

Herausragende Beiträge Der ICML 26: Tsinghua JustGRPO Überwindet Den dLLM-Inferenzengpass; Verabschieden Sie Sich Von Einfachen Instruktionstests: Agents Last Exam Bewertet Umfassend Die Langfristigen Professionellen Fähigkeiten Intelligenter Agenten.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Online-Tutorial | NVIDIA Open Source LocateAnything, Ein 3B-Modell, Das Bild- Und Videozielerkennung, Objekterkennung Mit Offenem Vokabular, Ziellokalisierung, OCR-Textlokalisierung Und Weitere Funktionen ermöglicht.