Tutoriel En Ligne | Vitesse De Génération jusqu'à 4 Fois Plus Rapide : DiffusionGemma Peut Générer Simultanément Des Blocs De Texte Entiers, Avec Une Optimisation Continue Basée Sur Un Débruitage Parallèle multi-itérations.

Le 11 juin, Google a officiellement publié en open source DiffusionGemma, un modèle de génération de texte basé sur la technologie de diffusion discrète. Ce modèle tire parti des capacités d'analyse par paramètre de pointe de la série Gemma 4 et des recherches de pointe menées sur la diffusion Gemini, intégrant une nouvelle tête de diffusion pour optimiser la vitesse de génération. Contrairement aux modèles traditionnels de grande taille qui produisent le texte jeton par jeton, il peut générer des blocs de texte entiers simultanément et optimiser en continu les résultats grâce à plusieurs cycles de débruitage parallèles.Cela permet d'augmenter la vitesse de génération jusqu'à quatre fois.

Les données officielles montrent que DiffusionGemma peut atteindre une vitesse de génération de plus de 1100 jetons/s sur un seul GPU NVIDIA H100 et de plus de 700 jetons/s sur une GeForce RTX 5090, dépassant de loin les modèles autorégressifs du même niveau.

Du point de vue de l'architecture,DiffusionGemma utilise une conception hybride experte (MoE) au niveau des paramètres 26B.Le nombre total de paramètres est d'environ 25,2 milliards, mais seuls 3,8 milliards sont activés lors de l'inférence, ce qui réduit considérablement la charge de calcul tout en préservant d'excellentes performances d'inférence. Le modèle repose sur une structure encodeur-décodeur et intègre un mécanisme d'attention bidirectionnel, lui permettant de traiter 256 jetons simultanément en parallèle. Il prend également en charge les tâches qui dépendent fortement du contexte global, telles que l'édition de texte en temps réel, la complétion de code et la génération de structures mathématiques.

De plus, DiffusionGemma prend en charge des contextes longs allant jusqu'à 256 000 jetons, une entrée de graphes et de texte multimodale et des modes d'inférence activés par <|think|>, offrant aux développeurs de nouvelles options technologiques pour explorer des applications d'IA de nouvelle génération à haute efficacité.

Bien que Google souligne toujours que la version standard de Gemma 4 est plus adaptée aux environnements de production en termes de qualité de génération, les capacités de génération de texte basées sur la diffusion démontrées par DiffusionGemma pourraient ouvrir une nouvelle voie remarquable pour le développement de grands modèles de langage.

Pour permettre aux développeurs de découvrir DiffusionGemma avec un minimum d'efforts, HyperAI a rapidement réagi après la mise à disposition du modèle en open source et a maintenant lancé un notebook facile à déployer, qui peut vérifier les puissantes capacités du modèle en utilisant uniquement une carte graphique NVIDIA RTX Pro 6000.

Exécutez en ligne :https://go.hyper.ai/879dB

Plus de tutoriels en ligne :

https://hyper.ai/notebooks

Essai de démonstration

1. Après avoir accédé à la page d'accueil d'hyper.ai, sélectionnez la page « Tutoriels » ou cliquez sur « Voir plus de tutoriels », sélectionnez « DiffusionGemma : Modèle de génération de texte à haute vitesse basé sur la diffusion discrète », puis cliquez sur « Exécuter ce tutoriel ».

2. Une fois la page redirigée, cliquez sur « Cloner » en haut à droite pour cloner le tutoriel dans votre propre conteneur.

Remarque : Vous pouvez changer de langue en haut à droite de la page. Actuellement, le chinois et l’anglais sont disponibles. Ce tutoriel présente les étapes en anglais.

3. Sélectionnez les images « NVIDIA RTX Pro 6000 » et « vLLM », puis cliquez sur « Continuer l'exécution de la tâche ».

4. Attendez que les ressources soient allouées. Une fois que le statut passe à « En cours d'exécution », cliquez sur « Ouvrir l'espace de travail » pour accéder à l'espace de travail Jupyter.

Affichage des effets

1. Une fois la page redirigée, cliquez sur le fichier README à gauche, puis sur « Exécuter » en haut.

2. Une fois le processus terminé, cliquez sur l'adresse API à droite pour ouvrir l'interface de démonstration.

HyperAI

Tutoriel En Ligne | Vitesse De Génération jusqu'à 4 Fois Plus Rapide : DiffusionGemma Peut Générer Simultanément Des Blocs De Texte Entiers, Avec Une Optimisation Continue Basée Sur Un Débruitage Parallèle multi-itérations.

il y a 2 mois

Information

Intelligence Artificielle

Apprentissage Automatique

Apprentissage Profond

Exécutez en ligne :https://go.hyper.ai/879dB

Plus de tutoriels en ligne :

https://hyper.ai/notebooks

Essai de démonstration

2. Une fois la page redirigée, cliquez sur « Cloner » en haut à droite pour cloner le tutoriel dans votre propre conteneur.

Remarque : Vous pouvez changer de langue en haut à droite de la page. Actuellement, le chinois et l’anglais sont disponibles. Ce tutoriel présente les étapes en anglais.

3. Sélectionnez les images « NVIDIA RTX Pro 6000 » et « vLLM », puis cliquez sur « Continuer l'exécution de la tâche ».

Affichage des effets

1. Une fois la page redirigée, cliquez sur le fichier README à gauche, puis sur « Exécuter » en haut.

2. Une fois le processus terminé, cliquez sur l'adresse API à droite pour ouvrir l'interface de démonstration.

Associé Actualités

Tutoriel En Ligne | Un Ordinateur Portable De 16 Go Atteint Des Performances De Près De 26 Milliards De MoE : Gemma 4 12B, Basé Sur Une Architecture Innovante Pour Le Traitement Unifié Des Modalités texte/image/son

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Résumé Du Jeu De Données | NVIDIA Open Sources Nemotron : Plus De 10 To De Jetons + 40 millions D’échantillons D’entraînement, Couvrant Le Raisonnement Mathématique, La Génération De Code Et Le Dialogue multilingue.

Google Publie TabFM-1.0.0-PyTorch : Un Modèle De Prédiction Zéro-shot Conçu Pour Les Données Tabulaires Mixtes ; NVIDIA Met En Open Source Un Ensemble De Données De Caractères Synthétiques Multinational, Contenant Des Dizaines De Millions De caractères.

Articles Exceptionnels De l'ICML 26 : Tsinghua JustGRPO Surmonte Le Goulot d'étranglement De l'inférence dLLM ; Dites Adieu Aux Tests d'instructions Simples : Agents Last Exam Évalue De Manière Exhaustive Les Capacités Professionnelles À Long Terme Des Agents intelligents.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

Les Emojis peuvent-ils Contrôler La Génération De La Parole ? Irodori-TTS Est Un Système De Synthèse Vocale Japonais Basé Sur L’architecture RF-DiT ; Ensembles De Données Sur L’eczéma Et La Teigne : Soutien À La Classification D’images Médicales Et À L’apprentissage Par transfert.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

HyperAI

Tutoriel En Ligne | Vitesse De Génération jusqu'à 4 Fois Plus Rapide : DiffusionGemma Peut Générer Simultanément Des Blocs De Texte Entiers, Avec Une Optimisation Continue Basée Sur Un Débruitage Parallèle multi-itérations.

il y a 2 mois

Information

Intelligence Artificielle

Apprentissage Automatique

Apprentissage Profond

Exécutez en ligne :https://go.hyper.ai/879dB

Plus de tutoriels en ligne :

https://hyper.ai/notebooks

Essai de démonstration

2. Une fois la page redirigée, cliquez sur « Cloner » en haut à droite pour cloner le tutoriel dans votre propre conteneur.

Remarque : Vous pouvez changer de langue en haut à droite de la page. Actuellement, le chinois et l’anglais sont disponibles. Ce tutoriel présente les étapes en anglais.

3. Sélectionnez les images « NVIDIA RTX Pro 6000 » et « vLLM », puis cliquez sur « Continuer l'exécution de la tâche ».

Affichage des effets

1. Une fois la page redirigée, cliquez sur le fichier README à gauche, puis sur « Exécuter » en haut.

2. Une fois le processus terminé, cliquez sur l'adresse API à droite pour ouvrir l'interface de démonstration.

Associé Actualités

Tutoriel En Ligne | Un Ordinateur Portable De 16 Go Atteint Des Performances De Près De 26 Milliards De MoE : Gemma 4 12B, Basé Sur Une Architecture Innovante Pour Le Traitement Unifié Des Modalités texte/image/son

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Résumé Du Jeu De Données | NVIDIA Open Sources Nemotron : Plus De 10 To De Jetons + 40 millions D’échantillons D’entraînement, Couvrant Le Raisonnement Mathématique, La Génération De Code Et Le Dialogue multilingue.

Google Publie TabFM-1.0.0-PyTorch : Un Modèle De Prédiction Zéro-shot Conçu Pour Les Données Tabulaires Mixtes ; NVIDIA Met En Open Source Un Ensemble De Données De Caractères Synthétiques Multinational, Contenant Des Dizaines De Millions De caractères.

Articles Exceptionnels De l'ICML 26 : Tsinghua JustGRPO Surmonte Le Goulot d'étranglement De l'inférence dLLM ; Dites Adieu Aux Tests d'instructions Simples : Agents Last Exam Évalue De Manière Exhaustive Les Capacités Professionnelles À Long Terme Des Agents intelligents.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

Les Emojis peuvent-ils Contrôler La Génération De La Parole ? Irodori-TTS Est Un Système De Synthèse Vocale Japonais Basé Sur L’architecture RF-DiT ; Ensembles De Données Sur L’eczéma Et La Teigne : Soutien À La Classification D’images Médicales Et À L’apprentissage Par transfert.

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Command Palette

Tutoriel En Ligne | Vitesse De Génération jusqu'à 4 Fois Plus Rapide : DiffusionGemma Peut Générer Simultanément Des Blocs De Texte Entiers, Avec Une Optimisation Continue Basée Sur Un Débruitage Parallèle multi-itérations.

Essai de démonstration

Affichage des effets

Command Palette

Tutoriel En Ligne | Vitesse De Génération jusqu'à 4 Fois Plus Rapide : DiffusionGemma Peut Générer Simultanément Des Blocs De Texte Entiers, Avec Une Optimisation Continue Basée Sur Un Débruitage Parallèle multi-itérations.

Essai de démonstration

Affichage des effets

Associé Actualités

Tutoriel En Ligne | Un Ordinateur Portable De 16 Go Atteint Des Performances De Près De 26 Milliards De MoE : Gemma 4 12B, Basé Sur Une Architecture Innovante Pour Le Traitement Unifié Des Modalités texte/image/son

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Résumé Du Jeu De Données | NVIDIA Open Sources Nemotron : Plus De 10 To De Jetons + 40 millions D’échantillons D’entraînement, Couvrant Le Raisonnement Mathématique, La Génération De Code Et Le Dialogue multilingue.

Google Publie TabFM-1.0.0-PyTorch : Un Modèle De Prédiction Zéro-shot Conçu Pour Les Données Tabulaires Mixtes ; NVIDIA Met En Open Source Un Ensemble De Données De Caractères Synthétiques Multinational, Contenant Des Dizaines De Millions De caractères.

Articles Exceptionnels De l'ICML 26 : Tsinghua JustGRPO Surmonte Le Goulot d'étranglement De l'inférence dLLM ; Dites Adieu Aux Tests d'instructions Simples : Agents Last Exam Évalue De Manière Exhaustive Les Capacités Professionnelles À Long Terme Des Agents intelligents.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Command Palette

Tutoriel En Ligne | Vitesse De Génération jusqu'à 4 Fois Plus Rapide : DiffusionGemma Peut Générer Simultanément Des Blocs De Texte Entiers, Avec Une Optimisation Continue Basée Sur Un Débruitage Parallèle multi-itérations.

Essai de démonstration

Affichage des effets

Associé Actualités

Tutoriel En Ligne | Un Ordinateur Portable De 16 Go Atteint Des Performances De Près De 26 Milliards De MoE : Gemma 4 12B, Basé Sur Une Architecture Innovante Pour Le Traitement Unifié Des Modalités texte/image/son

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Résumé Du Jeu De Données | NVIDIA Open Sources Nemotron : Plus De 10 To De Jetons + 40 millions D’échantillons D’entraînement, Couvrant Le Raisonnement Mathématique, La Génération De Code Et Le Dialogue multilingue.

Google Publie TabFM-1.0.0-PyTorch : Un Modèle De Prédiction Zéro-shot Conçu Pour Les Données Tabulaires Mixtes ; NVIDIA Met En Open Source Un Ensemble De Données De Caractères Synthétiques Multinational, Contenant Des Dizaines De Millions De caractères.

Articles Exceptionnels De l'ICML 26 : Tsinghua JustGRPO Surmonte Le Goulot d'étranglement De l'inférence dLLM ; Dites Adieu Aux Tests d'instructions Simples : Agents Last Exam Évalue De Manière Exhaustive Les Capacités Professionnelles À Long Terme Des Agents intelligents.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Associé Actualités

Tutoriel En Ligne | Un Ordinateur Portable De 16 Go Atteint Des Performances De Près De 26 Milliards De MoE : Gemma 4 12B, Basé Sur Une Architecture Innovante Pour Le Traitement Unifié Des Modalités texte/image/son

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Résumé Du Jeu De Données | NVIDIA Open Sources Nemotron : Plus De 10 To De Jetons + 40 millions D’échantillons D’entraînement, Couvrant Le Raisonnement Mathématique, La Génération De Code Et Le Dialogue multilingue.

Google Publie TabFM-1.0.0-PyTorch : Un Modèle De Prédiction Zéro-shot Conçu Pour Les Données Tabulaires Mixtes ; NVIDIA Met En Open Source Un Ensemble De Données De Caractères Synthétiques Multinational, Contenant Des Dizaines De Millions De caractères.

Articles Exceptionnels De l'ICML 26 : Tsinghua JustGRPO Surmonte Le Goulot d'étranglement De l'inférence dLLM ; Dites Adieu Aux Tests d'instructions Simples : Agents Last Exam Évalue De Manière Exhaustive Les Capacités Professionnelles À Long Terme Des Agents intelligents.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.

Associé Actualités

Tutoriel En Ligne | Un Ordinateur Portable De 16 Go Atteint Des Performances De Près De 26 Milliards De MoE : Gemma 4 12B, Basé Sur Une Architecture Innovante Pour Le Traitement Unifié Des Modalités texte/image/son

OpenAI Lance GeneBench-Pro, Un Outil Qui Évalue Les Capacités De Recherche En IA À Travers 129 Questions Et 10 domaines.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Résumé Du Jeu De Données | NVIDIA Open Sources Nemotron : Plus De 10 To De Jetons + 40 millions D’échantillons D’entraînement, Couvrant Le Raisonnement Mathématique, La Génération De Code Et Le Dialogue multilingue.

Google Publie TabFM-1.0.0-PyTorch : Un Modèle De Prédiction Zéro-shot Conçu Pour Les Données Tabulaires Mixtes ; NVIDIA Met En Open Source Un Ensemble De Données De Caractères Synthétiques Multinational, Contenant Des Dizaines De Millions De caractères.

Articles Exceptionnels De l'ICML 26 : Tsinghua JustGRPO Surmonte Le Goulot d'étranglement De l'inférence dLLM ; Dites Adieu Aux Tests d'instructions Simples : Agents Last Exam Évalue De Manière Exhaustive Les Capacités Professionnelles À Long Terme Des Agents intelligents.

Tutoriel En Ligne | Guide Approfondi Sur Le Suivi d'instructions/l'inférence/la Programmation : Mistral Medium 3.5 Déploie Des Agents De Programmation Dans Le Cloud

Tutoriel Gratuit En Ligne Sur Les Processeurs | Agent Hermes : Apprendre La Mémoire À Long Terme ? Le Plugin D’amélioration De La Mémoire TencentDB Agent Memory Peut Stocker Séparément Les Faits, Les Préférences, Les États Des Tâches, etc.