Date

il y a un mois

Organisation

URL du document

Balises

Le World Action Model (WAM) est une nouvelle architecture de modèle fondamental d'IA pour les domaines de l'intelligence incarnée et de la robotique. Il a été proposé pour la première fois par NVIDIA en février 2026, avec des recherches connexes publiées dans un article intitulé «Les modèles d'action mondiaux sont des politiques sans coup d'envoiCet article propose DreamZero (un modèle de base pour robot à 14 paramètres) et utilise, pour la première fois, explicitement le terme « World Action Model » (WAM) pour définir cette architecture novatrice. Il souligne que, contrairement aux VLA traditionnels (qui ne modélisent que des actions ponctuelles), le WAM est un modèle de base qui hérite directement des connaissances préalables du monde physique en prédisant conjointement l'état futur du monde (flux vidéo) et les actions du robot, ce qui lui confère une capacité de généralisation zéro-shot extrêmement performante (politique zéro-shot). Par ailleurs, NVIDIA a publié un article intitulé « … »Qu'est-ce qu'un modèle d'action mondiale ??Des explications supplémentaires sont nécessaires.

En mai 2026, l'Université Fudan, l'Académie de l'innovation de Shanghai et l'Université nationale de Singapour ont publié un article intitulé « ... »Modèles d'action mondiaux : la prochaine frontière de l'IA incarnéeL'article propose une revue systématique, définissant explicitement WAM comme : « Un modèle fondamental incarné qui unifie la modélisation prédictive des états avec la génération d'actions, dans le but de former une distribution conjointe des états et actions futurs, et non seulement les actions elles-mêmes. »

Avec NVIDIA DreamZero Par exemple, l'architecture sous-jacente de WAM est en réalité un modèle de génération vidéo massive (basé sur un réseau dorsal de diffusion vidéo, tel que Wan2.1 ou NVIDIA Cosmos). Le flux de travail principal peut être divisé en trois étapes :

Entrée : Écran actuel + commande vocale + état actuel du robot
⬇️
[Modèle de base WAM (tel que l'architecture DiT à 14 milliards de paramètres)]
⬇️
Une passe vers l'avant :

Images vidéo futures prédites (à quoi ressemblera le monde prochainement)

Les mouvements précis du robot dans chaque image (trajectoires articulaires des degrés de liberté)

Grâce à cette prédiction conjointe, les actions et l'évolution du monde physique sont inextricablement liées. Pour qu'un robot génère des actions correctes, il doit concevoir mentalement des séquences vidéo futures conformes aux lois de la physique (gravité, frottement, relations d'occlusion).

Associé Wiki

Apprendre En Déployant

LWD est un cadre d'apprentissage par renforcement hors ligne à en ligne au niveau de la flotte qui permet aux robots à usage général de collecter en continu de l'expérience et de réaliser une auto-évolution des politiques.

il y a 2 mois

Théorie De l'espace

La théorie spatiale désigne le cadre conceptuel permettant à un agent intelligent de construire, de mettre à jour et d'utiliser des représentations spatiales dans un environnement d'informations incomplètes grâce à une exploration active.

il y a 3 mois

Stratégie De Vitesse Moyenne (MVP)

MVP permet une génération d'actions en une seule étape avec une grande puissance d'expression et une rapidité de calcul extrême grâce à la modélisation du champ de vitesse moyen.

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Date

il y a un mois

Organisation

URL du document

2602.15922

Balises

Intelligence Incarnée

Entrée : Écran actuel + commande vocale + état actuel du robot
⬇️
[Modèle de base WAM (tel que l'architecture DiT à 14 milliards de paramètres)]
⬇️
Une passe vers l'avant :

Images vidéo futures prédites (à quoi ressemblera le monde prochainement)

Les mouvements précis du robot dans chaque image (trajectoires articulaires des degrés de liberté)

Associé Wiki

Apprendre En Déployant

il y a 2 mois

Théorie De l'espace

il y a 3 mois

Stratégie De Vitesse Moyenne (MVP)

MVP permet une génération d'actions en une seule étape avec une grande puissance d'expression et une rapidité de calcul extrême grâce à la modélisation du champ de vitesse moyen.

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Modèle d'action Mondial WAM

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Modèle d'action Mondial WAM

Associé Wiki

Apprendre En Déployant

Théorie De l'espace

Stratégie De Vitesse Moyenne (MVP)

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Modèle d'action Mondial WAM

Associé Wiki

Apprendre En Déployant

Théorie De l'espace

Stratégie De Vitesse Moyenne (MVP)

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Wiki

Apprendre En Déployant

Théorie De l'espace

Stratégie De Vitesse Moyenne (MVP)

Associé Wiki

Apprendre En Déployant

Théorie De l'espace

Stratégie De Vitesse Moyenne (MVP)