HyperAI

Le secteur de l'intelligence artificielle opère un changement de cap majeur en s'éloignant des modèles de langage uniquement textuels pour se tourner vers les modèles du monde. Cette nouvelle génération d'algorithmes vise à doter les systèmes informatiques d'une compréhension spatiale, temporelle et physique de l'environnement, plutôt que de se limiter à la prédiction statistique de mots ou d'images. Après des années consacrées aux grands modèles linguistiques, des chercheurs comme Louis Castricato ont perçu les limites de cette approche. Il a ainsi fondé Overworld, une entreprise qui développe des mondes virtuels adaptatifs où l'intelligence artificielle interagit directement avec des environnements complexes. Selon Castricato, l'objectif est d'optimiser l'interaction physique au-delà du simple traitement de données. Cette vision est partagée par une communauté croissante d'entrepreneurs et de scientifiques considérant les modèles du monde comme l'étape suivante de l'intelligence artificielle. La chercheuse Fei-Fei Li, pionnière du domaine et fondatrice de World Labs, définit ces modèles comme capables d'apprendre la structure de l'espace et du temps. À l'instar de Yann LeCun, ex-directif scientifique chez Meta et fondateur d'Advanced Machine Intelligence Labs, elle explique que ces systèmes permettent à une intelligence artificielle de prévoir les conséquences de ses propres actions. Pour Martin Hebert, doyen en informatique à l'université Carnegie Mellon, cette évolution est essentielle pour le développement de l'IA physique ou incarnée. Contrairement aux chatbots qui manipulent du texte, ces nouvelles architectures doivent intégrer la géométrie, la dynamique des mouvements et les interactions matérielles, fonctionnant de manière analogue au système nerveux humain qui adapte automatiquement l'équilibre et la marche. Les applications potentielles dépassent largement la robotique. Des startups comme Overworld appliquent ces principes aux jeux vidéo pour créer des univers réactifs, tandis que d'autres entreprises, soutenues par des fonds de capital-risque comme Kindred Ventures, ciblent la prévision météorologique ou le développement de puces informatiques spécialisées. Steve Jang, dirigeant de Kindred Ventures, note que l'avenir de l'IA résidera dans une diversité de modèles et d'architectures plutôt que dans un unique système dominant. Face à la multiplication des définitions, Fei-Fei Li propose une taxonomie claire pour y voir plus clair. Elle distingue trois catégories principales. Les premiers, dits rendus, privilégient la qualité visuelle mais manquent de rigueur physique. Les deuxièmes, appelés simulateurs, créent des environnements virtuels fidèles pour entraîner des systèmes complexes. Enfin, les planificateurs se concentrent sur la capacité d'une machine à anticiper et à décider dans des contextes non structurés. Selon Li, c'est dans cette dernière catégorie que réside l'enjeu industriel majeur : concevoir des robots véritablement autonomes et opérationnels. Ce tournant marque une phase charnière pour la technologie. En quittant les purely numériques pour s'ancrer dans la réalité physique, les modèles du monde ouvrent la voie à une intelligence artificielle capable de percevoir, comprendre et agir concrètement dans notre environnement, redéfinissant ainsi les frontières entre le traitement de l'information et l'action dans le monde réel.

Liens associés

Liens associés

Liens associés

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Command Palette

IA physique : les startups misent sur les modèles mondiaux

Liens associés

Command Palette

IA physique : les startups misent sur les modèles mondiaux

Liens associés

Command Palette

IA physique : les startups misent sur les modèles mondiaux

Liens associés

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.

Sortie d'image En 4 étapes/qualité 4K/accélération 6x, PiD Utilise La Diffusion De Pixels Pour Unifier Le Décodage Et La Sortie Super-résolution ; SA-3DAO : Un Ensemble De Données Contenant 1 000 Paires d'images Réelles Associées À Des Maillages 3D Fabriqués À La Main Par Des artistes.