HyperAI

La startup Decart a récemment dévoilé Oasis 3, son dernier modèle de monde interactif capable de générer des environnements de conduite photoréalistes en temps réel. Accessible directement via une API dès son lancement, ce nouveau modèle s'adresse prioritairement aux entreprises de véhicules autonomes, à la robotique et au secteur de l'intelligence artificielle physique. Le cofondateur et PDG Dean Leitersdorf espère ainsi construire un vaste écosystème de développeurs, sur le modèle initié par OpenAI avec les grands modèles de langage. Oasis 3 s'appuie sur les fondations du modèle vidéo Lucy de l'entreprise, déjà utilisé par plus de cent mille développeurs pour le e-commerce et le streaming en direct. Le modèle est proposé à un tarif de 0,02 dollar par seconde, avec des tarifs dédiés aux entreprises. Cette nouvelle entrée dans le domaine des modèles mondiaux intervient dans un marché déjà concurrentiel, où des acteurs comme Google avec Genie 3 ou World Labs avec Marble se partagent également la place. La récente levée de fonds de 300 millions de dollars de Decart, portant sa valorisation à près de quatre milliards de dollars et attirant des investisseurs tels que Toyota, Adobe, eBay et Nvidia, confirme l'ampleur des ambitions du projet. L'avantage concurrentiel d'Oasis 3 réside dans sa capacité à générer des scènes de manière infinie tout en maintenant un rendu visuel réaliste et une grande efficacité technique. Cette performance est rendue possible par la DOS Stack, une solution logicielle propriétaire qui optimise l'exécution des modèles sur le matériel Nvidia, Amazon et Google, réduisant considérablement les coûts de calcul par rapport aux concurrents. Le système génère des environnements multicaméras physiquement plausibles, idéaux pour tester les scénarios rares et les situations limites nécessaires à l'entraînement des systèmes autonomes. Néanmoins, des tests pratiques révèlent des limites techniques persistantes. Si la cohérence visuelle est impressionnante au départ, elle se dégrade rapidement au fil de la simulation. Les scènes perdent progressivement leurs détails spécifiques et le contrôle du véhicule devient moins réactif, entraînant des ruptures dans la continuité de l'environnement. Par ailleurs, la simulation ne gère pas encore parfaitement la physique des objets, comme en témoignent les véhicules capables de se traverser mutuellement. Ces contraintes s'expliquent en partie par l'architecture autorégressive d'Oasis 3, qui génère les images image par image en s'appuyant sur les données précédentes, ce qui sature rapidement la fenêtre de contexte de calcul. Face à ces défis, l'équipe de Decart travaille activement à l'extension de la mémoire contextuelle du modèle et à la compression des tokens générés. Le prochain volet de la technologie devrait permettre de créer des mondes à partir de vidéos préexistantes plutôt que d'images statiques. Malgré ces imperfections, Dean Leitersdorf maintient sa vision à long terme. Il compare cette phase de maturation aux premiers jours des API de langage, estimant que l'ouverture immédiate de l'accès aux développeurs catalysera l'émergence d'applications innovantes encore imprévisibles. Pour le moment, Oasis 3 s'impose comme un outil expérimental prometteur, mais nécessitant encore des ajustements pour garantir une cohérence et une fiabilité complètes à l'échelle industrielle.

Liens associés

Liens associés

Liens associés

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.

Command Palette

Decart simule la conduite

Liens associés

Command Palette

Decart simule la conduite

Liens associés

Command Palette

Decart simule la conduite

Liens associés

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.