Origin Lab lève 8 M$ pour vendre des données aux créateurs de modèles vidéo
Origin Lab a annoncé avoir levé 8 millions de dollars en financement de démarrage, une somme dirigée par Lightspeed Ventures et complétée par des investisseurs majeurs tels que SV Angel, Eniac, Seven Stars, FPV, ainsi que les fondateurs de Twitch et de Cruise, Kevin Lin et Kyle Vogt. Cette levée de fonds vise à soutenir la mission de la start-up : faciliter la vente de données issues de l'industrie du jeu vidéo aux entreprises de modélisation du monde physique, souvent appelées « world models ». Alors que l'intelligence artificielle commence à interagir avec le monde physique pour opérer des robots ou modéliser des objets dans l'espace réel, un défi majeur persiste. Contrairement aux modèles de langage, il n'existe pas de source de données facilement accessible pour entraîner ces nouveaux systèmes, obligeant de nombreux laboratoires à s'arracher des ensembles de données complexes. Origin Lab propose une solution inédite en utilisant les données déjà existantes dans le secteur du jeu vidéo. Selon Anne-Margot Rodde, co-PDG et co-fondatrice, les systèmes d'IA actuels doivent comprendre le fonctionnement du monde physique et les mouvements des objets. Or, ce type de données, riche en simulations de physique et d'interactions spatiales, se trouve essentiellement dans les jeux vidéo. La société, fondée également par Antoine Gargot et Colin Carrier, agit comme un intermédiaire de marché. D'un côté, les laboratoires spécialisés dans les modèles du monde, tels que AMI Labs de Yann LeCun ou World Labs de Fei-Fei Li, peuvent y acheter des données de haute qualité et sous licence. De l'autre, les entreprises de jeux vidéo peuvent générer des revenus supplémentaires à partir de leurs actifs numériques déjà créés. Au cœur de cet écosystème, Origin Lab convertit les actifs des jeux vidéo en formats exploitables pour l'entraînement de l'IA. Cette transformation peut varier d'une simple séquence de rendu graphique à l'automatisation de plusieurs heures de séquences de jeu. Rodde explique que l'industrie du jeu détient des données extrêmement précieuses, mais qu'il n'existait auparavant aucune infrastructure pour connecter ces créateurs de jeux aux laboratoires d'IA. Origin Lab a donc construit ce pont indispensable. Bien que les laboratoires aient toujours été intéressés par les images de jeux vidéo, les problèmes de licence et de qualité des données ont souvent entravé leur utilisation. En décembre 2024, par exemple, OpenAI a créé une controverse mineure lorsque le premier modèle de génération vidéo Sora semblait reproduire des extraits de jeux et de diffuseurs, probablement en raison d'un entraînement sur des flux Twitch. Amazon a également exprimé son intérêt pour l'utilisation de ces contenus pour entraîner ses modèles. Le succès financier d'Origin Lab marque l'émergence d'un marché plus large, non seulement pour les données d'entraînement, mais aussi pour les entreprises capables de servir de fournisseurs essentiels aux grands acteurs de l'IA. Faraz Fatemi, partenaire chez Lightspeed, note que la réussite de sociétés comme Scale AI a rendu cette opportunité inévitable. Il souligne que pour les laboratoires d'IA, riches en capitaux, la donnée reste le goulot d'étranglement principal. Ainsi, les fournisseurs de données spécialisés peuvent réaliser des revenus à grande échelle, transformant un réservoir de données sous-exploité en une ressource stratégique pour la prochaine génération d'intelligence artificielle.
