L’ère des entreprises de labelisation de données est terminée, selon le CEO de Turing
« L’ère des entreprises de labelisation de données est terminée », affirme le PDG d’une société d’entraînement d’IA valorisée à 2,2 milliards de dollars. Jonathan Siddharth, dirigeant de Turing, a déclaré lors d’un épisode de la série « 20VC » publié lundi que les tâches simples de labellisation, telles que l’étiquetage d’images ou le tri de textes, ne suffisent plus pour alimenter les systèmes d’intelligence artificielle avancés. Selon lui, les modèles d’IA d’aujourd’hui, notamment les modèles agents et les architectures basées sur l’apprentissage par renforcement, ont besoin de données plus complexes, proches des réalités du travail humain. « Les besoins en données ont profondément évolué », explique Siddharth. Dans les premiers stades du développement de l’IA, les annotateurs effectuaient des tâches standardisées, faciles à déléguer à grande échelle. Aujourd’hui, les laboratoires de pointe recherchent des partenaires capables de fournir des données réalistes, qui reflètent les processus cognitifs et les workflows concrets des professionnels dans divers secteurs. « Il s’agit désormais de données du monde réel, de données qui touchent à la manière dont les humains accomplissent leur travail intellectuel », souligne-t-il. Pour répondre à cette nouvelle exigence, les entreprises d’entraînement d’IA doivent devenir des « accélérateurs de recherche », capables de concevoir des environnements d’apprentissage par renforcement — des mondes simulés, des mini-mondes virtuels — qui reproduisent fidèlement les processus métiers. Cela implique de recruter des experts humains dans des domaines variés, capables de guider la création de ces simulations réalistes. Turing a récemment levé 111 millions de dollars dans un tour de financement de série E, portant sa valorisation à 2,2 milliards de dollars. L’entreprise a également annoncé que son chiffre d’affaires annuel a atteint 300 millions de dollars en 2024, soit presque un triplement par rapport à l’année précédente. Le boom de l’entraînement d’IA a également propulsé l’essor des startups spécialisées dans la labelisation de données. En juin, Meta a acquis une participation de 49 % dans Scale AI, portant la valorisation de cette dernière à plus de 29 milliards de dollars. En octobre, Mercor a clos un tour de financement évaluant sa valeur à 10 milliards de dollars. Ce phénomène a également alimenté une main-d’œuvre freelance en croissance rapide. Selon un rapport de Business Insider en septembre, certains travailleurs indépendants gagnent des milliers de dollars par mois grâce à ces missions, bien que le travail puisse être stressant, émotionnellement lourd et instable. Par ailleurs, la forte demande a engendré un marché parallèle : des centaines de groupes Facebook ont été révélés en octobre, proposant des accès non autorisés à des comptes de contractants, qu’ils soient réels ou fictifs. Bien que ces pratiques soient strictement interdites par les entreprises d’entraînement d’IA, des escrocs et des chercheurs d’opportunités profitent de la situation pour tirer profit de la demande croissante.
