Hassabis lance un appel à l’effort maximal pour le scaling de l’IA, convaincu que c’est la clé de l’AGI
Le PDG de Google DeepMind, Demis Hassabis, affirme que l’expansion des systèmes d’intelligence artificielle doit être poussée à son maximum. À l’occasion du sommet AI+ d’Axios à San Francisco, il a souligné que l’augmentation des ressources — données et puissance de calcul — constitue la clé pour atteindre l’intelligence artificielle générale (IAG), une forme d’IA capable de raisonner aussi bien que l’humain. « Nous devons pousser l’échelle des systèmes actuels au maximum, car elle sera au minimum un élément fondamental du système final d’IAG, et pourrait même en être l’intégralité », a-t-il déclaré. L’IAG, encore théorique, représente l’objectif ultime des géants de la technologie, alimentant des investissements massifs dans l’infrastructure et le recrutement de talents. Les lois d’échelle de l’IA suggèrent qu’un modèle devient plus performant avec davantage de données et de puissance de calcul. Hassabis estime que l’expansion seule pourrait suffire à atteindre l’IAG, bien qu’il soupçonne qu’au moins une ou deux autres avancées majeures soient nécessaires. Cependant, cette approche a ses limites. La quantité de données disponibles publiquement est finie, et l’augmentation de la puissance de calcul exige la construction de centres de données coûteux, à l’impact environnemental significatif. De plus, certains experts s’inquiètent d’un retour marginal décroissant sur les investissements colossaux consacrés à l’expansion. Des chercheurs comme Yann LeCun, ancien directeur scientifique de l’IA chez Meta, estiment que l’industrie ne peut pas se contenter de plus de données et de plus de calcul. « Les problèmes les plus intéressants échouent très mal à l’échelle », a-t-il déclaré en avril à l’Université nationale de Singapour. « On ne peut pas supposer que plus de données et plus de calcul mènent automatiquement à une IA plus intelligente. » LeCun, qui a récemment quitté Meta pour lancer sa propre entreprise, s’oriente vers un autre paradigme : les modèles du monde. Contrairement aux grands modèles linguistiques, ces systèmes s’appuient sur des données spatiales et sensorielles pour comprendre le monde physique. Son objectif ? Développer des systèmes capables de comprendre l’environnement, de conserver une mémoire persistante, de raisonner et de planifier des séquences d’actions complexes. « L’objectif de cette start-up est de provoquer la prochaine grande révolution en IA », a-t-il écrit sur LinkedIn en novembre. Cette vision alternative souligne une divergence croissante dans la communauté scientifique : la question de savoir si l’avenir de l’IA réside dans l’expansion continue ou dans des innovations fondamentales.
