IA : convergence affaiblie
Il y a deux ans, des chercheurs du Massachusetts Institute of Technology ont formulé l'hypothèse des représentations platoniciennes, suggérant que l'essor des modèles d'intelligence artificielle les pousse à développer une vision du monde de plus en plus similaire, indépendamment de leurs données d'entraînement. Cette idée a suscité un vif intérêt dans la communauté scientifique, soulevant la question d'une structure universelle sous-jacente apprise par l'IA. Cependant, une équipe de l'École polytechnique fédérale de Lausanne remet désormais en question cette convergence apparente. Présentée en juillet 2026 à la Conférence internationale sur l'apprentissage automatique à Séoul, l'étude dirigée par la professeure Maria Brbic et menée par Fabian Gröger et Shuo Wen démontre que les scores de similarité utilisés pour comparer les modèles sont largement influencés par les propriétés mathématiques des espaces de grande dimension. Dans ces espaces utilisés par les réseaux neuronaux, les distances ont tendance à se concentrer, ce qui peut créer une illusion de similarité entre des systèmes qui n'ont pourtant pas appris les mêmes structures fondamentales. Ainsi, une partie de la convergence observée résulterait d'artefacts statistiques plutôt que d'un apprentissage universel partagé. Malgré ce constat, les chercheurs de l'EPFL observent une forme de convergence persistante au niveau local. Les modèles tendent à regrouper des concepts similaires entre eux, formant des voisinages stables et cohérents. Sur la base de cette observation, l'équipe propose l'hypothèse des représentations aristotéliciennes. Contrairement à la vision platonicienne qui prône une forme idéale unique, cette approche met l'accent sur les relations, les catégories et le contexte. Ce qui importe serait moins la structure absolue de l'espace de représentation que les liens relatifs entre les concepts. Cette distinction théorique comporte des implications pratiques directes pour le développement de l'IA. Si les modèles divergent globalement dans leur représentation du monde, cela complique les enjeux d'alignement et d'intégration des systèmes multimodaux. Pour répondre à ce défi, les chercheurs ont mis au point un nouveau cadre d'évaluation qui corrige les biais mathématiques identifiés. Leurs tests sur des modèles de langage, de vision et de vidéo confirment systématiquement cette convergence locale au détriment d'un alignement global. Cette recherche a été accueillie positivement par les auteurs de l'hypothèse initiale du MIT, illustrant la dynamique normale du progrès scientifique fondée sur l'examen critique et la collaboration. Loin de clore le débat, ces travaux ouvrent de nouvelles pistes pour déterminer précisément quelles structures locales convergent réellement et comment exploiter ces connaissances afin de concevoir des systèmes d'intelligence artificielle plus fiables, mieux alignés et dont le fonctionnement interne est mieux compris.
