HyperAI
il y a un jour

Penser au-delà des tokens : de l’intelligence inspirée par le cerveau aux fondements cognitifs de l’intelligence artificielle générale et son impact sociétal

Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, Amgad Muneer, Anas Zafar, Ashmal Vayani, Maged Shoman, Abdelrahman B. M. Eldaly, Kai Zhang, Ferhat Sadak, Shaina Raza, Xinqi Fan, Ravid Shwartz-Ziv, Hong Yan, Vinjia Jain, Aman Chadha, Manoj Karkee, Jia Wu, Philip Torr, Seyedali Mirjalili
Penser au-delà des tokens : de l’intelligence inspirée par le cerveau aux fondements cognitifs de l’intelligence artificielle générale et son impact sociétal
Résumé

Les machines peuvent-elles vraiment penser, raisonner et agir dans des domaines comme les humains ? Cette question persistante continue de façonner la quête de l'Intelligence Artificielle Générale (IAG). Malgré les capacités croissantes de modèles tels que GPT-4.5, DeepSeek, Claude 3.5 Sonnet, Phi-4 et Grok 3, qui montrent une fluence multimodale et un raisonnement partiel, ces systèmes restent fondamentalement limités par leur dépendance à la prédiction au niveau des tokens et leur absence d'agence ancrée. Cet article propose une synthèse interdisciplinaire du développement de l'IAG, couvrant l'intelligence artificielle, la neurosciences cognitives, la psychologie, les modèles génératifs et les systèmes basés sur des agents. Nous analysons les fondements architecturaux et cognitifs de l'intelligence générale, en mettant en lumière le rôle du raisonnement modulaire, de la mémoire persistante et de la coordination multi-agents. En particulier, nous soulignons l'émergence des cadres Agentic RAG qui combinent la récupération d'informations, la planification et l'utilisation dynamique d'outils pour permettre un comportement plus adaptable. Nous discutons des stratégies de généralisation, telles que la compression d'information, l'adaptation à temps de test et les méthodes sans apprentissage (training-free), comme des voies critiques vers une intelligence flexible et indépendante du domaine. Les Modèles Vision-Langage (VLMs) sont réexaminés non seulement en tant que modules perceptuels mais aussi comme interfaces évoluantes pour une compréhension incarnée et une réalisation collaborative de tâches. Nous soutenons également que l'intelligence véritable ne naît pas seulement de l'échelle mais de l'intégration de la mémoire et du raisonnement : une orchestration de composants modulaires, interactifs et s'améliorant eux-mêmes où la compression permet un comportement adaptatif. En nous appuyant sur les progrès réalisés dans les systèmes neurosymboliques, l'apprentissage par renforcement et le soutien cognitif (cognitive scaffolding), nous explorons comment les architectures récentes commencent à combler le fossé entre l'apprentissage statistique et la cognition orientée vers un objectif. Enfin, nous identifions les principaux défis scientifiques, techniques et éthiques sur le chemin vers l'IAG.