Un petit modèle aux 27 millions de paramètres qui écrase les géants de l’IA sur des tâches complexes
Alors que les nouveaux modèles d’intelligence artificielle s’affrontent chaque jour dans une course folle vers la taille, la puissance et le coût, le Hierarchical Reasoning Model (HRM) surgit comme une révolution discrète, presque provocante. Pas de trillions de paramètres, pas de clusters de GPU qui consomment l’équivalent d’une ville. Juste 27 millions de paramètres, des jeux de données si réduits qu’on pourrait les traiter en quelques heures de week-end. Guan Wang, l’un des chercheurs derrière ce modèle, affirme qu’il peut être entraîné pour résoudre des grilles de Sudoku de niveau professionnel en seulement deux heures sur GPU — un délai que beaucoup d’entre nous passent à régler des problèmes de drivers CUDA sur une A100 mal configurée. Et pourtant, HRM ne se contente pas de fonctionner : il domine. Sur ARC-AGI, l’un des benchmarks les plus exigeants pour mesurer l’intelligence générale des systèmes artificiels, il atteint 40,3 %, loin devant Claude 3.7 (21,2 %) et l’o3-mini-high d’OpenAI (34,5 %). Mais c’est dans des défis spécifiques que sa supériorité devient frappante. Sur des Sudoku extrêmes — des cas si complexes que la plupart des grands modèles s’y cassent les dents — HRM en résout 55 %, tandis que Claude et o3-mini échouent complètement. Même scénario pour les labyrinthes de 30×30 cases : HRM trouve la solution optimale dans 74,5 % des cas, contre zéro pour ses concurrents. Ce qui frappe, c’est que ce n’est pas une question de puissance brute. HRM ne gagne pas parce qu’il est plus grand, mais parce qu’il pense différemment. Il utilise une architecture hiérarchique qui permet de décomposer les problèmes complexes en étapes logiques, de réfléchir de manière structurée, et de revenir sur ses erreurs. C’est une forme de raisonnement organisé, presque humaine, qui échappe aux géants de l’IA qui, malgré leur taille colossale, se contentent souvent de tirer des conclusions à partir de motifs statistiques. En somme, HRM ne démontre pas seulement qu’on peut faire mieux avec moins, mais qu’on peut faire mieux en pensant autrement. Alors que le monde de l’IA s’embourbe dans une logique de croissance illimitée, HRM offre une leçon : parfois, la véritable intelligence ne réside pas dans la masse, mais dans la clarté du raisonnement. Et ce petit modèle, presque discret, pourrait bien être le plus embarrassant des géants.