HyperAIHyperAI

Command Palette

Search for a command to run...

IA au Battleship pose mieux

Des chercheurs du MIT et de Harvard ont démontré comment améliorer la capacité des modèles de langage à poser des questions pertinentes, un enjeu crucial pour les agents d'intelligence artificielle autonomes. Leur approche expérimentale repose sur un jeu collaboratif inspiré de la Bataille navale, où un agent pose des interrogations naturelles à un partenaire répondant en temps réel. L'équipe a d'abord enregistré les échanges de plus de quarante humains pour servir de référence lors des tests. Sans entraînement préalable, les grands modèles surpassent déjà les humains à ce jeu, mais les versions légères peinent à formuler des requêtes utiles. Pour combler ce déficit, les chercheurs ont intégré une stratégie d'inférence Monte Carlo, qui permet à l'IA d'évaluer probabilistiquement chaque réponse et d'ajuster ses questions suivantes pour maximiser l'information recueillie. Parallèlement, les interrogations sont automatiquement traduites en code Python exécutable. Ce format permet au modèle de vérifier systématiquement ses hypothèses, réduisant les erreurs et renforçant la précision des réponses. Les résultats sont marqués. Le modèle léger Llama 4 Scout a vu son taux de victoire passer de 8 à 82 % face à des joueurs humains, tout en devançant des systèmes plus vastes comme GPT-5, pour un coût de calcul approximativement cent fois inférieur. D'autres architectures, dont GPT-4o-mini et Claude 4 Opus, ont également enregistré des gains significatifs. La même méthode s'est révélée efficace sur le jeu Devine Qui, où les taux de réussite ont fortement progressé. Selon Gabriel Grand, doctorant au MIT et auteur principal, ces travaux présentés en avril lors de la conférence ICLR révèlent que la formulation de questions pertinentes dépend étroitement de la capacité de l'IA à simuler l'évolution de son environnement. Le professeur Jacob Andreas souligne que ces techniques pourraient être étendues à la recherche scientifique, au codage ou à la résolution de problèmes complexes. Malgré ces avancées, les limites subsistent. Les modèles peinent encore face à des interrogations multidimensionnelles, et les joueurs experts demeurent difficiles à battre. Les chercheurs souhaitent désormais évaluer ces stratégies dans des environnements plus ambitieux, notamment pour accélérer la découverte de molécules ou optimiser l'assistance scientifique. Ils prévoient également d'étudier les dynamiques de collaboration humain-machine dans des contextes plus structurés. Comme le rappelle Robert Hawkins, linguiste à Stanford, le véritable défi pour les agents autonomes réside moins dans le calcul statistique que dans le raisonnement pragmatique nécessaire pour exploiter efficacement les informations. Cette recherche pose ainsi des bases solides pour une intelligence artificielle capable d'explorer et d'apprendre de manière plus autonome.

Liens associés

IA au Battleship pose mieux | Articles tendance | HyperAI