HyperAIHyperAI

Command Palette

Search for a command to run...

Grok s’impose dans les guides de Baldur’s Gate, preuve que xAI a misé sur le bon levier

Une bonne nouvelle pour xAI : Grok se montre désormais assez compétent pour répondre aux questions sur Baldur’s Gate. Les laboratoires d’intelligence artificielle ont chacun leurs priorités : OpenAI s’oriente vers les utilisateurs grand public, Anthropic vers les entreprises, tandis qu’Elon Musk et son laboratoire xAI ont récemment mis l’accent sur les guides de jeu vidéo. Une récente enquête de Business Insider, signée Grace Kay, révèle que Musk a rendu la vie difficile à ses employés, notamment en retardant le lancement d’une version du modèle à cause de sa critique des réponses sur Baldur’s Gate. Selon plusieurs sources, des ingénieurs de haut niveau ont été retirés de leurs projets pour améliorer les réponses — une situation qui pourrait sembler absurde pour un professionnel expérimenté, mais qui reflète une stratégie claire : atteindre une maîtrise précise dans un domaine spécifique. Mais la question qui reste en suspens est : Musk a-t-il finalement obtenu ce qu’il voulait ? Pour le savoir, notre spécialiste des jeux de rôle, Ram Iyer, a conçu un petit test comparatif, baptisé BaldurBench, avec cinq questions générales sur Baldur’s Gate. Les réponses ont été comparées entre Grok, ChatGPT, Claude et Gemini. Les transcriptions complètes sont disponibles en ligne pour garantir la transparence. Les résultats sont encourageants. Grok fournit des informations solides, bien que parfois trop techniques — il utilise des termes comme « save-scumming » ou « DPS » sans les expliquer, ce qui peut dérouter les débutants. Il affectionne particulièrement les tableaux et les analyses théoriques, ce qui correspond bien à l’image de l’IA orientée vers les joueurs avancés. Les autres modèles s’appuient sur des sources similaires, donc les différences se situent surtout au niveau du style : ChatGPT privilégie les listes à puces et des phrases courtes, Gemini met en valeur les mots clés en gras, tandis que Claude adopte une approche plus prudente, évitant tout spoil. Par exemple, lorsqu’on lui demande des conseils sur la composition d’équipe, il conclut par : « N’ayez pas trop de stress, jouez simplement ce qui vous semble amusant. » Un geste humain, mais qui ne répond pas toujours à la demande d’information précise. Il est important de noter que, selon les informations de Business Insider, xAI a effectivement ciblé Baldur’s Gate comme domaine de performance. Le fait que Grok atteigne un niveau comparable aux autres modèles majeurs après cette « course contre la montre » montre que l’entreprise peut produire des résultats solides quand elle s’y met. Cela ne signifie pas que Grok est supérieur, mais qu’il peut rivaliser — et cela, c’est déjà un bon résultat.

Liens associés

Grok s’impose dans les guides de Baldur’s Gate, preuve que xAI a misé sur le bon levier | Articles tendance | HyperAI