Grok、バルドゥールズゲート攻略で主要AIと並ぶ実力発揮
xAIが開発するチャットボット「Grok」が、『バルドゥールズ・ゲート』に関する質問に対して、非常に高い水準の回答を可能にしたことが明らかになった。これは、Elon Musk率いるxAIがゲーム攻略に特化したAI開発に力を入れていることを裏付ける実例だ。 ビジネスインサイダーのレポートによると、去年、Grokのリリースが数日延期されたのは、Musk自身がゲームに関する回答の質に不満を示したため。高レベルのエンジニアが他のプロジェクトから引き抜かれ、攻略内容の改善にあたったという。この出来事は、AI開発の現場に現実の価値観がどう反映されるかを問う一例となった。 実際に、同社が注力する分野であるRPG攻略の精度を検証するため、記者が『バルドゥールズ・ゲート』に関する5つの質問をGrok、ChatGPT、Claude、Geminiの4モデルに投げかけた。このテストを「BaldurBench」と命名し、すべての回答を公開している。 結果、Grokは専門用語を多用する点がやや難点だったものの、攻略の核心的な情報を正確に提供。特に、戦闘理論(theorycraft)や効率的な戦略構築についての回答は、ゲーム愛好家にとって有用な内容だった。また、テーブル形式での情報提示が特徴で、データの整理が得意であることがうかがえる。 他のモデルとの比較では、ChatGPTが箇条書きを好む一方、Geminiは重要なキーワードを太字で強調するスタイル。Claudeは、ゲーム体験の楽しみを損なわないよう配慮し、「無理に最適なパーティを組む必要はない。自分にとって楽しいものを選んで」とアドバイスするなど、ユーザー体験を重視した回答が目立った。 この結果は、xAIが特定の分野に集中して改善を重ねた結果であることを示唆している。確かに、Grokの回答は他の主要モデルと比べて大きな差はなく、あくまで「並み」の水準にとどまる。しかし、Muskの強い関心と開発チームの集中力が、技術的な実力を引き出せることを裏付けている。このように、特定のニーズに応じたAIの強化は、今後の技術進化の鍵となる可能性がある。
