HyperAI超神経
Back to Headlines

DeepMindとOpenAIのモデル、国際数学オリンピックで金メダルレベルを達成

10日前

DeepMindとOpenAIのモデルが国際数学オリンピック(IMO)の問題をトップ高校生レベルで解く能力を示した。7月21日にDeepMindは、自社のソフトウェアがIMOの問題で金メダル相当のスコアを達成したと発表した。この結果は、昨年の銀メダル上位レベルから進化し、今年は人間の金メダリストの下位レベルに相当する評価となった。ただし、この進展には大きな変化が含まれていると、DeepMindの研究者トラン・ルオン氏は語る。 昨年の成果は、AlphaGeometryやAlphaProofといった特定のAIツールを用いて、数学の証明や計算を実行する形で達成された。しかし、今年はすべてが自然言語で完結しており、問題の文をプログラミング言語に変換する必要がなくなった。この変化を実現したのは、Geminiを基盤とした大規模言語モデル「DeepThink」で、複数の思考プロセスを並列処理できるように改良されており、数学的な議論をより正確かつ迅速に生成できるようになった。 DeepThinkは今年のIMOの6問中35点(満点42点)を獲得。評価はIMOの審査員が同様に行い、開発者による手動の翻訳は不要となった。一方、OpenAIの共同創業者であるサム・アルトマン氏が率いるチームも、ChatGPTのモデルがIMOの問題で金メダルレベルの解答を出力したが、独自の評価で確認された。 長年、AI研究者は2つのアプローチに分かれてきた。2012年までは、論理的思考を手動でコード化する「ルールベース」の方法が主流だったが、その後ニューラルネットワークが大量のデータから学習する形で進展し、ChatGPTなどのツールが一般に利用されるようになった。ニューヨーク大学の神経科学者ギア・マーカス氏は、DeepMindとOpenAIの成果を「非常に印象的」と評価。彼は「ルールを手動で記述する」アプローチ、つまり「神経記号AI(Neurosymbolic AI)」を推奨し、LLMの過剰な宣伝に懸念を示している。 しかし、マーカス氏は、トップ高校生レベルの数学問題を解ける能力は「非常に高い数学的問題解決力」を示すと認めている。今後の発展には、LLMと神経記号AIのどちらが優位に立つかが注目される。ルオン氏は、両方のアプローチが今後も進化し、合流する可能性もあると語っている。

Related Links