HyperAI超神経

Google DeepMindがAlphaEvolveをリリース、300年前の数学の問題を解き、40近くの数学の問題でより良い解法を見つける

特色图像

北京時間5月14日深夜、Google DeepMindはAlphaEvolveと呼ばれるプログラミングAIエージェントをリリースした。大規模言語モデルの強力なコード生成機能と自動評価機能を組み合わせています。数学と現代のコンピューティングにおけるいくつかの基本的および複雑な問題に対するアルゴリズムを設計および最適化できます。

公式発表によると、AlphaEvolveはGoogleのデータセンター、チップ設計、AIトレーニングプロセスの効率を向上させたという。また、より高速な行列乗算アルゴリズムの設計にも役立ち、いくつかの未解決の数学問題に対する新しい解決策を見つけ、複数の分野での幅広い応用に大きな可能性を示しています。

具体的には、AlphaEvolve は Gemini シリーズの最新の大型モデルをいくつか使用しています。そのワークフローには、言語モデルからアルゴリズム コードを生成し、自動化された評価者によってこれらのコードを検証およびスコアリングし、最後にアルゴリズム データベースに進化メカニズムを実装して、生成されたソリューションを継続的に最適化することが含まれます。

上の図は、サンプラーが最初に言語モデルのプロンプトを構築し、次に新しいプログラムを生成する方法を示しています。これらのプログラムは評価者によって評価され、プログラム データベースに保存されます。データベースは、将来のプロンプト生成にどのプログラムを使用するかを決定するための進化的アルゴリズムを実装しています。

実際の応用では、AlphaEvolve は、単一の関数を超えて、コード ベース全体を進化させ、より複雑なアルゴリズムを開発することができます。Gemini Flash モデルを通じて問題解決のアイデアの範囲を広げ、Gemini Pro モデルは詳細な洞察を提供します。 2人は協力して、アルゴリズムによる解決策を体系化するための複数のコンピュータ プログラムを提案します。システムのワークフローでは、言語モデルから新しいプログラムを自動的に生成し、そのパフォーマンスを評価者が客観的かつ定量的に評価して、最高品質で最も効率的なコードを選択します。

公式発表によると、AlphaEvolve は、Google の大規模クラスタ管理システム Borg がより効率的に Google の巨大なデータセンターをスケジュールできるようにするための、シンプルだが非常に効率的なヒューリスティック手法を発見したとのことです。このソリューションは 1 年以上実稼働環境で使用されており、一貫して平均 0.7% のグローバル コンピューティング リソースを復元してきました。

また、AlphaEvolve は、行列乗算回路内の不要なビットを効果的に削除する新しい Verilog 書き換え方法も提案しました。この改良は、Google の次期 Tensor Processing Unit (TPU) に組み込まれ、チップのパフォーマンスが向上します。

モデルトレーニングの点では、AlphaEvolve は Gemini アーキテクチャにおける行列乗算演算を最適化します。速度は23%増加し、トレーニング時間は1%短縮されました。さらに、カーネルの最適化に必要なエンジニアリング時間を数週間から数日に大幅に短縮し、研究者の生産性を大幅に向上させます。

言及する価値があるのは、AlphaEvolve は数学の問題に対しても優れた能力を発揮しました。例えば、行列乗算アルゴリズムの発見では、4×4の複素行列乗算を48回のスカラー乗算で完了できる新しいアルゴリズムを発見しました。これは、1969年にシュトラッセンが提案した古いアルゴリズムよりも優れています。同時に、AlphaEvolve は、数学の 50 以上の未解決問題にも適用されています。約 75% のケースでは最先端のソリューションが再発見され、20% のケースでは、300 年以上も数学者を悩ませてきた「キッシング数問題」を解く効率を改善するなど、最もよく知られたソリューションが改良されました。

要約すると、AlphaEvolve は数学やコンピューティングに限らず、幅広い用途に使用できます。未来、GoogleはPeople + AI Researchチームと協力して、ユーザーフレンドリーなインターフェースを開発し、早期アクセス プログラムを通じて学術ユーザーが利用できるようにします。長期的には、AlphaEvolve の可能性は、アルゴリズムで記述して自動的に検証できるあらゆる問題に適用できることにあり、材料科学、創薬、持続可能性などの分野でさらなる飛躍的進歩を遂げることが期待されています。