Command Palette
Search for a command to run...
Gang Liu Yihan Zhu Jie Chen Meng Jiang

要約
大規模言語モデル(LLM)は科学的アシスタントとしての可能性を秘めているが、現存するエージェントはいずれもアルゴリズム進化に依存するか、孤立した深層的調査に依存するという、いずれも重大な限界を抱えている。純粋なアルゴリズム進化(例:AlphaEvolve)はLLMの内部知識にのみ依拠するため、複雑な分野では急速に限界に達してしまう。一方、純粋な深層的調査は検証を伴わず仮説を提示するため、現実的でない、あるいは実装不可能な解決策が生じる。本研究では、深層的調査とアルゴリズム進化を統合したエージェント「DeepEvolve」を提案する。DeepEvolveは、フィードバック駆動の反復ループの下で、外部知識の取得、複数ファイル間のコード編集、体系的なデバッグを統合している。各反復において、新しい仮説を提示するだけでなく、それらを精緻化・実装・検証するプロセスを実施することで、浅い改善や生産性の低い過剰な精緻化を回避する。化学、数学、生物学、材料科学、特許の9つのベンチマークにおいて、DeepEvolveは初期アルゴリズムを一貫して改善し、持続的な向上を達成する実行可能な新しいアルゴリズムを生成した。無作為な進化と根拠のない研究の間にあるギャップを埋めることで、DeepEvolveは科学的アルゴリズム発見の進展に信頼性のあるフレームワークを提供する。本研究のコードは、以下のURLから公開されている。