Command Palette
Search for a command to run...
Zewen Chi Li Dong Qingxiu Dong Yaru Hao Xun Wu Shaohan Huang Furu Wei

要約
私たちが目指すのは、「エージェント組織(agentic organization)」と呼ぶ新しいAIの時代であり、複数のエージェントが協働かつ並列的に作業することで、個々の知能をはるかに超える成果を実現するものである。このビジョンを実現するため、大規模言語モデルにおける推論の新たなパラダイムとして「非同期的思考(AsyncThink)」を提案する。AsyncThinkは、内部の思考プロセスを並列実行可能な構造に組織化するものであり、各エージェントが独立して思考を進めつつ、全体として整合性のある解決策を導く仕組みである。具体的には、オーガナイザーが動的にサブクエリをワーカーに割り当て、中間的な知識を統合し、一貫性のある解決策を生成する思考プロトコルを提案する。さらに重要なのは、このプロトコルにおける思考構造が強化学習を用いてさらに最適化可能である点である。実験の結果、AsyncThinkは並列的思考と比較して推論遅延を28%低減するとともに、数学的推論の精度を向上させた。また、AsyncThinkは学習した非同期的思考の能力を汎化し、追加の訓練なしに未見のタスクに対しても効果的に対処できることが示された。