5ヶ月前

エージェント

ベンチマーク

AIインフラストラクチャ

アプローチ／フレームワーク

Chengyue Yu Siyuan Lu Chenyi Zhuang Dong Wang Qintong Wu Zongyue Li Runsheng Gan Chunfeng Wang Siqi Hou Gaochi Huang

概要

実践からの学習（learning from practice）の枠組みは、高度なエージェント型AIシステムの開発にとって極めて重要であるが、特にGAIAのような複雑なベンチマークにおいて顕著な課題となる、非効率な経験の生成というボトルネックによって大きく制限されている。この問題に対処するため、本研究では大規模なエージェント-環境間相互作用を実現するオープンソースシステム「AWorld」を提案する。クラスタ上でタスクを分散処理することで、従来の単一ノード・逐次実行に比べ、経験収集速度を14.6倍に高速化した。この重要な高速化により、広範な強化学習が実用的かつスケーラブルな範囲で可能となった。この能力を活用し、Qwen3-32Bを基盤とするエージェントを学習させた結果、ベースモデルを大幅に上回る性能を達成し、GAIA全体の正解率を21.59%から32.23%まで向上させた。特にベンチマークで最も困難なレベルにおいては、16.33%のスコアを記録し、先進的なプロプライエタリモデルを上回る成果を達成した。本研究で開発したオープンソースシステムおよびその結果得られたエージェントは、効率的な相互作用から顕著なモデル性能向上までを実現する、包括的なエージェント型AI学習パイプラインの実用的な実装例を提供する。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

5ヶ月前

エージェント

ベンチマーク

AIインフラストラクチャ

アプローチ／フレームワーク

Chengyue Yu Siyuan Lu Chenyi Zhuang Dong Wang Qintong Wu Zongyue Li Runsheng Gan Chunfeng Wang Siqi Hou Gaochi Huang

概要

実践からの学習（learning from practice）の枠組みは、高度なエージェント型AIシステムの開発にとって極めて重要であるが、特にGAIAのような複雑なベンチマークにおいて顕著な課題となる、非効率な経験の生成というボトルネックによって大きく制限されている。この問題に対処するため、本研究では大規模なエージェント-環境間相互作用を実現するオープンソースシステム「AWorld」を提案する。クラスタ上でタスクを分散処理することで、従来の単一ノード・逐次実行に比べ、経験収集速度を14.6倍に高速化した。この重要な高速化により、広範な強化学習が実用的かつスケーラブルな範囲で可能となった。この能力を活用し、Qwen3-32Bを基盤とするエージェントを学習させた結果、ベースモデルを大幅に上回る性能を達成し、GAIA全体の正解率を21.59%から32.23%まで向上させた。特にベンチマークで最も困難なレベルにおいては、16.33%のスコアを記録し、先進的なプロプライエタリモデルを上回る成果を達成した。本研究で開発したオープンソースシステムおよびその結果得られたエージェントは、効率的な相互作用から顕著なモデル性能向上までを実現する、包括的なエージェント型AI学習パイプラインの実用的な実装例を提供する。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています