HyperAIHyperAI

Command Palette

Search for a command to run...

Console
6日前

Nex-N1:大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練

Nex-N1:大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練

要約

大規模言語モデル(LLM)が受動的な応答者から自律的エージェントへと進化するに伴い、学習のパラダイムも根本的に転換する必要がある——すなわち、静的な模倣からインセンティブ駆動型の意思決定へと移行する必要がある。しかし、この移行は、効果的な方策学習に不可欠な高品質な相互作用信号を構築できるスケーラブルなインフラの欠如によって著しく阻害されている。この課題に対処するため、本研究では、相互作用環境の多様性と複雑性を体系的にスケーラブルに拡張する包括的な手法を提案する。本手法は、以下の3つの直交する次元に着目してスケーリングを実現する:(1)複雑性:NexAUは、シンプルな構成設定により複雑なエージェント階層の構築を可能にする柔軟なエージェントフレームワーク;(2)多様性:NexA4Aは自然言語から自動的に多様なエージェント階層を生成し、無限のドメインをカバーする仕組み;(3)忠実性:NexGAPは動的な現実世界環境を統合することで、シミュレーションと現実のギャップを埋め、現実に基づく軌道の合成を実現する。本研究では、このインフラによって構築された多様かつ複雑な相互作用環境上で、Nex-N1を学習させた。SWE-benchやtau2などのベンチマークにおける実証結果から、Nex-N1は最先端のオープンソースモデルを一貫して上回り、複雑なエージェントタスクにおいても最先端のプロプライエタリモデルと競合する性能を達成した。本研究では、Nexエコシステムおよびモデルの重みをオープンソースとして公開し、今後の研究を促進することを目的としている。

コードリポジトリ

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Nex-N1:大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練 | 論文 | HyperAI超神経