Agent Instruct は、高品質のインタラクション軌跡を含む軽量の指示微調整データセットです。AgentInstruct は、1866 の高品質なインタラクション トラジェクトリと 6 つの多様な現実のシナリオ タスクを含む、選択されたエージェント データ セットであり、言語モデルのエージェント機能を強化するために使用されます。
- 思考チェーン: ReAct プロンプト戦略を使用して、操作の各ステップに詳細な思考チェーンを提供し、モデルの意思決定プロセスを深く理解します。
- 多様性: 日常の家事からデータベースの操作まで、6 つの現実世界のシナリオをカバーしており、平均ラウンド数は 5 ~ 35 です。
- 精度: GPT-4 はエージェントのタスクを完全に完了することはできません。軌跡報酬メカニズムを使用してデータを厳密に選別し、各データの品質を保証します。
- 一般化可能性: データ漏洩を回避し、データの一般化可能性を確保するための厳格な検査。