Orca-Math-200K は、Microsoft によって作成された高品質の合成データセットで、約 200,000 の小学校の数学の質問が含まれています。このデータセット内のすべての答えは、Azure GPT4-Turbo を使用して生成されています。
研究者は、データ セットの構築を支援するために複数のエージェントを作成しました。作成プロセスには、シード コレクションの構築、エージェントと「Ask Me Anything」の質問の生成、エージェントと提案者と編集者の共同生成、DMath データ セットのインポート、データ セットの拡張と反復が含まれます。学習プロセス。このデータ セットは、数学的問題を解決する際の言語モデルの強固な基盤を提供するために、言語モデルの数学的機能を向上させることを目的としています。
做种 1
下载中 0
已完成 50
总下载 143