Alpaca-Cleaned コマンド微調整データ セット
Alpaca-Cleaned データセットは、2024 年にスタンフォード大学によってリリースされた元の Alpaca データセットのクリーンアップされたバージョンです。オリジナルの Alpaca は、OpenAI のエンジンによって生成された 52,000 の命令とデモンストレーションのデータセットです (text-davinci-003)。この命令データを使用して、言語モデルが命令によりよく従うように、言語モデルに命令を調整できます。
このデータセットは、幻覚反応、マージされた命令、空の出力、一貫性のない入力フィールドなど、元の Alpaca のいくつかの問題を解決し、それによってデータの品質と一貫性が向上します。 Alpaca-Cleaned データ セットには、テキスト生成、質問応答システム、自然言語理解、コードの理解と生成など、さまざまなアプリケーション シナリオがあります。その機能には、品質の最適化、パフォーマンスの向上、豊富なモデル リソース、オープン ソース コードとコミュニティのサポートが含まれており、コミュニティの参加、継続的な更新と改善を奨励し、NLP 分野の発展を促進します。
Alpaca-Cleaned.torrent
シーディング 2ダウンロード中 0ダウンロード完了 107総ダウンロード数 114