HyperAI超神経

Alpaca-Cleaned コマンド微調整データ セット

日付

9ヶ月前

サイズ

13.98 MB

Alpaca-Cleaned データセットは、2024 年にスタンフォード大学によってリリースされた元の Alpaca データセットのクリーンアップされたバージョンです。オリジナルの Alpaca は、OpenAI のエンジンによって生成された 52,000 の命令とデモンストレーションのデータセットです (text-davinci-003)。この命令データを使用して、言語モデルが命令によりよく従うように、言語モデルに命令を調整できます。

このデータセットは、幻覚反応、マージされた命令、空の出力、一貫性のない入力フィールドなど、元の Alpaca のいくつかの問題を解決し、それによってデータの品質と一貫性が向上します。 Alpaca-Cleaned データ セットには、テキスト生成、質問応答システム、自然言語理解、コードの理解と生成など、さまざまなアプリケーション シナリオがあります。その機能には、品質の最適化、パフォーマンスの向上、豊富なモデル リソース、オープン ソース コードとコミュニティのサポートが含まれており、コミュニティの参加、継続的な更新と改善を奨励し、NLP 分野の発展を促進します。

Alpaca-Cleaned.torrent
シーディング 2ダウンロード中 0ダウンロード完了 107総ダウンロード数 114
  • Alpaca-Cleaned/
    • README.md
      1.57 KB
    • README.txt
      3.15 KB
      • data/
        • Alpaca-Cleaned.zip
          13.98 MB