Command Palette

Search for a command to run...

LongAlign 10K 大規模モデルのロング コンテキスト アライメント データセット

日付

2年前

サイズ

392.42 MB

組織

清華大学

LongAlign-10k は、長いコンテキスト アラインメント タスクで大規模モデルが直面する課題に対処するために設計された清華大学によって提案されたデータ セットで、8k ~ 64k の長さの 10,000 個の長い命令データが含まれています。

構築プロセス中、データセットはまず書籍、百科事典、学術論文、コードなど 9 つの異なる分野から資料を抽出し、次にクロード 2.1 大型モデルを使用して、長い形式のコンテキストで多様なタスクと回答を生成しました。このデータセットは、長いコンテキストにおける大規模モデルのパフォーマンスと、10,000 ~ 100,000 の長さのタスク命令に従う能力を評価するように設計されています。

LongAlign.torrent
シーディング 1ダウンロード中 0ダウンロード完了 268総ダウンロード数 422
  • LongAlign/
    • README.md
      1.28 KB
    • README.txt
      2.57 KB
      • data/
        • LongAlign-10k.zip
          392.42 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
LongAlign 10K 大規模モデルのロング コンテキスト アライメント データセット | データセット | HyperAI超神経