Command Palette

Search for a command to run...

Llama-Nemotron-Post-Training-Dataset トレーニング後のデータセット

日付

2ヶ月前

組織

エヌビディア

論文URL

2505.00949

ライセンス

CC BY 4.0

Llama-Nemotron-Post-Training-Datasetは、2025年にNVIDIAがオープンソース化した大規模な学習後データセットです。関連する論文の結果は「Llama-Nemotron: 効率的な推論モデルこれは、トレーニング後の段階(SFT や RL など)における Llama-Nemotron シリーズ モデルの数学、コード、一般的な推論、および指示の追従機能を向上させることを目的としています。

このデータセットは、教師あり微調整(SFT)と強化学習(RL)のフェーズから得られたデータを組み合わせたものです。現在のバージョンであるv1.1(以前のバージョンと比較して約220万の数学サンプルと50万のコード推論サンプルが追加されています)は、AIエージェント、チャットボット、RAGシステム、その他のAI駆動型アプリケーションの学習に適しています。

データ分布(カテゴリエントリ数別)

  • 数学:22,066,397
  • コード: 10,108,883
  • 科学: 708,920
  • 指示に従う: 56,339
  • チャット: 39,792
  • 安全: 31,426

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています