日付

10ヶ月前

データセット構成

Paper URL

2505.00949

ライセンス

CC BY 4.0

タグ

モデル学習

Llama-Nemotron-Post-Training-Datasetは、2025年にNVIDIAがオープンソース化した大規模な学習後データセットです。関連する論文の結果は「Llama-Nemotron: 効率的な推論モデルこれは、トレーニング後の段階（SFT や RL など）における Llama-Nemotron シリーズモデルの数学、コード、一般的な推論、および指示の追従機能を向上させることを目的としています。このデータセットは、教師あり微調整（SFT）と強化学習（RL）のフェーズから得られたデータを組み合わせたものです。現在のバージョンであるv1.1（以前のバージョンと比較して約220万の数学サンプルと50万のコード推論サンプルが追加されています）は、AIエージェント、チャットボット、RAGシステム、その他のAI駆動型アプリケーションの学習に適しています。 データ分布（カテゴリエントリ数別）

数学：22,066,397
コード: 10,108,883
科学: 708,920
指示に従う: 56,339
チャット: 39,792
安全: 31,426

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用 Discordで議論

日付

10ヶ月前

データセット構成

Paper URL

2505.00949

ライセンス

CC BY 4.0

タグ

モデル学習

数学：22,066,397
コード: 10,108,883
科学: 708,920
指示に従う: 56,339
チャット: 39,792
安全: 31,426

Nemotron Personas France（フランス合成ペルソナデータセット）

2ヶ月前

zh-meme-sft-8k 中国インターネットミーム文化データセット

3ヶ月前

地上情報源による世界洪水イベントデータセット

3ヶ月前

CHIMERA一般推論合成データセット

4ヶ月前

RubricHub_v1 マルチドメイン生成タスクデータセット

5ヶ月前

Nemotron-Personas-Brazil ブラジル合成文字データセット

5ヶ月前

Nemotron-Math-v2 数学推論データセット

5ヶ月前

TxT360-3efforts マルチタスク推論データセット

5ヶ月前

X線密輸品検出データセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Llama-Nemotron-Post-Training-Dataset トレーニング後のデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

Llama-Nemotron-Post-Training-Dataset トレーニング後のデータセット

関連データセット

Nemotron Personas France（フランス合成ペルソナデータセット）

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

Nemotron-Math-v2 数学推論データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

Llama-Nemotron-Post-Training-Dataset トレーニング後のデータセット

関連データセット

Nemotron Personas France（フランス合成ペルソナデータセット）

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

Nemotron-Math-v2 数学推論データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Nemotron Personas France（フランス合成ペルソナデータセット）

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

Nemotron-Math-v2 数学推論データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

関連データセット

Nemotron Personas France（フランス合成ペルソナデータセット）

zh-meme-sft-8k 中国インターネットミーム文化データセット

地上情報源による世界洪水イベントデータセット

CHIMERA一般推論合成データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

Nemotron-Math-v2 数学推論データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット