ラマ-ネモトロン推論データセット
このデータセットは、NVIDIA が 2025 年にリリースした高品質のマルチドメイン推論データセットです。関連する論文結果は次のとおりです。Llama-Nemotron: 効率的な推論モデル」は、数学、コード、科学的推論、命令の追跡などのタスクにおける大規模言語モデルのパフォーマンス向上をサポートし、Llama-3.1/3.3-Nemotron シリーズ モデルがより効率的な推論機能を実現できるようにすることを目的としています。
データセットには、約 2,206 万件の数学データ、約 1,010 万件のコードデータ、残りは科学および指導フォローの分野のデータが含まれています。データは、Llama-3.3-70B-Instruct、DeepSeek-R1、Qwen-2.5 などの複数のモデルによって共同で生成され、大規模モデルトレーニングの多様なニーズを満たすために、多様な推論スタイルと問題解決パスをカバーしています。
Llama-Nemotron.torrent
シーディング 1ダウンロード中 0ダウンロード完了 6総ダウンロード数 10