NVIDIA、DeepSeek R1 から導き出された高効率の推理専門 LLM「OpenReasoning-Nemotron」をリリース
NVIDIA AIは、「OpenReasoning-Nemotron」という新しい大規模言語モデル(LLM)のシリーズを公開しました。このモデル群は、671BパラメーターのDeepSeek R1 0528から派生しており、数学、科学、プログラミングなどの複雑な推論タスクで優れたパフォーマンスを発揮します。公開されたモデルには1.5B、7B、14B、32Bの4種類があり、それぞれが小型化および効率化を図りつつも高次の推論能力を保持しています。 特徴と概要 元のモデル:671BパラメーターのDeepSeek R1 0528 主要機能:推論の一般化に重点を置いた蒸留プロセスにより、トークン予測ではなく、構造的で認知的に要求されるタスクに対する効果的な性能を実現。 モデルバリエーションと仕様 | モデル名 | パラメーター | 想定用途 | Hugging Faceページ | |----------------------|--------------|------------------|--------------------| | OpenReasoning-1.5B | 1.5B | 基本的な推理と推論 | [リンク] | | OpenReasoning-7B | 7B | 中程度の推理、コード/数学の処理 | [リンク] | | OpenReasoning-14B | 14B | 高度な推論能力 | [リンク] | | OpenReasoning-32B | 32B | 論理的な課題でのほぼ最先端性能 | [リンク] | これらのモデルは、Transformerアーキテクチャーに対応し、FP16/INT8量子化をサポートし、NVIDIA GPUやNeMoフレームワーク上で最適化されています。 パフォーマンス指標 OpenReasoning-Nemotronモデルは、サイズ同じ一般的なLLMと比較して、次のような推論特化ベンチマークで優れた成績を上げています: | モデル名 | GSM8K 正解率 | HumanEval Pass@1 | ARC-challenge 正解率 | MATH 正解率 | |-----------------|-------------|------------------|--------------------|-------------| | 7B | 66.7% | 34.2% | 77.3% | 40.5% | | 14B | 72.9% | 42.0% | 80.1% | 47.6% | | 32B | 77.5% | 49.5% | 83.9% | 52.3% | これらの成績は、0-shotまたはfew-shot設定での最も良い評価に基づいています。特に、数学や科学の問題に対する精度では、LLaMA2、Mixtral、DeepSeek-Coderなどを上回っています。 推論スペシャリストへの道 NVIDIAが公開したこれらのモデルは、オープンソースであり、商用利用も許可されています。モデルのカード、評価スクリプト、推論可能な重みなど、すべての資源はHugging Faceで利用可能です。また、TensorRT-LLM、ONNX、Hugging Face Transformersといったツールチェーンに対応しており、研究や開発環境での迅速な導入を可能にしています。 主要使用例 数学的研究 科学的解析 コード生成・最適化 結論 NVIDIAのOpenReasoning-Nemotronモデルは、高コストが必要なフロンティアクラスの計算力なしで推論能力を拡張する、現実的でオープンソースの道を開きました。このシリーズは、671BパラメーターのDeepSeek R1からの蒸留によって作られ、具体的な推論ドメインに焦点を当てることで、精度、効率性、アクセシビリティのバランスを実現しています。 FAQ OpenReasoning-Nemotronと一般的なLLMとの違い:OpenReasoning-Nemotronは、数学、科学、プログラミングに関する推論を特別に強化しています。一方、LLaMAやMixtralは広範なウェブコーパスで訓練されているため、特定の推論領域ではOpenReasoning-Nemotronが優れています。 どのモデルが自分のアプリケーションに適しているか:技術詳細ページをチェックしてください。各モデルの特定の性能と用途について詳しく説明されています。 商用利用は可能か:はい、すべてのモデルは商用利用可能なライセンスで公開され、NVIDIAのネモフレームワークやHugging Face Transformarツールキットを介して企業環境で展開できます。 これらの改良点により、論理的なAIアプリケーションを開発している技術者、研究者、企業にとって、より魅力的な選択肢となるでしょう。