ネモトロン3.5 カスタマイズ可能AI安全性
NVIDIAは企業向けAI安全保護モデル「Nemotron 3.5 Content Safety」をリリースした。テキスト、画像、応答を統一評価するマルチモーダル機能を導入し、文脈依存の違反を検知する。基盤にGoogleのGemma 3 4B ITを採用し、LoRAでファインチューニング。4Bパラメータ規模に抑え、8GB VRAM搭載GPUでのリアルタイム運用を可能にした。言語対応では12言語の明示トレーニングに加え、約140言語へのゼロショット汎化を継承する。 最大の特徴はカスタムポリシー適用と監査可能な推論プロセス(THINKモード)だ。ドメイン固有のリスク許容度に応じた自然言語ポリシーを指定でき、モデルが動的に解釈する。THINKモード有効時は判定理由を出力、無効時は低遅延の二値判定に切り替え可能だ。推論最適化のため、教師モデル生成プロセスを3文以内に圧縮する2段階手法を採用した。 学習データセットも公開。実写画像を99%採用し、既存ベンチマークの合成偏りを是正。Aegis 2.0準拠評価では、有害コンテンツ検知精度が約85%を達成。12言語ベンチマークで96.5%、RTP-LXで88.8%を示し、競合比でレイテンシを最大50%削減した。 本モデルはHugging FaceとNVIDIA Open Model Licenseの下で商用利用可能。NVIDIA NIM、vLLM、SGLangおよび主要推論プラットフォームで提供開始。ポリシー生成ツールと実装ガイドを公開し、エンタープライズAIのセキュリティ実装と運用効率を同時に推進する。
