HyperAI超神経
Back to Headlines

NVIDIAのAIセキュリティレシピで自律型AIシステムを保護

2日前

NVIDIAのAIセキュリティレシピで能動型AIシステムを保護 大規模言語モデル(LLM)によって、自動的なアクション、ツールの使用、及び推論能力を持つ能動型(agentic)AIシステムが急速に増えてきています。企業はこれらのシステムの柔軟性と低い推論コストに引かれる一方で、目標の乖離、プロンプト注入攻撃、予期せぬ行動、及び人的監視の低下といった新たなリスクに直面しています。これらのリスクは、セキュリティ、プライバシー、信頼性、コンプライアンスという組織の Goal を脅かす可能性があります。 NVIDIAのAIセキュリティレシピは、AIライフサイクルの各段階を硬化させることで、このようなリスクを管理します。推論時には、NVIDIA NeMo Guardrailsが敵対的プロンプト、コンプライアンス違反、及び有害コンテンツの生成といったリスクを軽減します。 なぜ能動型ワークフローにセキュリティレシピが必要なのか 最先端のオープンウエイトモデルは、企業のセキュリティ方針と共にあるケースでズレが生じます。環境の変化により新規リスクが生じ、従来のコンテンツフィルターやベンチマークではカバーしきれない状況が発生します。連続的なポリシー対応型のモニタリングがないため、AIシステムは高度なプロンプト注入攻撃などにより脆弱性が暴露される可能性があります。 NVIDIAの能動型AIセキュリティレシピは、組織が構築、導入、運用の各段階で信頼性と内部ポリシー、外部規制との適合を確保できる包括的な企業グレードのフレームワークを提供します。 各段階での防御の適用 ビルド段階では、モデル評価およびアラインメントが重要です。NVIDIA NeMoフレームワークを使用すると、開発者は開放ライセンスのデータセットを使って、安全で信頼性のあるAIシステムを構築できます。NemoGator Content Safety Dataset v2 と Llama Nemotor Safety Guard v2 モデル、WildGuardMix Dataset と AllenAI WildGuard モデル、garak LLM脆弱性スキャナを使用して、有害な出力を厳しくスクリーニングし、コンテンツの整合性と企業ポリシーへのアラインメントを強化します。 トレーニング後には、モデルの安全性とセキュリティ報告が徹底的にレビューされ、企業固有のポリシーに準拠していることを確認します。タスク特異的な精度も再評価され、すべての評価がビジネスと安全基準を満たしていることを検証した後、モデルは信頼性のある状態でデプロイされます。Llama 3.1 Nemoguard 8B Content Safety NIM、Llama 3.1 Nemoguard 8B Topic Control NIM、Nemoguard Jailbreak Detect NIM が、偏見や悪意のある出力を防ぎ、 Interaction が承認されたビジネスまたはコンプライアンスドメイン内に留まるよう支援します。 製品の安全性とセキュリティの向上 製品の安全性は、開放ウエイトモデルの88%から94%に向上し、6%の改善率を記録しました。これは、コンテンツ安全性に関するベンチマークを使用した評価で確認されました。製品セキュリティも、56%から63%に向上し、敵対的攻撃や脱獄試み、有害なコンテンツ生成に対する安全性が改善されました。 NVIDIAのAIセキュリティレシピは、開発から導入まで信頼性を確保し、企業グレードの能動型AIシステムの責任ある導入を可能にします。 Active Fence や Cisco AI Defense、CrowdStrike Falcon Cloud Security、Trend Micro のような先進的なサイバーセキュリティやAIセキュリティ企業が、このレシピを利用し自社の製品やソリューションに統合しています。 Active Fenceは、リアルタイムガードレールを提供することで安全なAIアジェントの導入を支援し、安全性が高まります。Cisco AI Defenseは、NeMoとの統合によってモデルの脆弱性を算法レッドチームにより評価し、ランタイムアプリケーションの安全性、セキュリティ、プライバシー対策を提供します。CrowdStrike Falcon Cloud Securityは、ランタイムでの継続的なプロンプト監視と脅威インテリジェンスデータから得た学習をモデルのトレーニングに組み込むことで、さらなる後方教育を進めます。また、Trend Microは、NeMoのモデル開発パイプラインと統合して、信頼性と安全性を確保するとともに組織全体でのスケーリングを可能にします。 NVIDIAのAIセキュリティレシピはJupyterノートブックとして利用可能で、クラウドへのデプロイも簡単に始めることができます。このレシピは、能動型AIの安全性、セキュリティ、コンプライアンスを早期に評価と整合性を確保するために設計されており、能動型ワークフローの安全確保を支援します。

Related Links