OCIにNVIDIA AI-Qをデプロイ
NVIDIAとOracleは、多エージェント型AIシステム「AI-Q Blueprint 2.0」をOracle Cloud Infrastructure(OCI)上で本番環境対応で展開するためのオープンソース参照実装を正式公開した。本ブループリントはLangChain Deep AgentsとNVIDIA NeMo Agent Toolkitを基盤とし、単一クエリ処理やセッションコンテキストの維持に留まらず、長期計画の立案、サブエージェント間の作業分担、サンドボックス内でのツール実行を可能にする高度な推論エージェントの実装を支援する。 展開アーキテクチャでは、意図ルーターがユーザー入力を解析し、高速な浅層検索エージェントか、計画・研究サブエージェントによる深層処理エージェントへリクエストを自動振り分けを行う。各コンポーネントはYAML設定やプラグインシステムを通じて動的に交換可能で、モデル、検索ツール、RAGバックエンドの構成変更が容易に設計されている。OCI上での実装は、Terraformによるインフラストラクチャの宣言的プロビジョニングと、HelmによるOKE(Oracle Kubernetes Engine)上のワークロード配置を明確に分離。VCN、OKEクラスター、ロードバランサー、OCI Vaultを用いたAPIキーの暗号化保存を自動化し、インフラとアプリケーションのレイヤーをクリーンに管理できる。 運用フローは、Terraform変数の設定、インフラ構築(約10〜15分)、kubernetesクライアント設定とHelmチャートの適用(約5〜10分)で構成され、全体で20〜25分以内に稼働環境を完了できる。デプロイ完了後、ロードバランサーの公開IPにアクセスするとフロントエンドが起動し、簡易回答から比較分析のような複雑な深層調査タスクまで、エージェントのルーティングと処理能力を実際に検証可能だ。環境不要時は単一コマンドでリソース全体を削除でき、コスト管理と運用負荷の軽減を実現する。 本ソリューションはKubernetesとインフラストラクチャ・アズ・コードに習熟したプラットフォームエンジニアや開発者を対象としており、OCI上のGPU基盤を活用したエージェント専門のインフラ構築を迅速化させる。NVIDIAは、このオープンソース実装を起点に、後続の拡張フェーズにおけるカスタムスキル統合や評価器の実装に向けた柔軟性も示唆しており、企業向けAIエージェント基盤の標準化に向けた重要な一歩となる。
