HyperAI超神経
Back to Headlines

OpenAIの新オープンモデルがNVIDIA GeForce RTXシリーズでローカル高速化、AIインフラの進化を推進

1日前

OpenAIとNVIDIAの共同開発により、新たなオープンソースの推論型AIモデル「gpt-oss-20b」と「gpt-oss-120b」が公開された。これらのモデルは、NVIDIAのGPU最適化により、クラウドからPCまで高速かつスマートな推論を実現し、ウェブ検索や深層研究、コード補助など、エージェント型AIアプリケーションの実現を可能にする。モデルはNVIDIA H100 GPUで学習され、NVIDIA Blackwellアーキテクチャに対応しており、GB200 NVL72システムでは1秒間に150万トークンの推論性能を達成。NVFP4 4ビット精度を採用し、高精度かつ低リソースで効率的な推論を実現。最大13万1072トークンのコンテキスト長をサポートし、長文処理や複雑な推論タスクに最適。 NVIDIAは、Ollama、llama.cpp、Microsoft AI Foundry Localなどの主流ツールと連携し、RTX AI PCやワークステーション上でこれらのモデルを簡単に利用できる環境を整備。特にOllamaは、24GB以上のVRAMを搭載するRTX GPU向けに最適化されており、UIからモデル選択とチャットがワンクリックで可能。PDFや画像の添付、カスタムコンテキスト長設定など、開発者やユーザーにとって使いやすい機能を搭載。llama.cppやGGMLライブラリにもCUDA GraphやCPUオーバーヘッド削減の最適化を導入し、性能向上を実現。 このリリースは、NVIDIAの「フルスタックAI」戦略の成果でもある。CUDAプラットフォームは4.5億回以上のダウンロードを記録し、世界中で広く採用されている。OpenAIとNVIDIAは、Hugging Face、FlashInfer、vLLM、TensorRT LLMなど、主要なオープンソースフレームワークとも協業し、開発者が好きなツールでモデルを利用できるようにしている。NVIDIAの開発者コミュニティ(650万人以上、250カ国以上)は、この最新モデルを即座に活用できる。 Jensen Huang CEOは「OpenAIがNVIDIA AI上で何が可能かを示し、今やオープンソースソフトウェアの革新を推進している」と述べ、米国のAIリーダーシップの強化を強調。この取り組みは、2016年にNVIDIAが初代DGX-1をOpenAIに手渡した協業の延長線上にある。AIの次世代インダストリー革命を支える基盤として、医療、製造、スタートアップなど、あらゆる分野でのイノベーションが期待される。NVIDIA RTX AI GarageブログやDiscordコミュニティを通じて、開発者同士の協働と学びの場が広がっている。

Related Links