OpenAI、開発者向けにGPT-5 Pro・Sora 2・低遅延音声モデルをAPIで提供
OpenAIは、開発者向けエコシステムの強化を目的に、Dev Dayで複数の新機能を発表した。新たに提供されたのは、GPT-5 Pro、動画生成モデル「Sora 2」のAPI版、および低コストで低遅延を実現する音声モデル「gpt-realtime mini」だ。 GPT-5 Proは、金融、法務、医療など、高い精度と論理的推論が求められる分野向けに設計された。同社CEOのサム・アルトマン氏は、これらの業界では「正確性と深い推論能力」が不可欠だと強調。GPT-5 Proは、複雑な課題に対しても安定した高品質な出力を実現する。 音声機能に関しては、「gpt-realtime mini」が登場。従来の高機能音声モデルより70%コスト削減を実現しながら、同等の音声品質と表現力を維持。低遅延ストリーミングに対応し、リアルタイムの会話型AIアプリケーション開発を可能にした。 また、Sora 2のAPI版がプレビューで提供開始。Sora 2は、前バージョンに比べ、物理的に整合性のあるシーン、音声と映像の精密な同期、カメラワークの詳細な制御、スタイル化されたビジュアルを可能にした。アルトマン氏は、「iPhoneの映像をプロンプトで壮大な映画風の広角ショットに拡張できる」と説明。特に注目すべきは、単なる会話音声ではなく、環境音、効果音、視覚に根ざした音響の統合。たとえば、ある製品の雰囲気から広告のビジュアルコンセプトを生成する、あるいはマテルとの提携で、デザイナーがスケッチから玩具の動画コンセプトを即座に生成するといった応用が可能になる。 さらに、開発者向けにAIエージェント構築ツールと、ChatGPT内でのアプリ開発機能も提供。これらは、OpenAIが開発者コミュニティを強化し、自社プラットフォームに依存する開発者エコシステムを構築する戦略の一環である。 AIの実用化が進む中、OpenAIは「高精度」「リアルタイム」「創造的制御」という3本柱で、開発者に自社技術を採用させる動きを加速している。
