HyperAI超神経
Back to Headlines

OpenAI、GPT-5を正式発表 「エージェント型AI」の新たな一歩へ

11時間前

OpenAIは5日、次世代AIモデル「GPT-5」の提供を開始した。これは同社初の「統合型」モデルで、推理能力を備えたoシリーズと高速応答を特長とするGPTシリーズの長所を融合。CEOのサム・アルトマン氏は、GPT-5を「世界で最も優れたモデル」と評し、人工一般知能(AGI)への道の「重要な一歩」と位置づけた。このモデルは、ChatGPTの無料ユーザーにも標準で提供され、これまで高機能モデルが有料に限定されていた点で、OpenAIの「誰もがAIの恩恵を受けられる」 missionの実現に向けた重要な一歩とされる。 GPT-5は、複数のベンチマークで競合モデルを上回る性能を示している。GitHubの実際のコード課題を測る「SWE-bench Verified」では74.9%の正解率を記録し、AnthropicのClaude Opus 4.1(74.5%)をわずかに上回った。また、博士レベルの科学知識を問う「GPQA Diamond」では89.4%の正解率を達成し、Claude Opus 4.1(80.9%)やxAIのGrok 4 Heavy(88.9%)を上回った。医療分野のテスト「HealthBench Hard Hallucinations」では、誤った情報を生成する率が1.6%と、前モデルのGPT-4o(12.9%)やo3(15.8%)を大幅に改善。また、AIが意図的に人間を欺く傾向(デシジョン)も低下し、安全性が向上したとされる。 一方で、一部のタスクでは競合に劣る結果も。Tau-benchで航空会社サイトの操作テストでは63.5%(o3:64.8%)、小売サイト操作では81.1%(Claude Opus 4.1:82.4%)と、わずかに下回った。しかし、OpenAIはGPT-5が「より自然で味のある」創造的作業(デザインや執筆)にも優れていると強調。開発者向けには、gpt-5、gpt-5-mini、gpt-5-nanoの3種類のAPIが提供され、応答の長さや推論時間もカスタマイズ可能。基本料金は入力100万トークンあたり1.25ドル、出力は10ドル。 無料ユーザーは基本モデル、有料プラン(Plus・Pro)はより高機能なGPT-5 Proも利用可能。また、ChatGPTには「皮肉屋」「ロボット」「聞き手」「マニア」の4つの新キャラクター設定が追加された。この発表は、AIが単なるチャットボットから「自律的なエージェント」へと進化する兆しを示しており、AI業界全体の動向を左右する重要な出来事と見られている。

Related Links