HyperAIHyperAI

Command Palette

Search for a command to run...

OpenAI が GPT-5.6 プレビュー版を公開:コード、セキュリティ、エージェント機能の強化を図る 3 つのモデルを一斉に発表

現地時間 6 月 27 日、OpenAI は GPT-5.6 シリーズモデルのプレビュー版を正式に公開した。新シリーズには、高性能推論向けフラッグシップモデル「Sol」、高スループットタスク向けのミドルレンジモデル「Terra」、そしてコストパフォーマンス重視の軽量モデル「Luna」が含まれ、それぞれ異なるユースケースを対象としている。その前日には、トランプ政権からの要請に応じ、OpenAI が新モデルの発表スケジュールを見直し、限定的な範囲で先行テストを実施するとの報道があった。 OpenAI によれば、GPT-5.6 シリーズはコード生成、サイバーセキュリティ、生物学などの専門分野における能力を大幅に強化するとともに、長期間にわたるエージェントタスクでの継続的な推論と実行力を向上させたという。価格面では、フラッグシップモデル Sol の入力はトークン百万単位あたり 5 ドル、出力は同 30 ドルとなっている。Terra の料金は Sol の約半分であり、Luna はさらに低コスト化を図り、より広範な開発者や企業ユーザーに対応している。 基本バージョンに加え、OpenAI は複雑な推論任務向けの「Max」モードと、複数のサブエージェントを連携させて作業を行うことができる「Ultra」モードを含む、Sol のための 2 つの新規稼働モードも追加し、高度なタスク処理能力を一層拡大した。 今回のリリースにおいても、セキュリティが最優先事項として掲げられている。OpenAI は、GPT-5.6 を特別に訓練しており、モデルへのジャイブレイク攻撃や真意を隠す試みなど、不正なネットワーク攻撃リクエストに対して拒否できると説明している。また、Sol は完全なネットワーク攻撃フローを実行するためではなく、開発者がセキュリティ脆弱性を発見・修正するのを支援することに優れているため、社内策定の『準備度フレームワーク』で定義されるようなサイバーセキュリティ上の重大リスクレベルには達していないと同社は述べている。 モデルの安全性を検証するために、OpenAI は自動レッドチームテストに約 70 万 A100e GPU 時間を投じており、第三者のセキュリティ研究者による持続的な評価にも参加してもらっている。関連テストは今後 2 週間にわたり続行予定だ。加えて OpenAI は、現在のプレビュー段階において米国政府から厳格な監督下にあることから、サイバーセキュリティのようなデュアルユース(二重利用)シナリオに関連する一部の正当なリクエストが、セキュリティポリシーにより誤ってブロックされる可能性があることを明かした。これも今回実施されているプレビュー試験の重要な検証項目の一つである。 OpenAI は、GPT-5.6 シリーズが今後数週間以内にさらに多くのユーザーに向けて正式版として提供されると見込んでいる。同社はその際、モデルの広く普及可能な状態を常に目指してきたとし、今回は米政府との協力に基づく限定されたプレビューの実施という特別な措置であったと強調。今後は、政府による個別審査に長期依存するのではなく、より定型的かつ再現性のある承認プロセスを採用してモデルを発表していきたいと考えているとした。

関連リンク