GPT-5.1-Codex-Max登場:長時間・大規模なコード作業を可能にする次世代AIコーディングモデル
OpenAIは、新たなエージェント型コーディングモデル「GPT‑5.1-Codex-Max」を発表した。このモデルは、ソフトウェア開発、数学、研究など幅広い分野におけるエージェントタスクを学習した基礎モデルを基盤としており、開発サイクルの各段階でより高速かつ知能的で、トークン効率も向上している。特に、複数のコンテキストウィンドウを連携して処理する「コンパクション」という技術により、1つのタスクで数百万トークンにわたる長時間の作業が可能になった。これにより、大規模なリファクタリングや長時間にわたるエージェントループ、深いデバッグが実現可能となった。 GPT‑5.1-Codex-Maxは、CodexのCLI、IDE拡張、クラウド環境、コードレビュー機能で利用可能で、APIアクセスも近日中に提供予定。実際の開発タスク、例えばPR作成、コードレビュー、フロントエンド開発、Q&Aにおいて、従来モデルを上回る性能を発揮。特にSWE-Bench Verifiedでは77.9%の正解率を達成し、前モデルより30%の思考トークン削減で同等以上の結果を実現。非遅延系タスク向けに「Extra High(xhigh)」の推論モードも導入され、より高精度な出力を可能にした。 このモデルは、Windows環境での動作を標準的にサポートしており、Codex CLIでの協働性も強化されている。また、セキュリティ面では、デフォルトでセキュアなサンドボックス環境で動作し、ファイル書き込みはワークスペース内に制限。ネットワークアクセスは開発者が明示的に有効化する必要がある。AIの悪用リスクを防ぐため、専用のサイバーセキュリティ監視を導入。過去に不正利用の試みが検出され、対応済み。AIが生成したコードは、人間のレビューを代替するものではなく、あくまで補助的であると明言。コードレビュー機能はバグの検出を支援するが、最終判断は開発者に委ねられる。 GPT‑5.1-Codex-Maxは、ChatGPT Plus、Pro、Business、Edu、Enterpriseプランのユーザーに提供され、Codexのデフォルトモデルとして導入された。開発者向けに、内部評価では95%のOpenAIエンジニアが週次で利用し、導入後はプルリクエストの出荷数が約70%増加した。このモデルは、AIが長期間にわたって自律的に作業を継続し、テスト失敗を修正して成果を出す能力を示しており、今後のAIエージェント開発の重要な一歩となっている。
