Anthropic、コード作成に特化した新AIモデルClaude Sonnet 4.5を発表。30時間連続で複雑なタスクを処理し、AIエージェント開発での優位性を強化。
2025年9月29日、Anthropicは最新のAIモデル「Claude Sonnet 4.5」を発表し、世界で最も優れたAIコーディングシステムであると宣言した。このモデルは、わずか4か月前にリリースされたSonnet 4の後継であり、同社の急速な製品開発サイクルを示すものだ。Sonnet 4.5は、実際のソフトウェア開発の品質を評価する基準「SWE-Bench Verified」で77.2%のスコアを達成し、並列実行(parallel test-time compute)を活用すれば82%まで向上。これは、OpenAIのGPT-5 Codex(74.5%)やGoogleのGemini 2.5 Pro(67.2%)を上回る水準であり、実用的なコード生成能力の飛躍を示している。 特に注目すべきは、Sonnet 4.5が「生産準備完了」(production-ready)のアプリケーションを自ら構築できる点だ。内部テストでは、SlackやTeamsに類似したチャットアプリを1.1万行のコードで開発し、データベース構築、ドメイン取得、セキュリティ監査まで一貫して実行。著名なAIブロガーのSimon Willison氏も、自身のコードベースをクローンし、対話履歴を木構造に変更する複雑な変更をAIに任せ、22のテストすべてに合格させたと報告している。また、OSWorldテストでは61.4%、Terminal-Benchでは50%のスコアを記録し、リアルなデスクトップ操作やコマンドライン制御の能力も顕著に向上。 さらに、Sonnet 4.5は最大30時間にわたって自律的にタスクを継続可能で、Opus 4の4倍以上の持続性を実現。これは、長時間にわたる開発プロセスや複雑なプロジェクト管理に不可欠な要素だ。同社は、開発者向けに「Claude Agent SDK」を正式リリース。このSDKは、AIエージェントの長期記憶、権限管理、複数エージェント間の連携といった課題を解決するための基盤を提供し、開発者に高度なAIアプリケーション構築を可能にする。また、VS Codeプラグイン、チェックポイント機能、強化されたターミナルワークフローも追加され、開発体験の質が大幅に向上している。 ビジネス面では、Claude Codeの年間運転収益(run-rate revenue)が5億ドル以上に達し、3か月間で10倍に拡大。同社は、AIコーディング分野でOpenAIやGoogleをリードする存在となりつつある。安全性面でも、同社は「これまでで最も対齊(alignment)されたモデル」と位置づけ、提示注入攻撃や不正行為のリスクを低減。ただし、一部のセキュリティ研究者が短時間で安全バリアを突破した事例もあり、誤検出の問題も残っている。 価格はSonnet 4と同様、入力100万トークンあたり3ドル、出力15ドル。GPT-5より高価だが、Opusよりは安価で、プロフェッショナルな開発者層に訴求する戦略が明確だ。Anthropicは、単なる「モデル提供」から「プラットフォーム提供」へと進化し、開発者エコシステムの構築を加速している。今後、GoogleのGemini 3やOpenAIのGPT-5の次世代モデルが登場する中、AIの実用化を支える「信頼性・使いやすさ・持続性」の面で、Anthropicの優位性が問われる。