Claude Opus 4.1の発表でプログラミング能力が進化、さらなるアップデートが期待される
2025年8月5日、Anthropicはその最強モデルシリーズ「Claude Opus 4.1」を正式リリースした。このアップデートは、前バージョン「Claude Opus 4」からわずか3か月後の発表であり、AI業界の激しい競争下での戦略的発表と位置づけられている。同日、OpenAIが長年非公開だった推論モデルを初公開し、GPT-5の発表が近いと囁かれる中、Anthropicは「継続的な改善」を重視する戦略に転換したと説明。首席製品責任者Mike Kriegerは、過去の「大規模な代わりに」ではなく、「現行製品の進化」を重視する姿勢を示した。 Claude Opus 4.1の主な強化分野は、実世界でのプログラミング能力、自律的なタスク遂行(エージェント機能)、論理的推論の深化。新モデルは、GitHubや楽天グループ、Windsurfといった企業の実証テストでも高い評価を受けている。特にSWE-bench Verifiedテストでは74.5%の成績を記録し、前バージョンの72.5%を上回り、OpenAIのo3(69.1%)やGoogleのGemini 2.5 Pro(67.2%)を上回った。また、Terminal-Benchでは43.3%と、39.2%だった前バージョンから大きく進化。楽天グループは、大規模コードベースでの「正確な修正」に優れ、不要な変更やバグの導入を防ぐ点で実用性を評価。Windsurfは、新モデルが「初心者開発者レベルのベンチマークで1標準偏差の改善」を達成したと報告。これは、Sonnet 3.7から4への進化と同等の飛躍とされる。 価格はOpus 4と同一で、入力100万トークンあたり15ドル、出力は75ドル。API、Amazon Bedrock、Google Cloud Vertex AIを通じて提供され、すべての有料ユーザーとClaude Code利用者に公開。安全性面では、ASL-3(AI安全レベル3)基準を維持。政策違反要求の拒否率は97.27%から98.76%に向上。一方、GPQA DiamondやAIME、MMMUといった一般知能テストでは、競合と互角かやや劣る結果にとどまった。これは、4.1が「プログラミング」に特化した進化であることを示唆する。 商業面では、Anthropicの年間定期収益(ARR)は7か月で10億ドルからほぼ50億ドルに急拡大。特にClaude Codeのサブスクリプションサービスが年間4億ドル規模に達し、短期間で倍増。こうした実績を背景に、Iconiq Capitalが主導する50億ドル規模の資金調達が進行中。估值は1700億ドルに達する見込みで、OpenAIやSpaceXに次ぐ世界最強のユニコーン企業の地位を狙う。 Anthropicは「今後数週間でより大きなモデル改善」を予告。GPT-5への対抗策として、技術とビジネスの両面で一歩を先んじる戦略を進めている。AI競争の高潮期が本格化している。