Anthropic、Opus 4.5を発表 Chrome・Excel連携と無限チャット対応でエージェント用途を強化
Anthropicは11月18日、同社の主力モデル「Opus 4.5」のリリースを発表した。これは4.5シリーズの最終版であり、9月の「Sonnet 4.5」、10月の「Haiku 4.5」に続く最新版。Opus 4.5は、コード生成(SWE-Bench、Terminal-bench)、ツール活用(tau2-bench、MCP Atlas)、一般問題解決(ARC-AGI 2、GPQA Diamond)といった多岐にわたるベンチマークで最先端の性能を示した。特に注目すべきは、SWE-Bench Verifiedで80%以上のスコアを達成した点。これは、同ベンチマークで過去最高の成績であり、AIによるコード生成の信頼性が一段と高まったことを示す。 同モデルは、コンピュータ操作とスプレッドシート処理の強化にも注力。これに伴い、これまで限定的に提供されていた「Claude for Chrome」および「Claude for Excel」が、一般利用可能に。Chrome拡張機能は「Max」ユーザー向け、Excel用モデルは「Max」「Team」「Enterprise」ユーザー向けに提供される。 また、長文処理における記憶管理の改善が実現。長文の理解と記憶保持能力が向上し、「無限チャット」機能が導入された。これは、モデルがコンテキストウィンドウに達しても、ユーザーに知らせずに記憶を圧縮し、会話の継続を可能にする仕組み。この機能は、長期間にわたる作業や複雑なドキュメントの扱いに不可欠な「作業記憶」の強化に起因する。 Anthropicのプロダクトマネジメント責任者、Dianne Na Penn氏は、「長さだけでは不十分。何を記憶すべきかを判断する能力が重要だ」と強調。これは、Opus 4.5が複数のHaikuモデルを制御する「エージェント主導のタスク」を担うための基盤となる。 Opus 4.5は、OpenAIのGPT-5.1(11月12日リリース)やGoogleのGemini 3(11月18日リリース)といった最新モデルと、強力な競争関係にある。しかし、その記憶管理と実用性の強化により、特にビジネス現場でのエージェント活用において、独自の優位性を発揮する可能性がある。
