Anthropic、最新モデルSonnet 4.6をリリースへ
アントロピックは、中規模モデル「Sonnet 4.6」の新バージョンをリリースした。これは同社の四か月ごとの更新サイクルに沿ったもので、無料プランおよびプロプランのユーザーのデフォルトモデルとして採用される。このリリースは、わずか2週間前に発表された「Opus 4.6」に続くものであり、今後数週間以内に「Haiku」モデルのアップデートも予定されている。Sonnet 4.6の最大の特徴は、100万トークンのコンテキスト窓の導入である。これは従来の最大サイズの2倍に相当し、1つのリクエストでコードベース全体や長大な契約書、数十本の研究論文を一度に処理できるという点で、実用性の飛躍的向上を示している。 この拡張されたコンテキスト能力は、特にソフトウェア開発や長文分析、法律文書処理などの分野で大きな利点をもたらす。アントロピックは、新モデルが「コード生成」「指示理解」「コンピュータ操作」の分野で顕著な改善を遂げたと強調しており、実際のベンチマークテストでもその実力を裏付けている。特に注目すべきは、コンピュータ操作を評価する「OS World」テストと、ソフトウェアエンジニアリングを測る「SWE-Bench」での優れたスコアである。さらに、人工一般知能(AGI)に近い能力を測る「ARC-AGI-2」テストでは60.4%のスコアを記録し、同クラスの他のモデルを上回る結果となった。ただし、同社の最上位モデル「Opus 4.6」やGoogleの「Gemini 3 Deep Think」、一部のGPT-5.2の改訂版にはまだ及ばない。 Sonnet 4.6の登場は、中規模モデルが大規模モデルと比べて競争力を保つための重要な転換点と見なされている。これまで中規模モデルはパフォーマンスの面で制限があったが、100万トークンという巨大なコンテキスト窓により、実際の業務現場での応用が広がる。特に、開発者が一度に複数のファイルを参照しながらコードを書く、あるいは法律専門家が複数の契約条項を比較分析するといったユースケースが可能になる。 アントロピックは、この進化を「より自然な人間の認知プロセスに近づける」と位置づけており、今後は「ユーザーがモデルに『考えさせること』」を重視した設計を進めるとしている。業界関係者からは、「中規模モデルがこれほど高機能になるとは予想外だった」との声も上がっている。アントロピックは、安全性と信頼性を重視したAI開発を掲げており、Sonnet 4.6もその理念を踏襲している。今後の展開として、Haikuモデルのアップデートや、さらに高い性能を持つモデルの開発が期待される。このように、アントロピックは中規模モデルの限界を再定義する動きを進め、AIの実用化の速度を加速させている。
