HyperAIHyperAI

Command Palette

Search for a command to run...

アンソロピック、オパス 4.8 を迅速に反復更新し「自己修正」機能を強化

今週木曜日、Anthropic は現時点で最も先進的な公開モデル「Opus 4.8」を標準価格にて正式に発表した。今回のリリースは前バージョンである Opus 4.7 の発売からわずか 41 日後であり、Anthropic のイテレーション記録を更新した(一方、Sonnet と Haiku はそれぞれ過去 3 ヶ月と 7 ヶ月にわたって運用されている)。業界ではこの異常なまでの速さでの新作投入について、市場における Opus 4.7 の反応の冷たさと、OpenAI(Codex)および Google(Gemini Flash)からの高まる競争圧力が一因であると推測している。 過去のモデルとは異なり、Opus 4.8 の特徴は単なるトップクラスのベンチマークスコアだけでなく、「不確実性」に対する正確な制御能力にある。Anthropic の初期テストによると、新モデルは無根拠な断定を下すのではなく、自らの分析に含まれる不確定要素を積極的に標識化する傾向があることが示された。ブリッジウォーター・アソシエイツ(Bridgewater Associates)からのフィードバックはこの点を裏付けており、ユーザーらは Opus 4.8 が入力と出力内の潜在的な問題を自ら検出・排除し、他社モデルが陥りがちな見落とし領域を効果的に埋めると指摘している。 さらに Anthropic は、大規模モデルを用いて数百もの並列エージェント間で行われる複雑なタスクの管理を目的としたダイナミックワークフロー(Dynamic Workflows、研究プレビュー段階)も同時に発表しました。公式事例によれば、Claude Code を用いた場合、Opus 4.8 は起動からマージまでを含む全工程を自動化して、最大 10 万行規模の大規模コードベース移行を独自に行うことができるようになっている。 注目を集める最高峰モデル「Mythos」については依然としてサイバーセキュリティ上の懸念により制限付きプレビュー状態が続いているものの、同社はアナウンス内でその制限解除を示唆しており、「現在、関連するセキュリティ対策を着実に整備中であり、今後数週間以内にすべてのユーザー向けに Mythos レベルのモデルを提供できる体制を整える予定だ」と述べている。

関連リンク