HyperAIHyperAI

Command Palette

Search for a command to run...

Claude の新モデル、失敗時に「正直」さを強化

アンソロピックは木曜日に最新モデルの「Claude Opus 4.8」をリリースし、このモデルの特徴として「誠実さ」の大幅な向上を打ち出しました。同社によると、全てのモデルは裏付けのない主張を避けるようトレーニングされていますが、従来の AI は証拠が薄いにもかかわらず確信を持って結論を導く傾向がありました。Opus 4.8 はテスト段階において、自身の作業における不確実性をより強く指摘し、裏付けのない主張をする可能性が低減したことが確認されています。具体的な評価では、同モデルが作成したコードの不具合を見落とし、そのまま放置する確率が前世代と比較して約 4 分の 1にまで減少しました。 機能面では、ユーザーがタスクに対する処理の強さを調整できる新機能が追加されました。高負荷の処理には多くのトークンを使用するため、リソース節約を優先する場合は低負荷の回答を選択可能です。また、研究プレビューとして「ダイナミック・ワークフロー」と呼ばれる新機能が導入されます。これは Claude が大規模なタスクを自ら計画し、単一のセッション内で数百の並列サブエージェントを実行できる技術です。Opus 4.8 ではこれらのエージェントがさらに長時間動作可能となり、実行後の出力を検証してからユーザーに報告するまでの一連の処理が自動化されます。これにより、複雑で大規模なタスクへの対応力が大幅に強化されました。アンソロピックは、今回のアップデートにより、AI がより責任ある判断を行い、ユーザーの信頼を損なうことなく複雑な問題解決に貢献できると主張しています。技術の進歩に伴い、AI の出力の質と透明性を両立させるための重要なステップとなる見通しです。

関連リンク