アンソトロピック、Fable 5の危険トピックを制限
アンストロピック、新モデルFable 5の安全保障制約を強化 人工知能開発企業のアンストロピックは、次世代言語モデルFable 5において、サイバーセキュリティ、生物学、化学に関する問い合わせに対して応答を制限する新たな安全性プロトコルを導入したと発表した。同モデルは、これらの専門分野が誤用された場合に生じる潜在的な実害が過度に高いため、意図的に情報提供を拒否する設計方針を採用している。 アンストロピックの今回の決定は、高度なAIシステムにおける責任ある開発の枠組みを再定義する動きと捉えられる。Fable 5は汎用推論能力の向上を目指して構築されたものの、生体兵器の設計手法、マルウェアの作成・解析、危険化学物質の合成プロセスなど、直接的な実害を招き得る具体的な技術情報へのアクセスを厳格にブロックする仕組みが実装された。同社は、認証済みセキュリティ研究者や倫理規準を遵守する開発者に対しては、目的検証を通じた限定的な情報提供経路を別途確保する意向を示している。 本制約の実施により、Fable 5の商用・研究利用における倫理ガイドラインが明確化された。ハイパーリスク分野におけるAIの活用範囲が画定的に定義されることで、悪用防止と科学技術の進展のバランスを取る新たな基準が提示された。業界関係者は、防御メカニズムの堅牢性を評価しつつ、今後のモデル更新における柔軟な調整可能性に注目を寄せている。 アンストロピックは今後、これらの制約範囲を定期的に見直し、科学的進歩と公共の安全を両立させるための透明性レポートを公開する計画である。AI安全性の議論を先導する同社の姿勢は、大規模言語モデルのガバナンスにおける標準的な指針形成に引き続き影響を与えるものと見られる。
