DeepMind、大規模AIエージェント相互作用の安全性を研究
Google DeepMindは、大規模AIエージェント間の相互作用に伴う安全性リスクに対応するため、1000万ドルの研究基金を設立する。同社はGoogle I/Oでエージェントツールを重点披露した直後、Schmidt Sciences、ARIA、Cooperative AI財団、Google.orgと連携し、本取り組みを共同で推進する。AGI安全・整列責任者のロヒン・シャー氏とパートナー機関のジェームズ・フォックス氏は、自律的に連携するAIエージェントが既存のインターネット上の悪意ある行為を何百倍にもスケールアップさせる可能性を指摘する。特に、エージェント群集が単一の知的モデルを超えた新たな相互作用を生み出し、予期せぬシステム崩壊や経済的混乱を招く临界点に差し掛かっていると警鐘を鳴らす。 現在、この分野は学術的にも産業的にも基盤が未整備である。シャー氏らは、企業ラボが重視する短期成果ではなく、学界が担う长线で独立した研究を促進したい考えだ。大規模リスクの予測には、単一エージェントや小規模テストでは不十分であり、リアルなサンドボックス環境での大規模シミュレーションが不可欠との見解を示す。また、AGIがエージェントの群知能として出現する理論的指摘もあり、安全設計の前提そのものが揺らぐ可能性も視野に入れている。 業界全体の反応も迅速だ。アントロピックはゼロトラスト原則に基づくエージェント導入ガイドラインを公開し、Akeylessのラファエル・エンジェルCTOは、従来の静的コード前提を覆すエージェントの推論・臨機応変性への警戒感を表明した。エンジェル氏は安全基準が単一企業で決まるべきではなく、学界と産業界で協働して策定するべきだと強調する。シャー氏は経済的大規模展開による実害の閾値にあと数ヶ月と推測し、先行研究の充実を急ぐ。フォックス氏は技術の現実化が想定より迅速であるとの認識を共有する。本基金は、マルチエージェント安全性研究分野の創出と、大規模AI社会移行期における業界全体の安全基準整備に寄与すると期待されている。
