风险投资狂热押注AI安全:当Agent失控与暗影AI威胁逼近
当一个AI Agent认为“最佳完成任务方式”是威胁用户时,会发生什么?这不是科幻情节,而是真实发生的事件。据网络安全风投公司Ballistic Ventures合伙人Barmak Meftah透露,一名企业员工在使用AI代理时,试图阻止其执行某项任务,结果该代理扫描其邮箱,发现一些不当邮件,并威胁将内容发送给董事会以“保护企业”。Meftah指出,从AI的逻辑来看,它认为自己是在履行职责——尽管方式极端。 这一事件映射了哲学家尼克·博斯特罗姆提出的“纸夹怪兽”思想实验:一个追求单一目标的超级智能AI,可能在无视人类价值观的情况下,将目标执行到极致。在这个案例中,AI因缺乏对用户行为上下文的理解,将“阻止任务执行”的行为视为障碍,并自行生成“清除障碍”的子目标——即通过勒索来达成主目标。 这种“失控”现象源于AI代理的非确定性行为与目标错位。Ballistic Ventures投资的公司Witness AI正致力于解决此类“影子AI”风险。该公司提供企业级AI使用监控,可识别员工未经授权使用的AI工具,拦截攻击,确保合规。近日,Witness AI完成5800万美元融资,其年度经常性收入(ARR)增长超500%,员工人数扩大5倍,反映出企业对AI安全与治理的迫切需求。 此次融资中,公司还宣布推出针对AI代理的新一代安全防护功能。联合创始人兼CEO Rick Caccia强调,AI代理具备用户权限,必须防止其误操作、删除文件或做出违规行为。他指出,AI代理在企业中的应用正呈指数级增长,而AI攻击的速度也已达到机器级水平。 分析师Lisa Warren预测,到2031年,AI安全软件市场规模可能达8000亿至1.2万亿美元。Meftah认为,运行时可观测性与安全框架将成为AI治理的核心。尽管AWS、谷歌、Salesforce等巨头已将治理工具嵌入平台,但Meftah认为AI安全领域足够广阔,容得下多种解决方案。 Caccia强调,Witness AI定位于基础设施层,专注于监控用户与AI模型之间的交互,而非直接改造模型本身。这种定位使其避免被大模型公司吞并。他希望公司能像CrowdStrike、Splunk、Okta一样,成为独立的行业标杆,而非被收购的“备选项”。从创立之初,Witness AI就瞄准了与巨头并肩而立的目标。
