多数AI聊天机器人存在安全漏洞 专家呼吁加强披露机制
一项由剑桥大学领衔的研究发现,当前主流AI聊天机器人、浏览器助手和企业自动化工具普遍存在基本安全信息披露严重不足的问题,安全透明度“严重滞后”。该研究通过对30个前沿AI代理进行评估,揭示了AI技术快速融入日常生活的同时,风险管控机制却明显缺位。 研究团队来自剑桥大学、MIT、斯坦福大学及希伯来大学,成果发布于arXiv预印本平台。他们构建的“AI代理指数”(AI Agent Index)对全球主流AI代理进行系统性评估,涵盖能力、透明度与安全性三大维度。结果显示,仅有4个AI代理发布专门的“系统卡片”——即包含自主性水平、行为规范和现实风险分析的正式安全文档。 更令人担忧的是,25个代理未披露内部安全测试结果,23个未提供第三方安全测试数据,而这些才是评估AI风险的关键实证依据。仅5个代理公开了已知安全事件或隐患,其中仅2个记录了“提示注入漏洞”——即恶意指令可诱使AI绕过安全限制。 在5个中国AI代理中,仅1个发布过任何安全框架或合规标准。研究负责人、剑桥大学莱弗休姆未来智能中心的Leon Staufer指出,许多开发者仅强调底层大语言模型的安全性,却对上层AI代理的规划、工具调用、记忆机制和策略等关键安全特性避而不谈。实际上,13个代理已具备“前沿级”自主性,但仅有4个披露了自身安全评估。 研究还发现,AI代理存在“安全洗白”现象:开发者热衷于发布宽泛的安全声明,却缺乏可验证的实证数据。与此同时,他们对自身能力的披露远多于安全信息,形成显著的“透明度不对称”。 尤其值得关注的是,AI浏览器代理和企业级自动化工具的安全信息缺失最为严重:前者64%的安全字段未披露,后者达63%。这些代理常以“类人行为”自动执行购票、填表、登录等真实世界任务,却极少向用户或网站表明AI身份。仅3个代理支持AI生成内容的水印标识。另有至少6个代理使用伪装成人类的代码与IP地址,绕过反爬机制,使网站无法区分真实用户、合法AI代理与恶意爬虫。 典型案例Perplexity Comet被指为高风险代理,其宣称“像真人助手一样工作”,但亚马逊已就其未标明AI身份提出法律警告。研究指出,此类代理一旦被攻击,可能立即造成购买、账户泄露等现实后果。去年已有研究发现,网页恶意内容可劫持浏览器代理执行非法指令,或窃取用户关联服务的隐私数据。 Staufer强调,当前AI代理的自主性与现实影响力迅速提升,但安全评估、透明披露与治理框架却严重滞后。若不及时建立标准,潜在风险可能在被暴露前已造成广泛损害。
