谷歌AI漏洞赏金计划最高奖励3万美元,激励安全专家发现潜在风险
6 天前
谷歌于周一推出一项专门针对AI产品漏洞的赏金计划,最高奖励可达3万美元。该计划旨在鼓励安全研究人员发现并报告可能被恶意利用的AI系统漏洞,特别是那些能引发“越界行为”的严重问题。 谷歌明确列出了符合条件的AI漏洞类型,例如通过精心设计的提示(prompt)间接操控AI系统,导致Google Home擅自解锁门锁,或通过提示注入攻击,让AI自动提取并发送用户全部邮件摘要至攻击者账户。其他典型问题包括利用被污染的Google日历事件远程开启智能百叶窗或关闭灯光等。这些行为均属于“越界操作”,即利用AI模型的缺陷对用户账户或数据造成实际损害。 值得注意的是,单纯的AI“幻觉”(如生成错误信息)并不符合奖励标准。谷歌强调,若发现AI生成仇恨言论、侵犯版权等内容,应通过产品内反馈渠道提交,由其AI安全团队分析并优化模型的长期安全训练。 此外,谷歌同步发布了名为CodeMender的AI辅助工具,可自动识别并修复开源项目中的安全漏洞。该工具在人类研究人员审核后,已成功为72个开源项目完成安全修复。 赏金奖励主要面向谷歌核心产品,如搜索、Gemini应用及Gmail、Drive等Workspace核心服务,最高奖励2万美元。根据报告质量、创新性等因素,还可获得额外奖励,总金额最高可达3万美元。对于其他产品(如Jules、NotebookLM)或较轻微的漏洞(如窃取模型参数),奖励金额则相应降低。