3 个月前

Qiushi Sun Mukai Li Zhoumianze Liu Zhihui Xie Fangzhi Xu Zhangyue Yin Kanzhi Cheng Zehao Li Zichen Ding Qi Liu

摘要

基于视觉-语言模型（VLMs）的计算机操作代理在操控移动平台等数字环境方面已展现出类人能力。尽管这类代理在推动数字自动化方面具有巨大潜力，但其可能引发的不安全操作行为，如系统入侵和隐私泄露，正引发广泛关注。在移动环境庞大而复杂的操作空间中识别这些安全风险，构成了一个极具挑战性的问题，目前仍处于严重研究不足的状态。为建立移动代理安全研究的基础，我们提出了MobileRisk-Live——一个动态沙箱环境，并配套构建了一个安全检测基准，包含具有细粒度标注的真实操作轨迹。基于此，我们进一步提出OS-Sentinel，一种新型的混合式安全检测框架，该框架通过形式化验证器（Formal Verifier）协同检测显式的系统级违规行为，同时结合基于VLM的上下文判别器（Contextual Judge）评估上下文风险与代理行为。实验结果表明，OS-Sentinel在多个指标上相较现有方法实现了10%至30%的性能提升。进一步分析揭示了关键洞见，为开发更安全、更可靠的自主移动代理提供了重要指导。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

3 个月前

Qiushi Sun Mukai Li Zhoumianze Liu Zhihui Xie Fangzhi Xu Zhangyue Yin Kanzhi Cheng Zehao Li Zichen Ding Qi Liu

摘要

基于视觉-语言模型（VLMs）的计算机操作代理在操控移动平台等数字环境方面已展现出类人能力。尽管这类代理在推动数字自动化方面具有巨大潜力，但其可能引发的不安全操作行为，如系统入侵和隐私泄露，正引发广泛关注。在移动环境庞大而复杂的操作空间中识别这些安全风险，构成了一个极具挑战性的问题，目前仍处于严重研究不足的状态。为建立移动代理安全研究的基础，我们提出了MobileRisk-Live——一个动态沙箱环境，并配套构建了一个安全检测基准，包含具有细粒度标注的真实操作轨迹。基于此，我们进一步提出OS-Sentinel，一种新型的混合式安全检测框架，该框架通过形式化验证器（Formal Verifier）协同检测显式的系统级违规行为，同时结合基于VLM的上下文判别器（Contextual Judge）评估上下文风险与代理行为。实验结果表明，OS-Sentinel在多个指标上相较现有方法实现了10%至30%的性能提升。进一步分析揭示了关键洞见，为开发更安全、更可靠的自主移动代理提供了重要指导。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供