HyperAIHyperAI

Command Palette

Search for a command to run...

MosaicLeaks揭示深度研究智能体隐私泄露风险

近日,由亚历山大·古荣等学者发表的研究指出,深度研究类人工智能智能体在结合私有文档与外部网络检索时,存在严重的隐私泄露隐患。研究团队提出 MosaicLeaks 基准测试,通过构建千余条交织内部数据与公开信息的跨步查询链,证实了智能体在多次网络检索中产生的拼凑效应,足以让旁观者从查询日志中逆向还原企业核心机密。实验发现,单纯依赖提示词约束或仅优化任务完成率的训练模式均告失败,后者甚至因查询内容更丰富而导致泄露率从百分之三十四点零激增至百分之五十一。 为破解此难题,研究提出隐私感知深度研究强化学习框架。该框架引入情境任务奖励与动态隐私风险评估,在模型训练中对高风险查询规划进行精准惩罚。测试结果证实,该方案在保持百分之五十八点七严格任务成功率的同时,将答案及全信息泄露率大幅压降至百分之九点九,不仅优于基线模型,且训练样本效率提升近六倍。该研究明确,智能体隐私保护无法依靠提示词实现,必须将安全边界深度内化于强化学习奖励机制中,以兼顾高算力性能与企业数据合规。

相关链接