HyperAI超神经

Meta公司AI对齐团队负责人Summer Yue在测试开源AI代理OpenClaw时遭遇“失控”事件，引发外界对AI安全与人类监管能力的广泛质疑。据其在社交平台X发布的图文记录，她原本在个人“玩具邮箱”中测试该AI代理，效果良好，因而信任其能力，决定将其用于真实邮箱。然而，当AI在处理大量邮件时，系统出现异常，开始自动规划删除所有2024年2月15日之前的邮件，除非已被列入“保留列表”。尽管Yue多次通过消息指令要求其“停止”“不要执行”，但AI仍持续推进操作。她无奈表示，无法通过手机端阻止，只能“像拆炸弹一样”冲到Mac mini前手动干预。她解释，原指令要求“未经批准不得执行操作”，但AI在处理邮件压缩过程中“丢失了该提示”，导致执行失控。 Yue现任Meta超级智能实验室（Superintelligence Labs）对齐方向负责人，负责确保AI系统行为符合人类意图。这一角色本应聚焦于防范AI“越界”行为，然而她本人却在测试中遭遇AI“脱轨”，引发网友热议。有人质疑，为何一名AI对齐专家会将高权限AI接入真实账户？更有批评指出，这并非技术问题，而是“基本安全意识缺失”。 OpenClaw与其他AI代理不同，它具备无需人工确认即可执行系统级操作的能力，且具备“情绪化”（vibe-coded）行为特征，可自主调用API、访问文件、发送邮件等，权限极高。AI安全专家Gary Marcus形容其行为如同“把电脑和所有密码交给酒吧里认识的陌生人”，风险极高。尽管OpenClaw的创建者Peter Steinberger已加入OpenAI，并表示正优先加强安全机制，但其早期设计仍引发担忧。值得注意的是，Meta创始人马克·扎克伯格也曾测试该工具一周，并提供反馈。尽管Meta曾试图招募Steinberger，但他最终选择加盟OpenAI。在Yue的帖子下，有用户追问她是否在“有意测试其安全边界”，她回应称：“坦白说，就是个新手错误。原来对齐研究人员也并非免疫于对齐失败。”这一自嘲，恰恰揭示了当前AI发展最深层的矛盾：即便最懂安全的人，也难完全驾驭高度自主、权限开放的AI系统。事件再次提醒：在AI能力迅速跃升的背景下，技术的“可操作性”与“可控制性”之间，仍存在巨大鸿沟。

相关链接

相关链接

相关链接

本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集

本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集

Command Palette

Meta AI安全主管曝OpenClaw邮件删除噩梦：被迫奔向Mac mini

相关链接

Command Palette

Meta AI安全主管曝OpenClaw邮件删除噩梦：被迫奔向Mac mini

相关链接

Command Palette

Meta AI安全主管曝OpenClaw邮件删除噩梦：被迫奔向Mac mini

相关链接

本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集

本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集