HyperAIHyperAI

Command Palette

Search for a command to run...

微软推出 Fara-7B:主打小型化端侧智能体

微软于 2024 年向社区开源了名为 Fara-7B 的本地化智能体模型,这标志着 AI 计算机操作能力从云端向终端设备的重大转变。这是一款拥有 70 亿参数的小型语言模型,专为在本地设备上通过视觉交互完成网页浏览和计算机任务而设计。 与传统依赖复杂云端架构的代理不同,Fara-7B 采用“感知 - 推理 - 行动”的闭环逻辑。它直接基于屏幕截图进行工作,通过预测鼠标和键盘的坐标来执行点击等操作,无需辅助的无障碍树解析或第二层模型转换。该模型基于开源架构 Qwen2.5-VL 微调,训练数据来源于微软 Magentic-One 框架生成的 14.5 万条合成任务轨迹,实现了小模型处理复杂任务的“蒸馏”效果。 在功能实现上,Fara-7B 被设计为在遇到“关键节点”(如结账、支付或输入敏感信息)时自动暂停并请求用户确认,这一安全机制已内嵌于其训练数据中。尽管模型体积小巧且能在单张 24GB 显卡甚至普通工作站上运行,但其安全性并未降低。由于视觉感知与直接操作控制合二为一,该模型同样面临输入注入、语义操纵等潜在攻击风险,因此微软强调目前需仅在沙盒环境中测试,且不得用于高风险领域。 Fara-7B 的发布意味着计算机操作代理不再局限于昂贵的云端系统。它证明了小型模型配合本地推理即可构建实用工具,改变了以往依赖多智能体协作和云端交互的部署模式。虽然当前基准测试表现优异,但从实验室到大规模实际应用的落地仍有差距。未来,利用合成数据进行模型蒸馏或将成主流训练范式,Fara-7B 的成功为构建更普及、更低成本的通用智能体指明了方向。

相关链接

微软推出 Fara-7B:主打小型化端侧智能体 | 热门资讯 | HyperAI超神经