HyperAIHyperAI

Command Palette

Search for a command to run...

Hugging Face 推出高效机器人模型 SmolVLA,可在 MacBook 上运行并支持异步推理

Hugging Face于本周早些时候发布了一个名为SmolVLA的开放机器人模型。该公司声称,SmolVLA不仅在虚拟和现实环境中表现优于更大规模的机器人模型,而且其设计目的是为了实现对视觉-语言-行动(VLA)模型的广泛访问,从而加速通用机器人代理的研究进程。SmolVLA拥有4.5亿参数,相比其他复杂模型更为轻巧,能够在单个消费者级别的GPU上运行,甚至在一台MacBook上也能顺利运行。 这次发布的SmolVLA是Hugging Face不断发展的低成本机器人硬件和软件生态系统的一部分。去年,该公司推出了LeRobot,这是一个专注于机器人的模型、数据集和工具库。近期又收购了位于法国的机器人技术初创公司Pollen Robotics,并推出了一系列经济实惠的机器人系统,包括人形机器人。 SmolVLA的训练数据来自LeRobot社区共享的数据集,这些专门标记的数据集由Hugging Face的AI开发平台用户共享。Hugging Face强调,该模型不仅能用相对廉价的硬件进行测试和部署,还支持异步推理堆栈,使得机器人的行动处理与视觉和听觉处理相分离,从而在快速变化的环境中更快响应。 尽管SmolVLA还在初期阶段,但已经展现了其潜力。一位用户在社交平台上X上分享,他们成功利用SmolVLA控制了一款第三方机械臂。这再次证明了Hugging Face在推动开放机器人领域发展和降低准入门槛方面的努力取得了显著成效。 值得注意的是,在开放机器人竞技场上,Hugging Face并非一枝独秀。竞争对手如Nvidia也提供了相应的工具集合,K-Scale Labs正在构建所谓的“开源人形机器人”的组成部分,此外还有Dyna Robotics、Jeff Bezos投资的Physical Intelligence以及RLWRLD等公司活跃于这一领域。这些公司的存在表明开放机器人市场正在迅速成长,吸引着众多顶尖企业和研究机构的参与,为未来技术的普及和创新奠定了坚实的基础。 业内人士认为,Hugging Face发布的SmolVLA是一个重要的里程碑,标志着低成本、高性能的VLA模型即将成为现实。随着市场上更多企业和研究团队加入这一领域,开放机器人技术的发展将有望迎来更快的突破,降低科研和技术落地的成本,让更多的个人和小型团队能够参与到高尖端的机器人技术研发中来。Hugging Face通过推出一系列工具和模型,不仅加快了机器人技术的进步,也为整个AI行业带来了新的活力。

相关链接