三次元的世界里,机械臂的手活儿也无敌了

6 年前

头条

推荐列表

Dao Wei

特色图像

By 超神经

对于叠叠乐(Jenga)这种积木游戏,想必很多人都深有体会,因为稍有不慎,辛辛苦苦堆起来的积木塔就毁于一旦。这样的事情,交给 AI 和机器人来做,会怎么样呢?

似乎研究人工智能的团队,总喜欢通过游戏找到突破口,麻省理工学院的团队研发出来的机械臂,也从三次元世界的游戏开始。

叠叠乐,一般是把积木条先将木块三根为一层,交错叠高成塔,然后从下部抽取积木,放到塔顶,创造一个更高的积木塔。

叠叠乐游戏是对耐心、平衡、力度等多方面的考验,对很多人来说,(尤其是容易手抖的同学)这个游戏实在是太难了。而 MIT 研制出的这个机器人,则通过探测、算法结合推拉、对齐等操作,轻松的攻克了这个任务。

它究竟是何方神圣?

人类总会说自己「手抖」,所以机械臂的研究就是为了完成一些精细化或者高危的操作。项目团队成员之一,MIT 机械工程系的助理教授 Alberto Rodriguez ,指出这个机器人的关键在于,它把视觉和触感完美的结合了起来。

但从外观上看,这个机器人和一些常见的应用型机器类似,像一个普普通通的机械臂,但它配备了一个软齿状夹持器、一个力感应腕带和一个外部摄像头,这相当于给它赋予了手,触感和眼睛。

在工作时,夹持器用来操作积木,也能反馈触感;感应腕带用来控制操作积木的力度的力感;摄像头用来收集视觉图像。

除了拥有这些让机器人能够灵活移动积木的外形,它最关键的还是拥有和之前机器人不一样的「灵魂」——研究人员使用新的算法让它变得更擅长这项工作。

根据 MIT 研究人员的介绍,这款机器人没有使用传统的 AI 学习方法,而是创造性的使用了分层模型动态,去建立一个聚类学习模型。这样做的好处是不再依赖大量的数据,而是能够根据反馈的数据,作出实时的分析,边接触探测,边预测移动下一块积木的方案。

它是怎样玩叠叠乐的?

事实上,机器人能够处理看起来复杂的叠叠乐游戏,关键用到了聚类学习。

传统的思路去解决这个游戏,就是把积木、机器人、积木塔之间会发生的所有关系都收集起来,从而计算出最好的方式。但这明显会带来海量的数据,而且计算难度也大大提升。

而这个研究中,选择了让机器人去模仿人类玩游戏的方式。首先是通过尝试,对数据标注和聚类。然后通过和标记的数据对比判断新操作的可行性。

首先让机器人面对一个积木塔,随机的选择积木块并按一个比较小的力度推出,对于每次推出和抽积木的操作,计算机会记录下相应的视觉和力度数据,并和操作的结果一起标注出来。

这个研究中用了约 300 次尝试,就积累到了足够的数据,然后就就是对数据进行处理。这里用到了聚类处理。要把数据和结果类似的操作分为一组,表示特定的积木行为。

不同的组代表了不同的可操作程度,这也是了衡量每个操作的标准。比如一组数据代表机器人在难以移动的积木上的尝试,而另一组数据则代表一个比较容易移动的积木上的尝试。

而每一个不同的数据集,再相应的给出一个简单的模型,结合这些模型,机器人相当于学会了实时的学习。

最后,就可以进行实际演练,机械臂在推出积木块时,利用摄像头和腕带去接受视觉和触觉信息,然后把接收到的这个反馈和之前的数据作对比,如果数据对应到好的结果,就执行这个操作,如果会有倒塌的危险,就放弃此操作。

并不只是叠叠乐

MIT 的研究人员指出,虽然在研究中实现了机器人玩这个个游戏,但要是拿来和人类高手比赛,估计还需要一些改进。因为在这个研究中, AI 机器人重点解决的是物理交互问题,解决了这块积木能不能抽出来,摆上去之类的问题。但叠叠乐的游戏还需要一些策略,这就涉及到考虑和分析关联步骤。

但 MIT 的这个研究团队明显没有这个想法,或许对他们来说,制造出一个玩叠叠乐的高手并没有太多的价值。根据团队研究人员 Rodríguez 的说法,正在考虑把这项技术用在实际的工作环境中,比如应用在制造装配线的机器人等领域。

等等啊喂,就这么个简单的益智小游戏,我们可能还比不过它,人家就不跟我们人类玩了。眼看着它要去做更了不起的事情,Emmmm,算了,还是让我们被过年的美食淹没着吧。