三次元的世界里，机械臂的手活儿也无敌了

7 年前

By 超神经

对于叠叠乐（Jenga）这种积木游戏，想必很多人都深有体会，因为稍有不慎，辛辛苦苦堆起来的积木塔就毁于一旦。这样的事情，交给 AI 和机器人来做，会怎么样呢？

似乎研究人工智能的团队，总喜欢通过游戏找到突破口，麻省理工学院的团队研发出来的机械臂，也从三次元世界的游戏开始。

叠叠乐，一般是把积木条先将木块三根为一层，交错叠高成塔，然后从下部抽取积木，放到塔顶，创造一个更高的积木塔。

叠叠乐游戏是对耐心、平衡、力度等多方面的考验，对很多人来说，（尤其是容易手抖的同学）这个游戏实在是太难了。而 MIT 研制出的这个机器人，则通过探测、算法结合推拉、对齐等操作，轻松的攻克了这个任务。

它究竟是何方神圣？

人类总会说自己「手抖」，所以机械臂的研究就是为了完成一些精细化或者高危的操作。项目团队成员之一，MIT 机械工程系的助理教授 Alberto Rodriguez ，指出这个机器人的关键在于，它把视觉和触感完美的结合了起来。

但从外观上看，这个机器人和一些常见的应用型机器类似，像一个普普通通的机械臂，但它配备了一个软齿状夹持器、一个力感应腕带和一个外部摄像头，这相当于给它赋予了手，触感和眼睛。

在工作时，夹持器用来操作积木，也能反馈触感；感应腕带用来控制操作积木的力度的力感；摄像头用来收集视觉图像。

除了拥有这些让机器人能够灵活移动积木的外形，它最关键的还是拥有和之前机器人不一样的「灵魂」——研究人员使用新的算法让它变得更擅长这项工作。

根据 MIT 研究人员的介绍，这款机器人没有使用传统的 AI 学习方法，而是创造性的使用了分层模型动态，去建立一个聚类学习模型。这样做的好处是不再依赖大量的数据，而是能够根据反馈的数据，作出实时的分析，边接触探测，边预测移动下一块积木的方案。

它是怎样玩叠叠乐的？

事实上，机器人能够处理看起来复杂的叠叠乐游戏，关键用到了聚类学习。

传统的思路去解决这个游戏，就是把积木、机器人、积木塔之间会发生的所有关系都收集起来，从而计算出最好的方式。但这明显会带来海量的数据，而且计算难度也大大提升。

而这个研究中，选择了让机器人去模仿人类玩游戏的方式。首先是通过尝试，对数据标注和聚类。然后通过和标记的数据对比判断新操作的可行性。

首先让机器人面对一个积木塔，随机的选择积木块并按一个比较小的力度推出，对于每次推出和抽积木的操作，计算机会记录下相应的视觉和力度数据，并和操作的结果一起标注出来。

这个研究中用了约 300 次尝试，就积累到了足够的数据，然后就就是对数据进行处理。这里用到了聚类处理。要把数据和结果类似的操作分为一组，表示特定的积木行为。

不同的组代表了不同的可操作程度，这也是了衡量每个操作的标准。比如一组数据代表机器人在难以移动的积木上的尝试，而另一组数据则代表一个比较容易移动的积木上的尝试。

而每一个不同的数据集，再相应的给出一个简单的模型，结合这些模型，机器人相当于学会了实时的学习。

最后，就可以进行实际演练，机械臂在推出积木块时，利用摄像头和腕带去接受视觉和触觉信息，然后把接收到的这个反馈和之前的数据作对比，如果数据对应到好的结果，就执行这个操作，如果会有倒塌的危险，就放弃此操作。

并不只是叠叠乐

MIT 的研究人员指出，虽然在研究中实现了机器人玩这个个游戏，但要是拿来和人类高手比赛，估计还需要一些改进。因为在这个研究中， AI 机器人重点解决的是物理交互问题，解决了这块积木能不能抽出来，摆上去之类的问题。但叠叠乐的游戏还需要一些策略，这就涉及到考虑和分析关联步骤。

但 MIT 的这个研究团队明显没有这个想法，或许对他们来说，制造出一个玩叠叠乐的高手并没有太多的价值。根据团队研究人员 Rodríguez 的说法，正在考虑把这项技术用在实际的工作环境中，比如应用在制造装配线的机器人等领域。

等等啊喂，就这么个简单的益智小游戏，我们可能还比不过它，人家就不跟我们人类玩了。眼看着它要去做更了不起的事情，Emmmm，算了，还是让我们被过年的美食淹没着吧。

三次元的世界里，机械臂的手活儿也无敌了

7 年前

By 超神经

对于叠叠乐（Jenga）这种积木游戏，想必很多人都深有体会，因为稍有不慎，辛辛苦苦堆起来的积木塔就毁于一旦。这样的事情，交给 AI 和机器人来做，会怎么样呢？

似乎研究人工智能的团队，总喜欢通过游戏找到突破口，麻省理工学院的团队研发出来的机械臂，也从三次元世界的游戏开始。

叠叠乐，一般是把积木条先将木块三根为一层，交错叠高成塔，然后从下部抽取积木，放到塔顶，创造一个更高的积木塔。

叠叠乐游戏是对耐心、平衡、力度等多方面的考验，对很多人来说，（尤其是容易手抖的同学）这个游戏实在是太难了。而 MIT 研制出的这个机器人，则通过探测、算法结合推拉、对齐等操作，轻松的攻克了这个任务。

它究竟是何方神圣？

人类总会说自己「手抖」，所以机械臂的研究就是为了完成一些精细化或者高危的操作。项目团队成员之一，MIT 机械工程系的助理教授 Alberto Rodriguez ，指出这个机器人的关键在于，它把视觉和触感完美的结合了起来。

但从外观上看，这个机器人和一些常见的应用型机器类似，像一个普普通通的机械臂，但它配备了一个软齿状夹持器、一个力感应腕带和一个外部摄像头，这相当于给它赋予了手，触感和眼睛。

在工作时，夹持器用来操作积木，也能反馈触感；感应腕带用来控制操作积木的力度的力感；摄像头用来收集视觉图像。

除了拥有这些让机器人能够灵活移动积木的外形，它最关键的还是拥有和之前机器人不一样的「灵魂」——研究人员使用新的算法让它变得更擅长这项工作。

根据 MIT 研究人员的介绍，这款机器人没有使用传统的 AI 学习方法，而是创造性的使用了分层模型动态，去建立一个聚类学习模型。这样做的好处是不再依赖大量的数据，而是能够根据反馈的数据，作出实时的分析，边接触探测，边预测移动下一块积木的方案。

它是怎样玩叠叠乐的？

事实上，机器人能够处理看起来复杂的叠叠乐游戏，关键用到了聚类学习。

传统的思路去解决这个游戏，就是把积木、机器人、积木塔之间会发生的所有关系都收集起来，从而计算出最好的方式。但这明显会带来海量的数据，而且计算难度也大大提升。

而这个研究中，选择了让机器人去模仿人类玩游戏的方式。首先是通过尝试，对数据标注和聚类。然后通过和标记的数据对比判断新操作的可行性。

首先让机器人面对一个积木塔，随机的选择积木块并按一个比较小的力度推出，对于每次推出和抽积木的操作，计算机会记录下相应的视觉和力度数据，并和操作的结果一起标注出来。

这个研究中用了约 300 次尝试，就积累到了足够的数据，然后就就是对数据进行处理。这里用到了聚类处理。要把数据和结果类似的操作分为一组，表示特定的积木行为。

不同的组代表了不同的可操作程度，这也是了衡量每个操作的标准。比如一组数据代表机器人在难以移动的积木上的尝试，而另一组数据则代表一个比较容易移动的积木上的尝试。

而每一个不同的数据集，再相应的给出一个简单的模型，结合这些模型，机器人相当于学会了实时的学习。

最后，就可以进行实际演练，机械臂在推出积木块时，利用摄像头和腕带去接受视觉和触觉信息，然后把接收到的这个反馈和之前的数据作对比，如果数据对应到好的结果，就执行这个操作，如果会有倒塌的危险，就放弃此操作。

并不只是叠叠乐

MIT 的研究人员指出，虽然在研究中实现了机器人玩这个个游戏，但要是拿来和人类高手比赛，估计还需要一些改进。因为在这个研究中， AI 机器人重点解决的是物理交互问题，解决了这块积木能不能抽出来，摆上去之类的问题。但叠叠乐的游戏还需要一些策略，这就涉及到考虑和分析关联步骤。

但 MIT 的这个研究团队明显没有这个想法，或许对他们来说，制造出一个玩叠叠乐的高手并没有太多的价值。根据团队研究人员 Rodríguez 的说法，正在考虑把这项技术用在实际的工作环境中，比如应用在制造装配线的机器人等领域。

等等啊喂，就这么个简单的益智小游戏，我们可能还比不过它，人家就不跟我们人类玩了。眼看着它要去做更了不起的事情，Emmmm，算了，还是让我们被过年的美食淹没着吧。