三次元的世界里,机械臂的手活儿也无敌了
By 超神经
对于叠叠乐( Jenga )这种积木游戏,想必很多人都深有体会,因为稍有不慎,辛辛苦苦堆起来的积木塔就毁于一旦。这样的事情,交给 AI 和机器人来做,会怎么样呢?
似乎研究人工智能的团队,总喜欢通过游戏找到突破口,麻省理工学院的团队研发出来的机械臂,也从三次元世界的游戏开始。
叠叠乐,一般是把积木条先将木块三根为一层,交错叠高成塔,然后从下部抽取积木,放到塔顶,创造一个更高的积木塔。
叠叠乐游戏是对耐心、平衡、力度等多方面的考验,对很多人来说,(尤其是容易手抖的同学)这个游戏实在是太难了。而 MIT 研制出的这个机器人,则通过探测、算法结合推拉、对齐等操作,轻松的攻克了这个任务。
它究竟是何方神圣?
人类总会说自己「手抖」,所以机械臂的研究就是为了完成一些精细化或者高危的操作。项目团队成员之一,MIT 机械工程系的助理教授 Alberto Rodriguez ,指出这个机器人的关键在于,它把视觉和触感完美的结合了起来。
这项技术不仅上了 Science Robotics 期刊 ,
还在今天上了中央台电视台的午间新闻
但从外观上看,这个机器人和一些常见的应用型机器类似,像一个普普通通的机械臂,但它配备了一个软齿状夹持器、一个力感应腕带和一个外部摄像头,这相当于给它赋予了手,触感和眼睛。
在工作时,夹持器用来操作积木,也能反馈触感;感应腕带用来控制操作积木的力度的力感;摄像头用来收集视觉图像。
除了拥有这些让机器人能够灵活移动积木的外形,它最关键的还是拥有和之前机器人不一样的「灵魂」——研究人员使用新的算法让它变得更擅长这项工作。
根据 MIT 研究人员的介绍,这款机器人没有使用传统的 AI 学习方法,而是创造性的使用了分层模型动态,去建立一个聚类学习模型。
这样做的好处是不再依赖大量的数据,而是能够根据反馈的数据,作出实时的分析,边接触探测,边预测移动下一块积木的方案。
它是怎样玩叠叠乐的?
事实上,机器人能够处理看起来复杂的叠叠乐游戏,关键用到了聚类学习。
传统的思路去解决这个游戏,就是把积木、机器人、积木塔之间会发生的所有关系都收集起来,从而计算出最好的方式。但这明显会带来海量的数据,而且计算难度也大大提升。
而这个研究中,选择了让机器人去模仿人类玩游戏的方式。首先是先通过尝试,对数据标注和聚类。然后通过和标记的数据对比判断新操作的可行性。
首先让机器人面对一个积木塔,随机的选择积木块并按一个比较小的力度推出,对于每次推出和抽积木的操作,计算机会记录下相应的视觉和力度数据,并和操作的结果一起标注出来。
这个研究中用了约 300 次尝试,就积累到了足够的数据,然后就就是对数据进行处理。这里用到了聚类处理,要把数据和结果类似的操作分为一组,表示特定的积木行为。
不同的组代表了不同的可操作程度,这也是了衡量每个操作的标准。比如一组数据代表机器人在难以移动的积木上的尝试,而另一组数据则代表一个比较容易移动的积木上的尝试。
而每一个不同的数据集,再相应的给出一个简单的模型,结合这些模型,机器人相当于学会了实时的学习。
最后,就可以进行实际演练,机械臂在推出积木块时,利用摄像头和腕带去接受视觉和触觉信息,然后把接收到的这个反馈和之前的数据作对比,如果数据对应到好的结果,就执行这个操作,如果会有倒塌的危险,就放弃此操作。
并不只是叠叠乐
MIT 的研究人员指出,虽然在研究中实现了机器人玩这个个游戏,但要是拿来和人类高手比赛,估计还需要一些改进。因为在这个研究中, AI 机器人重点解决的是物理交互问题,解决了这块积木能不能抽出来,摆上去之类的问题。但叠叠乐的游戏还需要一些策略,这就涉及到考虑和分析关联步骤。
但 MIT 的这个研究团队明显没有这个想法,或许对他们来说,制造出一个玩叠叠乐的高手并没有太多的价值。根据团队研究人员 Rodríguez 的说法,正在考虑把这项技术用在实际的工作环境中,比如应用在制造装配线的机器人等领域。
反正我们经常说自己手抖,那以后这些专业的事情就让专业的「人」去做吧,我们还是等着被过年的美食淹没着吧。
超神经小百科
聚类 Clustering
聚类是一种对数据分组的机器学习技术。一般就是将数据对象分组成为多个类或簇 ( Cluster ),使得在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。
对于给定一组数据点,可以用聚类算法将每个数据点分到特定的组中。理论上,属于同一组的数据点应该有相似的属性和/或特征。聚类是属于无监督学习方法。
历史文章(点击图片阅读)
未来的春晚,可能就不需要活的主持人了
对 2018 年 AI 发展预言全中,他们又立了 2019 的 Flag
一个宇宙学实验验证:
整个宇宙都是高级文明编写的代码?
AI 百科
教程
数据集
商店
更多
http://hyper.ai