查看原文
其他

这群极客,在地下参加了一场「机器人死亡挑战赛」

周永亮 极客公园 2022-05-11


DARPA「机器人地下挑战赛」的幽暗甬道,是机器人走向大众的必经之路。


作者 | 周永亮
编辑 | 靖宇



谈到移动机器人,你可能经常遇到,比如在酒店、医院、餐饮等服务领域,经常会看到机器人的身影。除此之外,波士顿动力公司 (Boston Dynamics) 的网红机器人,各种摸爬滚打的视频在网络上也吸引了众多关注。


但在一些更复杂、极端的环境下,机器人依旧叫好不叫座,亟待技术层面的深层突破。


这样的局面,曾经的无人驾驶也遇到同样的问题。从 2004 到 2007 年,美国国防部高级研究计划局(DARPA,Defense Advanced Research Projects Agency)赞助了无人驾驶挑战赛。大赛除了捧红了激光雷达公司 Velodyne,同时也直接催生了此后十几年火热的自动驾驶赛道。


遵循同样的思路,2018 年 DARPA 组织了机器人地下挑战赛(Subterranean Challenge,SubT),并设置了 500 万美元的奖金,吸引世界各地的机构和公司的工程师和科学家团队来参加比赛。


DARPA SubT 地下挑战赛决赛结果|IEEE


如今,此次持续近三年的系列赛已经落幕,最终 CERBERUS 团队和 CSIRO Data61 团队,分别获得决赛的第一名和第二名。


除了比赛结果,这次挑战赛更大的价值,在于对现实的映射。回顾这场比赛中遇到的问题和给出的解决方案,可以更深层地了解机器人发展的动向,以及加速机器人的普及。



01

机器人的「死亡挑战赛」



谈起举办这次地下挑战赛的直接契机,DARPA 战术技术办公室项目经理 Timothy Chung 表示,这主要考虑到作战人员的需求,以及先遣应急队的需求。他们需要在各种地下环境中执行搜索和救援的任务,可能是人口密集的事故、自然灾害,也可能是矿山中等救援。


同时,在这次挑战赛的官网,引用了克劳塞维茨在《战争论》中的一句话,「战争与地形的关系,要求我们具备快速而精准地获取任何地区地形信息的能力。」


Cerberus 团队的 ANYmal 机器人在自主探索洞穴|IEEE


在比赛场地的选择上,这次地下挑战赛选取了地下隧道、城市地下、岩洞三个最具挑战性的场景。在这样的环境中,机器人将面临很多极限的情况,比如地形非常复杂,无法使用 GPS,通信受到限制,能见度低,移动性也受到挑战等等。简单说,DARPA 的目标是要寻找能在极端环境下,仍然能够通行的机器人。


据主办方介绍,他们希望参赛团队在四个领域推动机器人技术的边界:移动性(如何迅速移动)、感知(如何理解外界)、网络(把数据传回服务器)和自主权(机器自主决策)。


这场挑战赛的规则是,参赛团队要搜索、检测比赛场地,找到并定位主办方设置的 10 到 30 件物品的精确位置,这些物品可能包括人体模型、门、电动泵、阀门、背包、灭火器、收音机或手机,以及更多抽象的东西,如煤气泄漏。团队的最终得分主要取决于他们能够找到多少物品,以及用时多长。


与此同时,参赛人员被禁止进入隧道,所有的工作必须要有参赛的机器人完成。标记精度在 5 米以内,被认为完成了定位,能获得积分。


要想取得比赛的成功,还是非常有难度的。因为涉及到隧道、城市、洞穴等场景,因此需要一个整体解决方案,来实现能力的相对平衡。举个简单例子,机器人需要足够小巧才能通过狭窄通道,但它又需要携带足够大的传感器和计算机,来为自己测绘、导航和作出自主决策;另外,在动力系统方面,机器人需要更加节能,才能在极端环境中行驶数公里,但自主决策和测绘都需要很大的电力需求。


对于这场比赛,官方的称呼是「地下挑战赛」,类似铁人三项比赛,不是要找到最强的游泳、跑步和自行车运动员,而是要三项综合成绩最好的人。很多人觉得这种说法过于委婉,更应该把它称为「机器人死亡挑战赛」或「机器人奥运会」。



02

「机器人与地下城」



要真正理解这次挑战赛,需要简单回顾一下整个过程。据了解,2019 年 8 月,来自 8 个国家的 11 支机器人团队,汇集在美国匹兹堡的一个矿洞,这是第一次隧道比赛(Tunnel Circuit)的场地。与团队一起出现的,还有 20 架无人机、64 架地面机器人和一架名为 Duckiefloat 的自主飞艇。


参加 SubT 地下挑战赛参赛团队|IEEE


大部分团队的策略,是先派出机器人侦察、探测环境,然后根据场景和机器人性能,选择合适的机器人完成定位任务。在比赛最开始时,情况还都很顺利。但意外很快发生,通信成了这次比赛的最大问题。就在机器人转过矿洞第一个拐角的时候,许多团队失去了与机器人的联系,因为无线电波无法穿透坚硬的岩石。


随后,时间很快来到了 6 个月后,第二场比赛(Urban Circuit)来到了西雅图附近的萨索普核电站。这个核电站始建于 1977 年,建设完成 80% 的时候,政府决定不再投入资金,这个核电站也成了废弃项目。如今,它成为此次挑战赛的场地。


如果说,在隧道挑战赛中,通信是一个巨大的挑战。那在这次城市地下赛道中,通讯已经不是什么大问题。参赛团队进行了升级和迭代,使用可部署的网络节点建立了网状网络。机器人在前进的过程中,每隔一段距离就会放置一个小的通讯机器人,然后它会自行建立起网络节点,这样就可以在通讯范围之外进行长时间的工作。


通信问题解决了,但低温成了问题。当时,废弃核电站内的温度是-4 摄氏度,甚至比室外(2 摄氏度)还要低。所以,参赛的团队人员和机器人,都无法长期在比赛场地逗留太久,比赛结束手立即转移到温暖的地方。


最终,CoSTAR 依靠更好的性能和表现,在城市地下巡回赛中,总共获得 16 分排名第一,比排名第二的 Explorer 高出 5 分,CTU-CRAS-NORLAB 团队获得第三名。


DARPA SubT 地下挑战赛决赛海报|IEEE


第三场是洞穴巡回赛,原本要在 2020 年秋季举办,但因为 COVID-19 被迫取消。所以,这场赛事直接跳到了 2021 年 9 月的决赛,地点是在路易斯维尔巨型洞穴,这是一个非常有挑战性的场地。整个洞穴大约有 400 万平方英尺(约 37 万平方米),它的特点是结合了 DARPA 设计的三个场景,有不规则通道和大型洞穴系统,还具有复杂布局的地下结构。


这时,参赛队伍已经从最初的 11 支,减少到 8 支。对所有的参赛队伍来说,自主性是决赛的最大挑战。因为比赛场地不允许团队人员进入,每支团队只有一个人可以对机器人进行远程操控,所以让机器人自行决定去哪里,如何去哪里,将是赢得比赛的关键。


在决赛结束时,CERBERUS 和 CSIRO Data61 两支队伍都发现了 23 件物品。因为用时更少,CERBERUS 团队赢得最终的决赛冠军,拿走了 200 万美元奖金,CSIRO Data61 则获得第二名。



03

启示和未来



回顾机器人地下挑战赛的三年间,应该是梦想照进现实的三年。CSIRO Data61 团队负责人 Navinda Kottege 在接受采访时曾表示,这次挑战赛最有价值的地方在于,DARPA 刚开始知道机器人并没有这种能力,但要求三年之后,形成一支有竞争力的机器人团队。


最初的想法,也确实变为了现实。在挑战赛开始之前,他们团队确实有一些很炫酷的技术,但没有机器人系统可以可靠地工作一个小时或者更长;但三年之后,他们可以部署机器人,让他们自主地去做一些任务,然后团队成员去做自己手中的工作,这是非常大的进步。


与此同时,这次挑战赛也带来了很多技术层面的惊喜,可能会引领机器人的发展。在这次系列赛中,参赛团队带来了很多形态的机器人,包括六足仿蜘蛛机器人,四轮车型机器人、履带坦克型机器人、飞行机器人等。其中,轮式机器人提供了最可靠的机动性,无人机可以探索一些较大的洞穴。


但最令人印象深刻的是 CERBERUS 团队的四足机器人 ANYmal C,在比赛中表现可靠,即便遭遇碰撞也可以保持稳定,完成了团队的大部分工作。


ANYmal C 四足机器人|IEEE


这款机器人是由瑞士 ANYbotics 公司打造,有点像一只大型犬,重量在 100 斤左右,配备了摄像头、3D 传感器,包括用于 3D 绘图和同步定位和映射(SLAM)的激光雷达,可以执行搜救、检查等任务。移动速度上,它可以达到 1 米/秒,还能轻松处理 20 度的斜坡和 45 度的楼梯,以及跨越 25 厘米的空隙,通过仅有 60 厘米的通道。


更重要的是,ANYmal C 不需要进行艰苦的建模过程,以及危险且高成本的实地测试,就可以应对现实世界复杂的地形地貌。那它是怎么达到的呢?


据团队负责人介绍,在复杂的地形和无法准确探测环境的情况下,机器人必须依赖本体感受(proprioceptive)——在高时间分辨率下感测其自身的身体形态。


为此,瑞士 ANYbotics 公司提出了一种稳健的控制器。这种控制器仅使用联合编码器和惯性测量单元的本体感受度量,这是腿式机器人上最耐用最可靠的传感器。有了新型控制器的加持,这些机器人可以轻松翻越溪流、草地、雪地、碎石坡等富有挑战的场景。


同时,这个控制器由一种神经网络策略驱动,在模拟环境中进行训练。虽然没有任何现实世界的数据和精确的地形模型,但控制器仍然能克服野外的各种不规则地形。研究人员还强调说,「我们的系统可以穿越几乎所有地形,而且一次都没有摔倒。」


除此之外,研发人员还引入了一些新的方法:首先,在模型上,ANYbotics 公司并没有使用当前主流的的多层感知器(MLP),而是使用了序列模型,特别是感受状态的时间卷积网络(TCN);其次,是关于特权学习(privileged learning)。新模型在训练中分为两个阶段,首先训练教师策略,该策略可以访问特权信息,即对地面的真实了解和机器人与之的接触;随后教师指导纯本体感受的学生控制器学习,后者仅使用机器人本身可用的传感器信息。


此外,这项研究中提到的方法并没有用到摄像头、激光雷达或接触式传感器信息,只依赖本体感受传感器信号(proprioceptive sensor signal)来提高控制策略在不同地形中的适应性和稳健性。


CSIRO 团队测绘的地图精度极高|IEEE


除了四足机器人,高精度的测绘地图,也是这个挑战赛让人惊喜的地方。在此次挑战赛中,CSIRO data61 团队虽然排在第二位,但他们的机器人测绘得到的地图,与 DARPA 的真实地图相差不到 1%。


据了解,DARPA 官方的地图,是邀请了专业的技术人员,使用了非常昂贵的设备,花费了 100 个小时进行专业测绘得来。但 CSIRO data61 团队,只用了不到一个小时内,得到的结果就跟官方地图接近。这背后的技术,着实让所有人都很吃惊和好奇。


据了解,在 CSIRO data61 团队背后,有一套叫 Wildcat 的自主机器人的研发平台和工业应用的商业化解决方案。据团队负责人曾介绍说,Wildcat 使用非线性优化算法,将来自机器人传感器的 3D LiDAR(光检测和测距)数据,实时转换为高度详细和准确的环境地图,同时为机器人控制提供更新速率的姿态信息。


机器人可以实时共享地图片段,以帮助他们保持对环境变化的认识,并探索新的领域。这使他们能够轻松地将不同的机器人平台集成到他们的车队中。


Wildcat 利用 CSIRO 十多年的 SLAM 研发经验,该技术与 IMU(惯性运动单元)和 LiDAR 传感器结合使用,可选择添加其他传感器,如化学、放射、气体、GPS 和 Wi-Fi。


目前,Wildcat 解决方案已经开始商业化,无人机公司 Emesent 是其第一个客户,同时它还其他几家公司合作。


几年前,波士顿动力在 YouTube 上传的机器人视频,捧红了旗下的双足机器人和四足机器狗。但是,即便成为了「网红」,波士顿动力辗转于谷歌、软银和现代汽车的命运,也折射出机器人产业的举步维艰。


最近两年,宇树科技等国内创业团队将四足机器人价格做到了万元区间而小米等巨头公司也开始纷纷押注机器人赛道,可以看出机器人已经成为一个新的风口。但不可否认的是,虽然机器人的价格已经不再「高不可及」,但是其使用场景依然局限于安保等固定场景。


DARPA 机器人挑战赛虽然考验的是机器人在极端环境中的搜寻和施救能力,但正像 15 年前的无人驾驶大赛催生了自动驾驶赛道,机器人大赛中所锻炼出的地形扫描、制图和运动能力,或将很快应用到市面可见的机器人产品中,极大拓展机器人的应用场景,并最终加快机器人向消费电子产品类别的过渡步伐。


本文为极客公园原创文章,转载请联系极客君微信 geekparkGO


极客一问

机器人的多场景应用,

还需要多久时间?







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存