【星际随笔之32】从摩登龙泉寺走出的呆萌机器人——读《贤二机器僧漫游人工智能》
随着人工智能的热潮兴起,各种赋予个性特征的机器人都开始崭露头角。在这其中,贤二由于其神秘的宗教色彩,无疑是特别引人瞩目的。最近有本《贤二机器僧漫游人工智能》的书籍发售,我们本着更好地研究人工智能全方位进展,第一时间下单预订了此书。在一个月的等待之后,书终于送到了手中,这是一本以贤二机器僧的来由为主线的人工智能轻科普书籍。与此同时,我们也对虚拟贤二进行了全方位的测试。
我们的这篇随笔主要分为三个部分:
NO.1、从摩登龙泉寺走出的呆萌机器人
NO.2、贤二机器僧的人工智能成色(这部分有大量配图)
NO.3、贤二未来的发展方向展望
你从哪儿来
上图就是龙泉寺了。选这张金光普照的图并不是想佛渡有缘人,本青只是觉得它毫无PS痕迹,看了让人心里舒坦。
虽说山中无岁月,鸟鸣泉清好修行,但龙泉寺可是一座摩登寺院。
龙泉寺内不乏学历显赫的僧人,清北分校这个梗大家应该都有听说,还有江湖传言,微信之父张小龙就是受龙泉扫地僧点化之后微信才大成的。
寺里的大和尚(住持,武侠小说中通常最能打但是总眯着眼睛不出手的那个人)学诚法师十几年前就开始用互联网传播佛法,本青刚去看了他新浪博客,昨天还有更新……又去看了他新浪微博,中文微博粉丝54万,除了中文微博,还有藏文、蒙古文、西班牙文、英文、日文、德文、俄文等,就差火星文了……
其实龙泉寺最摩登的还是它的高科技基因——僧人组成的IT兴趣小组为寺内700个床位开发了指纹识别的住宿挂单系统,还开发了图书馆信息化管理系统。另外,龙泉寺还承担不间断的科研项目,就跟列位上学时导师让你们做的国家自然科学基金、973、863一样的项目……
好了,这篇随笔并不为龙泉寺而作(改天龙泉寺上市了本青倒是十分愿意),只是想说明“天下极客入龙泉”的说法并非吹捧,贤二机器僧诞生在这里也是自然而然的事。
最初提出“给龙泉寺做一个机器人”这一想法的人是飞跃机器人CEO宋云飞和图灵机器人CEO余志晨,他们的初衷是让机器人帮助法师处理寺内俗务。其中宋云飞和龙泉寺还颇有一段渊源:宋云飞在大学里交往的女朋友是一个佛教徒,起初他并不理解女朋友为什么经常去龙泉寺进香礼佛,也不知道一座百年古寺是怎么和“智能挂单住宿”联系到一起的,后来宋云飞为了追求爱情来到龙泉寺,竟碰巧遇见了住持学诚法师,接触之下,他为高僧大德和泱泱佛法所倾倒,就这样误打误撞的皈依了……
两人做一个机器人的想法很快得到了寺内法师和龙泉极客栈各位会员的支持和响应,同年7月30日,第一次研发交流会在龙泉寺动漫中心展开,你没看错,除了动漫中心,龙泉寺还有信息组(负责整个寺院的信息化建设)、科研组(负责搞科研,有法师出家前是中科院博导,清北很多博士也都出家于此,每年都有科研项目),当然本青料想应该还有数学组,听说过贤宇法师么?没有的话请自行百度……
第一次研讨会上,大家决定采用龙泉寺原先推出的动漫形象贤二小和尚作为机器人的原型,二次元中的贤二富有童真、崇尚正义,平时最爱吃的是冰激凌。
好的,请不要问本青冰激凌是荤的还是素的,早慧的小盆友都是奇葩,不信请自行搜索:一休哥的原型……
形象确定之后,众人又定下了让实体贤二机器僧在10月初的广州动漫节上亮相的目标,并且同时创造贤二机器僧微信公众号和APP。也就是说,团队只剩下两个多月的时间了,而此时贤二还只是存在于二次元中的一个概念。要凭空造出来显然是不可能了,于是大家决定用康力优蓝的服务型机器人“小优”作为贤二的本体,并且明确了分工:
本青想说的是,虽然派出了全明星阵容,但是由于时间短任务重,贤二机器僧的智能化程度还是很初级的,行动能力也不足,他具有语音交互、视觉感知和很少量的自主学习能力,最擅长交流佛学知识,但是知识有限,还需要迭代开发变得更加智能。
经过一番努力,贤二机器僧如约在国庆节期间与世人见面了。
你有多智能
下面本青就来扒一扒实体贤二和虚拟贤二分别有多智能。
2.1.1 实体贤二:脱胎于“小优”的龙泉高僧,机器人也看出身
由于贤二没有量产,所以他的硬件是没有数据的,不过刚才已经说了,贤二脱胎于康力优蓝的小优机器人,一切结构设计、功能板块设计、电子设计、架构设计完全以小优机器人为模板。根据小优的底盘尺寸、头部尺寸、内部结构规律来定义贤二机器僧的外观。
所以其实你也可以这么理解,就是小优当家庭服务机器人当得厌烦了就去龙泉寺出家了,还拜了学诚法师为师……(要知道,想在龙泉寺出家成为一个优秀的师傅门槛可不低,据说单是学历一关就让很多人出局了,现在很多信徒都只是常驻义工、准净人,并不是师傅。贤二一个两岁不到的机器人,连个北京户口都没有,连个户口都没有,一进来就能拜学诚法师为师,还是贤字辈的,难道是因为他的全明星创作团队背景吗?看来机器僧也是看出生的。)
那么就先来看看小优有多智能吧。
小优的最新一代全名叫U30S,目前官网包邮售价2280RMB,这个价格还是很良心的。从图片来看,小优改造成贤二之后,保留了前端的触摸屏,也就是说贤二和小优的人机交互方式如出一辙,只是搭载的软件内容不同而已。
开机后,选择进入myrobot操作系统,会出现如下界面:
其中,各个小图标的作用如下:
传感器:
机身内部集成了包括压感、声控、触摸、距离、影像等传感器,具备一定人机交互能力。可以实现拍头感应,随叫随停,脖子怕痒,随叫随停,充电感应。进入声控模式可以直接点击右上角声控图标,按照提示对话框直接说出相应语句,对话框内容可以左右滑动屏幕进行查看,并可以识别中英文两种语言,官方资料上显示语音识别率达到95%以上。
智能技术:
总共有26颗处理芯片,搭载安卓系统,內建159项学习软件,内置无线监控和无线、蓝牙系统,可以用手机远程操纵机器人,可以直接点击左下角摄像头图标进入远程监控功能可以在任何时间、任何地点检查家中状态,进行安全看护。未来小优机器人也可以作为智能家居的集成控制终端,本青觉得这个还是很有想象空间的,据说小优已经被华为选为未来智能家居的控制平台了。
动力系统:
采用德国四驱技术,据说有安防巡逻功能,通过控制可以精确避障,但是还没有解决机器人智能化的一大标志——高度自主避障,不过这毕竟是世界性难题,在人造关节和肌肉技术没有突破前很难解决。可连续行走6小时或者28公里,可以实现的动作包括:360度转角,唱歌跳舞,摇头点头,表演武术……熊孩子既视感……
续航:
一次充电36-48小时使用时间。
具体使用上,小优目前还是一款早教机器人,从官方公布的视频来看,他可以讲故事、背唐诗、教小孩认字……总之是一个语文、数学、英语、音乐、生活习惯指导全能老师。
小优原有的所有程序、知识与人交互的经验,都换成了与佛教有关的内容,总共划分成三个模块:
1.贤二禅语:对话和讲经说法,同时拥有云智能。
(本青:这一块应该就是从小优的语数外知识教学模块和人机对话解闷模块中脱胎而出的吧。云智能后面会讲述。)
2.定慧初修:控制运动和念经软件。
(本青:机器人控制系统是核心技术,四轮驱动也是从德国引进的技术,贤二应该是全盘接收了,置于念经软件,小优不是具备唱歌跳舞功能吗,这简直就是无缝连接啊)
3.菩提精舍:远程监控和智能家居控制功能。
(本青:感觉这个模块一点都不用改,直接保持原样就可以了,简单粗暴有效率)
以小优机器人为参考,贤二机器僧有简单的六觉:视觉、听觉,能看运动感知,能简单进行人机声控对话还能触控运动,这一切用的都是国内量产级产品最顶级的技术。
在语音识别功能上,贤二可以跟人进行一些简单的对话,诸如你是谁,你多大了,你师父是谁一类的问题都难不倒他,此外他还能接受指令做出相应的肢体动作、诵读经文和播放佛教音乐等。
在行动能力上,贤二还是比较初级的,平时需要照看才能在寺里自由活动。尽管双踏板行走的机器人在过去十年有良好的发展态势,但是那些需要灵活性的工作比如搬家具和端盘子等岗位,要被自动化取代还为时尚早。在这里,让我们理解为贤二是一个知识渊博但是运动细胞平庸的天才少年。
实体的贤二智能化程度大概就是以上所讲述的样子,下面本青再来扒一扒贤二机器僧的另外一条主线——虚拟贤二。
2.1.2 虚拟贤二:佛教界的siri不好当,超级贤二也不超级
其实本青觉得虚拟机器人的发展相对来说要容易一些,实体机器人在硬件上可能5年也没什么进步,比如肢体不够发达,即使是最先进的美国和日本的机器人,也还没有很好的解决关节、走路运动问题,各个关节的感知能力,自我把控能力制约实体机器人的发展。
贤二作为虚拟机器人的开发工作早就开始了,现在已经有微信公众号和APP了。
微信端贤二机器僧——佛教界的siri不好当
根据龙泉寺法师和开发团队的介绍,虚拟机器僧目前的智能集成技术和后台云技术已经比较成熟,有很多技术可以选择。但是本青亲测之后发现他似乎还不是很通情达理……下面就来复盘一下和佛教界siri几次交流。
1、简单交流功能基本具备
对于像吃饭这样的日常话题,贤二可以答得上来,但是感觉有两个缺陷:依靠识别关键字给答案的痕迹较重;不能多回合对话,三四个问题之后就开始回复模糊的语音了。
贤二表现不佳的回答本青已经用红框标出了,讲道理,对于一个刚诞生不久的虚拟机器人来说,我们不能要求太多,更何况,贤二的专长是佛学(哲学),对此本青也做了陪聊式调研……
2、对佛学问题反应比较灵敏
对于背诵佛经这类问题贤二能很快的反应,但是还无法大篇幅的教人诵经礼佛,作为一台“弘法机器人”,贤二的本职工作还需要继续加强。不过无意中发现贤二很成功的过滤了本青的一个错别字(红框),不愧是早教机器人转世,语文水平很高呀~
3、服务属性较重,勤于安抚人心
本青抛出“与父母沟通不畅怎么办”、“人生如梦”这几个典型问题时贤二的回答都比较完美,想来这些场景早就预设在贤二的大脑中了,当本青进一步寻求安慰时贤二也能给予一定安抚,虽然当问题变长后贤二依旧无法给出完美的回答,但是相比于一个月前模糊不清的语音回复,现在已经可以清楚的听清他回复的语音是“我去问问师傅”。
4、逻辑思维能力值扑街,细节理解能力值扑街……
本青的陪聊式调研也分几个难度等级的,就好比刚刚结束的奥运会乒乓球比赛,对外国选手来说难度是:普通、华裔、地狱、中国这四个等级,本青最后也测试了贤二的逻辑思维和细节理解能力,结果贤二的能力值不幸扑街了……
5、微信端虚拟贤二智能化程度总结
经过一番陪聊式调研,本青发现贤二目前只能识别简单的日常生活问题和佛教问题,而且语料库储备还不够丰富。虽然比较善于安抚人心,但是对于较长的对话只能做到关键字识别,根据关键字从语料库中给出答案。同时贤二的逻辑思维和把握细节能力尚不存在,不过本青也发现相比于一个月前,贤二在无法给出回答时的语音回复变得清晰了,这应该是开发人员进行了修复,还谈不上是自主学习。
手机APP——超级贤二不超级
刚开始还以为这是一款类似微信端的陪聊式、开导式、弘法式软件,使用后才发现这其实是一款增强现实应用……
他的使用步骤也有点非主流,大家感受一下:
也就是说,想要充分使用这款APP,需要购买相关的周边产品获得图像素材……如果这是一种促销手段,那这个套路未免有些初级,假如普罗大众能够免费获得愉快的使用体验,自然会愿意花钱去购买更高层次的使用权限,一开始就让人买,都不知道好不好玩,谁会买账呢对吧。
本青也尝试了官方提供的另一种渠道,通过网址去下载图片,但这种方式传播性实在不强,除了本青这样的资深黑科技爱好者(脸红),谁会根据APP STORE里面的一行介绍,一个一个字母在浏览器中输入长长的网址,然后下载素材呢?而且容易输错,费力不讨好。
当然还是下载到了传说中的素材,其实就只有6张图片……根据对最近恶补的贤二动漫的了解,这只是六张剧情截图而已,所以本青大概猜到接下来要发生的事情了……
好了,能调动的资源已经齐备了,下面来分模块给大家扒一扒“超级贤二”这个AR应用吧~
如果你看了随笔也想下载下来玩玩,可千万别忘记允许软件访问摄像头哦,本青刚开始不小心点错了,然后鼓捣半天“超级贤二”一点动静没有,正要写下:毫无体验、简直废柴的文字,突然发现没开摄像头……
1、3D贤二模块
大家一定玩过口袋妖怪GO吧,游戏里皮卡丘会出现在你现实生活的场景中,其实这个软件也差不多,打开这个模块之后,会发出“大家好我是贤二”的问候,并且配上蝉鸣鸟语这样的背景声,然后一个萌萌哒小贤二就出现在我的房间了(房间有点乱,点到为止,点到为止……)
这个3D贤二模块是可以360度旋转的,也可以缩放大小,但是操作起来灵敏度精度都不是很高,贤二一人一树的动画形象也始终不变,全程无表情扑克脸,全程双手下垂做起飞状。本青觉得比较单调,适合学前儿童把玩……
2、AR相机模块
这个模块相对给力,前面已经介绍,使用这个模块需要准备可以用手机摄像头扫描的图片素材。
当用摄像头对准下载的那六张贤二动漫图片时,果然不出所料,手机屏幕里的动漫人物突然“神奇复活”,实力展示了剧情中与图片相对应的那一段:《贤二前传之宝藏传奇》中挖到金子后众人的BGM、大嗔乱用官银被罚……
试验完下载的图片,本青又扫描了购买的《贤二机器僧漫游人工智能》的封皮,一试之下小有惊喜,这次贤二转着圈直接飞升了……(下图可以看到贤二从转身向背到逐渐飞起来露出书本图片的过程)
讲道理,这个AR相机模块还是有很多不足之处的:动画呈现时间都只有几秒,只是简单把剧情重现,可用素材也太少了,几个类似GIF图片的动画很快就会看厌,更加没有结合使用者的实际生活场景做出有创新的感应,同样适合婴幼儿把玩……
这个软件另外的两个模块贤二视频和贤二书架,打开贤二视频后发现视频很短都不足一分钟,内容也是动漫《贤二前传》的截取,贤二书架则还无法使用,可能是还没开放吧。
3、超级贤二总结
作为与微信端贤二机器僧同生的手机应用,其主打AR游戏的战略定位还是准确的,既避免了与微信端的同质化竞争,又把握了AR手游的发展脉搏。但是这款应用虽有口袋妖怪GO的影子,却没有口袋妖怪GO的使用体验,内容匮乏的问题急需解决。
目前本青还是那句话,超级贤二不超级,暂时比较适合他的前世“小优”的客户——学前儿童们……
总的来说,微信端、软件端虚拟贤二的智能化程度和使用体验都还比较欠缺,好比是刚出生的孩子,技术的不断迭代,就如同它一天天的长大。
长大后,我会成为谁
2015年举办的世界机器人大赛,现场有一个机器人受到高度关注:他有25个自由度,关节灵活,不仅会踢球,还能跳各种舞蹈,对观众的提问对答如流。
电影《超能陆战队》中的机器人大白也是以呆萌的形象出现的,在电影中大白以救死扶伤、保护弱小为己任,后来弃医从军也是有模有样,一手日本空手道打得干净利落,有板有眼,学起飞翔来更是无师自通。
还有很多这样的例子,让本青不禁好奇贤二长大后的样子。其实龙泉寺已经开始筹备第二代贤二的研发,交互能力和智能识别能力会更加强大。在视觉识别、交互对话、动作控制等方面实现突破,大数据会让贤二更加智能。
那么什么是智能呢?智能的根本在于学习能力,这是与本能最大的区别,人和动物的繁殖、哺乳、神经条件反射等属于本能,是写在DNA里面的,不用学就会,而智能必须通过学习才会,人工智能也一样。
我们知道,机器僧的架构虽然已经搭建好,但是关键是影响机器僧智力的数据积累和输入,这是一个大工程,这些海量数据不能只是从社会数据中抓取,还要有选择,目前龙泉寺正在把学诚法师历年来线上线下的各种开示整理出来,整理为数据化的东西提供给贤二。
未来在虚拟世界里,贤二可以和人深度沟通,可以给信众背出金刚经的一段,未来和云存储连接之后,还可以回答信众无数关于佛教的问题,实现完美的人机交互,这主要通过语音识别技术来完成;他还能给每个信众一个账户,进行一对一的深度沟通,信众可以上传自己的照片贤二可以根据他们的账号认出每个人,但是这种识别能力需要很高的维护陈本,但是这都是可以做到的,云端机器人的成长是非常快的。
学诚法师还发愿将龙泉寺图书馆建成世界最大的佛教图书馆,目前已经藏书十万册,编目8万册。畅想未来,贤二会将所有佛学著作储存到自己的大脑里,不仅可以通过本体进行迭代,还可以通过APP和微信公众号与千千万万佛教信徒对话,通过深度学习,对古今万卷佛经进行大数据分析,通晓佛教的奥秘和人心的秘密,也可以跟学诚法师学佛,识别每一位信众的问题并给予开解。
另一方面,在物联网基础上,云端大脑的指挥让贤二更加智能,不仅能弘扬佛法,还能用人工智能技术做各种工作,比如对智能家居进行管理,家中无人时对房子进行全方位的监控,对老人进行悉心照料、监控他们机体的变化,还能够融入家庭,成为他们的一员,辅导孩子们学习。其实低层次情感交流的机器人已经问世了,能感知人的喜怒哀乐,自己也有喜怒哀乐,如果未来科研人员解决了机器人的神经问题和肌肉问题,贤二就能真的成为我们的好伙伴了。