浅友们大家好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你特别想听到谁的故事,不妨加微信(微信号:shizhongmax)告诉我。
拆开一看,一个带按钮的圆盘,按下去,一个小姐姐的声音蹦出来:我在,你说。这是来自阿里巴巴的一个发布会邀请函,我望着窗户想破脑袋也没猜出来他们要发布什么。直到我在会场看到了“天猫精灵”。阿里巴巴我当然很熟悉,但是淘宝、支付宝、闲鱼什么的都一直躺在电脑和手机屏幕里。活了这么大,这是我第一次看到阿里巴巴发布一个看得见摸得着的实体硬件。2017年的阿里巴巴,做硬件绝对不是他们擅长的领域,但是他们不仅花了很多钱做出了”智能助手“天猫精灵,还在接下来的”双11“中直接把价格杀到99,以低价补贴的姿势鼓励大家购买。不到一年的时间,天猫精灵热销300万台,成为了中国第一、世界第三的智能音箱。(如果还有不知道神马是天猫精灵,推荐你看《天猫精灵被调戏了》。)就在大家还没想明白“妖”在哪里的时候,中国的互联网巨头纷纷跟进,推出自家的智能助手——小米的小爱同学、百度的小度音箱、京东的叮咚音箱、腾讯的9420,掀起了一波排山倒海的“智能助手”浪潮,颇有攻占每一家客厅和卧室的态势。大佬们虽然有钱,但相信中哥,越大的佬越不会乱花一分钱。让我们调转镜头。就在天猫精灵火速成为人们宠儿的时候,平行时空发生了一件看上去无关的事情。时任阿里云总裁胡晓明在2018年的云栖大会上,突然宣布了阿里巴巴的一个新战略,此战略名为“IoT”,翻译成普通话叫“物联网”。啥子是物联网?其实大名鼎鼎的比尔盖茨在他1995年出版的书《未来之路》里早有预言:当你走进机场大门时,你的袖珍个人计算机与机场的计算机相联就会证实你已经买了机票;而你所遗失或遭窃的照相机将自动发回信息,告诉用户它现在所处的具体位置,甚至当它已经身处不同的城市的时候……
简单来说,物联网的奥义就是:不用麻烦人,机器和机器之间自己“喊号”,就能齐心协力完成复杂任务。回到我们的故事现场。当时阿里巴巴放出狠话:要在未来5年,连接100亿台设备。当然,像这样的狠话阿里巴巴以前说得也不少。为了让这次的狠话“比狠更狠”,他们破釜沉舟地加了一句:IoT 将成为和淘宝天猫、蚂蚁金服、菜鸟物流、阿里云并列的“第五条赛道”。IoT 有多牛,大伙儿没感觉。可是它的四个哥哥有多牛,大家是知道的。这就像葫芦娃,大娃二娃三娃四娃都很牛,那五娃也肯定是个狠角色。人们没猜到,库伟就是那个被阿里巴巴雪藏多时的新赛道掌门人。人们更没猜到,两年之后,库伟将带领团队上演一波让吃瓜群众恍然大悟的骚操作。看到这,你可能有点晕。没关系,坐稳扶好,听中哥慢慢讲阿里巴巴的“棋道”。《黑客帝国》你看过吧?虽然里面各种角色的恩怨情仇颇为复杂,但是这些角色设定归根到底只有两个属性:人和机——尼奥不做个人,就得做个机。互联网世界也只有两类东西:你我这样的都是“人”,手机、电脑、智能音箱、空调、电视、汽车这些都是“机”。明确了“人”“机”这两个角色,世界上的沟通问题就都可以归为这三类:第一类:人-机沟通问题;
第二类:机-机沟通问题;
第三类:人-人沟通问题。
你猜这里头最难解决的是哪类问题?以中哥的人生经验,绝对是第三类“人-人沟通问题”。。。看看灯塔国的新闻就知道了,人和人之间想说明白点事儿有多困难。这超出了中哥能力范围,本文只讨论前两类:“人-机沟通”和“机-机沟通”。好,先把这个脑洞放在这里,我们回头来看“天猫精灵”。天猫精灵这几年铆足了劲,其实就在处理第一类问题,“人-机沟通”。为了等会能让你更好地感受到技术浪潮的脉搏。这里不要嫌中哥啰嗦,听我给你详解一下天猫精灵的技术。先多说一句。“人-机沟通”不是近几年才诞生的学问,它是一个历史悠久的领域:最传统的方法就是用身体沟通,例如你开汽车,必须手脚并用,才能指挥汽车前进;
后来人机沟通就不上脚了,主要是用手,例如你敲电脑发微信打游戏,都是用手;
直到近些年,人机沟通的方法变成了嘴,例如你想让天猫精灵告诉你今天的天气,直接开口问它就行。
之所以能用语言实现人机沟通,是因为“人工智能”(AI)技术的进步,具体来说,是远场语音识别和自然语言处理(NLP)技术的进步。聂再清是人工智能界的大咖,曾经在微软研发了“人立方”搜索和自然语言理解平台 LUIS,“让机器人听懂人话”这件事儿,从学生时代至今他干了快30年。2017年,就在第一代天猫精灵发布之后,他正式加盟阿里巴巴。聂再清给我讲了很多他们正在研发的黑科技,不过他是从科学家严谨的角度为我讲述的。为了科普,我还是牺牲一定的准确性,翻译成浅友们能理解的话来讲给你。第一步:听清;
第二步:听懂;
第三步:拿不准的时候,比划比划。
在天猫精灵的体内,有一堆麦克风,他们排排站,专业术语叫“阵列麦克风”。这么多麦克风的作用,主要就是把你的话从周围的背景噪音里提取出来。这有点像手机处理照片时“背景虚化”的过程。你在家里和智能音箱说话的时候,往往不会凑得很近,这就像是在照片里你的人很小,系统还必须精准找到你。另外,真实的环境中还会有很多强干扰:例如你可能开着电视,电视离天猫精灵比你还近;例如你家的小朋友正在发出熊孩子的怒吼;例如你女票正在旁边给闺蜜打电话。而且,在天猫精灵本身说话或者播放音乐的时候,你也很可能和它说话,这时天猫精灵自己的回声也会大大影响识别的准确率。这就像你在KTV里唱歌时,很难听清别人跟你讲话。针对上面每一种典型情况,阵列麦克风都要和特定的算法合作,才能保证最大限度听清你的指令。在聂再清的团队里,专门有一票科学家负责研究降噪算法,就是保证你家无论山崩地裂狂风海啸,都能把你的声音“捞”出来。听懂的技术最复杂,人工智能大牛们几十年都在解决这个问题。这里,我只挑选两个最重要的步骤讲给你:1、实体链接;2、意图识别。实体链接的意思就是,找出你说的一句话里主要指向的东西,一般会是个名词。举个例子,你说出指令:“天猫精灵,我想听陈奕迅的《圣诞结》。”这里面,“陈奕迅”和“圣诞结”就是实体。把这两个词和“知识图谱”里的歌手陈奕迅还有歌曲《圣诞结》对应上,就叫做实体链接。实体链接很重要。假设天猫精灵对于你其他的词汇一概没听懂,只听懂了“陈奕迅”和“圣诞结”这两个实体,那么它接下来的动作大概率不会错,就是给你放这首歌。其实这和人类说话时的策略很相似。假如你在街头碰见一个老外,他冲上来对你叽里咕噜说了一长串,你都没听懂,但是只听懂了一个词“天安门”,那你估计会猜测,他是想问去天安门怎么走。还拿这个指令来说,如果你不是陈奕迅的歌迷,听到“shengdanjie”这个音,你想到的肯定是圣诞节。如果天猫精灵把“shengdanjie”给链接到了“圣诞节”这个实体上,那就不会给你播放想要的歌曲。。。实体链接失误的情况在“人-人交流”中都经常发生,把“为你而死”听成“喂你耳屎”的事儿比比皆是。针对实体链接的问题,天猫精灵的大牛们研究出了一种“音素级的实体链接”技术,听到“shengdanjie”这个词,不着急把它翻译成文字,而是把这个音和句子里的其他音一起考虑。因为句子里还有“听”“陈奕迅”这样的词汇,所以经过综合计算,“shengdanjie”这个音,指向《圣诞结》这个实体的可能性更大。在某些情况下,例如使用者口音很重的时候,天猫精灵实体链接的能力其实是要超过人的。下面有一个对比视频,你感受一下。意图识别的意思就是,找出你说的一句话里主要想做的动作,一般会包含动词。这时,文艺的天猫精灵也许会说:“多情自古伤离别,更那堪冷落清秋节。”我不知道你怎么看,反正我需要那个普通的天猫精灵。。。你看,这背后就是“意图识别”在发挥功效。你的话里根本没提空调的事儿,但是它能判断你说冷的意图就是希望变热,变热的方法就是开空调。(写到这,我突然发现很多直男的意图识别能力还不如天猫精灵。。。)要想增强“意图识别”的能力,天猫精灵需要对大量的人类对话做学习。聂再清告诉我,幸好天猫精灵是中国最先达到千万级用户的智能音箱,从2017年到现在,积累的人类对话已经像大海一样,这些不知疲倦的学习训练已经帮助天猫精灵识别很多角度刁钻的意图。听到这我恍然大悟。为什么情场老手的渣男能那么精准地判断女生的意图,而半次恋爱都没谈过的直男却连女生化没化妆都看不出来。无他,唯手熟尔。这就是数据和学习的力量。人在和天猫精灵的对话里,经常有上下文的语境。例如你刚才让天猫精灵开了空调,后面又说:“调高一度。”这时,天猫精灵就必须知道,你是指把前面提到的空调调高一度。这对于人来说是很容易理解的,但是人工智能却需要专门学习才能掌握上下文语境。于是,天猫精灵的科学家们又专门对这种上下文的对话进行专门训练。三年来,天猫精灵的意图识别能力才一点点接近了"情场老手"的水平。这是各大语音助手最近都在攻坚的一个技术。简单来说就是,在语音控制的同时,你还可以用动作、手势、眼神给天猫精灵发辅助指令。例如,三个人站在天猫精灵面前交谈,但是只有你是看向天猫精灵的,它就会知道你在和他说话。反过来说,你查询了今天的天气,天猫精灵也可以一边对你说话,一边用显示屏给你展示天气信息。其实这种方法在人类交流过程中并不新鲜:我对你说过来的同时,可以向你招手;老师给你讲课的时候,会边说边画图;听不清你说话的时候,我会看你的嘴唇动作辅助我听懂。这里就不展开具体的技术了,你可以看下面这个视频感受一下。讲真,看了以上两千字,你就已经能在饭桌上给朋友们吹牛讲清楚目前人工智能领域最前沿的课题了。2017年至今,在硬核科技的加持下,“人-机交互”的体验越来越好;随着产品设计的改进,天猫精灵还专门为孩子的课业辅导和老人的陪伴开发了很多贴心的功能。我找了一张天猫精灵教育场景的宣传图片,你感受一下妈妈那期待中带着杀气的眼神。
但是平心而论,这种水平距离科幻电影《2001漫游太空》里的 HAL 9000 那种对答如流甚至会耍心眼的人工智能还有十万八千里。而且,相信中哥,以目前人类的科技水平,短时间内是造不出科幻电影里那种人工智能的。可是,反过来看天猫精灵却干劲十足,推出了十几款性价比特别好的智能语音助手,不带屏幕的、带屏幕的、小屏幕的、大屏幕的。现在问题来了,用三年时间,这么认真地做智能助手,难道只是为了让大家体会“人-机交流”的乐趣吗?当然不是。在文章开头我就疯狂暗示,天猫精灵代表的“人-机交互”可以看成是阿里巴巴大战略里的一招棋。好,现在跟着中哥来一个急转弯,来看阿里巴巴的另一招棋:“机-机交互”。“人-机交互”和“机-机交互”,别看就差一个字,那背后的技术可差了十万八千里。我记得有一位大佬曾经说过一句精辟的话:在海外判断一个人是不是中国人,不要看他的长相,你只需要对他说:“床前明月光。”如果他脱口而出:“疑是地上霜。”那就是友军无疑。你看,虽然中国14亿人千差万别,但所有人都说中国话,所有人都保有同样的价值观和文化认同,所以研发“人-机交流”技术的时候,机器面对的其实是一个抽象的中国人。用到的技术都围绕着一个“单点”。例如:城市里有水表、电表、煤气表,路灯、井盖、垃圾桶;社区里有门禁、电梯、摄像头;医院里有医疗设备、监测仪、定位器;工厂里有机器人流水线、质检、运输器;农业大棚里有水质检测仪、空气处理器、温度湿度监控仪。这些设备涉及的领域太广了,各个制造商之间也少有交流,只是按照自己的思考来制造,使用的通信协议和协作标准都千差万别。为了防止大洪水再来洗劫大地,人们联合起来要“举大计”——造一座通天塔。上帝一看人类这波操作很挑衅自己的权威,于是决定小小惩罚一下人类。他用的方法不是直接毁灭通天塔,而是把人们说的语言变成了各不相通的“部落语言”。于是人们相互不理解,就再也没办法继续合作修塔了。现在的 IoT 世界就和《圣经》里描述的很像,一派鸡同鸭讲的局面。阿里巴巴 IoT 团队为了实现“机-机交互”,首先要做的,就是让所有机器都可以说同一套语言。他们开发了一个叫做 AliOS things 的物联网设备操作系统,任何一台设备,只要安装了这套开源操作系统,就都可以使用相同的语言对话,这些语言包括:LoRA、NB-IoT、低功耗蓝牙、Wi-Fi 等等。但是一入 IoT 深似海,要想推进剧情,阿里巴巴发现自己要首先解决另一个问题:AliOS things 要跑在支持它的芯片上。于是在2018年,阿里巴巴拉来了高通、联发科、展锐等几十家芯片厂商,一起发布了支持 AliOS things 的芯片。截止到2019年3月,支持 AliOS things 的芯片就卖出去了1亿套。但芯片这件事儿,你懂的。别人家的千般好,也不如自家的一点红。2018年秋天,阿里巴巴突然宣布收购中国自主芯片公司中天微,火速改组为自己的芯片公司,这就是大名鼎鼎的“平头哥”。(平头哥是芯片波澜壮阔大历史中的一朵浪花,推荐你去看一下《中国人用30年望见了计算力的珠峰》。)平头哥第一个推出的芯片架构叫做“玄铁910”,这个芯片,正是专门为物联网设备使用的。这里明确一下,平头哥的芯片梦想当然不止局限于 IoT 领域,只不过目前看来 IoT 芯片对于中国芯片产业来说是一个绝好的突破口。平头哥的战略,等有机会的时候,中哥详细给你们讲。有了芯片、操作系统,才终于搞定了这套“机-机交互”的底层语言,接下来就要帮助各行各业建造他们的物联网了。最需要“机-机互联”的领域大概有这么几个:智慧城市、智慧社区和智能制造。于是人们纷纷放飞想象,在未来,每个城市的楼宇都会根据天气情况自动调节空调和照明,交通灯会根据车流大小自动切换;每个社区都可以刷脸进入,开车进地库自动抬杆,车停好的一瞬间,电梯已经为你打开,你走到门口,家门自动解锁;你从网上下单一件商品,可以自由选择参数,下单之后工厂开始为你自动生产,天上飞的地下跑的全是机器人,直接把你想要的东西送到家。。。然而,几年过去了,人们发现这些改变虽然正在发生,但是速度似乎比想象中慢一点。在我看来,慢倒不是技术不到位,而是“机缘”不到位。例如,很多社区会觉得,建设一套智能门禁系统比几位朝阳大妈的工资高多了,却并不一定能获得更好的效果。说到底,很多事情用人力解决的效率还比机器高。这就有点像种田,如果只有后院的一亩三分地,老爹带上儿子和一头牛就能搞定秋收。只有在广阔的平原上拥有千顷良田,才会动用联合收割机。由此看来,只有一些超大型企业才有动力进行物联网改造。如果厂房里没有人,甚至都不用开灯,被称为“黑灯工厂”。
于是,阿里巴巴 IoT 事业部东挡西杀,帮助很多大城市部门和大型企业进行了物联网改造,例如和步科自动化、佛山照明合作,建立了全套的工业物联网体系。不过这样一个大企业一个大企业地改造,很是辛苦,却很难让普通人真切地感受到科技进步带来的改变。以至于当初幻想未来生活的那些人,又纷纷开始怀疑万物互联的 IoT 时代到底是不是真的会来。。。就在这时,阿里巴巴带着尴尬而不失礼貌的微笑,不慌不忙地走出了第三步棋。在围棋中,经常有这样的操作:两处看似被包夹的棋子,被棋手三下五除二巧妙地连接起来,兵合一处,就突然变得战斗力爆棚。2020年1月1号,阿里巴巴突然发布公告,库伟同时担任 IoT 事业部和天猫精灵事业部的负责人。直到这时,人们才看清楚,原来阿里巴巴正是玩了这一手“合围战术”。天猫精灵代表了“人-机交互”技术,而 IoT 代表了“机-机交互”技术,这两套系统融合,就是“人-机-机-机-机交互”。对应在真实世界是这样的:人只需要和天猫精灵交互,而天猫精灵作为“助手”,负责和一群机器交互。这群机器,有可能是空调、电视、洗衣机,也可能是手环、眼镜、按摩仪。我亲眼看到,家用设备 IoT 化的速度是非常快的。2019年年中,国内某个生产家用电器的大品牌就要求从2020年1月1日起生产的所有产品都要智能化,必须具备 IoT 连接功能。
中国的家电一般是以“产业带”的形式存在的,就是一个城市或者周围的几个城市都共同生产同一类产品。从2019年开始,浙江慈溪电暖风扇产业、广东中山照明产业、福建福安按摩仪产业还有浙江嵊州厨电产业的很多厂商都陆续转向智能化。例如浙江亿田智能厨电,基于天猫精灵开发了一套智能集成灶,用语音就可以控制发酵、蒸鱼、调温、定时;例如佛山照明,推出了可以被天猫精灵控制的各种智能灯具。中哥顺势YY一下,感觉下一步潮汕功夫茶产业带就要开发出智能茶具了。。。
虽然无数家用智能设备正在出现,但显然阿里巴巴还嫌速度不够快,他们想让更多的智能设备快点诞生。关键一点:还要诞生在阿里巴巴的 IoT 网络中。于是,2020年5月,天猫精灵突然揭幕了一个厉害的东西:妙物平台。这是个啥呢?简单来说就是,全世界大大小小的团队,都可以和天猫精灵一起合作,开发出在天猫精灵物联网中的智能硬件。库伟放出豪言,要花100亿,而且是今年就要花完100亿,孵化出100款销量在千万级的智能产品。这个架势比当年阿里巴巴补贴销售天猫精灵的阵仗有过之而无不及。如果阿里巴巴真的按照这个计划执行,估计在未来一年,我们应该能买到很多质量上乘,又便宜到离谱的智能产品,例如智能冰箱、智能电饭煲、智能台灯。当然,这些设备都会天然和天猫精灵相连接。这个妙物平台,很容易让人联想到另一个平台,那就是小米的“米家平台”。在米家平台上,有很多小米自产的家居设备,也有很多合作伙伴的设备,他们都可以通过背后的物联网相互连接,使用过小米产品的浅友们应该都很熟悉。在我看来, 妙物平台的初期会和米家平台有点像,都会是家庭场景中用到的东西。但是,根据我对阿里巴巴的理解,他们这样做虽然看起来直指小米,但绝对不会在智能家庭这个领域跟小米长久死磕。妙物平台上的无数设备,很可能是在为阿里巴巴 IoT 战略的第四招棋做准备。假设在几年后,妙物平台上的爆款设备有几百种,城市里很多人家里都有一台天猫精灵,会出现什么情景呢?在所有设备的背后,会出现一张非常强韧的物联网,设备与设备之间用同样的“语言”交流,哪怕相距万里也可以实时调度,相互连接。这张强韧的物联网才是阿里巴巴想要的东西。它有两个目的:1、让天猫精灵背后的物联网具备工业级的连接能力,作为“样板间”,对各行各业形成示范。
2、在天猫精灵服务个人用户的过程中,等待中国人工成本的进一步上升,国家政策对于物联网基础设施的进一步倾斜,直到城市、社区、工业领域黄金时机的全面来临。
到了这个时候,接入物联网的设备,就可能不只是各个家庭的冰箱、彩电、洗衣机,而是更多的楼宇电力、医疗仪器、工业生产线。这个级别的物联网,才真正把每个人的生活和这个社会的根基:工业制造、健康医疗、城市治理联合起来。如果这个构想实现,你再回望2017年阿里巴巴在 IoT 领域下的第一颗棋子——天猫精灵,才能完整地体会到老司机们横跨一个世代的谋篇布局。不过,有一件事很值得思考:科技人下这么一盘大旗,克服无数难关,一点点推进 AI 和 IoT 技术,把人和万物都连在一张网里,究竟为了什么呢?从人类文明诞生以来,有一个巨大的趋势从未发生变化,那就是:人的“生命”和“时间”变得越来越宝贵。人的生命变得宝贵,意味着任何人的牺牲都是要避免的。2011年,福岛核泄漏发生,无数工程师冒着生命危险返回辐射区域进行抢修;2020年,湖北爆发新冠疫情,无数医护人员冒着生命危险进入武汉,治病救人。他们之中的一些人,帮助了别人,自己却再也没能站起来。你我这样的普通人,会被逆行者的可爱可敬而感动。但科技人却会从另一个角度思考这个问题:如果把时间拉到无限长,危险一定会再次降临。到那时,我们是否有更从容更安全的方式来应对?一个 AI+IoT 的网络,恰恰就是最佳的候选人。如果在2020年的新冠疫情来临时,一个强韧的 AI+ IoT 网络已经就绪,我们就可以在医院里有病毒风险的病房和手术室里使用机器人护士,甚至可以让医生在安全的环境内通过远程操纵医疗器械来为病人治疗,而医院日常的消毒和清洁工作,都可以交给楼宇机器人来完成。这就是在疫情期间,楼宇内自动消杀机器人工作的场景。人的时间变得宝贵,意味着老板要为员工的每一秒钟付出昂贵的对价。在今天的中国,有无数岗位上最无聊和没有创造性的工作,还在用人类实现。这背后的根本原因,就在于人类劳动力的价格低于机器。但是向远处看,人的时间价格会在越来越多的领域超越机器。每一次超越之后,机器都会代替人“执行者”的位置,人会站在机器之上,成为更大的“战略制定者”。这个奇点来临之后,人口就再也不是国家竞争力的关键,科技会让生产力以 Ctrl+C、Ctrl+V 的速度迅速复制。而像阿里巴巴、华为、百度这些公司的大战略,正是让这一天快一点到来,而某国拼命遏制中国的本质,正是在减缓我们向这个奇点迈进的步伐。据此,AI+IoT 的未来,当然不仅仅是某个公司的“赛道”这么简单,它也是这片土地上人们的梦想之一。为了这个梦想的到来,人们需要勇气和坚持,也需要站在时间岸边的一点点耐心。
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax