查看原文
其他

傅盛机器人发布会精华版:梦想可能就是源于当初那一点点异想天开(下)

2018-03-25 傅盛 傅盛


傅盛机器人发布会精华版:梦想可能就源于当初那一点点异想天开(上)


有了新的机器人梦想,我们开始全力投入。为了让机器人往前冲得更快,单独成立了一家公司叫猎户星空


为什么取这个名字呢?你知道,当你冬夜里抬头看着满天星斗时,最大最明亮的一个星座就是猎户座。

 

我非常钟爱这个名字,把我们最钟爱的机器人放在了这家公司亲力打造。

 

 

仰望星空  脚踏实地

我对机器人行业的两个困惑

 

虽然做机器人就像仰望星空一样,听起来激动人心;但做好这件事,就得脚踏实地。

 

为了快速了解行业,我花了很长时间去学习,跑了很多国家,比如美国以色列日本欧洲;全球飞行了近20万公里,每周工作六天,踏踏实实做个小学生,学习很多曾经从未接触的知识。

 

这个过程中,我产生了两个疑惑:

 

第一个疑惑:那些刷遍朋友圈的钢铁机器,好像马上就要来统治人类了,但为什么从未在现实生活中出现过?

 

先看几个例子。比如波士顿动力这家公司,以擅长的机械控制技术展示漂亮空翻,遗憾的是,波士顿动力已经被Google给卖掉了;还有日本的ASIMO(日本本田机器人),已经研制30年,成本高达80万美金,至今不能走进家庭。

 

我跟很多相关的人一起讨论过这个问题。今天的机械控制还是一个非常复杂的系统工程。技术进步也非常缓慢。如果没有定义清晰的标准,他们每隔半小时就得充电。所以,这些机器人要想走进生活,还有很远的距离。

 

第二个疑惑:AlphaGo都已经下赢李世石了,都要超越人类了,为什么我们看到的机器人还笨得超出想象?


今天你到生活中的任何地方,比如机场,你看到的机器人其实都特别傻,傻的出奇。很多人肯定会diss我,说不是这样的。

 

我也看过很多相对好一点的机器人,比如pepper。很幸运,我认识这家公司的投资人,他们后台这段对话一定是事先写好的,再拿来录制出炉的。这位朋友人告诉我,有的时候为了宣传只能如此。

 

是套路啊……

 

尽管机器人的表情做得有特点,当然造价也很高,但它就像一个录音机,录好一句,说一句,再回答一句。但这不是人工智能。

 

为什么会这样呢?这是我当时一直在问的一个问题。

 

为了解这款机器人,我专门去过两次日本,与核心团队一一聊了个遍。孙正义当年花了很多心血,想要做成这款机器人,后来被日本首相带去参加G7峰会,成为了日本国力的一种展示。其实,远没有达到当初他们的预期。

 

我相信,没做到,一定不是因为他们笨,也不是为了去拍一段秀。真正的问题在于——人就是一个超级复杂的产品,单点总是被超越,整体却遥不可及。

 

 

人是超复杂产品

举个例子:“服务员,给我倒杯红酒”

 

这一整套流程有多复杂呢?我举一个小例子。当你走进餐厅,应该都有这样的需求,找服务员帮你倒一杯红酒。尽管这样一个简单的任务,目前全世界没有一家机器人公司能做到,说完这句话红酒就来了。除非是固定轨道的机器人。

 

尤其在嘈杂的环境中,我们的耳朵是一个非常了不起的感官器。今天没有一个麦克风能超越。在一个吵闹的环境中,你听到一个人说话,可立刻只听他的声音,不听别人的声音;当你低头玩手机时,别人跟你说什么,完全听不见;但当你想要听到一些话语时,可以排除很多噪音去听到那个核心要点。

 

“给我倒杯红酒”这个行为,除了涉及非常复杂的语义理解技术,还涉及图像识别技术。比如看你一眼,就要知道你在哪里,长什么样子,然后将红酒递送给你。光看一眼,就非常难,为什么呢?因为可能在昏黄的灯光下,你可能只给他了一个侧脸,就可能导致人脸识别不准。

 

当下,我们讲摄像头有多好,人脸识别有多好,其实大多还是在特定光照条件下。而人眼是5亿像素,即便在晚上,一根蜡烛点出来也能清晰看见你,且没有噪点。可是,今天你能买到的最好的手机也就2000万像素。但问题是,高速行动时,还能看清外面的风景吗?人可以,机器能做到吗?想想,无人驾驶为什么这么难?因为速度快了后,整个处理都会下降。

 

理解了“听到”和“看到”两个行为的难度之后,你还得让机器知道红酒的位置吧?也许在吧台,也许在厨房,中间路线怎么规划?如果走着走着突然一个小朋友跑到你身边,应该怎么避开他?即使看到红酒后,还得懂得塞子怎么打开……甚至包括红酒怎么倒?能倒多少?多快的速度,什么时候倒好,拿杯子的哪个部位?力气大了会不会把杯子捏碎?怎么端过来?都是非常复杂的系统。

 

 

做机器人确实很难

正因为它难  才有我做的价值

 

因为我们自己是人,常常就觉得人没什么了不起。但,如果你想制造这么一个产品,它的难度大到超过很多人的想象大多数人可能比较习惯于定式思维,认为这件事没什么难的。


无论怎样,人族同胞们要有自信,我们进化了上亿年,不是一个算法能超越的。谈论人工智能取代人,以我自己的观察来看,我不知道是否可以,但至少还有很远很远。如果人真的是上帝创造的,那上帝就是一个不可超越的产品经理。

 


对于很多热爱机器人的朋友来说,这是一个好消息,因为我们人类终于不会被消灭了:)但,作为一个以机器人为梦想的产品经理来说,真是特别特别的

 

今天还没有一个像机器人这样的设备,能够做到主动感知。虽然大家都有智能手机,但和机器人相比,它并不智能。手机的每一个指令,必须人去点击,去打开,去触控。而机器人应该是站在那里,当环境发生变化时,主动来做一些事情。此时,你就会知道传感器、语言、脑、计算能力、深度学习都有相当大的距离。

 

更何况人工智能还很幼年,有多少人工,才有多少智能。

 

什么意思呢?今天的人工智能技术,即使去做一件很小的事情,比如学一句话,认一个人脸,我们都要动用大量的人力去标注数据,再用机器去学习这些数据,迭代也需要时间。这个学习的过程不像一个小朋友,每天跟他说几句,实在不行打他一顿,他就学会了。

 

所以,整个产业尚处在早期,整个行业找不到几乎一款真正有用的机器人。理想很丰满、现实很骨感。

 

我们经常看朋友圈一些新闻,认为我们自己已经到了山顶,下一步就是颠覆人类了,其实以我们真正干这行的人来说,只能算刚刚开始爬坡,正一步一步往前走。

 

当然,选择做机器人,不是因为它难就不做,而是因为它难,我们才觉得更有机会。正因为难,很多人才望而却步。美国人在登月时,肯尼迪说过一句话:“我们决定登上月球,并实现更多的梦想,并非它轻而易举,而是因为它很难,困难重重。”

 

我不想等到不难的时候再去实现梦想,而是要迎难而上。做难的事情,才有价值。我相信,所有的东西都不是从完美开始的。尽管人是一个近乎完美的产品,但我们并不需要一个近乎完美的产品。

 

我们只需找到我们真正需要的产品。

 

 

产品思维 重新思考

为真有用机器人而生

 

当我真正进入机器人领域,决定要做这件难的事时,我总结了八个字——产品思维,重新思考

 

第一点,不一定非得像人,像人不是最重要的,对用户真有用才是核心。

 

回想当初,我很早开始做安全软件,带了4个人的小团队,没有所谓的杀毒技术,也没有安全软件的经验。但我每天泡在论坛上,不停地去电脑城调查了解那些普通用户需要的功能——那些在技术之外,用户真正需要的一些功能。所以,那款产品在很短的时间,就达到了上亿用户,其实就是在技术和用户需求之间找到了恰当的结合点,而不是一味等待完美技术。

 

完美的技术永远不会出现用产品的思路找到最实用最契合的技术才是王道。

 

既然人是这么难以超越,我们做的机器人未必就要像人一样复杂。今天市面上看这些机器人,不管是日本的pepper,还是机场看到的永不开机的机器人,一定会找到一双手。事实上,那双手不能拿起几乎任何东西,唯一的作用就是显得像人。且手的关节非常多,成本也很高,对用户却没什么用。

 

第二点,通用机器人非常难,我们能不能做出一款在特定场景真有用的机器人呢?让用户真的觉得它对我有点价值。

 

我想起特斯拉刚开始做电动车时,电池技术并不完美。这个时候,它并没有出一款直接卖给老百姓的电动车,而是先做了一款跑车,让发烧友喜欢;第二款车做的是豪华车,因为当你家里有一辆车时,你又比较富有,再买一辆豪华车作为备车,直到最近才推出了大众版的Model 3。所以,我们能不能从一个小众的、边缘的市场切入,去找到这样的用户需求呢?

 

这是我一直思考的问题。

 

第三点,由于产业尚在早期,为了做到真有用,就得下笨功夫,自己造轮子,去认真打造每一个细节。

 

为什么说要自己造轮子呢?比如语音唤醒技术,虽然市面上有各种各样的开放平台,但它并不像一些开放平台已有积累,他们也才刚刚开始,能满足的需求是非常少的。

 

再举一个例子。很多公司说,他的语音识别率能到多少多少,包括今天现场也用的是我们自己的语音转文字大屏技术。这个技术,坦率地说,我们不是最好的。因为这需要对长文本进行训练,但在音箱或机器人行业里,并不需要大篇的演讲。很多时候,你只会说,帮我播一首歌,带我去哪里,谁谁谁在不在等这样的短句。

 

这就好比,你要造一辆汽车,需要一个轮子,市面上能买到越野胎、竞速胎、雪地胎,但机器人这个行业,你只买得到一种轮胎,那就是木轮子,只能保证你能滚动,没法更多别的运用了。

 

所以,我们只好自己去打造适合我们场景的轮子。今天,整个机器人行业就是这样。得下笨功夫,把每一个细节打磨好,可能多那么一点,累计起来就是一个巨大的差别。如果每个细节少那么一点,几乎就等于没做,等于零。

 

如果不自己做会有什么问题呢?比如,pepper机器人的语音系统就采购了别人家的,买了一家法国公司,将形体技术集成。此外,他们的视觉也不是自己做的,于是导致机器人只在形式上很讨巧,使用几分钟后,新鲜感没了,就发现没什么用了。

 

即使光对话能力,全世界也没有一家公司能做到人类真正的语义对话能力。谁要说机器的阅读理解超过人类,基本都是在耍流氓。

 

我们的目标就是为真有用的机器人而生。我们不想去讲什么像人或不像人,或跟谁的技术怎么比,这都不是我们思考的问题。我们唯一的出发点就是——像做手机一样给用户做一款他真正需要的好产品。

 

为了这样一个产品,我们打磨了两年之久。我有一个词,叫化整为零,即把每一个系统的细节能力(比如眼/耳/口/脑/手),都变成一项产品,然后推向市场,再与用户见面。

 

所以,此刻,我要发布第一款产品了。这个产品,我们叫它真有用的机器人。

 

 

第一款真有用机器人:豹小秘

提供五星级服务的接待机器人

 

你们一定经历过这样的场景,比如遇到以下这些问题:“你好,我是来面试的,请问哪里面?我的胃不舒服,挂哪一个科?哪一个窗口能办暂住证?这个兵马俑背后有真正故事吗?”。

 

我们其实需要很多的引领、接待和讲解。无论是公司前台、博物馆、公共事务,还是医院,我们都需要这样热情的接待。

 

我们本来希望的接待是这样——礼貌又热情,长的像初恋,主动引导你,百问不厌烦。但现实中,你遇到的接待是这样——经常不在岗,忙着看微信,口气也很冷漠,我管你是谁。

 

我认为,这是一个有需求的地方。以我们的语音视觉能力,非常有机会让它变得真有用。我们给这个产品命名豹小秘——全球首款五星级服务接待机器人


https://v.qq.com/txp/iframe/player.html?vid=o06116si04s&width=500&height=375&auto=0

 

1.优雅曲线与灵活头部

 

希望你们遇到它时,都像在五星宾馆里遇到的服务员一样。当你问它,“厕所在哪儿”,它一定不会跟你说,“向东走两个路口”,而是说“请跟我来,我带你去”。当你去到一个陌生的地方,它可带你参观,一定不会只顾自己玩手机,而是给你讲这里有什么故事。

 

为了让大部分人看到它时没有压力,我们并没有给它装上一双手。屏幕的引导,足够了。加上手后,只会增加成本和控制的复杂度,却并不实用。当时内部的代号都想叫它维纳斯。


 

我们也没有像你在市面上看过的很多机器人一样,把脑袋做得和人一样圆圆的。因为做得圆圆的,除了形状像人之外,并不能做出人的表情。

 

所以,我们在它脑门上加了一个显示器,使得它既可以做表情,也可以表达信息。不需要像pepper一样,在胸口上加一块屏幕。

 

包括整个机器人的曲线也很优雅,做得也比较舒服。每一个细节都是非常精心打磨。我们做了一个能够180度旋转的云台,脑袋可以上下左右自动转动,如此,它就可以随时看着你,非常灵活地跟随你。

 

那么,这样一个产品,看似很简单,它里面包括了哪些技术能力呢?接下来,我们就分别讲讲我们自主研发的几个子系统。

 

2.全感知智能系统——眼

 


大家可以看这张图,其实从上到下,全部都是感应器。从脑袋上最开始,就有一个广角摄像头,有150多度。我们在背后也给它加了一个摄像头。当它在前面走时,就能看到你有没有跟着它。避免它走它的,你走你的。

 

我们还在它前面加了一个立体摄像机,胸口也加了一个立体摄像机,类似于iPhone x 前置摄像头,但我们比它的距离远,最远能看到6米处人的位置。它还能把人的3D图像给还原出来,这样就避免了平面的图形识别困难。

 

此外,脖子上加了6个麦克,头顶上加了2个麦克。为什么要有6个麦克?它是一个环形麦克,当你对它说“小豹、小豹”的时候,它会把离你最近的麦克打开,听你的声音,把另外5个全部关掉。

 

所以,即便你的周围很嘈杂,依旧可以很好地响应你,识别你的语音。而头顶的麦克,是为了当你走近时,那个麦克风能去识别你的声音。

 

最后是底座,加了一个广角全局快门摄像机,和我们平时的摄像机最大的不同在于,它是整幅成像。而我们平时的相机,是一行一行成像的。当它快速行动时,它能整幅成像,且保证画面不出现偏移。这都是很细节的技术。

 

底座还加了一个激光雷达。无人驾驶车都要有激光雷达,避免在光线黑暗情况下或图像不能识别时,用激光去识别障碍物。

 

除了激光雷达,还加了6个超声波传感器,使得即便其它传感器都失灵,也不会碰到障碍物时撞上来。因为超声波传感器能知道回波,但不知道方向和距离。

 

所有的这些感知传感器,都是为了让豹小秘能在一个环境当中,找到你,跟随你,引领你,并避开所有障碍。

 

不仅如此,这么多传感器,要能协调运行好,也是非常麻烦的。为了这一整套感知系统的良好运行,我们自己研发了人脸识别算法。不仅能看到人脸,还能根据人体形状进行识别,保证当你转身时,也能认出你。

 

因为,人也不是完全靠人脸去认人的。光靠人脸去找一个人,在现实场景中,失败率会非常高。所以,我们融合了整个人体识别技术。

 

3.麦克风阵列技术——耳

 

去年,我们就跟喜马拉雅一起发布了一款音箱叫小雅AI音箱。其中,所有的麦克风技术、语音技术都是猎户星空做的。到目前为止,它已经经过了超过1.5亿次的用户唤醒。

 

什么叫唤醒?“服务员给我倒一杯红酒”,这就叫唤醒。我们还自主研发了TTS语音合成。你在电脑里面打出一段文字,电脑就把这段文字念出来。这不是通过录音完成的。这个技术很多公司会说有,我也相信很多公司在技术点上有他自己的优势,但这不是一个靠技术就能做到完美的东西。

 

我们与其他公司思路的最大不同,在于花了大量人力去打磨这个声音。我们找到发音人后,让他一句句录下来,再让电脑去学习,调动好几十人参与,精心做非常细致的标注。花了一年的时间,打磨了自主语音合成技术。

 

除了小雅这样一个声音,近期还专门为孩子做了一款童音。很多公司不愿意在这里大投入。因为它不是一个体现技术能力的活。它体现的是关注用户的感受,或要花非常高的成本去完成的一件事情。

 

我们很多合作伙伴都想让他们的音箱用小雅的声音。目前,小雅的声音只在喜马拉雅音箱、小米音箱、小美音箱和小豹全系列机器人产品上才有。

 

我再给大家讲一个细节,为什么我们要自己做麦克风?有人说,科大讯飞也有6个麦克,拿来用那个就行了,为什么也要自己做?因为科大讯飞的板子拿过来,放到产品舱体里时,它的回音就会和音箱里的回音不一样,使得声音的识别率立刻下降。

 

只有针对自己的舱体去做麦克风,才能达到真正的语音识别效果。今天,你到各个展厅去看,他要说,用了哪一方面语音技术,实际都不可用。隔几十米,看到一个领导来了,就开始打招呼,其实机器背后有一个人。

 

4. 室内自主导航系统——腿

 

我们还做了什么呢?室内自主导航系统,也叫多传感器融合

 

人眼是非常牛的。一双眼睛,既解决看脸的问题,也能解决开车的问题,还能解决晚上找东西的问题。传感器做不到的,我们就优化算法。尽管我们用了激光传感器、视觉传感器、超声波传感器的多传感融合,但,离人眼还是很有差距的。

 

如果没有那么强的光照,高速度的情况下,我们今天已经是行业内跑得最好的导航平台之一。它的成本比市面上的很多成本都要低。我们把这些传感器做到了很好的融合。

 

无人车上,一个激光传感器要几十万的成本。今天,很多在屋子里跑的运货机器人,一个成本也要上万元。我们成本只有对方的十几分之一。本质都是为了把高高在上的技术成本降下来,让大家觉得有用



我们还受邀参加了GTC日本机器人赛。英伟达的老板黄仁勋看了这个产品,非常感兴趣,要求我们去他们的场内展示。日本技术展的公司里,我也没有看到有哪一家公司,能在这样的场内做出来回自主巡航的导航产品。

 

4.语音语义能力——口

 

什么叫语义呢?比如,“服务员请帮我倒一杯水”,当机器人把它还原成拼音,它就能理解倒一杯水这个词的含义时,这叫语义能力。

 

如果你看到朋友圈里说,一个系统对文章的理解超过了人,这个结论一定不要相信。比如你读一段文本,可能有机会。但,对于通用语义理解,今天在全世界来说,都是难题。

 

我们的做法是针对用户问的最多的问题,去精细打磨。所以,我们在合作伙伴的音箱产品上,包括小雅的产品上,针对用户说“想听哪首歌”,“听哪一个评书”等做了大量的优化。有时候,你说我想听《飘扬过海来看你》,你只要说到“来看”两个字的时候,它就知道你要的歌了。它可以非常精准地给你播出来。

 

有人在谈智能交流,理解情感,坦率讲,这件事走偏了。我跟pepper的首席产品经理谈完后,他说,日本pepper要做成一个情感陪护的机器人。我觉得这款机器人基本是没有机会的。因为今天,即使用语音下达一些指令,就像遥控器一样,帮助人完成一些任务,已经能做得非常好了,也做得很舒服。

 

这也是一开始我们跟别人在产品思考不一样的地方。

 

5.行业最强芯片系统——脑

 

我们的机器人里放了三块芯片,分别是高通821、英伟达TX1、英伟达TK1,整个运算能力达到了2T的Flops,相当于3.5个iPhone X的运算能力,几乎能做到感知周围的环境。

 

其实,人脑还是很了不起的。我们可能用一个近乎灯泡的能耗,就能完成对复杂环境的判断,而在机器人上却要用这么多的芯片,同时还要优化算法,才能让它变得很流畅,还要让他们芯片之间通信衔接好,我们自己下了很多功夫。

 

你看到很多机器人,刚开始动了一下,然后又不动了,或者等一会儿再动,一不小心又动过了。人脑只有零点零几秒的反应时间,而如果整个机器系统的协调时间到不了这样,人就会觉得它特别笨。这些细节,我们做了大量优化工作。

 

此外,我们还往肚子里加了很多电池。经过实测,比手机还耐电,可长时间在办公区来回跑,也不喊累,也不需要回充电桩充电。头部也非常灵活,有很多很多的传感器,基本就能完成很好的接待任务。除了以上这些自研的技术成果外,也和微软、搜狗等公司建立战略合作。 

 

6.为什么选择接待这个场景?

 

为了找到接待这个场景,我们内部至少翻新了5、6个版本。我们跑机场,商场,不断想需求,不断想到底能不能做到和这个需求符合,内部的产品其实都推翻了很多很多版。

 

一度,我们认为可能这条路是走不通的。后来我说,不要想做那么多事情,甚至把手从它的身上卸下来,我们就做好这一点点接待。

 

这些接待看上去很简单,如同刚刚那个案例,只是简单的“帮我倒一杯红酒”,放在机器人上也变得很复杂。所以,我们认真打磨了这样一些功能,只需要输入2、3张照片,就能做到精准人脸识别。

 

这套识别系统在猎豹2000多人的上下班打卡中,每天都在被使用。

 

他们还做了一个老板分身和夜间巡逻的功能。当你需要去处理一些远程的事情时,你可以附体在它身上,还能像在公司一样跟员工一起开会。到晚上了,就像一个保安。因为它有公司所有的地图,你只要给它制定任务,它就会不厌其烦,一圈一圈,来回巡逻。

 

7.零经验,零设备,快速安装使用

 

它还有一个很重要的功能就是快速建图。建图的本质就是让机器人知道整个环境。我们把它做得像一个手机APP一样简单,只要你打开手机,进行前后左右操作,跟着它,再带它走一圈,它就记下了地图,就可以开始为你工作了。

 

我们把它叫做零经验、零设备。只要手机,就能简单操作,没有任何门栏。无需编程,只需拖拽图标,新建任务,与制作PPT没有本质区别。

 

市面上所有的机器人,真的没有用。我们买了一台号称高科技公司做的价值15万的机器人,拆开以后,我特别生气。我跟我的产品经理说,你给我退了它,就算损失5万也要退了,因为它不值得我学习。

 

完全就是把很多系统采购过来,集成组合装在一起,再套一个壳子,加一双手臂,弄一个圆球,就叫机器人了。甚至底下加一个轮子,上面加一个Pad,就叫机器人。没有考虑过场景以及用户的需求。

 

我们要做一款有用且智能的机器人。做到什么价格呢?讨论了很久,自动充电、五星级接待、麦克风阵列都是我们自己做的,内部还用了汽车上用的Canbus总线,使得我们整个上下系统之间的通信连接非常好。

 

即使你来回跑得很快,它都能跟得住,这就是系统融合。因为它要用上面的视觉指挥下面的底盘转动。很多机器人转得慢,是因为它通信也很慢。我们的豹小秘相当于3部手机来回通信。

 

讨论了很久的价格,决定用一个和以前不太一样的价格策略,我们希望用一个月2999的租金来让大家体验这款豹小秘。



我们也和58同城首家合作机器人租赁频道, 跟傅盛战队投资项目——医号线,潘石屹先生创办的SOHO 3q,毛大庆先生创办的优客工场,小米之家等建立商业合作。

 

基于刚刚公布的那几款自主研发的子系统,他们一起组合构建了我们的猎户机器人平台(orion os),能力全部开放出来,与行业一起进化。


 

第二款真有用机器人:豹小贩

一个会行走的零售机器人

 

很多人一定记得当年挤绿皮车时,列车员总是推着小货车售卖一些零食,这大概是当时春运我们能到找到的唯一的五星级服务。

 

我们想把这样一种能力复制到更多的地方。比如图书馆,大型商场,游乐园,或者健身房。所以,我们和越凡创新一起推出了这款能行走的售卖机器人——豹小贩。


1. 它会主动来到你身边,给你想要。

 

通过生物识别技术,知道你的年龄性别频率等就主动能来到你的身边。你只需要扫码,就能获取商品。不需要口渴时到处找售卖机或找小卖部。

 

我们在电子科技大学做过一个30天测试,它比售卖机的效率高3倍以上。因为今天整个消费环境的变化,消费者变得越来越懒,越来越希望随手可得。

 

2.肚子足够多,商品足够多。

 

肚子也足够大,中间有一个钻地设计,通过旋转,就能直接把你需要的品类吐出来。商品也足够多。

 

3.长期不喊累,电池足够大。

 

 

第三款真有用机器人:豹豹龙

覆盖0-12岁儿童教育内容的陪伴机器人

 

以我们的技术,能做出这两款已经不错了。但,我们能不能去找到一款真正为孩子准备的机器人呢?就像阿童木陪伴孩子的童年。

 

现在市面上有很多玩具,比如故事机,但其实都没有做到足够贴近孩子的需求。今天的孩子,除了手机和Pad,就没有真的玩具了。很多玩具从来没有创新过,都是用低廉的价格对外形产生一时的兴趣,但并不能真正让孩子童年变得有趣、快乐和有知识。

 

我们做了一个调研,发现孩子喜欢会发光,外形好看,会动的,能跟着孩子唱歌、讲故事的玩具。于是,我们做了这样一款机器人:一个会发光,能动的,能听得懂孩子话的,能唱歌讲故事,还能学习英语和编程的儿童陪伴机器人

 

https://v.qq.com/txp/iframe/player.html?vid=w0611thj8ej&width=500&height=375&auto=0


1.坚持真童声,呕心沥血

 

为了做出一款真正让“孩子陪伴孩子”的陪伴机器人,我们需要让一些小朋友每天花几个小时去教机器怎么说话,连续几个月去打磨。有时候,小朋友讲很长时间后,就会没有力气。有时候,中途小朋友不想录了,就得重新再找一个人从头开始录,非常非常麻烦。

 

为了打造了刚才大家听到的童声,花了很大的精力。

 

2.24小时安全陪护

 

基于我们的视觉识别技术,我们能做到危险提醒,随叫随到。小朋友自己在一个房间的时候,机器人可以形影不离,甚至帮他养成一些好习惯,比如早起床、吃早餐、喝水,记录他的整个成长。

 

3.独家定制优质儿童教育内容

 

我们为豹豹龙定制了很多优质儿童教育内容,选择了国内最领先知名的儿童内容平台一起打造编程、英语内容和儿童情商内容。

 

比如,傅盛战队投资过的一个项目——编程猫。我们在他没有团队,只有一个创意的时候就投资了他,一直支持他做到中国最大的青少年编程教育平台。现在,基于这款机器人,他们会为豹豹龙独家定制专属的开发语言,孩子只需要拖拽模块,就能像搭积木一样,控制豹豹龙跟他一起去做一些事情。



乔布斯说过,每一个人都应该学习编程,因为编程会教你如何思考。我也认为,下一个时代是程序和人的教导的时代,你不一定要成为程序员,但学习编程是为了了解下一个时代

 

除了编程,豹豹龙也跟全球领先的英语教育品牌VIPKID进行首家合作,为孩子提供一对一的英语教学;与国内领先的中小学名师家教平台独家定制内容,孩子在家只需要线下课外辅导三分之一的价格与名师一对一指导,在家也能解决学习难题。

 

 

第四款真有用机器人:小豹AI

东半球音质?好的智能音箱

 

我们也把智能音箱也定义为机器人。只是它没有眼睛,没有腿,但能完成很多AI交互。


很多人可能会问为什么做智能音箱呢?其实我们不是赶热潮。本质上,我们是最早除了叮咚之外,第二款联合喜马拉雅做的小雅音箱,其中所有语音技术都出自猎户星空。

 

我们认为,即便是智能音箱,音箱的本质仍然是音质。所谓智能,就是帮你更快找到内容,更快完成一些操作,而不是走向技术迷恋,做所谓语言的对话能力。

 

消费升级的时代,我们需要更动听的音乐。我们的同事挑选了几家智能音箱,做了百人盲测,找了公证处监督,测试结果是小豹音箱音质第一。

 

音质非常非常重要,如果我们一味强调智能,让音质变得很差,就舍本逐末了。所以,我们在喇叭的选取上花了很高的成本。同行只有2个,我们有5个,单个喇叭成本高于几倍。

 

除了好音质外,还有上千万集音乐音频内容。与拥有1700万曲库的QQ音乐深度合作,赠送2年音乐服务。基本所有的歌都可通过小豹直接听,不需掏出手机。

 

也有人问我,如果手机上就能听,为什么我还需要一个音箱?我自己也是这样一个用户。经常跑着步,用手机听着喜马拉雅,但等我真正自己在家时,尤其洗澡或双手腾不开时,就会喜欢用音箱收听,也不需要独立打开某个APP。只要说我想听什么,内容就到面前了。非常非常简单。

 

不仅如此,我们推出了基于区块链技术的内容收听计划。你听的音乐和其他内容,包括你跟它的对话,也能帮助你兑换积分,我们会把这些收益拿出来分享给用户。也可以在猎豹、猎户的所有体系下兑换产品或奖品。

 

我们也把会这个能力输送给很多合作伙伴,除了喜马拉雅,小米,美的,我们也会跟锤子科技一起在下半年推出一款语音相关的智能硬件。

 

 

第五款真有用机器人:七轴机械臂

走进生活的智能易用低价机械臂

 

机械臂发展60年,一直停留在生产线,我们普通人在生活中从未见过机械臂,但它是一个非常重要的技术,不是简单的玩具。


虽然你可能见过一些机械臂,但都做得很大、很贵,就是因为关节技术,以前叫谐波减速器,占据了很大的成本。以前,日本和德国在这方面的技术很强,有它自己独到的专利技术。但这个专利期是50年,2015年其实已经过期了。

 

今天,谐波减速机大家都能开始生产了,我们看到了一线曙光。过去30年,所有最聪明的脑袋都去琢磨怎么点击广告了,我们在想,能否把聪明的脑袋用来琢磨机械臂,让机械臂从生产线真正走进日常生活?让他们真的能帮助人们干点活?

 

但,必须坦率的说,走进生活还困难重重,三个问题阻挠了机械臂从工业走进生活。第一,智能;第二,低价;第三,易用。

 

现实是,机械臂能做出灵活的动作,但它并不能感知周围的环境。你在生产线看到的,无论是特斯拉的生产线,还是其他的生产线,做出那么灵巧的动作都是预设好的。环境发生一点点变化,比如拧螺丝钉,换了位置,机械臂可能就拧不到了。

 

机械臂在工厂上要求极高的精度和极高的可靠性。一旦出现问题以后,整条生产线都得停滞。如此,造成了机械臂的价格非常高昂。那么,我们做机械臂的思路是什么样呢?

 

1.智能

 

智能是打开机械臂走进生活的第一环。但我们不该把精密度全部留给机械装置,而是应该留给算法。这是我们很重要的思路。我们的智能就是让机械臂长了眼睛,加上视觉模块,让它能够感知周围的环境。

 

光感知不行,还得让机械臂真的完成抓取。我们用了很多方案。做到今天在半开放的环境中,它已经能做到比较标准了。

 

我们测试了一些数据,有毫米级的抓取误差,我们当时所有的目标就是让机械臂能在外界环境变化的情况下,依然准确去做动作。这个点一旦打开,就有机会让它在更多生活场景中变得有用。

 

2.易用

 

我们将以前复杂的机械臂编程变成像拖拽积木一样简单,只需简单任务自定义,就能教机械臂做一杯咖啡,倒一杯水,甚至做一个鸡蛋。

 

3.低价

 

这个行业的价格有多高呢?一个生产线上,看到拿汽车的机械手可能要几十万、上百万不等;一只切东西的机械臂大概需要12万。这样的价格下,怎么可能进入家庭呢?

 

我们与投资的一家公司联合设计了一款机械臂:第一,它很小巧灵活。我们的手有7个关节,今天大部分是6关节的机械臂。我们用了7个关节的碳纤维来做这条手,就很轻;第二,足够安全,它自己有逆反馈,当碰到人的时候,就会停下来,不会伤人;第三,聪明能干,加上了视觉模块,就能干很多活。

 

 

我希望它能够更便宜。为了证明这件事情可行,我们首选了咖啡机这样一个落地应用叫豹咖啡。与咖啡大师相比,85%的用户觉得我们好一些。因为它不累,每天可以生产800杯,3倍于普通咖啡师。零培训,即可就能学会使用,还可以适应你的口味,保证品质一致。

 

 

全开放猎豹机器人平台

联合开发者  共同推动行业发展

 

我们整个机器人的OS平台已经全部公布了,包括我们的眼、耳、口、腿、脑,还有手。我们的机械臂平台也会建立开发者社区,能力也会全部开放,并成立专项产业基金,让更多的开发者和我们一起打造猎户机器人平台。

 

 

 

 最后,想说的话

  ……

 

发布完所有产品,此刻站在这里,我心中无限感慨。

 

前几天恰好是我40岁生日,雷总和我的很多好朋友一起给我庆祝生日,也带上了我们的豹小秘。对一个男人来说,40岁是一个很重要的时间节点。有时候,我也会问自己为什么还要折腾?姚劲波给我的评价是,最勤奋。“最”,肯定算不上;但“很勤奋”,可能算得上。



那天我爸爸给我写了一封信,信中如此写到:

 

1978年的今天,一个小婴儿来到了这个世界进入了我的怀抱。

他一天天长大,从学会走路到我带着他到处跑,走南闯北,逐步成长。

今天,他带着我走出了国门看世界。

一晃四十年,四十年的历练,四十年的努力,四十年奋斗,如今已是在世界潮流中冲刺。

拼搏、奋斗、向前,不断提高,排除万难,力图站在最前沿。

从山城挤进世界级的大城市,从名不经传的大学生,到带领众多博士生团队,从跟随潮流走到潮流前端。这就是当年那个小婴儿四十年的历程。

我为你感到高兴感到骄傲,感到自豪。祝你生日快乐!

 

感谢我的父亲!

 

我想说,正因为我的父亲,在我很小的时候,带我走南闯北,坐着火车到处看风景,才让我到今天都保持着一颗孩子的心。

 

在复杂的世界里,做一个简单的孩子

用好奇心打败灰心,用初心替代胜负心

用无比的热爱一起进化这个时代

 

https://v.qq.com/txp/iframe/player.html?vid=z061080tnzm&width=500&height=375&auto=0

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存