【前沿观察】人工智能竞赛:BAT保守布局 技术尚输国际巨头
来源:《财经》杂志(2016年6月13日),作者:谢丽容、梁辰
2015年12月,微软亚洲研究院首席研究员刘铁岩博士去蒙特利尔参加了NIPS年会(Annual Conference on Neural Information Processing Systems),这是人工智能领域的顶级学术会议。但与会期间,他印象最深的不是同行的专业进展,而是一位科学家告诉台下的与会者,早些年,他的博士生根本找不到工作,今年却被一抢而空。
这也是中国正在发生的故事。从硅谷到北京,人工智能都是热浪滚滚。这个在上世纪50年代和80年代掀起过两次高潮的技术,现在似乎真的到了产业化的临界点。互联网时代的思想家和预言家凯文·凯利宣称,人工智能是下一个20年里颠覆人类社会的技术,它的力量堪比电与互联网。
人工智能(Artificial Intelligence),缩写为AI。它是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。该领域的研究包括、语音识别、图像识别、自然语言处理和专家系统等。
人工智能快速进入大众视野,源于今年3月谷歌围棋人工智能程序AlphaGo战胜世界冠军李世石。人机围棋对弈只是普及人工智能的一个秀。它的背后是规模千亿级的人工智能产业市场。BBC预测,2020年全球人工智能市场规模将达1190亿元人民币。
目前看,这一数据远比不上2015年中国移动互联网的产业规模。但人工智能的意义不仅于此,人工智能技术的发展,还将带动云服务、大数据分析、移动互联网和物联网产业的升级迭代。它甚至将超越移动互联网,全面改变人类的生活和工作方式。
离人工智能最近的IT互联网公司敏锐嗅到了这一机遇。从2011年开始,包括深度学习算法、计算资源和大数据产业的成熟令人工智能技术实现飞跃,包括微软、IBM、谷歌、Facebook、BAT在内的国内外企业都开始深度布局人工智能,试图把握风口,成为下一个产业变革的巨擘。
已布局人工智能的IT和互联网巨头们,最有资格成为这一轮革命的获益者。但这终究是一个漫长的耐力游戏,除了技术布局,产业布局和战略视野也是决定成败的关键因素,短视者将随时出局。
BAT保守布局
中国的所有行业中,以BAT为代表的互联网行业在人工智能研究和商业化探索方面走得最早,也看得最远。其中,技术起家的百度走在最前端。
2012年10月,百度董事长兼首席执行官李彦宏参加了内部的一个基于深度学习的语音识别产品研究会。当时该产品的主导者余凯回忆,那是李彦宏第一次知道深度学习,他非常吃惊,并给全公司写信,让所有产品经理都要了解人工智能技术的发展。
李彦宏很快将相关技术投入到搜索的核心业务中。2014年的百度内部统计数据显示,深度学习技术的应用,让百度和竞争对手的Diff(different,内部叫Diff)指标提升了若干倍。 当年12月,李彦宏开始和余凯讨论成立深度学习研究院的可行性。次年7月,这个研究院成立,李彦宏任院长,余凯为常务副院长。这是中国公司里的第一个人工智能研究院。
但人工智能的科研,尤其是基础科学研究,是一个冗长寂寞的过程。此后,迫于财务数据和竞争压力,百度的决策者们更加注重眼前的布局和资源。
“到了后期,太长远项目,或是比较创新的项目,百度总部确实不太支持了。百度i站的项目、百度快搜这样的项目没了。”一位不愿具名的前百度人工智能研究岗位人士评价。一位现任百度相关人士对《财经》记者表示,百度前些年确实剔除了不少经过验证没有商业化前景的分支项目,但最近两三年,百度明显加大了在人工智能上的投入,包括无人驾驶汽车等长期项目。
6月8日,在2016百度联盟峰会上,李彦宏将百度无人驾驶汽车称作“一台带轮子的电脑”。他现场播放了百度无人车路测的实况录像,百度无人车已经可以像正常车辆一样加速、并线、超车,他同时表示,三五年之内,无人驾驶一定可以成为现实。
从整体来看,百度仍是BAT三家中首先完成有关人工智能技术体系整合的公司。目前,百度研究院、百度大数据、百度语音和百度图像等技术都已归入人工智能技术体系。李彦宏多次向外界强调,百度未来的发展将严重地依赖人工智能。
IBM研究院一位人工智能专家告诉《财经》记者,百度是被他们列入竞争列表的唯一中国公司。
硅谷尤其关心“百度大脑”的进展。百度大脑是百度在人工智能领域的核心。百度此前发布的诸多人工智能产品,如无人驾驶、智能搜索等,都是基于百度大脑的能力。
百度高级副总裁、自动驾驶事业部总经理王劲称,百度大脑已具备视、听、说和预测、规划决策以及行动控制的能力。在数据方面,百度有万亿级的网页、移动和行为数据可供分析。在深度学习方面,百度的万亿参数排在世界第一。
2015年,百度的研发投入超过100亿元。占百度2015年总营收663.82亿元的15%。
百度正在计划将百度大脑在金融、汽车、医疗等领域商业化。李彦宏称,人工智能的“井喷式”创新,将推动互联网进入第三幕,并将重构传统产业。比如“人工智能+金融”,可以快速地实现征信升级,实现“秒放”贷款。
阿里巴巴和腾讯的布局则更加克制。或者说,它们更代表中国公司的普遍做法,从业务驱动开始,逐渐加大档位。
阿里从2011年开始布局互联网医疗,投资收购和战略合作的公司数以百计。围绕医院、医保、医药做了大量布局。最新的统计数据显示,全国已经有超过400家大中型医院加入阿里的“未来医院”计划,覆盖全国90%省份。阿里云人工智能首席科学家闵万里博士告诉《财经》记者,阿里在健康医疗领域的布局快慢,取决于阿里在人工智能领域的技术突破。
阿里的设想是,未来,在阿里遍布全国边远山村的医院医疗点里,病患足不出户,只需拍一张CT,通过远程技术来完成专家级的诊疗过程。这种诊疗,依赖的就是基于阿里云的人工智能医疗系统。随着学习数据的不断增加,机器会变得越来越聪明,最终成为一个“永不退休的医学专家”。
多位接受《财经》记者采访的专家评价,阿里这个技术并不复杂,医疗诊断是基于经验的专家型劳动,是机器擅长的经验学习,三年内该技术便可成熟。
闵万里告诉《财经》记者,要实现这个目标,除了技术平台,还需要整个医疗体系的打通,需要政府和社会共同推动设备和资源的开放。一旦打通,聚合在一个人工智能服务平台之上,就将衍生出更多的应用服务场景,从而实现“商业和技术互为驱动”。
阿里是目前中国所有公司里,数据生态最完善、最健全的公司。iPIN创始人兼CEO杨洋认为,阿里的MaxComputer数据通道,是非常健康的数据大动脉,可以将阿里的所有数据资源非常高效地结合在一起。
此外,阿里云也是目前世界上最接近AWS(亚马逊云服务)的云计算平台。数据生态体系是做人工智能的重要基础。因此,在这场有关未来的布局中,阿里云的主导地位清晰。
阿里的人工智能研究分散在其各个业务分支之中,有待整合。闵万里说,阿里希望在算法能力上有所突破,这需要一个集中的技术机构来整合阿里的所有相关技术资源。
腾讯和阿里的情况类似。腾讯在人工智能上的布局,以IM和SNS业务为基础。例如语音识别主要是在微信部门、图片识别主要是在QQ,支付和金融业务方面植入了人脸识别,搜索部门则关注自然语言识别。
其中一些技术已在腾讯内部实现产品化。SNG(社交网络事业群)的优图团队聚焦图象识别领域,推出了黄图识别功能,并为腾讯内部产品如图片优化工具“天天P图”提供技术支持。WXG(微信事业群)则人机互动领域的拓展,也对图像和语音识别进行了原发。WXG推出了智能机器人“小微”,用户可以用自然语言与之沟通,解决此前语音助手智能机械应答的短板。对于未来,工程师希望“小微”成为一种“连接器”——与微信支付串联起来,接入微信公众号以及钱包内的各种生活服务,打造完整的微信内O2O闭环生态体系。
腾讯高级副总裁姚星在接受《财经》记者采访时表示,腾讯越来越重视在人工智能领域的技术开发,这包括两个路径:一是整合腾讯自身的技术资源,形成体系和重点;二是加快对优秀公司的收购和合作步伐。
腾讯参与了多个人工智能项目的早期投资。腾讯投资并购部一直在为公司寻找需要的标的,服务于腾讯的整体战略。腾讯日前与硅谷风投机构Felicis Ventures领头了人工智能创业公司Diffbot 1000万美元的A轮。这家公司通过人工智能技术,让“机器”抓取网页关键内容,并输出软件可以直接识别的结构化数据。
BAT的人工智能技术研发从第一天开始就是商业需求驱动的,他们从业务入手,收购甚至模仿别人的东西,这种做法避免了漫无目的研究和不必要的失败,但也无法保证在下一轮的人工智能平台大战中胜出。
今年,阿里和腾讯均有组建人工智能研究院的想法。姚星对《财经》记者说,很快,腾讯人工智能研究院就会成立。
国际巨头深入无人区
如果说BAT的人工智能布局处于对标和追赶的状态,那么以IBM、微软、谷歌、Facebook为代表的美国巨头公司已经开始深入科技无人区。
这些公司技术和业务各有所长,面向的用户也不同,但它们的目标一致:把人工智能机器做大、做强、再做没。
IBM和微软可能没有谷歌、Facebook看起来那么酷,但在人工智能领域有深厚的技术底蕴,IBM甚至已经开始用人工智能赚钱。
IBM人工智能研究可以追溯到1997年“深蓝”战胜当时的国际象棋世界冠军卡斯帕罗夫。2011年,代表着IBM在认知计算领域最先进技术的Watson在一个电视节目中一战成名,被认为是人工智能历史上的一个里程碑。
今天可以代表IBM在人工智能领域最高技术水平的,是不断进化中的Watson系统,和已经可以量产的人脑模拟芯片SyNAPSE(超大规模神经突触计算机芯片)。
Watson是一台超级计算机,最初由90台IBM的Power 7服务器并行组成。和Google、微软的人工智能相比,它从硬件芯片构架就开始模拟人类神经元,基于IBM的“DeepQA”技术开发。2014年1月初,IBM宣布组建“Watson Group”,旨在进一步开发、商用和增强“Watson”及其他认知技术,此外还投入10亿美元用于其他相关项目。
Watson已经开始为IBM赚钱了。法国农业信贷银行预测,Watson系统创造的收入将在2018年占IBM总收入的12%以上。Watson已经被部署在IBM去年收购的云计算基础设施业务Softlayer上,成为IBM与亚马逊、谷歌、微软等大型科技公司在云计算领域展开竞争的武器。
另一个代表性产品是IBM在2014年发布的人脑模拟芯片SyNAPSE。该芯片能够模仿人脑的运作模式、低功耗,在认知计算方面要远胜传统计算架构。和其他芯片公司的纸上规划不同,这款芯片已达到量产要求。
IBM将其技术和商业实力总结为“认知计算体系”。IBM大中华区副总裁、战略部总经理郭继军向《财经》记者表示,IBM推动认知计算体系,目标是把IBM在人工智能、大数据、深度学习、模式识别等所有领域里所做的积累应用到各个行业中去,帮助各行各业客户提升效率,解决他们所面临的现实挑战。
微软人工智能技术的研究已超25年。1991年微软成立研究院,最早的五个研究组,研究方向分别是人机交互、自然语言处理和机器学习、语音识别和语音合成、计算机视觉。这些恰恰是今天人工智能的几个最重要的分支。
微软的人工智能研究方向要宽泛很多,微软研究院拥有超过1000位科学家,在包括深度学习的多个领域的技术布局处于世界顶端。
微软最新的深度学习系统在2015年ImageNet计算机视觉识别挑战赛中,将计算机视觉系统错误率降低至3.57%,相比于人眼辨识的5.1%,这是人工智能首次在识别图像的错误率上超越人类水平。这些机器由微软的Azure云服务提供支持。
微软不仅将人工智能技术应用于如Windows、Azure等核心业务中,还构建开放的平台,将多年的技术积累开放给产业界,它的目标是打造一个人工智能生态圈。
它在无人区走得最远,在现实商业世界中隐蔽得最深。
和前辈相比,年轻的谷歌在人工智能领域做的事情更让外界看得懂,也更兴奋。谷歌一方面不知疲倦地做底层人工智能技术的积累,研发更加高级的深度学习算法,增强图形识别和语音识别能力。另一方面亲力亲为布局了包括智能家居、自动驾驶、机器人(2013年收购了8家机器人公司)等领域,前者为后者带来基础技术支撑,后者为前者提供数据和反馈。
值得一提的是,谷歌在无人驾驶汽车领域的技术积累,已经远远超过传统汽车厂商和其他互联网公司。
更加年轻的Facebook,将人工智能视为未来的三大方向之一。Facebook天然拥有全球范围内的海量社交数据,但在基础科学的研究上依然不遗余力。2013年,Facebook在加州成立了Facebook AI Research (FAIR)。卡耐基梅隆大学机器人系博士、Facebook人工智能组研究员田渊栋称,FAIR的研究方向自由宽松,研究所需的计算资源(如GPU)相对丰富,同时也没有近期的产品压力,可以着眼长远做困难和本质的研究。他称,这样的学术氛围在各大公司是极其少见的。
如果说前述几大巨头都是从人工智能技术出发,结合云计算赋予技术更多势能,那么亚马逊的路径正好相反。亚马逊是全球第一大云服务提供商,它的云服务收入超过微软、IBM、谷歌、Salesforce等所有对手的总和。但亚马逊目前发布的人工智能技术,多数集中在提升购物体验的深度学习领域。
人工智能技术有两大要素:核心技术平台和数据循环。只拥有技术是不够的,需要业务和数据结合,才能打造好的技术。对循环数据的获取,巨头们也都不遗余力。
以最热衷开源的微软为例,去年,微软发布了“牛津计划”(现更名为“微软认知服务”),这是一个基于微软云平台的智能API(应用程序编程接口),涵盖了五大方向的人工智能技术,包括了计算机视觉、语音、语言、知识、搜索五大类API。去年夏天火爆的How-Old.net,就是借助该平台快速开发出来的一款应用,一共只有20多行代码。
类似的工具包微软还有很多,例如深度学习工具包(CNTK)和微软亚洲研究院主导的微软分布式机器学习工具包(DMTK)等。
这些对于创业公司和中小企业来说相当实用。他们不用从底层技术一点点学,在小集群上或者是云服务上就可以直接调用。
对于巨头来说,算法已经不再是竞争的障碍,数据和用户习惯才是山头。大量的初创企业会采用开源做很多垂直领域的业务,其中包括海量试错和验证,最终也会反馈回开源,而这正是巨头们所期望的。
做B2B生意的IBM对数据的专业度要求更高,无法仅依赖搜索引擎和大量应用的交互来训练Watson系统,因此通过深度合作和并购来获取专业数据。
以医疗领域为例,IBM和多家世界级顶尖医院合作,向医院部署Watson的智能系统,通过分析这些医院的病历、专家的治疗经验、现有的学术研究等,帮助它们制定、观察和调整癌症患者的治疗方案。在这一过程中,Watson也就有了这一领域的数据积累。
2015年4月,IBM收购了Explorys,它是一家可以查看5000万份美国患者病历的分析公司。类似的收购IBM还有不少,并且出手相当大方。
Watson已经可支持针对乳癌、肺癌和结肠直肠癌、皮肤癌等癌症的初期诊断。在皮肤癌领域,在一项对3000幅皮肤镜检查图像的研究中,Watson识别皮肤癌的准确率高达95%以上。而人类识别皮肤癌的准确率只有84%。
国内的一位人工智能业者调侃,国际巨头在人工智能领域真正有价值的是它们的那些你看不见的、没开源的、国际会议上含含糊糊一笔带过的技术。“那些才是可以颠覆未来的弹药。”
填补断层
人工智能的产业结构可以分为三层:应用层、技术层和基础层。应用层聚焦在人工智能和各行业各领域的结合;技术层是算法、模型和技术开发;基础层则是计算能力和数据资源。
BAT擅长第一层。BAT手中,天然握有全球最大的数据资源。但在第二层和第三层严重断层。中国在人工智能领域的科研水平停留在工程数学、物理算法等工程科学的创新层面,基础理论研究领域的人才和资源很少。
多位接受《财经》记者采访的中外业者认为,BAT的优势在于海量数据,和国际巨头的核心差距在技术。
腾讯高级副总裁姚星告诉《财经》记者,今年初,他和腾讯的投资并购部达成了一个共识,开始大量考察美国的机器学习平台类创业公司。一则中国这类技术公司不多;二则收购这种公司可以快速补足腾讯在算法领域的不足。
姚星向《财经》记者分析,同样提供10万个样本给机器,优秀的算法平台可能只需要几个小时,速度慢的可能需要几天时间。
对于海外收购,搜狗公司CEO王小川则更加直白:“国内适合收购的标的公司很少,因为根是断的,(技术和基础研究)源头在国外,要到国外看。”
在快速迭代的互联网世界里,即便是互联网巨头,单打独斗练独门秘籍也会错失良机。最佳方式,就是拥有数据和拥有技术的公司,通过各种结盟方式形成优势互补,快速抢占市场。
2014年11月,蚂蚁金服宣布和旷视科技战略合作,利用后者的人脸识别技术Face++软件去确认开立在线银行账号的用户身份,即“人脸支付”。
Face++在人脸检测的多项指标评测中接连拿下世界第一。2013年,在极难识别的互联网新闻图片上,获得了97.27%的准确率,这个指标高于Facebook团队。三年后,这一准确率已提高至99.5%。
进行面部识别,需要处理大量来自面部的数据信息,包括结构、五官以及肌肉等方面的数据分析。阿里云为这个合作注入自身的数据和分析能力。
“凡是花钱解决的问题都不是问题,阿里可以自己完成这些事情,但时间成本是相当昂贵的。”闵万里对《财经》记者说,“阿里有1000件同级别的事情要做,能做好的只有其中几件,剩下的用投资+合作,这是时间和资本效率最高的做法。”
技术和数据的结盟并不限于BAT,更多的公司希望通过结盟方式获得未来,新的巨头或许从中诞生。
搜狗CEO王小川的思路是社交化,做更多连接,通过建设社群关系,把人大脑里的智慧表达出来,从而解决目前搜索技术存在的内容不够精准和实用性较差的问题。2013年腾讯入股搜狗后,先后向搜狗开放了微信公众号数据和QQ兴趣部落,为搜狗输入数据资源。除此之外,搜狗还在去年11月战略投资知乎1200万美元,全面接入知乎内容。
王小川想让搜狗的人工智能机器不断学习社群数据,他对《财经》记者说,“人工智能下一个五年不在于人工智能本身,而是让机器找到人。”
今天,技术和数据的天然开放性让各公司之间的竞争变得“我中有你、你中有我”,最终的赢家是可以将技术和数据平衡利用,达到平台效益最大化的公司。
微软亚洲研究院常务副院长芮勇认为,横向对比,中国和国际领先公司在核心技术上确实存在差距,国外更加注重基础研究和技术研发,国内企业可以将国外的研发工具化、商业化;从纵向看,中国在人工智能领域的技术积累近几年确实出现了飞跃,无论是最底层的计算机体系架构,还是智能硬件,或是上层软件应用,都有质的进步。
“只要不太急于求成,持之以恒地投入,中国的人工智能产业相当值得期待。”芮勇说。
挤出泡沫
马云在一次内部讲话中强调:“全球都在讲人工智能,到了风口浪尖,在创新面前,没有第二只有第一,创新落伍了,你就输了。”
焦虑的不仅是BAT,华为公司创始人任正非5月30日在全国科技创新大会上发言提到,“未来二三十年人类社会将演变成一个智能社会,其深度和广度我们还想象不到。如果不能坚持创新,迟早会被颠覆。”
开放趋势之下,人工智能也注定不是一场巨头间的战争。
市场调研机构CB Insights的统计数据显示,2014年风险资本对人工智能的投资增长302%,达到3.09亿美元。
中国人工智能领域已有近百家创业公司,65家获得投资,共计29.1亿元人民币,其中旷视科技、优必选、云知声、SenseTime四家公司登上艾瑞独角兽榜单。
更多初创公司只是打上了人工智能的标签。它们本质上是用国际开源的平台,用数据训练一两个模型,甚至照搬国际模型,这其实潜含危险,最大的风险是产品严重同质化,尤其在人脸识别、语音识别等成熟领域,这些公司的产品没有突破性创新,根本没有继续走下去或被收购的价值。
姚星常常为投资人鉴定真伪人工智能公司。他说,辨识伪人工智能公司有两个关键点:一是这家公司所采用的技术是否是最新、最前沿的技术,如果不是,则是用人工智能概念包装的伪人工智能。
其二,这家公司的技术和业务是否具备可扩展性?若否,则是采用部分机器学习算法或浅层人工智能技术的商业公司,而非真正的人工智能公司。
iPIN是一家拥有文本认知智能技术的公司,从去年开始,iPIN收到了不少投资机构的投资意向,该公司创始人兼CEO杨洋告诉《财经》记者,到目前为止,他还没有遇到真正有能力鉴别人工智能技术水平的投资机构。
“这对于做伪人工智能的公司绝对是一个好消息。”杨洋调侃说。
危险在于,就算是一些初创时期确实手握人工智能独特技术和商业模式的公司,也在资本的胁迫下慢慢走形。
在资本的压力之下,一些人工智能创业公司开始过早商业化,研发投入逐步降低,人员结构也发生变化,销售开始主导公司,最终技术公司变成营销公司,失去了被并购的价值。
投资人工智能公司,需要专业技术知识和长线投资眼光。根据Gartner的“智能机器炒作周期图”,由人工智能驱动的应用中,语音识别产业化最高,自动驾驶汽车和智能顾问处于炒作最高点,智能机器人、自然语言处理/生成和虚拟个人助手则处于爬坡期。这些都属于5年-10年内能广泛普及的颠覆性技术。而神经形态硬件(如神经元芯片等)属于10年以后才能普及的技术,但该技术可能还没研发成熟就被淘汰了。
需要在这一轮变革中保持耐心和恒心的还有政府和高校。人工智能涉及计算机科学、生物学、社会学、哲学、材料学、工程学等多个学科,中国高校基础学科的研究能力无法被充分利用,体制内缺乏一套产学研流畅对接的机制。这导致中国高校在这次产业变革中严重缺位。从美国的经验来看,正是其从法律、机制上保证了产学研的平滑转换,才令美国在这一轮的人工智能研究中占据上风。
一些乐观的投资人认为,技术发展本身就是驱逐泡沫的手段,“不用很长,一年或一年半的时间,很多真实情况就会暴露出来,泡沫也将逐渐散去”。
5分钟教你如何布局人工智能
来源:硅谷密探(SVS-007)
人工智能是科幻电影《星球大战》中的重要部分。智能机器到处都是。从酷似Sheldon、精通各国语言的C-3PO礼仪机器人,到擅长太空船修理和电脑接口的宇航技工机器人R2D2。
《星球大战》中的人们已经完全习惯了拥有机器人的世界,机器人的应用出现在了方方面面,从农场到战争,人工智能的应用以融洽的方式融入我们的日常生活,成为社会结构的一部分。
而现实确实如此,人工智能也早以融入我们的日常生活。最简单的例子就是Google搜索,实际上搜索引擎就是信息检索(Information retriveal)的直接应用,而亚马逊的商品推荐,更是推荐系统的直接应用,人工智能成熟的应用,很多将变成一种隐形的、无所不在的东西。
如今业界、学术界都在谈人工智能。但是今天的人工智能百分之八九十是收集数据之后去进行机器学习,这个事情大家早就在做了。那当我们说人工智能的春天到来时,我们在说什么?
有三方面的原因,一方面是随着语音识别、图像识别、计算机视觉等技术日趋成熟,深度学习获得突破,越来越多人工智能技术走出实验室,取得商业化应用。另一方面是硬件的发展,计算速度的显著提升。最后是数据的极大丰富,我们已经积累了大量数据,而且可穿戴设备和智能家居等智能设备也让我们获得更多的数据。
那为什么不叫机器学习的春天呢?主要原因是翠花听起来不够洋气,一秒变Tiffany之后瞬间高大上起来。
人工智能的前景
人工智能的发展方向并不是开发出和人一样思考的AI,而是像星球大战上开发出各种细分领域里可以帮助到人们的智能系统。例如微软推出的Skype interpreter能够即时翻译各种语言,用户只管说话,Skype Translator 就会流畅地将用户所说的话翻译出来,这让一对一的跨语言语音交谈成为可能,在这点上已经很接近C-3PO礼仪机器人。又例如自动驾驶中的智能系统,能够很好的专注于驾驶,这也很类似能够帮助驾驶战斗机的宇航技工机器人的BB8。
(微软的Skype Interpretar 可以做到即时翻译)
随着可穿戴设备和智能家居、家庭机器人等越来越多的智能设备进入人们的日常生活,人工智能的应用将越来越广泛。举个例子,亚马逊支持语音识别的Echo将集成各种功能,我们可以用语音直接预定 pizza、呼叫Uber 和播放 Spotify,甚至通过提供的接口控制Tesla,控制各种智能设备,比如冰箱、灯和空调。会洗衣服和做饭的机器人或者智能设备的出现,也将人类从一些繁琐的日常活动中解放出来。
(Amazon 推出的Echo)
而在企业领域,越来越多的智能算法将提供更多企业服务,一方面将各种将重复的人工劳动,一个很好的例子就是客服领域,通过聊天机器人解决很多很多重复的问题。而另外一个例子就是安防领域,通过图像识别或者语音识别能够实现智能人脸抓拍与识别,另一方面提供更智能的企业服务,通过更多数据分析来帮助做更好的决策和推荐。
(微软聊天机器人被玩坏 变身满嘴脏话“不良少女”)
当越来越多的人使用AI,通过大量数据的积累,它就会变得更加智能。它变得更智能后,也会有更多人使用,就像搜索一样成为生活的基础设施,习以为常。
造锤子
那么硅谷的大小公司都在在围绕人工智能在干什么?
总的来说,大公司都在开发和改善人工智能的一些算法,造锤子,或者做提供锤子的平台,做生态。
谷歌研究深度学习(被称为谷歌大脑计划),以及收购DeepMind团队。这些研究成功广泛应用于搜索引擎。在谷歌大脑计划中,计算机能够自动识别词类,理解句子含义,识别手写字体、图像和视频。例如谷歌大脑通过三天的学习,可以识别出猫脸,研究人员从1000多万个YouTube视频缩略图中随机抽取20000张图片,让“谷歌大脑”进行训练。训练结束时进行测试,这个所谓的“大脑”识别猫类图片的准确率基本达到四分之三。谷歌也在进行自然语言处理等方面的研究,利用“谷歌翻译”我们也能得到各种语言的翻译甚至是同声传译。
(Google新的排序算法RankBrain 应用了Google Brain的成果)
远在西雅图的微软在人工智能领域动作不断。微软研究院一直是最好的人工智能的研究中心,微软也发布了的Cortana和Skype Interepter等一系列产品。微软在2015年5月初发布了人工智能领域的牛津计划,由一系列基于云端的机器学习相关的API,SDK和相关服务等组成,旨在让开发人员们不需要繁复的机器学习背景也能开发跨平台的更智能和更交互的应用。当时,牛津计划率先开放了人脸识别、语音处理和计算机视觉三个部分。在今年的Window Build开发者大会上,微软开发了Microsoft Bot Framework,开发者可以直接接入Microsoft Bot Framework来开发类似微软小冰这样的聊天机器人。微软这些行为就是在做一个提供锤子的平台。
(微软推出的Microsoft Bot Framework可以用来构建聊天机器人)
而facebook同样建立了Facebook AI Research(FAIR)研究中心,囊括了Yann LeCun等在内的一些人工智能学者。FAIR的研究领域包括深度学习,自然语言处理,计算机视觉和计算机图形学等方面的研究。Facebook也在研究他们个人助理“Facebook M”,试图PK苹果的Siri、微软的Cortana和Google Now。 facebook在人工智能领域也搞了很多大新闻,比如facebook在Torch(火炬)计划中开源了许多深度学习的代码库,后来又开源了名为Big Sur的人工智能硬件平台。
(Facebook 在自家聊天软件Messensager 上推出Facebook M智能助手)
苹果也大力搞人工智能,去年搞Apple Car时便大张旗鼓地从各个企业挖走自动驾驶车研究的相关人才。苹果买买买的动作也一直不停,去年收购人工智能初创公司Perceptio来加强离线图像分类功能,收购自然语言处理创业公司VocalIQ,来强化Siri功能。苹果还收购了拥有12名员工的地图可视化公司Mapsense。此外,去年苹果还发布广告,大规模招募人工智能和机器学习方面的人才。据说苹果通过这次招聘募集了近百名机器学习的研究人才。不过苹果向来是闭门造车。
除了这些大的商业公司,也有越来越多的非营利性的公司。非营利性的公司加入是人工智能研究的有益补充,高校等科研单位的人工智能研究往往苦于没有工业界的数据,而大公司的人工智能研究成功由于商业原因往往不愿意公开,而Open AI等非营利性的公司能作为有益补充,一方面获取业界的数据,一方面也将自己的成果开源和共享。 OpenAI是由特斯拉CEO马斯克联合“Paypal黑帮”等大佬发起的非盈利项目,已获10亿美元捐赠。而微软联合创始人保罗艾伦也捐赠了上亿美元在2014年成立了Allen Institute for Artificial Intelligence(AI2)。
从总的趋势上看,好的人工智能的应用,很多变成一种隐形的服务,而且能够在很多领域超越人类。而人工智能本身其实早已作为“底层技术”,一把看不见的锤子,推动着新一轮的技术浪潮。人工智能在众多领域的应用潜力,也会给行业发展带来无限的想象力。
找钉子
如果说大公司都有财力去造锤子,而创业公司则很多集中于找钉子,利用相对成熟的语音识别自然语言处理和图像识别技术,来解决一些生成和生活中的问题。或者为了特定的钉子改造锤子。
我们可以从Y Combinator 2016 年 Demo Day为首的硅谷公司中可见一斑。
有不少初创企业试图为其他公司提供聊天机器人获问答机器人,或者语音识别服务。
msg.ai:在各大社交平台的 AI 聊天机器人
msg.ai 能帮助品牌整合在社交网络上的表现,实时检测流行话题,寻找新的销售与参与机会。msg.ai 能够让聊天机器人实时自动与用户互动,并且在出现无法处理的情况时将对话由机器人无缝转交人类处理,帮助企业获得更多商机。
类似企业还有:Chatfuel,让普通企业拥有聊天机器人;DeepGram,最精准的关键词语音识别技术
热点研究领域还包括在人机交互中具有改革意义的手势识别
LeapMotion:人工智能与虚拟现实的结合
Leap Motion是一家将人工智能与虚拟现实相结合的公司。他们利用机器学习技术对用户的手势进行识别分析,并配合虚拟现实硬件产品完成多种VR及AR的相关功能。他们成立于2010年,并完成了5轮融资总计4405万美元。
类似产品还有:Sixense,新一代电子游戏输入设备
还有一大类公司集中于数据的智能分析和处理,提供SaaS(软件即服务)服务。
Elucify:帮助找到潜在客户群
处理潜在的客户数据是非常耗时的,大部分时间都浪费在数据整理和清洗上。Elucify通过使用人工智能技术,帮助企业在潜在的用户数据中快速识别和整理旧的数据,快速提取有针对性的客户线索,动态的搜索和更新潜在的客户数据。
类似企业还有:PaveIQ,企业市场策略分析;Nova,帮你更好的写邮件
人工智能的研究也可以结合可穿戴设备
Hykso:给拳击手用的分析工具
Hysko推出一款产品,可以跟踪速度、强度、数量和其他方面的一举一动,并提供具有洞察力的产品。这很像 Fitbit,但这是针对拳击手的。它提供了实时监控,有助于玩家不断改造错误和不断提升。
人工智能的研究也可以结合智能家居
典型的例子就是前文提到Echo,详情可见亚马逊重磅产品“Echo”的内幕消息
还有个非常热门的应用领域是无人驾驶技术
Cruise:专精研制无人驾驶设备
Cruise Automation是一家总部位于旧金山的初创企业。原先公司做的是半自动的转换系统,不过在2015年Cruise已经实现了“全栈”无人驾驶技术,它制造的传感器可将普通车辆变成自动驾驶的汽车。Cruise成立于2013年,在2016年3月被通用汽车以10亿美元收购,在此之前总计完成3轮融资共1880万美元。
也有创业公司想做平台,做卖锤子的生意
Skymind:深度学习界的Cloudera
Skymind 自称是 AI 中的 Cloudera,帮助企业级 Hadoop 和 Spark 用户进行深度学习。利用 Skymind 的开源框架 Deeplearning4j,大型机构可以构建软件解决方案。Skymind 的用途包括诈骗检测、时间序列数据分析、文本分析、图像 / 面部识别和语音识别。
当然,怎么会少的了机器人呢?
Fetch Robotics:会识别取货的机器人
其主要产品Fetch和Freight可利用摄像头、图像处理和导航技术等,根据订单内容,利用机械臂将位于货架某一位置上的特定商品取下来,然后交给Freight运回打包。不工作时,机器人会自动返回充电桩进行充电。Fetch Robotics成立于2014年,在2015年6月完成了A轮融资2000万美元,总计共完成2轮融资共2300万美元。
类似企业包括:Gecko Robotics ,电厂安全检查机器人。
总结这些公司,我们发现人工智能显然不只是大公司的之间的游戏,初创企业也纷纷融入,用人工智能的技术解决很多实际的问题,为企业或者消费者提供价值。目前很神奇的情况是初创企业在人工智能的领域的方向很多都是面向企业做SaaS,而消费者领域的人工智能应用很多都是谷歌微软和facebook等大公司在做。
更多数据,更多智能
目前人工智能的应用已经出现在了生活的很多地方,更多的数据,更多的人工智能,而人工智能新的爆发点也将是集中在过去缺乏数据或者缺乏分析的地方
在消费者领域,人工智能的发展将和移动互联网、智能家居、可穿戴设备的普及紧密结合,人工智能将有越来越多的应用场景。
在企业领域,人工智能的发展也将结合企业服务(SaaS)的趋势,为企业提供更多智能服务。
人工智能是近年来高速发展且应用非常广泛的技术领域。当Google的AlphaGo利用深度学习技术在围棋领域击败了人类之后,人工智能越发受到各行各业的广泛关注。
前沿君微信:tech9999
投稿邮箱:13355524@qq.com