其他

李开复:2018中国最大AI红利是政策

2018-01-03 量子位 监管与合规

编者按:本文来自微信公众号量子位(ID:QbitAI),作者:李根。

旧岁已逝,新年已来。2017年一年,中国AI的发展速度有目共睹,从顶会竞技,到创业融资,再到巨头布局,乃至大国博弈,AI有关的一切都在加速。那2018又会在此基础上塑造怎样的格局呢?哪些事件成为了AI发展的关键变量,中国AI又面临什么样的红利?

创新工场董事长、创新工场AI工程院院长李开复博士,就此话题接受了量子位专访,谈到了他对2017年AI宏观发展的看法,以及对后续AI竞争格局的判断。

我们在不改变原意的基础上,对专访进行了第一人称改写。

△ 创新工场董事长、创新工场AI工程院院长李开复最大变量

如果你问我2017年关于AI印象最深的一件事,我会毫不犹豫回答你:一定是7月国务院印发的《新一代人工智能发展规划》,这不仅展示出了国家对于AI发展的重视,影响也将是全球性、历史性的。

在科技发展和政策规范的相互作用之间,最好的政策能够推动科技进步,不增加更多的限制,关于AI的发展规划,正在延续这样的传统。

我们之前在移动支付、互联网金融等科技发展中,都有过类似的经历,所以我认为现在AI发展规划,能够让中国延续类似的成功。

这样的观点并非我个人之见,最近全球著名咨询智库欧亚集团发布了一份中国AI产业的最新白皮书,创新工场受邀提供了部分资料,其中欧亚和我们就中国政策执行落地方面有一致结论:由于中国政府在实现成果方面拥有良好的记录,这些政策规划应被认真对待。

举例来说,中国在2010年提出将成为高速铁路领域的世界领先者。现今,中国占有世界高速铁路的60%。2014年,中国政府提出“大众创业和万众创新”计划。几年内,中国的创业孵化器数量从2014年的1400个提升到8000个。

所以没有理由不相信,拥有强大政策执行力和落地能力的中国,将会为全球AI的发展注入不可估量的“变量”。

△ 欧亚报告中国AI政策图

大国竞争分水岭

既然我认为AI政策是2017最大的变量,不妨举了最近的具体例子。

12月18日,北京刊发了无人车路测的细则,相比美国原本就宽松的交通政策,中国在允许无人车上路方面算不上早,而且从细则来讲,限定时间区域、明码标识“自动驾驶”等都看起来更严格。

但对于中国来说,无人车是全新的新事物,一切刚开始,政策从紧到松也情有可原,因为一开始谨慎一点,随着技术提升,再不断改善政策,总会把事情推动得更好,过去也能看到不少这样政策推动科技发展的例子。

而且中国与美国不同,我们不能只看到加州吸引了全世界的无人车公司前去路测,也要看到有些州在相关政策推进上并不容易。

但中国只要首都性、中央性的政策出台,还会带动地方性法规出台,而且地方为了落地,可能不光会给相关企业政策上的扶持,也会有财务上的补足,这会促进整个生态的发展。

另外,不能忽视的是美国选举和工会传统会对无人车等AI发展造成的阻力。

前几天,Jeff Dean(量子位注:Google大脑负责人)还转发评论了我谈论中美AI不同的MIT演讲,他为目前美国的AI推进和人才政策感到担忧。他当然不是一个简单粗暴的美国民族主义者,一直倡导的科技进步也是为全人类服务的,但对于目前人才和科技发展方面的政策,他开始越来越多出面发声。

美国正在发生什么呢?像无人货车一项,是自动驾驶方向上的重要的垂直应用,但由于货车司机担心失业,于是卡车司机工会请求交通部延迟自动化卡车测试,这会造成无人货车技术研发上的进展缓慢。

所以现在我们无人车路测细则出台,我不认为中国不是没有弯道超车的理由。

关于无人车的研发,美国在技术推进上肯定要比中国早和快,但无人车最终还是要落地到具体场景的,在美国跑得很顺畅,不一定就能适应中国的路况,所以现在北京允许上路路测,不仅会节省更多中国无人车公司的跨洋协作成本,也能更快在中国路况场景下把无人车开起来。

国情优势

中国在政策方面的优势还不止于此。还是围绕无人车,可能还有一些路测之外的侧面——无人驾驶引发的安全问题、失业问题,还有交通设施上的作为等等。

比如交通设施上的作为,中国就会主动做一些事情。现在有些地方在和阿里合作城市大脑,也有和滴滴、摩拜的合作,对现有基础设施进行一些修改,这都会利于无人车更快推进。

或许不久将来,中国就有一条专门的道路允许无人驾驶上路、允许无人驾驶和其他客用车一起行进,还有可能在道路上装载传感器,让定位感知不仅发生在汽车端,也在路网端,这样也会推进无人驾驶到来。

实际这些措施也不是不会在美国发生,但在中国,大手笔的改革的发生概率总要更高一些。也有一些新城市建设或城市翻新,过程中也会有很多机会,可以把无人车融入其中。

再比如保险理赔,中国也可能比美国更利于无人车发展。假设在美国,一个年轻画家要是被Google的无人车撞伤了手,可能面临的将是天价官司,索赔天文数字也不是没有可能。但在中国或许就有伤害引发赔偿的上限规定,这在美国可能性几乎为零。

这样的不同是由于国情不同造成的,也不会短时间发生变化,所以对于中国来说,更理性快速解决问题,也就会更加利于整个科技新事物的推进。

至于AI带来的失业问题,这将是全球性的,不分国界。但中国也有优势,至少中国现在不惧怕讨论,而美国很多大公司都不敢公开谈论,担心引发民众反对。所以这不是很好地解决问题的方式,历史趋势如此,阻碍是没用的,更多考虑的应该是如何疏导、解决问题。

我并非历史学家,但过往大的技术革命造成职业变革,人类都经验可循,而中国可能在集中人力物力应对大变革方面,做得还比其他国家更出色,我对此并不悲观。

建议

OK,已经足够宏观而细致地谈论了我认为2017的最重要“变量”。

那也可以在此基础上给AI创业者一点个人建议:

大趋势如此,大环境更好,对于整个AI创业者都是好消息,那对于创业者来说,可能最核心的就是利用拥有的资源和技术,实现快速迭代和滚动,最好还能够在垂直场景中做深做透。

我们还是以无人车举例,如果你现在做垂直行业应用,仍旧有一些机会。比如借助Apollo这样的基础平台,做货车、巴士,甚至矿车等应用,跟具体场景紧密结合,给出你的产品方案和解决方案,并在市场中获得验证。

巨头推出的平台Apollo,今年的确做得很成功,但也不意味着别人没有机会,毕竟安卓之外,iPhone肯定也有市场和前景,你看驭势科技做的就是具体场景的完整方案,累积得很快。

另一个建议是留意交叉领域出现的新机会。

可能年初的时候还不好说无人车领域会有哪些新机会,但现在总结一年,新的机会还在产生,来自一些结合性的机会。比如电动车+无人驾驶的结合,可能就会在耗电相关方面给芯片机会。

总而言之,对于AI初创公司而言,我认为最关键的还是快速切入行业,形成人才、行业的积累,让自己更快发展,形成技术、行业上的滚动。

延伸阅读:

和李开复先生商榷:失控的黑色大数据不是中国AI的坚固基石

本文转载自财经杂志

“监管与合规”导语:隐私数据泛滥短期内降低了人工智能的开发门槛,让算法的设计实现更加简单,但这以数据所有权的粗暴剥夺和算法滥用为代价,不可能是长久之计。



李军/文

11月21日《金融时报》刊出李开复先生写的一篇文章《中国搞21世纪数字经济的条件比美国有利》,文中谈到,中国人已开始在智慧城市开展大数据收集工作,公民的隐私当然会受到损害,但算法也将因此变得更加丰富。中国政府善于——借用马克·扎克伯格的话来说——“快速行动,破除陈规”。巨大的消费市场,以及持续的增长潜力,将使中国有可能发展出一套颇具经济效益且独立于西方的数字生态系统……

此文令笔者惊诧莫名。李开复先生是IT与互联网行业的意见领袖,前Google公司中国区总经理,更是互联网创业投资行业的领军人物。对于数字化与人工智能的发展,李先生应该有比绝大部分IT与互联网人士更加深刻的洞察。但认为公民隐私数据滥用会推动人工智能和相关的算法演进,中国因此比美国更有利于发展数字经济,却是一种片面与短视的认识,必须加以澄清。

弱人工智能时代的数据污染

人工智能作为一种最新的信息技术手段,核心就是通过模仿人类的学习过程,以海量数据对于特定的复杂数学模型(如神经网络)进行训练,通过数学模型的逐步优化,建立包含智能化业务规则的系统并加以实用。

现阶段的人工智能是弱人工智能,其特点是:1.单一模型只能针对特定应用;2.需要海量的正确数据进行模型训练;3.产生的智能化业务规则可解释性极差。

换句话说,一个弱人工智能系统就是一个专用的无法打开的黑盒子,既没有高适应性,也无法拆解出具体的智能化业务规则,而且高度依赖于参与训练的海量数据。

从目前的业务实践来看,构建人工智能系统,绝大部分工作是数据准备,包括设计数据、获取数据、清洗数据和整合数据等步骤。这部分工作平均要花费60%-70%的时间。对于大型的人工智能系统,一般会安排专门的数据工程师按照数据科学家的要求进行数据准备。

在弱人工智能发展阶段,人工智能系统高度依赖于海量数据训练,并且算法本身对错误数据几乎没有甄别能力。

数据作为整个人工智能产业链的最上游,数据的任何问题都有可能影响到人工智能的产业链中下游甚至最终的全面应用。

试想一下,如果支撑人工智能的关键数据来源是灰色的甚至是黑色的,这就意味着从源头开始的数据采集、处理、传递和数据质量管理就处于失控状态。

数据使用者无法通过追溯的方式了解数据本身的采集要求,更不可能通过提高数据源数据质量的方式训练出更加高质量的模型。在很多场景下,来源不明的数据甚至无法手工剔除错误,以避免对模型训练的干扰。

如果非法数据的提供方出于某些目的对数据进行特定方向的加工处理,并提供给人工智能企业,那基于这些数据训练出的模型就可能受到特定方向的误导,造成模型畸形,未来的全面应用就有可能会面临极大风险。

尽管目前还没有这样的案例出现,但从理论上来分析,这是完全可能的,非法数据来源正在为人工智能应用埋下未知风险。

对于中小企业的人工智能应用,数据污染和算法畸形可能不会造成严重后果,毕竟应用范围有限。但对于涉及国计民生或者是对市场有重大影响的行业,严控训练数据来源、数据质量,是企业和政府必须考虑的问题。

2016年10月美国国家科技委员会公布的《美国国家人工智能研究和发展战略计划》中有七大战略计划,第五个就是开发用于人工智能培训及测试的公共数据集和环境。

这份战略计划中谈到,政府将开发满足多样化人工智能兴趣与应用的丰富数据集,并开放满足商业和公共利益的训练测试资源,以支持企业在丰富健康的大数据环境下加速人工智能技术发展,规避数据缺陷本身带来的潜在风险。

播洒跳蚤,收获的绝对不会是巨龙。不合法不健康缺乏管控的大数据基础,很难构建出有强大竞争力的人工智能产业环境。那些认为损害隐私会带来算法提升乃至获得数字经济竞争优势的想法是片面的、短视的。

隐私滥用动摇数据基础

盗版音乐从根本上动摇了音乐产业的价值链,对音乐产业的生产环节是毁灭性的打击,这个道理也适用于人工智能和数据生产的关系。

对于人工智能应用来说,数据绝不是俯首可得的,这需要一个健康的产业环境,从数据收集、数据清洗、数据匹配到数据集成。一个广泛应用的人工智能应用往往要牵涉到多个产业的数据合作,这也是数据服务提供商存在的基础。

数据服务商获取合法的数据,以脱敏操作为前提进行数据整合,并按照所服务企业的要求提供数据和分析,最终获得自身的良性发展。

所谓数据脱敏,是对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号等个人信息都需要进行数据脱敏。

低价劣质的私盐泛滥,正规的盐业市场一定会萎缩。如果隐私数据泛滥,数据服务行业就会受到沉重的打击。

有了近乎免费的数据资源,没有人再愿意为数据支付合理的价格。数据产业最前端的数据准备和整合环节不再能够得到合理的收益,费力却没有回报的数据基础性工作就始终无法健康发展,最终动摇整个数据产业良性发展的基础。

当真正需要使用数据的企业在市场上茫然四顾,发现数据准备和整合的工作必须要自己从头做起,我不知道这算是什么数字化的竞争优势!

整合善用才是关键

在IT和互联网专业人士眼中的大数据,尤其是推动整个数字化社会层面的大数据,有更加宽广的范畴。隐私数据只是大数据蓝图中的小小一块拼图。要让社会全面进入数字化发展阶段,跨行业、跨企业、政企融合后的数据才是构建数字化社会坚实的基础。

发达国家的数据收集工作开展得并不晚,恰恰相反,政府和企业内部的数据收集与管理工作开展得更早,管理模式也更加成熟。

以社会运行数据为例,在美国和加拿大,企业可以很容易地从政府数据库中获得特定的统计和运营数据。

笔者以数据科学家的身份在加拿大某零售企业工作时,经常会访问政府数据库提供的脱敏后的人口地理信息数据,涵盖了年龄、性别、收入、种族、家庭结构等各种信息,其细致程度令人惊叹。

因为数据管理科学有序,所以政府与企业在展开数据合作时障碍更少,更能够发挥数据整合的威力。

早在十几年前,加拿大就已经出现了采集大量客户数据对社会消费特征进行整体画像的企业。这些数据收集和分析企业根据广泛收集的跨行业客户信息,把全国居民细分为68个子类,并对每个子类进行画像,抽取其消费特征和潜在需求,为零售、金融、通信等各个面向消费者服务的企业所用。目前,中国广泛收集与分析数据的能力还非常缺乏。

从事人工智能研究的人都知道,模型训练优化时某一区域内局部的最优解,并不等于整体范围的最优解。一个好的模型会在全局范围内搜寻最优解,而不只局限于一时一地的范围进行搜寻。

数据获取和数据使用管控作为数字化的初始环节,应该纳入到对数字化社会发展的整体影响中去分析。

的确,隐私数据泛滥会让人工智能企业建立的门槛降低,算法的设计实现更加简单,短时间内似乎能让一切更加容易。但这些门槛的降低是以数据所有权的粗暴剥夺和算法滥用为代价的。长远来看,数据管理失控和算法滥用因为从源头上污染了数字化产业的生态环境,所以会拖累整个数字化与人工智能产业的发展。

通过吸毒能够获取比正常生活高几倍十几倍的快感,可一旦染上毒瘾,你还能回到正常的生活轨迹上吗?绝大多数人是不行的,对于企业也是一样。当企业通过非法途径获得隐私数据并取得超出预期的优化效果,它还能够回到正常的模型优化道路上来吗?难度和瘾君子戒毒一样。

如果没有科学的数据管理框架指导,也缺乏严格的法律保护体系支撑,人工智能技术的全面应用,带来的很有可能会是披着高科技外衣的数字化掠夺,而不是全体公民受益的数字化社会进步。

不忘初心,方得始终。在数字化和人工智能产业发展的初期,摆正姿态,警惕旁门左道,才是持续稳定健康的产业发展正途。

(作者为科技与互联网资深分析师,编辑:谢丽容)

延伸阅读:

李开复:中国搞21世纪数字经济的条件比美国有利

中国人已开始在智慧城市开展大数据收集工作;公民的隐私当然会受到损害,但算法也将因此变得更加丰富。


更新于2017年11月21日 12:20 英国《金融时报》 拉娜•福鲁哈尔

几天前,我跟中国的风险投资家李开复(Kai-Fu Lee)共进晚餐。他跟我讲起了一本有趣的反乌托邦科幻小说《北京折叠》(Folding Beijing),不久前这本书被译成英文,很快获得了雨果奖(Hugo Award)最佳短中篇小说奖。这本书讲的是一个过于拥挤、严格按照阶层划分的首都。在北京,第一等居民享受正常的24小时时间,第二等和第三等的居民不得不分用另外24小时的时间,其中悲惨的5000万底层人口过着一种邋遢、恶劣的生活,并且拥有的时间更短。

我为何要讲这件事?因为我一直在思考这样一个问题:我们这个时代的主要经济矢量,包括技术驱动的就业破坏、工资停滞和政治两极分化,未来几年里将在美中两国造成什么样的影响?李开复帮助谷歌(Google)启动了中国业务,他还投资了中国一些顶级的创业型企业。他提出了一个强有力的观点,即中国搞21世纪数字经济的条件比美国有利,因为中国政府善于——借用马克•扎克伯格(Mark Zuckerberg)的话来说——“快速行动,破除陈规”。

中国人已开始在智慧城市开展大数据收集工作;公民的隐私当然会受到损害,但算法也将因此变得更加丰富。干细胞伦理?什么干细胞伦理?巨大的消费市场,以及持续的增长潜力,将使中国有可能发展出一套颇具经济效益且独立于西方的数字生态系统,目前小米(Xiaomi)和华为(Huawei)等一些本土品牌已把数字供应链与消费者连接起来。

“未来有一个问题是,还有什么理由购买西方品牌?”李开复说。这跟英国《金融时报》旗下《投资参考》(FT Confidential)近期的一份报告提到的问题类似。“我认为,你将看到中国不但在国内、而且在东盟(ASEAN)和许多中东国家拥有数字生态系统。”

中国仍在艰难应对跟美国相同的颠覆性问题:收入不平等、技能短缺,以及必须实施教育改革以培养适应21世纪数字经济的劳动队伍。问题在于,指令和控制型的经济是将让中国变得过于脆弱、乃至无法驾驭这种变迁,还是刚好相反,将给予中国一种力量、让它安然度过一段就业破坏的时期并避免落入中等收入陷阱?在《北京折叠》中,政府为底层劳动者创造了虚假的工作岗位,以维持社会稳定。在现实生活中,中国和美国都将不得不思考如何创造更多的真实岗位。

译者/何黎




诚意推荐 欢迎关注


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存