开源的中国声音
点击上方“开源社”关注我们
| 作者:Xlab开放实验室| 转载自:Xlab开放实验室| 编辑:李明康| 设计:叶修缘丶| 责编:袁睿斌
在当今的人工智能时代,开源开放是AI与社会发展深度融合的有力工具,它不意味着免费,它有商业模式,它是生态。在2020世界人工智能大会云端峰会·开发者日主论坛上,我们特别组织了一场“开源的中国声音”圆桌讨论,邀请了来自政府、学界、技术、投资、社区的各位专家学者,围绕开源开放对各行各业的意义、各个不同的领域如何以开源文化精神为导向进行实践、以及中国如何贡献力量等方面探讨,分享洞见与经验。
(以下根据圆桌删减整理)
圆桌主持人:金耀辉
上海交通大学长聘教授、人工智能研究院总工程师
“开源”既不是一个新名词,也不是一场新的运动,在人工智能时代,想要获得先发优势,引领国际社区,开源开放生态的建设必不可少。——金耀辉
1
分享内容概要了解开源的契机
1. 技术发展趋势
2. 国家战略层面
3. 上海承担任务
随着大数据、云计算、物联网的发展,人工智能打破了技术与应用的鸿沟,进入到了一个跳跃式、跨越式的发展期。在这个过程中,开源开放紧随其后,从大的趋势来说,这是了解它的一个契机。第二,随着人工智能在全球的发展,欧、美、日等国纷纷将其制定为国家战略,2017年中国国务院发布《新一代人工智能发展规划》,这是从大的背景来说,了解开源的契机。第三,人工智能是国家交给上海的三大任务之一,上海积极建设人工智能上海高地,构建一流创新生态,开源开放是其中的一个重点方向。
--石伯明,上海市经济和信息化委员会人工智能发展处处长
理解开源的精神
开放、分享、回馈
大学时代,作为学校BBS的技术站长,接触了开源软件,站在巨人的肩膀上,使我们只用了三、四个月的时间,就很顺利地完成了开发工作。毕业进入谷歌后,公司内部不仅大量使用开源软件,而且乐于社区分享,比如TensorFlow;所以在成为投资者后,我一直在思考如何回馈开源社区。在过去的几年里,我们已经投资了几个中国的开源软件,希望有资本的加持,它们能发展地更好!
--陈昱,云启资本董事总经理
结缘开源的故事
个人与工作双头并进
从个人角度来讲,我入行算比较早,八十年代就在写代码了。当时小伙伴们写完代码,或者知道有什么好用的工具,都会非常自然地分享,虽然是比较草根的一种开源的模式,但已经体现出了开放、共享以及合作的理念。加入英特尔后,有更多的机会跟开源结缘,既可以使用各种各样的开源软件工具,也会合作参与。比如英特尔的 Analytics Zoo,它是为大数据科学家提供的一套开源方案,也有英特尔OpenVINO这样的工具,用来提升深度学习推理过程当中部署和应用的效率。
--夏磊,英特尔首席工程师、人工智能技术中国首席架构师
接触开源的机会
以好奇之心,不断探索
作为曾经计算机专业的学生,读书的时候已经去“玩”一些开源软件。现在因为工作的原因,有更多的机会与开源接触。在教学的过程中,我们发现开源是现在唯一的选择,比如会用到Hadoop,Spark等软件框架,开源的世界在扩大。在做研究的过程中,碰到开源项目,我也很好奇它背后运转方式,几年前,我加入了开源社,它其实是一个民间的开源组织。在那里,我认识到开源不只是技术层面的,还有一些开源基金;另外我也对GitHub这样的代码托管平台比较好奇,因此我们把所有开发者的行为数据拿来,做了GitHub的全域分析。
--王伟,华东师范大学数据科学与工程学院研究员、开源社理事会成员
开源扮演的角色
参与人生,陪伴至今
开源在我的人生中扮演了一个非常重要角色。十年前,从第一次参与到Hadoop项目开始,我后面的人生基本上跟开源都是相关联的。开源帮助我走出了国门,到了英国工作,到了美国工作,同时开源又把我带回了国内,回到国内企业工作,极大地丰富了我的人生经历。因为开源是由来自不同公司、不同背景的工程师,一起协作工作,相比只在一个公司内部协同工作,会有机会接触到非常多的相关领域的人。所以对我而言,开源让我认识了很多志同道合朋友,拓展了我的人脉和视野。
--堵俊平,前腾讯专家研究员、开源联盟主席、Apache基金会成员
开源提供的帮助
从个人学习到项目开发,开源使我受益良多
开源对我个人的帮助是多方面的。作为程序员,它帮我提升个人能力。很早以前我学习编译器技术的时候,像GCC、LLVM这样的项目都是开源的,让我可以近距离地看这么大规模的工业级开源编译器是如何实现的,跨越国界和地域,向全球最好的程序员学习交流。作为项目开发者,开源节省了写代码的时间,运用各种开源模块,可以极大地缩短整个研发过程。开源也教会了我与程序员高效沟通的方法,比如在开源社区里,分布式的研发团队如何协作,更进一步地,开源对我的价值观也产生了潜移默化的影响。
--星爵,Zilliz创始人兼首席执行长
2
圆桌会议问答Q
金耀辉:大家都知道英特尔是一家硬件厂商,那么硬件厂商投资开源开放,有什么样的意义?
夏磊:大家对英特尔的了解,可能更多的是处理器产品,但是其背后支撑这些处理器产品的,还有英特尔的架构。我们把与开源社区的合作视为英特尔整个生态架构中一个非常重要的组成部分。大部分英特尔处理器架构的服务器产品,都是和Linux操作系统一起配合着运行。
在整个IT产业发展当中,不管是云计算、大数据还是人工智能,很多新的技术方案、新的应用机会,都是和开源平台、开源方案结合在一起的。我们今天也在跟谷歌合作,把像Tensorflow这种大家都在使用的开源技术方案,在英特尔的架构上进行深度优化,让我们的用户在英特尔平台上,能够更加完美运行这些开源的软件方案。英特尔正是通过对开源软件的支持、与开源软件社区的合作,来支撑客户,扩大英特尔整个生态,形成一个良性循环。
Q
金耀辉:我们可能有一个误区,认为开源就是免费,那么投资开源软件企业,回报是什么?
陈昱:作为投资人,肯定不会投一个纯免费的东西。做公司、服务客户、上市,最后还是需要有收入的。开源并不等于免费!实际上,开源本身只是一种获取客户的手段。开源主要有三种商业模式:第一种是卖技术支持或培训;第二种是免费使用核心代码(Open core),但实际上,客户在部署到生产环境时,可能需要一些比较高级的特性,这时我们会以企业授权的方式或者企业版的形式,卖给有功能需求的企业客户,完成变现;第三种和SaaS类似,把开源软件封装成公有云上的一个服务,企业客户使用的时候,按需去租赁该服务。
星爵:对于我们这种技术驱动型的初创公司来讲,开源是一种能够很好地让我们的技术、产品广泛传播,迅速地占领程序员、企业的“心”,形成更大的用户基数,从而在一个领域里面有更大影响力,成为行业事实标准的方式。我们要做一家技术驱动型公司,而技术又是没有国界的,如何打破地域限制,更好地去传播,甚至在全球建立自己的影响力,开源是一个很好的手段。
开源可以让程序员之间形成更好的社区联接,更好地交朋友。比如Github作为一个开源代码托管协作平台,是全球五、六千万开发者最好的交友网站。我们可以看到在过去的十多年里,全球涌现了一批很优秀的开源公司,有很多公司在一、二级市场里,估值超过五十亿美金甚至到一百亿美金。这些公司他们都是在做大技术用户社区,让更多的人能够使用他们的产品和技术,打造全球范围内的影响力,然后通过开源去构建自己的生态和商业模式,以5-10年的时间来看,这会是一个很好的甚至很快创收的生意。
Q
金耀辉:开源社区对开源软件的发展至关重要,特别是在社区治理层面,对开源软件有哪些重要作用?
堵俊平:首先我对开源的理解,就是以代码为基础的人与人的连接。所谓人与人的连接,就是一个社区的概念。如何保证社区按一个节奏,传达一个我们想要的结果,这就涉及到社区治理,一般来说它有一些原则,其目的是保证一个开放的环境,让大家能够拥抱创新。
我想讲一讲社区治理里很重要的就是确保所有的人都能平等地参与社区。如果我是一个单纯的软件使用者,我在用一款软件的时候,也是在为社区做贡献。通过使用,可以帮助发现这个软件可能存在的问题,或者帮助这个项目发现它未来可以应用的其它场景。如果我是一个开发者,在使用这个开源软件或者开源项目的过程中,发现它有哪些问题,然后根据自己的兴趣去了解这款软件或项目,甚至自己动手增添一些新的功能来帮助这个软件变得更好。慢慢地,如果我长期在社区里有贡献,对开源软件的源代码也越来越了解,我可能成为这个项目的 maintainer 或者 committer,更多地帮助外部的contributor或者用户解决他们的问题,从而成为这个社区核心力量。再往后,就会涉及到一些社区治理和社区管理者的角色。在社区里可以有各种各样的创意想法,我们要保证创新的技术实现,不会被其他的非技术的原因排斥掉。
可以看到,不同的角色都可以为开源社区服务,而且角色不同,侧重点也不同,从社区治理的角度来说,最终就是希望形成一个氛围,让大家可以去开放式的创新,去颠覆一个技术,一个项目,甚至是一个产业。
王伟:我先说一下我为什么要参与社区、观察社区。我们学校最重要任务就是培养人才,为未来培养人才。怎样做好这件事?我们也一直在思考。学生不仅仅应该在课堂上听老师讲课,还应该课后去做一些实践。我发现特别是计算机技术领域,社区对学生的培养起到越来越大的作用。我会把在社区观察到的一些现象和我自己的经验带回课堂,希望能够利用社区的协作方式,与学校传统课堂的方式相结合来培养人才,目前已经有了一些比较好的效果和经验。
我参与到社区,比如说在开源社,我们每个月都有例会,会形成一些决策,然后会有一些方向性的东西,每年还会有一个开源年会。首先我觉得挺热闹、挺好玩的,能结交一帮朋友。其次可以提升我对开源社区的认知,包括组织、经济、社会、法律等,这些反过来又引起我的好奇,为什么开源社区会有这样的发展过程,为什么会有不同的形态,每个社区为什么又有不同的特点,就会促使我从研究的角度来分析这些问题。
Q
金耀辉:政府层面对于支持开源开放的意义是什么?
石伯明:上海在人工智能开源开放方面既有优势也有劣势。比如说,原创性的基础理论、核心芯片、一些软件框架,实际上还是受制于外。从应用层面上来说,目前 To C 一端做得还不错,但是整个To B 端,围绕企业服务这一块的应用,还有很长的路要走。
在这样的形势下,我们发现了开源开放的意义。第一,大势所趋。上海要建设成为全球具有影响力的科创中心,创新能力和生态打造离不开开源开放的平台建设。第二,应用需求。我们在金融、教育等领域的to C 端应用已经比较活跃,但是上海也是一个智能制造的城市,在工业领域、商贸领域,还有更大的市场。第三,新的经济形态发展。上海具有丰富的数据资源,怎么把这些数据资源开放出来,让开发者围绕这些数据,带动上海的经济活力,有十分重要的意义。第四,人才集聚。据领英的统计,北京和上海两地,人工智能方面的人才占据了将近70%,上海是33.7%,因此,怎样通过开源开放平台的建设,把更多的开发者人才集聚到上海,共同激活上海的创新能力,也是非常重要的。
Q
金耀辉:近年来由中国工程师发起的有影响力的人工智能和大数据开源软件越来越多。请您结合“武汉2020”的项目谈一谈。
王伟:如前所述,我特别支持也特别希望高校学生能够参与到开源项目中。今年春节,因为这次疫情,我们实验室的一位同学提出来可以通过开源项目的形式为世界范围内的疫情做一些事。我们的出发点是当时很多地方都需要物资,也有很多的热心人士希望捐助物资,所以我们就在GitHub上建立了一个仓库,最开始是希望做一个信息平台,一方面满足信息消费,另一方面,提供信息供给,并使两者很好地对接起来。
我们当时的出发点很淳朴,就是希望做一个开放平台,没想到在项目发布三天内,就有几千个开发者、志愿者涌入项目中。我们当时也通过slack及其它的平台,开始协作。这件事出乎我们意料的是它能够引起全世界开发者的关注,并且通过开源协作的方式,真的做出来了,且起到了一定的效果。这可以说是我们对开源认知的提升。代码只是其中的一个方面,另一个方面是志愿者,他们通过微信、石墨等,完成数据的采集、整理、整合等工作,这是我们能看到的开源普世性的地方所在。
Q
金耀辉:我们知道Analytics Zoo就是由英特尔中国工程师发起并主导的项目,请分享一下这方面的经验。
夏磊:英特尔在国内已经有上千个研发岗位,这中间相当一部分就是在跟各种各样的开源项目合作,贡献开源代码,并对其进行优化。在早期,英特尔中国工程师在开源项目中主要还是参与者,很多项目的发起并不在中国。随着现在英特尔中国团队的能力增强,也得益于人工智能的发展,因为国内有大量的AI应用需求,我们的工程师有了更多的创新机会。Analytics Zoo,就是英特尔中国研发团队的产品,这个团队也就在上海。这个开源项目发布以来,已经得到了非常多业界同僚的响应,而且有很多具体的实际应用案例。
Q
金耀辉:作为Apache基金会的成员,请从您的角度,给中国的企业、中国的工程师就从事开源软件,提供一些建议。
堵俊平:从Apache基金会角度来说,中国的工程师或者源于中国的项目发挥着越来越重要的作用。我在2013年成为了Hadoop项目的 committer,可以说是当时中国第一个Hadoop项目的committer。Hadoop项目成立在2006年左右,过了六、七年,中国才有了第一个committer。但是目前主流的Apache大数据项目,可能半年、一年的时间就在中国成长出了committer。
除了国外发起的有影响的项目外,国内已经捐献给Apache基金会的项目也越来越来多,除了华为、腾讯、阿里、百度等大公司,我们也看到一些中小型的公司,甚至一些个人的项目,都在往Apache基金会里捐赠。目前起源于中国的Apache的项目已经有二十个左右,同时有很多中国工程师,也慢慢地成长为很多重要项目的committer、PMC,甚至Apache基金会组织的member。Apache基金会在今年4月份新一轮的选举中,来自中国的committer人数翻番,从原来的不到10人到现在有将近20人。
Q
金耀辉:请从您的角度,或者根据您自己项目的经验,为中国开源企业未来道路的发展提供一些建议。
星爵:以我们LF AI基金会为例,来自大中华区的企业现在已经有五、六家,基金会里一共有13个项目,其中有5个项目来自于中国,我们已经成为这个基金会的中坚力量。在这种新兴的基金会里,我们是从第一天就参与到了国际的交流和协作中,相信以后会看到更多优秀的中国程序员,参与到这样的国际开源社区中。
如果说对下一代开源程序员,有什么建议,我想说,在开源时代,我们更加提倡协作、学习和交流。如果是初次参与开源的程序员,最好方法是先参与到一个你自己真正感兴趣的项目里,然后去学习整个开源代码的规范、项目的治理流程、社区交流等,你可以得到各方面能力的综合提高。等到能力提高以后,可以从一个项目参与者的独特视角和丰富经验,发起并运营另外的全新开源项目。
Q
金耀辉:云启资本投资了不止一家中国开源项目,请您分享一下这方面的经验。另外,怎么样才能获得云启资本的投资?开源项目是怎么来获得机构投资者的青睐?
陈昱:云启资本第一次投资开源软件是在2016年,在过去的四年时间里,我们总共注资了三个中国原创的开源软件,投资金额超过一亿人民币,包括PingCAP的TiDB,它是目前中国在开源领域影响力最大的项目之一,它做的是分布式数据库。什么样的开源项目能够得到我们的投资呢?我们确实是有自己的一套标准。首先技术必须是全球领先的,因为开源软件本身是没有国界的,在同等的条件下,中国程序员在选择用什么技术的时候,是在全球范围内去考察,一个开源软件要做到有全球范围内的竞争力,它才能成功。
第二,我们希望它有很强的社区运营能力。开源从组织开发者、到市场宣传再到与用户的交互,都离不开社区运营。你必须非常熟悉开源的规则,才能够很好地运营社区。第三,我们投资的毕竟是开源项目背后的一个商业化公司,从过往的经验来说,一个开源项目最好就只有一个商业化公司。一个开源项目背后如果有三、五家公司,甚至十多家公司在运作,就会造成很多问题,社区本身可能会失去控制,因为不同的商业化公司有各自的利益诉求,大家很难齐心把开源项目往一个更好的方向推进。其次,这些商业化公司推出来的商业化产品,可能会比较同质化,到最后就很难去做好商业变现。
Q
金耀辉:上海一直很关注开源开放,从政府的角度,我们有什么样的政策,能够支持开源开放,支持开源社区?
石伯明:具体来说,包括以下几个方面:
第一,在体系上,上海支持各类主体来建设开源开放平台,建设人工智能实验室、研究院,培养人才、开发自主软件框架等。同时,鼓励与国内外知名开源社区互联互通,把上海建设成为国际人工智能开发生态网络的关键节点。
第二,在人才上,上海制定了人工智能人才的个性化政策,无论是从让我们的开发者住下来、干起来,还是做出来、引进来等方面,都有一些个性化的政策,达到集聚人工智能人才的目的。
第三,在资金上。除了一些必要的政策外,我们组建了上海人工智能发展的产业基金,整个基金规模是一百个亿,在这次人工智能大会上,要跟第一批支持项目签约,也是为上海人工智能投资生态,做到更好的发展和完善。
第四,在服务上,上海的数据资源和应用场景丰富,我们分级推动重点领域数据开放,为人工智能发展提供丰富数据资源和应用场景,在本次世界人工智能大会上,还要发布第三批应用场景。
第五,在保障上,围绕人工智能方面的治理、标准、检测等等,逐步地跟世界接轨,然后制定相应的标准、规范、检测,为人工智能开源开放提供相应的一些保障,包括知识产权保障。
Q
金耀辉:今天各位专家分享了很多有趣的洞见和思考,下面我们请各位专家用一句话来做个总结。
王伟:云端漫步,开源遨游。
夏磊:英特尔和大家一起共同拥抱开源软件的生态,进一步促进人工智能的发展!
石伯明:我们正在积极构建创新策源、人才集聚、应用示范、自动供给的人工智能上海高地,需要各类主体和开发者小伙伴们积极参与。
陈昱:资本助力中国开源软件登上世界舞台。
星爵:软件吞食世界,开源正在吞食软件。
堵俊平:开源的本质是基于代码的人与人之间的连接,希望有更多的有志之士加入到我们,一起来颠覆式创新,促进产业升级。
开源社简介
开源社是由国内外支持开源的企业,社区及个人,依“贡献,共识,共治”原则,所组织的厂商中立、纯志愿者、非营利的开源联盟,旨在共创健康可持续发展的开源生态体系,并推动中国开源社区成为全球开源软件的积极参与及贡献者。我们专注于开源治理、国际接轨、社区发展和开源项目。
相关阅读 | Related Reading
"源"来如此倒计时第2天,赶快扫码预约吧~