中国信通院栗蔚等:全球开源生态价值凸显,发展和治理双轮驱动产业创新
开源是一种开放共享的新型协作模式,是数字经济创新、开放、共享、可持续发展的源头活水。开源已从开源软件拓展延伸至开放数据、开放标准、开放人工智能模型、开放内容等多种形态。开源对于科技创新、产业开放、经济共享、全球可持续发展具有重要价值,是赋能数字经济高质量发展的原动力。
一、开源生态发展意义重大
1. 开源激发技术创新活力
开源汇聚众智、促进多方协同,有效实现了优势互补,激发技术创新活力。开源开放的创新模式相比于工业时代封闭专利的创新模式,更顺应数字时代技术迭代快、应用范围广的发展规律,解决单一主体创新成本过高问题,通过去中心化的异步协作激发各类主体的创新创造活力,以开放协作实现智慧累积,对创新效率和创新质量带来巨大提升。
2. 开源助力数字时代产业转型升级
科技创新开放共享的模式引领产业协作模式开放化。传统产业吸收开放、共享、协同的协作模式,促进了产业分工体系更紧密更高效,分工链条更长更广,满足复杂技术成果易组装、垂直化的生产要求与场景化、定制化的应用需要。数字时代产业体系相比于工业时代以专利为牵引的封闭产业体系,具有分工效率更高、协作范围更广的特点,能够建设多元合作的产业平台,顺应分布式分工趋势,促进产业内资源共享,构建产业发展新格局。
3. 开源促进经济实力提升
根据欧盟委员会发布的《开源软硬件对欧盟经济的技术独立性、竞争力和创新的影响研究报告》(见图1),开源对GDP产生直接影响和间接影响。一方面,开源通过吸引全球贡献者共同参与,提升软件产品在全球范围内的影响力,进一步提升软件产品净出口额,对GDP产生直接正向影响。另一方面,开源软件通过协作与培训等多种方式提供了广泛的就业机会,提升知识产权转化能力,扩充专利与商标规模,增加知识产权相关费用收入,进而对GDP产生间接正向影响。
来源:中国信息通信研究院,欧盟委员会
图1 开源软件对社会经济宏观影响模型
4. 开源推动全球可持续发展,为全球数字经济发展贡献中国智慧
开源依托网络实现“万物互联”,建立共同参与、共同享有、共同管理、共同维护的合作模式,推动实现全球共同维护的发展路径,共同解决社会化冲突问题,促进生态保护和疫情防控等工作开展,实现全球可持续发展目标。开源形成的全球分工格局相较于工业时代具有连接范围广、公共问题解决能力强的特点,能够汇聚全球资源、跨越数字鸿沟,构筑共商共建共享的全球数字治理体系,打造数字命运共同体。
二、全球开源生态发展现状
1. 全球开源生态持续突破圈层并实现边界渗透
全球开源生态稳中向好,持续突破圈层并实现边界渗透。如图2所示,全球开源生态表现为四个方面:即以开源项目群为核心的项目方面开源生态,以技术成果转化为特征的技术方面开源生态,以区域开源政策、开源人才为支撑的区域方面开源生态,以数字公共产品为代表的社会方面开源生态。
来源:中国信息通信研究院
图2 全球开源生态全景图
2. 全球开源软件项目数量稳定增长,各梯队成熟度差距明显
全球开源软件项目总规模突破4亿个。图3显示出2023年GitHub托管仓库已达4.2亿,新增仓库7300万个,增长率达21%。其中,贡献质量提高促进开源软件项目数量规模化发展是主要原因。开源软件项目的贡献质量直接影响开源软件项目的接受度,进而影响开源软件项目的活跃度和长期稳定发展。据GitHub 2023年度报告数据显示,2023年GitHub平台上贡献总量超过45亿,较2022年增长了近29%。开源软件项目的贡献接受度逐渐提升,驱动开源软件项目逐步规模化发展。疫情后开源发展氛围空前浓厚,线下活动促进开源理念广泛传播是另一原因。开源活动对开源文化传播、促进和推动开源软件项目构建至关重要,疫情后开源活动持续增多,线下活动逐步恢复常态,开源理念被广大开发者认可,纷纷投入到开源软件项目建设中,使得项目逐渐具备了“自生长”能力。
来源:GitHub,2023年11月
图3 GitHub近六年开源软件项目数量及增长率
开源软件项目“马太效应”进一步凸显,头部开源软件项目具备“断层式”领先优势。中国信息通信研究院以项目可持续性和项目可信性的中间值为坐标轴,构建并划分了包括孵化型、成长型、挑战型、领导型4个类型的开源软件项目竞争力魔力象限。图4显示了GitHub平台上活跃度靠前的开源软件项目依据开源软件项目竞争力评价模型的度量结果。总体来说,大多头部开源软件项目位列领导者和成长者地位,处于领导者地位的开源软件项目在可信性和可持续性方面均无明显短板,处于全面发展态势。处于成长者地位的开源软件项目在可信性方面较强,项目质量较高。
来源:中国信息通信研究院
图4 全球活跃开源软件项目竞争力魔力象限
3. 主流技术领域开源生态发展阶段差异较大,各自优势明显
中国信息通信研究院依据2023年全球活跃度靠前的开源软件项目,围绕技术流行度、技术生产力、技术稳健性、安全能力、法律合规和创新转化能力6大方面洞察各技术领域开源生态成熟度情况。图5显示出操作系统领域安全能力和法律合规能力较为突出,该领域开源软件项目高危漏洞数量较少,修复能力较强,同时该领域注重项目许可证的限制条件。云计算领域法律合规能力较为出色,该领域开源软件项目的许可性冲突风险较小。大数据领域具备较好的技术稳健性,该领域开源项目响应效率较高,支持力度较强。人工智能领域具备较好的技术生产力和创新转化能力,该领域开源软件项目更容易吸引贡献者的参与,同时该技术领域开发者普遍利用开源模式进行技术创新。前端领域创新转化能力和安全能力表现抢眼,该领域开源软件项目关注度更高,与2023年GitHub上编程语言JavaScript关注度排名第一相吻合,同时项目发展较为稳健。
来源:GitHub,中国信息通信研究院,2023年6月
图5 全球主要技术领域开源生态成熟度雷达图
4. 开源热点地区积极推动开源生态建设
美国开源项目全球占比超四成,是开源软件项目主要供应大国。根据中国信息通信研究院统计分析,如图6所示,截至2023年,在全球活跃度排名前100的开源软件项目中,美国开源软件项目占比45%,牢据第一。中国开源软件项目占比17%,排名第二。欧盟开源软件项目占比15%,位列第三。其次分别是加拿大(5%)、英国(4%),巴西(3%)和印度(3%)并列第六。
来源:中国信息通信研究院,CSDN,2023年
图6 全球主要区域开源软件项目占比
印度开源贡献者增长迅猛,GitHub预测2027年将超过美国成为全球开源贡献者最多的国家。据GitHub统计显示,2023年全球新增超2千万的开源贡献者。图7显示出美国以2107万的总贡献者数持续排名第一,相较2022年增长率为26%,印度以1421万的总贡献者数排名第二,相较2022年增速为46%。中国则以927万的总贡献者数排名第三,较2022年同比增长6%。此外,依据近几年印度开源贡献者较高的增长率,GitHub预测分析2027年印度将首次超过美国,成为全球开源贡献者最多的国家。
来源:GitHub,2023年11月
图7 2022-2023年全球各国开源贡献者数量
5. 开源公共价值进一步凸显
开源模式作用于不同场景衍生出多种概念形态。广为人知的开源软件与闭源软件相对,其概念由OSI(开放源代码促进会)重新定义并推广,强调软件的源代码开放。2020年,联合国秘书长安东尼奥·古特雷斯以开源软件为核心,以公益价值为出发点,在美国经济学家Shane Greenstein的基础上,提出了目前广为接受的数字公共产品概念:“尊重隐私和遵守其他适用的国际和国内法律、标准和最佳做法且无害的开源软件、开放数据、开放人工智能模型、开放标准和开放内容。”图8显示出开源软件与数字公共产品之间的联系。
来源:中国信息通信研究院
图8 开源软件和数字公共产品的关系
数字公共产品对于释放数字技术的巨大潜力以实现可持续发展目标至关重要。当前数字公共产品已经在多个领域发挥出巨大价值。在公共卫生方面,2014—2015年西非爆发埃博拉疫情期间,以开放数据为代表的数字公共产品在遏制病毒方面发挥了至关重要的作用,非洲当局依据疫情区域移动手机中的数据信息,绘制了该区域典型人口迁移的详细地图,确定了建立治疗中心的最佳地点,有效控制疫情发展。在数字支付方面,数字公共产品在确保政府快速安全地发放社会援助方面可以发挥的重要作用。在新冠大流行的社会背景下,全球100多个国家宣布扩大社会援助支付计划,2020年世界银行启动G2Px倡议,旨在建立开放标准,制定最佳做法,并提供上游技术援助,以从根本上改善G2P(政府对个人)支付现状,目前已累计向34个国家提供了技术援助。在全球粮农方面,数字公共产品有效促进全球粮食及农业数字化工作加速推进。2023年,联合国粮农组织已加入数字公共产品联盟,旨在积极影响粮食和农业生态系统,以创建和使用数字公共产品,并创建粮农组织数字公共产品框架。
三、全球开源生态风险尚存
1. 全球开源风险类型多样
全球开源生态风险总体包括安全风险、供应链、许可证风险等类型。在安全风险方面,根据《开源安全和风险分析》最新报告,2023年全球84%的代码库包含至少一个已知开源漏洞。在许可证风险方面,部分软件开发者版权意识相对薄弱,根据《开源安全和风险分析》报告,在2022年审计的代码库中,有1/3的代码库存在开源许可证无法识别问题或使用了自定义许可证。在供应链风险方面,据《2023年软件供应链状况报告》显示,2023年共发现245000个恶意软件包,超过96%受到攻击的下载版本均可以通过修复避免。
2. 企业开源治理进入高速发展期
各行业稳步推进开源治理举措,在政策及市场的引导下,各行业开始推进开源治理。通过中国信息通信研究院调研,近40%的被调研企业具备明确的开源软件治理规划或治理目标,制定了企业级的开源软件流程制度规范。同时,约88%的被调研企业在引入开源软件后,会对开源漏洞信息进行持续跟踪,以及时采取措施,最大程度降低开源漏洞所带来的安全风险。
四、全球开源生态发展趋势
一是开源项目的繁荣发展将遵循技术螺旋发展的本质脉络。全球软硬件开源经历了操作系统、云计算、大数据、人工智能从底层软件到上层应用的历程,再到硬件和行业开源,遵循了技术螺旋发展,从技术到产业的普遍发展规律。云网融合等底层技术开源项目将是未来的一个重要方面。
二是新技术应用将扩充软件开发方式,进而提升开源协作效率。生成式人工智能(AIGC)相关技术应用深化,在开源协作方面也出现大量应用场景。
三是行业开源将从开源软件应用到开源模式应用。行业将充分运用开源在产业链、数据、平台等方面进行开放协作,推动各行业数字化转型。
四是开源治理落地将经历长周期发展,开源风险在集中暴露之后趋于平稳。新一轮的开源治理落地中将侧重企业级统筹战略规划。同时随着治理程度的持续开展,开源风险将趋于常态化显现。
五、我国开源生态发展建议
我国开源生态发展应兼顾发展与安全需求。项目运营方面,加快借鉴国际开源社区运作方式,结合我国国情探索出可复用的开源社区运营模式,例如中国信息通信研究院算网云开放社区(CNCOS)创新借鉴安卓、OpenStack等社区模式,围绕社区成员贡献度与激励机制、社区产品商业化等方面形成社区特色运营路径。同时依托行业组织有针对性的支持重点开源项目,实现开源项目解决实际产业场景问题。
基础设施方面,加快建设一批开源联盟,成为基金会和企业等开源组织形态的精细化补充。加大开源平台开放功能,以吸引更多的开发者加入。不断扩大代码库中代码数量,为企业和个人提供常用开源软件安全检测和下载入口。
人才培养方面,不断完善高校开源课程体系,重视青年开源人才储备。科学建立开源人才及企事业单位的评价体系,加大开源人才表彰奖励力度。
行业应用方面,在云计算、大数据等新兴领域持续提升话语权,带动整体开源产业繁荣。在操作系统、云网融合等底层技术领域持续攻关,实现技术突破。持续扩大行业开源范围,推动各行业数字化转型。
风险治理方面,加快《网络安全技术 软件产品开源代码安全评价方法》国家标准的应用实施,以开源安全标准带动重点行业开源代码安全能力提升。明确开源治理规则,以评促建推动各行业提升开源治理重视程度。
六、结束语
开源是一种开放的产品形态,同时也是一种无边界的协作模式和开放共赢的合作理念。开源有力推动数字技术创新和应用,加速产业与数字技术的深度融合,促进数字经济发展,提升社会生产效能。近年来,全球开源生态发展进一步成熟,开源项目规模稳步提升,应用场景不断拓展,开源的社会价值逐步凸显。同时开源伴生的风险也进入了集中暴露期,产业多方主动布局开源风险治理。未来,相信开源生态将进一步成熟,行业开源应用更加广泛,企业开源治理将更加规范,进一步促进经济社会高质量发展。
作者简介
栗蔚,中国信息通信研究院云计算与大数据研究所副所长,高级工程师。负责云计算、开源、数字化转型、算力互联网和算力服务等工作,编写相关标准50余项。
郭雪,中国信息通信研究院云计算与大数据研究所开源和软件安全部主任,高级工程师。主要从事开源、安全相关工作,牵头编写《开源生态白皮书》等十余本开源及安全领域白皮书。
张一阳,中国信息通信研究院云计算与大数据研究所工程师,主要研究方向为开源生态建设、开源项目社区、数字公共产品、OSPO等。
武倩聿,中国信息通信研究院云计算与大数据研究所开源和软件安全部副主任,工程师。主要从事开源及信创领域研究工作。
俊哲,中国信息通信研究院云计算与大数据研究所工程师,主要从事开源软件、数据、人工智能模型等领域研究工作。
李晓明,中国信息通信研究院云计算与大数据研究所工程师,主要研究方向为开源供应链、开源安全、开源治理基础设施等。
联系方式:
15666476630(微信同号)
zhangyiyang@caict.ac.cn
校 审 | 谨 言、珊 珊
编 辑 | 凌 霄
推荐阅读
专家谈