堵俊平:有效的模型不能一味追求“大”,效率和质量才是真正追求的方向
内容来源于 国际在线
5 月 10 日,由中国软件行业协会主办的 2022 中国国际软件发展大会(简称“软发会”)暨第五届中国软件产业年会在线上举办。本届软发会围绕“数字经济新时代--软件产业赋能高质量发展”主题,盛邀产业主管部门领导、两院院士、国内外软件领域知名专家、领军企业负责人、行业组织和机构代表等业界翘楚及权威媒体相聚云端。全国各地方软件行业协会和中国软协海外办事处以分会场的方式在线参会。
大会现场,华为计算开源总经理堵俊平在会后接受了国际在线记者专访,从“近年来全球和中国 AI 开源社区呈现的趋势”以及“企业需要如何优化完善以交付可持续的产品”等方面分享了自己的观点。
Q:近年来全球和中国AI开源社区呈现哪些趋势?
AI 是近年来的一个发展热点,最近一轮爆炸式增长也是以开源的形式牵引的。除大家耳熟能详的开源框架 TensorFlow、PyTorch,中国的开源框架也在崛起,例如国内知名的开源框架社区 MindSpore、PaddlePaddle 等。
除了训练与推理框架,开源在 AI 方向还有很多领域正在创新,例如模型市场,模型格式,数据 Pipeline,模型以及数据集开源,联邦学习等,这些都是整个业界的热点,包括头部企业、基金会,都在不断的做探索。
Q:中国企业加入开源社会会遭遇哪些挑战?带来哪些贡献?
从我开始贡献开源技术,到现在差不多有十几年的时间了。起初,开源在国内很小众,大家都是奔着理想情怀、以及对技术的爱好,来参与开源、拥抱开源。近些年,国内的开源已经发展成可以真正落地的产业,这是令人欣喜的局面。中国企业加入开源社会会遇到的挑战以及能带来的贡献,我认为有几点很关键:
第一,拓展开源的盈利模式。欧美等一些开源发展较为成功的地方,企业通过开源来盈利的商业模式非常清晰,例如提供商业发行版、7x24 小时支持、云服务、SaaS 服务等。但我国在很长一段时间,从事开源的企业的盈利模式都还在探索阶段。当前,以华为为代表的国内头部公司在积极推动开源社区的商业生态发展,助力伙伴一起探索成功的商业模式,其中,软件使能硬件、以及云服务等模式已较为清晰且有效,商业发行版和企业服务支持等模式正在探索,但类似 SaaS 化的商业模式还较为空白。模式越多,可拓展开源的空间更大,大家也不用都扎到某些特定领域内卷,我觉得这是一个非常关键的方面。
第二,夯实开源的技术储备。中国是开源应用大国,有很大的市场。我们是开源使用者,也是开源社区的维护者。但站在全球开源版图角度看,国内从 0 到 1 构建开源项目、开源社区还是比较少的,所以希望能有更多像 openEuler、MindSpore 这样从 0 到 1 的大型开源社区,能持续地在中国土壤上吸收营养、蓬勃发展,带给全世界开发者更多惊喜。
第三,推广开源文化与沟通方式。我们的传统文化讲究面子,强调与人交往不要过于尖锐,但国际主流的开源社区沟通方式是坦率和直接的,这也是工程师文化的一个特点。我们鼓励在协同方式上能多吸收现有开源文化的优秀特质,开放心态、就事论事,否则可能会对社区的协作效率造成影响,优秀的人才也留不住。
第四,加强高校开源培训投入。目前,刚从高校走出来参与到企业工作的开源开发者,很多都需要先经过企业的培训。未来,是否能够加大高校开源培训投入,提前培养学生们的开源基因,帮助他们在走向工作岗位时,从第一天开始就是开源社区的一份子,我认为这点也是非常重要的。
Q:您认为企业需要如何优化完善以交付可持续的产品?
与传统的闭源软件相比,开源很好地避免了大量的重复劳动。从可持续发展角度看,把工程师的时间资源用于创新,而非重复地开发,我认为是非常好的。开源本质上也属于软件领域的共享经济,就好比共享出行可以更环保一样,开源也可以提升软件的生产效率和消费效能。
我们正在快速迈向智能时代。在数据爆炸式增长以及各行各业越来越智能的背后,是大量 AI 技术与应用的推广与使用,这里面就包括需要开发与训练各种各样的 AI 模型。为了应对业界对模型和应用需求的指数级增长,当前国家正在大力建设开放的算力网络。同时,如果我们能把更多的模型开源和开放出来,相信会让开放算力网络发挥更好的效能、有更高的价值。站在各行各业的角度,我们既需要能解决行业通用问题的大模型,也需要针对具体痛点的“小而美”的模型,让模型开放、可复用、可推广是当下亟需解决的问题。因此,要应对数据与智能时代的挑战,我认为有效的模型不能一味追求大,效率和质量才是企业真正应该追求的方向。
END
开源雨林由华为联合开放原子开源基金会、中国信息通信研究院、中国软件行业协会、中国科学院软件研究所共同合作。面对企业在开源领域的各种问题,各共建方愿把长期积累的经验系统化分享给企业,围绕开源通识、开源使用、开源贡献三大方面构建知识体系,在团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。
开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest ,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。
往期精彩回顾
开源影响世界 世界推动开源——2022中国国际软件发展大会开源雨林企业开源合规与实践论坛圆满落幕!王怀民院士:共建繁荣的开源生态体系,为中国的软件产业创造欣欣向荣的“开源雨林”!
点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦~