查看原文
其他

百度王海峰:加强AI新型基础设施,抢占数字经济发展制高点

百度 2022-12-19



人工智能、大数据、云计算等数字技术快速发展 ,推动数字经济高速增长,并与实体经济加速融合。当前,如何让数字经济成为推动战略性新兴产业发展的增长引擎?作为市场主体,我国高科技企业如何增强自主创新的能力?
近日,百度首席技术官(CTO)王海峰做客人民网《人民会客厅》视频访谈时表示,现阶段我国数字经济蓬勃发展,已经成为经济社会转型升级、迈向高质量发展的关键一环。随着深度学习推动人工智能进入工业大生产阶段,要完善人工智能(AI)新型基础设施,来进一步支撑经济高质量发展。


以下为采访全文:





Q欢迎您和我们一起聊一聊人工智能和数字经济这样一些话题。我们知道,我国的“十四五”规划和2035年的远景目标纲要明确要加快推动数字产业化。当前我们的数字产业化的进程已经发展到人工智能为核心的智能经济发展新阶段。所以,我们一开始请教一下,现在百度在数字赋能和智慧引领方面,我们目前做了哪些工作?


王海峰现阶段,我国数字经济蓬勃发展,已经成为我国经济社会转型升级、迈向高质量发展的关键一环。而智能经济是数字经济发展的新阶段,产业加快应用智能技术,从海量数据中发现规律、提炼知识、训练模型,促进产出增加和效率提升,实现企业生产经营的智能化,进而实现整个产业的智能化升级。


促进数字经济、智能经济的发展,从技术角度,要提升人工智能等关键核心技术创新和供给能力,夯实AI基础设施;从产业角度看,要促进数字技术和实体经济深度融合,更好赋能产业数字化转型和智能化升级。


百度是领先的AI公司,在核心技术方面有着长期积累和全面布局,包括语音、计算机视觉等感知技术自然语言处理、知识图谱等认知技术,以及深度学习框架与平台、大模型、AI芯片等底层基础技术及底座。突破核心关键技术的同时,百度也在不断降低技术的应用门槛,加速AI技术深入到制造、城市、能源、交通、金融、媒体等各行各业和人们的生产生活中,促进产业升级、人们生活的便捷和智能化。


在深度学习平台方面,我国第一个深度学习开源开放平台飞桨,在核心技术上已经达到国际领先水平,具备了标准化、自动化、模块化特征。飞桨包括开发便捷的深度学习框架、基础模型库、功能丰富的开发套件和工具组件,以及学习和实训社区等,是支撑人工智能技术研发和应用的基础共性平台。基于飞桨,深度学习技术研发的全流程,都具备了显著标准化、自动化和模块化的工业大生产特征,持续降低应用门槛,让人工智能技术可以高效便捷地应用于各行各业。


在大模型方面,百度依托飞桨深度学习平台研制了文心产业级知识增强大模型。文心大模型同时从大规模知识和海量数据中融合学习,效果更好,效率更高。目前,文心大模型系列中已经有20多个大模型*,包括以鹏城-百度·文心为代表的基础通用大模型、跨模态大模型、生物计算等领域大模型,以及能源、金融、航天等行业大模型,还包括辅助大模型适配场景应用的工具套件和大模型API等平台,探索生态共建的创意社区旸谷等。文心大模型进一步降低了AI应用的成本和门槛,加速智能经济的发展。


(*注:截至本文发稿,文心大模型系列中已经有36个大模型,构建起业界规模最大的产业大模型体系。)


文心大模型和飞桨深度学习平台一起,贯通AI全产业链,进一步拓宽了人工智能技术落地的场景覆盖广度和产业应用的深度,成为产业智能化基座,有力支撑千行百业的智能化升级。


Q刚刚您给我们介绍了一个是文心大模型和飞桨代表深度学习开源开放平台,而且现在应用也非常广泛,也想请王总聊聊产生的过程,首先跟我们说一说飞桨为代表的深度学习框架的诞生过程是什么样的?有没有一些难度在里面。以飞桨为代表的深度学习框架在人工智能的产业链当中的位置是什么?究竟有多重要呢?


王海峰深度学习技术具备很强的通用性,推动人工智能进入工业大生产阶段。但是人工智能真正要实现大规模应用落地,面临很多挑战。


深度学习技术研发周期长,应用落地流程复杂。一方面,深度学习的“深”和神经网络的复杂度紧密相关,随着参数量增大、网络模型层数增多、硬件芯片类型多等问题出现,意味着深度学习的开发和训练难度越来越大;另一方面,应用开发出来之后,要运行在对应的芯片上,而芯片的种类非常多。


在这种背景下诞生了以飞桨为代表的深度学习框架和平台。以飞桨为例,基于百度多年深度学习技术研究和应用实践,打造了飞桨深度学习平台。


2011年,我们就判断深度学习对人工智能技术的价值,开始探索验证;2012年,率先在语音识别方向上线基于深度学习的语音识别模型,随后拓展到计算机视觉;2015年,上线世界上首个大规模神经网络机器翻译系统。同期,总结并沉淀深度学习技术研究和应用实践中的共性问题及经验,研制深度学习框架和平台,并于2016年开源。


以飞桨为代表的深度学习框架与平台的出现,让开发者不需要从0到1搭建地基,可以根据自身行业的特点和场景需要,选择基于框架定制开发,或者从模型库中选择或组装自己想要的模型,甚至采用零门槛平台导入场景数据进行训练,便捷部署应用。这让开发者和企业更快速、便捷地开发AI应用,避免重复“造轮子”。同时,深度学习框架也会协同硬件厂商,开拓软硬件协同的产品和功能,让AI应用更快更好地提供服务。深度学习应用层面,制造、城市、能源、金融、媒体等各行各业都在广泛应用人工智能技术,新业态和新模式也在不断涌现。在这样的趋势下,人工智能将越来越普惠,赋能千行百业,惠及千家万户。


深度学习框架在人工智能产业链中的位置,可以类比PC时代的操作系统Windows、移动时代的操作系统iOS和安卓。深度学习平台下接芯片,上承应用,相当于“智能时代的操作系统”,能够针对性地解决大规模发展、应用深度学习技术过程中面临的实际问题,推动人工智能在产业中应用起来,加速产业数字化转型和智能化升级。比如,现在许多企业已经借助深度学习平台,对生产经营的全流程进行智能化升级,从排产排程、工艺优化,到产线的质检、安全监测,以及企业知识管理、经营分析等等。


在全球范围内,谷歌的TensorFlow、Meta的PyTorch和百度飞桨占据前三位置,是开发者使用最多的框架平台。飞桨在深度学习框架的开发、训练、预测及部署等核心能力上,均有着比肩甚至超过国外主流框架的表现,这使得我国人工智能技术开发者和使用者,不必依赖于国外平台进行科技创新和产业应用,能够把我国广大科技工作者的智慧聚集在自主的平台上,避免技术形成代差、技术封锁等风险,同时还可进一步培育自主可控的技术和产业生态。


Q谢谢王总的介绍。刚刚您介绍飞桨深度学习诞生过程,可以看到我们国家的核心和自主技术在里面。现在我们也了解多,“十四五”规划和2035年远景目标同时也明确要加强原创性引领性科技攻关,瞄准人工智能等前沿领域。飞桨是深度学习框架技术及应用国家工程研究中心的核心成果,我们也想了解一下,现在与国外同行相比,大家的发展现状是什么样的?我国人工智能又处在什么样的水平呢?


王海峰飞桨的优势体现在核心技术优势、平台优势、生态优势等方面。


核心技术上动静统一的核心框架兼具灵活和高效,支持科研创新和产业应用,端到端自适应分布式训练技术,支持超大规模深度学习模型的高效训练等。


平台优势上,功能丰富的开发套件和工具组件,比如多端多平台训推一体工具链,提升全流程效率,硬件统一接入方案全面降低硬件适配成本,开源模型数量超过500个,结合实际应用场景调优、接口便捷、支持广泛场景应用。


生态优势上,飞桨建设了全方位的生态体系,包括开发者生态、硬件生态、企业生态、教育生态等等。开发者生态,除开源社区外,培育区域化的开发者团体,以及为开发者提供学习和实训社区等等。


硬件生态,联合硬件厂商针对芯片和框架一体化优化。


企业生态,与产业链上下游企业联合技术创新和应用推广,壮大生态。


教育生态,联合顶尖高校培养人工智能研究型人才,联合应用型高校高职等培养应用型人工智能人才,为企业培养多层次复合型人才同时,飞桨更了解中国产业和中国开发者。飞桨基于深度学习技术研究和产业实践,聚集产业需求技术创新,逐步完善工具与平台,降低包括大模型在内的技术应用门槛。


现在,飞桨已经广泛应用在工业、农业、能源、城市、科学计算等20多个领域。飞桨关注开发者的需求,和国内开发者直接对话,使得飞桨对应用场景理解更透彻,知道开发者想要什么。不仅为企业开发者提供PP系列模型、产业实践范例库等真正解决实际问题的工具;同时,也为个人开发者提供AI Studio学习与实训社区,为他们提供算力和学习资料,让他们在学习的同时能够上手实践。

Q这是优势,有没有不足?


王海峰刚才我提到国际上有三大主流框架,另外两个都是国外的。与飞桨相比,TensorFlow和PyTorch具备一定的先发优势,并且有国际环境等因素影响,飞桨的全球影响力还需要继续提升。虽然飞桨框架和平台在业界得到越来越多的认可,比如,英伟达就将飞桨列为它官方支持的三大框架之一,也有越来越多的海外开发者基于飞桨开发应用,为飞桨社区贡献代码等等,但受国际环境因素影响,飞桨的全球影响力还有提升空间。


Q谢谢王总的介绍,谈完飞桨,我们接下来再谈一谈预训练大模型,目前,文心大模型现在都应用于哪些行业?它在国际上什么样的核心优势?未来的发展前景您怎样预估呢?


王海峰大模型是近几年人工智能发展的重要方向,具有效果好、泛化能力强、研发流程标准化的特点,进一步增强了人工智能的通用性,为人工智能进一步发展带来了新机遇。


文心大模型基于飞桨平台实现开源开放,一方面广泛应用于百度产品,显著提升产品效果和研发效率,另一方面应用于金融、能源、医疗、制造、企业服务等领域。在能源、金融、航天领域,百度与国家电网、浦发银行、中国航天联合研发了电力、金融、航天行业大模型。


以能源电力行业为例,推进行业大模型更重要的是与国网专家们一起,引入电力业务积累的样本数据和特有知识,并且在训练中,结合双方在预训练算法和电力领域业务与算法的经验,设计电力领域实体判别、电力领域文档判别等算法作为预训练任务,让文心大模型深入学习电力专业知识。进一步降低了AI应用开发成本,快速赋能千行百业。

Q王总,以百度飞桨及文心大模型为代表的新技术、新应用在AI大生产阶段,您觉得会对我国数字经济的发展产生什么样的影响?它的作用会体现在哪里呢?有什么样的意义和影响力?


王海峰做强做优数字经济,从技术角度看,要提升人工智能等关键核心技术创新和供给能力,夯实AI基础设施;从产业角度看,要促进数字技术和实体经济深度融合,更好赋能产业数字化转型和智能化升级。深度学习平台和大模型正在成为AI新型基础设施,是做强做优我国数字经济必须抢占的关键点和制高点。


百度飞桨是我国第一个自主研发的产业级深度学习开源开放平台,核心技术国际领先。截至目前,飞桨平台已凝聚了477万开发者、服务18万家企事业单位*,是我国市场应用规模第一的深度学习框架和赋能平台,也是全球三大主流深度学习平台之一。


(*注:截至本文发稿,飞桨平台已凝聚535万开发者,服务20万企事业单位,基于飞桨创建了67万个模型。)


托飞桨平台,百度研制了“文心”系列知识增强大模型,持续降低AI开发与应用门槛


如今,以人工智能为代表的数字技术加速创新,已经走出实验室,深入田间地头、车间厂房,日益融入经济社会发展各领域的全过程。如在制造业,人工智能已应用到质量检测、安全巡检、设备监控、工艺参数优化、设备故障分析等各个环节;在农业领域,无人驾驶拖拉机等智能农机已经可以独立耕作,智能的病虫害监测系统帮助农民精准、科学施药施肥。在城市交通方面,应用智能信控系统,城市多条主干道可形成“绿波带”,驾车出行能一口气通过12个红绿灯路口,市民通行的时间显著缩短。目前,百度的智能交通方案已经在全国50多个城市得到实践和验证

Q王总,现在在整个全球化大背景之下,您觉得我国人工智能发展在未来要发展的更快、更好、更强的话,我们着力点应该在哪些地方布局?有没有一些挑战?挑战在哪里?


海峰首先我们说着力点。我们要加强原创性基础创新和核心关键技术攻关。科技立则民族立,科技强则国家强。只有在基础研究方面取得原创性突破,才能努力实现科技自立自强。同时,基础创新和关键技术攻关要瞄准支撑产业发展的基础技术,重视应用牵引,从经济社会发展面临的实际问题中凝练科学问题,突破瓶颈。


充分利用我国应用场景众多和海量数据优势,加速融合创新。一方面,越来越多技术在“融合创新”,人工智能现在是算力、算法、数据的综合运用,这和早些年主要是研究算法有了很大的不同。另一方面,技术和产业也在越来越深入融合,每个行业有自己的问题要解决,有应用场景要突破,需要技术跟场景的深度融合。


建设基础共性平台,持续降低门槛当人工智能开始应用于各行各业的时候,不是每个行业都有足够多精通深度学习或者人工智能算法的专家。因此需要飞桨和文心大模型这样的基础共性平台来降低门槛,推动AI越来越普惠,让更多人用上AI。


联合各方力量,培养人才。一方面培养复合型产业人才,另一方面培养未来进入这一行业的年轻人才,他们将直接影响技术应用的方向与效果。在这方面飞桨也十分重视,比如飞桨有面向一线算法工程师的“AI快车道”,面向CTO、架构师层级的“AICA首席AI架构师培养计划”,培养了近4000位AI教师,覆盖全国900多所高校。


开放合作,积极融入全球创新网络加强同各国科研人员的合作交流,参与全球科技创新,贡献中国智慧。


接下来说一下挑战。

一代人工智能技术的发展,离不开芯片与深度学习框架这一“软”一“硬”两大基础。随着中国科研创新能力的提升,在技术领域取得大量突破,AI基础与核心技术层面与国外的差距正在逐渐缩小


硬件方面,芯片产业面临的挑战和难关,已被大众所熟知。面向AI计算的AI芯片,某种意义上会成为我国芯片产业赶超的机遇。


基础软件方面,自2016年百度飞桨深度学习框架率先开源后,陆续有企业、高校等也开源了各自研发的深度学习框架。飞桨等平台在技术上已取得突破和领先,但在全球市场上占有率、生态成熟度等方面仍有提升空间。深刻认识深度学习框架和平台的重要性,鼓励和发展我国自主深度学习框架平台,对加快突破人工智能技术、推进产业健康转型具有重要意义。


此外,前面也提到,在人工智能基础研究方面,还需要加强原创性创新,比如研究小样本、低功耗的学习机制;人工智能可解释性研究等等。

谢谢。







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存