助力新基建,国产AI芯片加速驱动智能化时代到来
与过去“铁公机”式的传统基建相比,新基建以“硬核科技”面向未来,补足产业基础能力、创新发展能力和新兴产业的短板,以支撑和引领未来产业升级。人工智能(AI)是新基建当中的一项重要内容,是赋能信息基础设施建设的关键技术,更是新一轮产业变革的核心驱动力量,将推动数万亿数字经济产业转型升级。国务院《新一代人工智能发展规划》指出,到2025年中国人工智能核心产业规模超过4000亿元,带动相关产业规模超过5万亿元。
新基建为半导体产业注入新力量
在2019年中国进口商品中,集成电路位列进口商品之冠。全年进口的芯片总量为4451.3亿个,进口金额约为3055.5亿美元。而近10年中国进口芯片金额则高达1.8万亿美元,对于进口芯片的依赖程度相当高。
半导体是整个信息产业的基石,同时也关乎着国家信息安全的命脉。而随着国家对于集成电路产业的重视,以及国家“大基金”及各地方政府的扶持,国产集成电路产业发展迅猛,国内的集成电路产业在产业规模、产量、产值、质量上都得到了很大的提升。此次“新基建”的提出,也将为中国硬科技创新带来更大的发挥空间。
近年来,随着AI技术的发展和AI应用的成熟落地,催生了新的市场,也为传统产业的发展注入了新的活力,尤其对半导体产业发展是也带来了极大的助力。同时,AI的发展也离不开储存、计算和连接能力,AI算法也都需要大量的数据支持。
算法、数据和算力是推动AI技术进步和产业发展的“三驾马车”,芯片则是AI的“大脑”。而衡量AI发展的标准则是算力。
过去半导体芯片的计算力的提升依赖于摩尔定律的推进,每两年翻一番,但是随着摩尔定律的放缓,传统的依赖于半导体制程工艺升级所带来的算力提升,已经无法满足智能化社会构建的需求。有研究显示,2012年以前,AI算力的需求提升紧追摩尔定律,每两年翻一番,但2012年以后,AI对于算力的需求已迅速缩短为3、4个月翻一番。
中国工程院院士邬贺铨表示提升AI算力的背后涉及庞大产业链。“有各类AI芯片,包括‘云端’、用户端的类脑芯片,以及各类传感器、激光雷达、毫米波雷达、摄像头、体感传感器等。最重要的人工智能是通用的AI平台,包括计算机视觉、语音识别、自然语言处理,机器学习、知识图谱等。人工智能的应用领域很广。”邬贺铨说。
AI产业链可分为基础层、技术层和应用层。基础层提供算力支持,通用技术平台解决算法问题,场景化应用挖掘数据价值。技术层是人工智能发展的核心,对应用层的产品智能化程度起到决定性作用,在这一发展过程中,算法和算力是AI的核心驱动力。
芯片则是AI新基建发力的重点。在AI应用的第一阶段,应用场景主要为训练和推理,在模型训练方面,算法模型需要对海量数据进行处理,这往往依赖于高吞吐的大规模服务器集群完成,云端芯片是AI算力基建的重点,诸如CPU+GPU、CPU+FPGA使得异构计算成为目前AI的主流计算架构。随着算法模型应用趋于成熟,AI应用步入第二阶段,AI算力基建偏向于推理芯片的建设。AI新基建势必成为半导体产业未来最强大的推动力。而半导体产品也将贯穿于“新基建”领域,如以AI芯片为核心的SoC芯片:将主要支撑数据中心、人工智能系统建设。
来源:2018年人工智能芯片技术白皮书
“新基建”之下,人工智能的机遇和挑战
从2016年开始,中国AI进入市场爆发阶段。2019年,AI企业开始加快落地应用探索,基础层、技术层企业开始向应用层下游渗透,AI相关应用产品更加丰富,对于不同应用场景,AI企业能够提供更全面的综合智能化解决方案。2019年中国AI市场规模达到489.3亿元,增长率27.5%。新基建将为AI带来一波新的机遇。据预测,到2023年,中国AI市场规模将达到7000亿元,2018-2023年复合增长率超过28%。
由信息化到数字化的变革,AI无疑是最关键的技术力量。特别是在此次疫情下,AI再次被推上防疫一线,1)疫情防控信息采集,思必驰的科技战役武器“疫情防控机器人”在全国121个地方上岗,累计呼出量逾600万。与此同时,体温测量是疫情期间的必要工作,智能安防也面临着大考。传统的体温测量方式效率低下,且存在交叉感染的风险。2)体温监测和实时追踪加强疫情监控,行业内的两家独角兽企业,商汤、旷视积累了相当的AI技术实力,旷视科技通过人像聚类和人体ReID技术,把红外测温卡口相机、人脸卡口相机和治安卡口相机中采集到体温、人脸图和人体图数据融合联动,实现实时追踪定位人员轨迹。商汤科技在疫情下也开发了无接触体温测量方面的技术——“AI无感测温”,并已应用到首都国际机场等区域。
科技正逐步接管我们社会生活的各种场景,在新基建的推动下,传统产业借助AI赋能,完成智能化升级,AI企业对于这些应用场景的不断投入将实现应用场景的不断落地。智慧城市、智能医疗、智能驾驶、智慧教育、机器人、安防建设等领域应用,持续探索新一代人工智能应用场景。这背后除了科技日新月异的高速发展,也呈现出计算在万物互联、万物智能时代中的重要性,当前备受关注的新冠病毒疫苗研制进程加速,也是算力提升带来的成果之一。人工智能与其他产业间的结合应用逐渐成熟,算力需求与日俱增。为了匹配产业级、城市级的项目需求,AI芯片的需求逐渐显现。
“新基建”的提出,有助于加速云计算、算法、芯片等领域关键技术的突破,进一步帮助各垂直产业实现智能化和数字化的转型。而数字化、智能化应用,将会倒逼“端、边(网)、云”提升基础能力。边缘算力和端侧算力暴发将会带来大量的数据量,对芯片处理能力提出了新要求,而多场景的定制化需求对芯片的灵活性也提出了更高的要求,同时将近一步挑战 AI 芯片的计算能力。
据Gartner 的统计,2015年以IaaS、PaaS和SaaS为代表的典型云服务市场规模达到522.4亿美元,增速20.6%,预计2020年将达到1435.3亿美元,年复合增长率达22%。其中IaaS公司到2020年市场空间达到615亿美元,占整个云计算市场达43%,云计算硬件市场空间巨大,而云计算和人工智能各种加速算法关系密切,未来的云计算硬件离不开AI芯片加速。随着企业用户对计算需求的不断提高,市场规模仍在扩大。传统的云服务算力已然很难满足新生海量数据处理需求,特别是以语音识别、图像识别、视频识别、深度学习等技术对算力的需求更高,所以AI云服务逐渐进入到我们的视野。
资料来源:Gartner , 中信证券研究部整理
2018年下半年,以百度、华为为代表的新一轮造芯势力吹响了中国云端AI芯片冲锋的号角。寒武纪、比特大陆、燧原科技等在2019年都推出了云端AI芯片,从细分市场进入云端AI芯片市场。
2020年,巨头和初创公司产品都将落地。云端AI芯片市场的竞争将更趋激烈,AI模型训练所需的计算能力每年呈指数增长。因此,提高生产率和可扩展性,解决数据中心和云计算对算力的迫切需求成为至关重要的任务。
由于算力需求的提升速度极快,芯片制造工艺发展愈发困难,从 1960s 开始集成电路商用化以来,制程从 10um 到最新的 5nm,基本每 5 年左右半导体制程提升一代。每一代的性能与功耗都会大幅度提升,制程提升的动力是下游电子行业对于算力的需求的不断提高。过程还包含提高良品率,提高生产效率,节约成本,事故预防等等。
以中芯国际、长江存储、合肥长鑫为代表的本土半导体制造企业正分别在逻辑电路、芯片、3D NAND 存储芯片、DRAM 存储芯片领域布局先进制程产能,是中国半导体制程工艺技术走在最前沿的企业。中芯国际 28nm 制程的发展成熟已经为本土企业带来了可观的验证机会,据中国电子专用设备工业协会数据,2019上半年国产设备在集成电路生产 线设备市场占比达到10%左右。随着中芯国际、长江存储、合肥长鑫等企业在工艺技术上的进一步发展将为国产设备带来更前沿的验证机会和更广阔的进口替代市场,近期,中科院造出最强紫外超分辨光刻机,通过技术的自主创新,开发出设备技术超前的产品,为中国芯片制造迈出一大步。
从语音到图像,从边缘到云端,要在越来越激烈的竞争中占有一席之地,落地的速度成为关键。芯片的易用性将变得更加重要,这将从技术上降低客户尝试的成本,加快产品推向市场的时间,也能够弥补硬件迭代速度慢不能很好满足应用需求的痛点。解决AI算力瓶颈仅仅依靠芯片工艺的发展远远不够,关键在于以更短的开发流程,加速开发架构层面创新的AI芯片。
EDA作为芯片产业链的最上游,是芯片设计和生产的必备工具。对AI芯片的架构创新将发挥至关重要的作用。注重计算架构及处理器设计的突破,加强软硬件协同设计和优化,改变传统的设计理念和方法,已成为整个行业重大趋势。EDA 在其中所承载的价值亦不容忽视。软件工具、制程封装、存储、互联、安全等方面,全栈式的能力将变得越来越重要。
新思助力AI新基建打造中国“芯”
“从技术来看,架构是获得巨大算力,使吞吐量或计算量大幅增加的唯一途径,我们必须不断改进封装和架构;从需求来看,海量的数据结合机器学习及高速的通信,成为了一种重要的经济驱动力,我们需要100倍或更高的算力。”
- 新思科技董事长兼联席CEO Aart de Geus
现在,芯片要求节点更小、密度更高、速度更快、功耗更低,需要架构的创新才能支持这些要求,针对性强的解决方案成为必要。对于AI芯片设计,除了早期的架构探索,还需要了解来自软件的应用需求;同时,AI软件和底层驱动软件的开发也需要相关的硬件信息,以实现早期的软件开发和优化。
当 AI 技术春回大地,新思科技也敏感地觉察到 AI 技术将对上游的应用带来的冲击,所以早早将AI嵌入芯片设计来推动产业链的融合与创新并大力开发自己的产品推动着AI前行,为合作伙伴实现先进的芯片设计和验证提供了整套综合性的工具、IP核等支持。
· 昆仑芯片可以在100瓦+功耗下提供260TOPS ,每秒260万亿次定数运算性能。在百度“昆仑”芯片的研发过程中,采用新思科技全流程解决方案,Verification Continuum为芯片验证提供了统一的验证环境从而取得更高的研发效率;ZeBu Server 4利用其独特的快速仿真架构、最先进的商用FPGA以及基于FPGA的仿真软件创新,提供比传统硬件仿真解决方案高出两倍的性能。软件的创新提供了更快的编译、高级调试、功耗分析、仿真加速和混合硬件仿真。使芯片设计过程中的软件设计步骤提前于硬件交付之前,以加速研发;“昆仑”采用PCIe 4.0 IP核辅助AI加速器快速地运算和数据传输,助力“昆仑”实现适配诸如自然语言处理,大规模语音识别,自动驾驶,大规模推荐等具体终端场景的计算需求。Fusion 设计平台解决了目前从应用端到工艺端对于芯片设计和制造带来的一系列巨大挑战,将算法和芯片实现早期优化,帮助项目团队缩短了至少1/3的项目开发周期。
· 2019年12月11日,燧原科技发布首款人工智能训练产品“云燧T10”。 “云燧T10”拥有单精度(FP32)下算力20TFLOPS;半精度及混合精度(BF16/FP16)下算力80TFLOPS的卓越的算力,而最大功耗仅为225W;以及出色的通用性,可支持CNN、RNN、LSTM、BERT等常用人工训练模型,可用于图像、流数据、语音等训练场景。为了加快原型设计、软件开发和IP与SoC的集成,新思科技 DesignWare PCIe4/CCIX IP以及模拟IP核可支持高速缓存一致性和虚拟化内存功能,可用于AI异构计算并减少AI应用中的延迟。多种嵌入式存储器编译器可以实现高密度、低泄漏、高性能的片上SRAM选项,其中包括TCAM和多端口存储器,使燧原科技设计人员降低了集成风险,缩短了产品上市时间。新思科技Virtualizer/VDK和PCIe虚拟I/O技术提前构建芯片虚拟原型平台,将耗时巨大的诸多测试和验证任务时间大大缩短。加上易于使用的模块化原型验证系统HAPS、业内最快的硬件仿真系统ZeBu诸多助力,仅仅用了一年半的时间,便完成了首款人工智能训练产品的开发,并成功实现流片,即将投入量产。
· Habana Labs使用新思科技DesignWare控制器和PHY IP Solutions for PCI Express® 4.0实现了其Goya™推理处理器片上系统(SoC)一次投片成功。先进的人工智能芯片需要集成IP解决方案,经硅验证的IP运行数据速率为16GT/s,支持PCI Express 4.0规格的所有关键特性,并兼容PCI Express 3.0,满足了AI芯片所需的实时数据连接性。对于Goya这样的高性能AI加速器,需要服务器接口加速才能实现端到端工作负载性能。Habana Lab整合新思科技低延迟、高性能DesignWare IP(面向PCI Express 4.0)加速其芯片开发并在飞速发展的人工智能市场实现差异化。Goya基于ResNet-50基准实现每秒15012张图片的吞吐量(延迟时间为1.3毫秒),同时达到无可匹敌的能效记录 -- 150张图片/秒/瓦。
新思科技作为中国半导体产业快速发展的优秀伙伴和坚实支撑将一同跨入智能化新基建时代!
编辑:芯智讯-浪客剑
参考资料:
- 《人工智能将成为新基建发展的重要建设目标》
- 《新基建”之下,人工智能的机遇和挑战》
- 《AI新基建已在路上》
- 《人工智能领域 “新基建”将聚焦算力提升 满足应用泛化需求》
- 《新基建下的智能安防:缘何在科技探索的道路越来越“复杂化”?》
- 《思必驰:这场战役,我们的利器是爱与AI》
- 《智能语音:人工智能领域的重要入口》
- 《简单介绍一下当前芯片先进制程的发展现状》
- 《一幅漫画引发的思考:打破算力瓶颈的钥匙终于找到了》
- 【中信研报】AI群“芯”逐鹿,英伟达、谷歌、寒武纪等25家公司实力拆解
- 《半导体主流先进制程工艺梳理》
- 《一文读懂半导体制程工艺发展》
- 《半导体行业深度研究-硬核科技代表》
- 《人工智能:新基建,迎接智能新时代》