高 文 :人工智能前沿技术和高质量发展解析
一、世界人工智能发展历程和方向——大势所趋
人工智能(Artificial Intelligence,简称AI)是指在机器上实现相当乃至超越人类的感知、认知、行动等智能。按照智能能力的不同,人工智能通常可分为通用人工智能和专用人工智能,或被称为强人工智能和弱人工智能。目前对通用人工智能有两种理解:一种是通用性的人工智能(GeneralArtificial Intelligence,简称GAI)是媒体和社会公众的一般理解,指的是能够处理很多任务的智能 ; 另一种则是人工智能专业领域的准确名称,即人工通用智能(Artificial General Intelligence,简称 AGI),是指在人工智能所有方面都达到人类水平,能够自适应地应对外界环境挑战,完成人类能完成的所有任务的人工智能。
长期以来,人工智能系统都是为了实现特定或专用目标任务的智能,属于弱人工智能或专用人工智能范畴。2018年以来,大规模预训练模型(简称大模型)通过在海量无标注数据上依托强大算力资源训练能适应一系列下游任务,实现了通用性的人工智能(GAI),拉开了通用人工智能的序幕,但当前仍没有达到真正的人工通用智能(AGI)。
(一)人工智能发展历程
人工智能的概念最早于1956年在美国达特茅斯学院召开的夏季研讨会上被正式提出。纵观人工智能近七十年的发展历程,大体上可分为三个阶段。
第一阶段以符号主义逻辑推理证明为中心。该阶段主要研究在形式化表示方法基础上,通过逻辑推理或启发式程序来模拟人类推理能力,解决代数应用题求解、几何定理证明和机器翻译等问题。第二阶段是以人工规则的专家系统为核心。该阶段的研究焦点就是将领域专家的知识归纳成人工规则,进而进行辅助决策,专家系统技术在这一时期得到快速发展。第三阶段是以大数据驱动的深度学习为核心。该阶段有效整合算法、算力和数据,推动人工智能的研究重心从如何“制造”智能转移到如何“习得”智能。2006年,加拿大多伦多大学杰弗里·辛顿教授提出“深度学习算法”,为新一轮人工智能的发展奠定了理论和方法基础。2012年,杰弗里·辛顿教授与学生提出的深度学习神经网络模型 AlexNet 在ImageNet 图像识别挑战赛上以巨大的优势击败了其他非神经网络模型,成为深度学习兴起的标志。2016—2021年,谷歌开发的系列围棋机器人AlphaGo 和 AlphaZero,不仅在比赛中先后战胜了世界冠军李世石和柯洁,后来还取得了擂台赛不败的战绩。同时,该公司研发的 AlphaFold2在蛋白质结构预测问题上达到接近人类实验解析的水平,解决了困扰生物学界50年的“蛋白质折叠”难题。近十年来,基于大数据的深度学习模型和算法得到大规模应用,在机器翻译、智能问答、博弈对抗等领域取得了巨大成功,人工智能进入加速发展期。
以上三个阶段中,前两个阶段的主要思路是设计新的理论和算法,用机器模拟人的智能,尽管在理论方法上取得了进展,但由于目标过高,与应用结合不够,使得人工智能发展几经起伏。第三阶段基于大数据的深度学习技术已成为当前人工智能的主流发展路径,在计算机视觉、自然语言处理、智能语音等技术领域实现了规模应用。其中,计算机视觉是人工智能技术中应用最为广泛的领域。计算机视觉是指通过计算机对图像或视频进行处理,使其能够自动识别、分析和理解图像或视频中的信息。2015年,由微软亚洲研究院何恺明、孙剑、任少卿、张祥雨提出的深度残差学习网络 ResNet 成为计算机视觉领域具有里程碑意义的代表性技术。ResNet 的出现,使得超过上百层的更深层网络可以更有效地进行训练,推动了深度学习技术不断探索能力极限。目前,ResNet 已经成为计算机视觉任务的首选架构,例如图像分类、物体检测和图像分割等。2023年,基于为人工智能作出的基础性贡献,ResNet 的四位作者获得了未来科学大奖。
(二)当前人工智能发展新趋势
2018年以来,大模型首先在自然语言处理领域取得突破,以 ChatGPT为代表的现象级产品拉开了通用人工智能的序幕,引发了新一轮人工智能发展浪潮。当前人工智能发展已由小模型时代迈向大模型时代。
大模型是“大数据 + 大算力 + 强算法”结合的产物,至少具有三个特点:一是规模大,神经网络参数规模要达到百亿以上;二是涌现性,要产生预料之外的新能力,这是人工智能发展近70年来,最具里程碑意义的新特性;三是通用性,能够解决各类问题。
美国 OpenAI 公司的 GPT(生成型预训练 Transformer 模型)系列大模型是当前国际大模型领域的领先代表。2022年11月,OpenAI 发布的人工智能对话大模型 ChatGPT 表现出了惊人的智能水平,能够长时间进行自然流畅的对话,同时还能够高质量撰写几乎任何类型的书面材料,可以完成很多需要创造性思考的任务,一经发布就受到全球用户广泛关注,成为历史上增长最快的消费应用,引发了人工智能的“iPhone 时刻”。
ChatGPT之所以能表现出色,主要归因于几个关键方面的技术和策略。第一,其采用了大规模的训练数据,特别是互联网文本数据,以捕获丰富的知识和语言模式。第二,模型基于高效的 Transformer 架构,该架构通过自注意力机制,能够有效处理输入序列中各位置信息间关联依赖关系,极为适合自然语言处理任务。第三,ChatGPT通过多任务学习,提高了其在多样化问题上的泛化能力和生成能力。第四,模型还针对特定任务进行了微调,以更好地适应和解决特定领域或场景下的问题。第五,通过利用强化学习等技术进行模型调优,ChatGPT 在特定任务上的输出更加接近人类的习惯,进而表现得以进一步提升。这些技术的融合和应用,使ChatGPT成为了文本问答任务中的佼佼者,激发了公众对强人工智能未来发展的无限遐想。
除语言能力以外,大模型也在迅速扩展视觉、听觉、具身(有身体的智能,能与环境进行交互)、行动等其他通用智能能力,在向多模态方向发展的同时,也将逐渐进入现实世界,发展实体智能,引发下一波人工智能发展浪潮。
但是,也应看到,大模型等通用人工智能技术在给世界经济社会发展带来巨大机遇的同时,也带来了难以预知的各种风险和复杂挑战。大模型是高度复杂的人工智能系统,特点是难以预测,当前取得的进展基本上是通过经验模式取得,大模型背后的智能发生和涌现机理尚不清晰,国际社会对如何构建一个安全的人工智能系统仍知之甚少。当前以大模型为代表的通用性的人工智能(GAI)已显现出伦理道德、数据安全等一系列风险,需要加强安全监管。未来,面对伴随着人工通用智能(AGI)的到来可能会引发的人类生存性风险,更需要严加防范。加强通用人工智能治理已成为世界各国面临的共同问题。
随着人类探索通用智能发展路径的越发清晰,全球正处于“AGI”(准强人工智能) 的前夜,处在一个不确定性的状态,未来需要对大模型基础原理、安全与价值观对齐、人工通用智能(AGI)风险控制策略等方面开展深入研究,促进人工智能技术造福于人类。
(三)世界大国加快人工智能战略与政策部署
当前,人工智能已成为国际竞争的新焦点和经济发展的新引擎,世界主要发达国家把发展人工智能视为提升国家竞争力、维护国家安全的重大战略,纷纷出台人工智能规划和相关政策,力图在新一轮国际科技竞争中掌握主导权。
各国从国家战略层面强化人工智能布局。美国围绕人工智能研发和国家安全,陆续出台《国家人工智能研发战略规划》等相关战略和政策,力求巩固其世界领先优势;法国发布《国家人工智能战略》,着力推动健康、交通、环境、国防安全等领域的智能化;欧盟自2010年以来就把实现智能增长作为其三大增长目标之一。2018年4月发布了《欧洲人工智能》,系统地提出了欧盟的人工智能发展战略规划。同月,发布了《人工智能合作宣言》,标志着欧洲人工智能进入合作发展的新阶段;德国通过《联邦政府人工智能战略要点》,提出成为全球领先的人工智能科研场,实现人工智能德国造;英国发布《国家人工智能战略》,从数据获取、人才培养、科技研发和产业应用等方面打造人工智能强国;俄罗斯发布《2030年前人工智能国家发展战略》;日本提出建设“超智能社会5.0”,不仅要提升产业竞争力,还要实现国民生活智能化。
各国竞相加大人工智能研发投入。美国政府2017财年向人工智能非保密项目投入研发经费超过20亿美元,在2022年累计投入达249亿美元,预计2028年投入将破千亿美元;2021财年美国国防预算提案在人工智能研发领域的投资总额为8.41亿美元 , 较2020财年的7.8亿美元增长约8%。法国在2022年前在人工智能项目中投资15亿欧元。韩国提出要从“IT强国”发展为“人工智能强国”, 计划在2030年将韩国在人工智能领域的竞争力提升至世界前列。根据预算,相关措施若得以实施,到2030年,韩国将在人工智能领域创造455万亿韩元 ( 约合2.7万亿元人民币 ) 的经济效益。
各国组建新型人工智能研发机构。美国国家科学基金会协同联邦机构,包括国土安全部、国防部、教育部、农业部等,联合成立了25家国家人工智能研究院;欧洲计划建立一所世界级人工智能研究所,在英国等多个欧洲国家设立科研中心;法国提出新建人工智能中心,并组建人工智能研究网络 ;英国扩建阿兰·图灵研究所,启动数据伦理与创新中心建设,成立新的人工智能技术学院。全球各大人工智能跨国公司和领军企业也在加快布局人工智能研发中心。
各国加紧推动人工智能治理体系建设。联合国自2018年起专门成立了人工智能与机器人中心,研究人工智能的管控问题;美国国会建议成立人工智能安全委员会,负责对人工智能、机器学习的发展和相关技术开展审查;欧盟签署《人工智能合作宣言》,发布《欧盟机器人民事法律规则》,共同应对人工智能在伦理、法律等方面的挑战;2019年起,欧盟持续加强对人工智能应用和治理的关注,于当年4月出台了《可信赖的人工智能伦理准则》,为实现可信赖的人工智能设定了一个伦理框架。
目前,全球人工智能发展正处于由弱人工智能向强人工智能过渡的阶段,人工智能已然成为主导国家战略竞争力的重要支撑和推动科技革命的重要力量。未来,“人工智能+ 高速移动互联”将成为人类社会生活的基本场景。着眼更长远的未来,强人工智能将会带来颠覆性、全局性影响,谁率先实现突破,谁就会掌握未来发展的主导权。如果我国在新一轮人工智能发展中落后,将会在全球竞争中处于不利地位。
二、中国人工智能发展现状和前景——大有可为
习近平总书记指出,“把新一代人工智能作为推动科技跨越发展、产业优化升级、生产力整体跃升的驱动力量,努力实现高质量发展”。2017年,国务院发布《新一代人工智能发展规划》,确立了人工智能三步走目标,将人工智能上升为国家战略。此后,相关部委和各地方政府推动《新一代人工智能发展规划》加快实施,同时,科技界、产业界、投资界协同发力,推动我国人工智能发展进入跨越赶超的关键时期。
(一)我国人工智能基础理论和部分关键技术实现突破,人工智能与经济社会融合不断深入
经过多年的持续研发布局,我国人工智能科技创新体系逐渐完善,智能经济和智能社会发展不断深入,取得显著成效。
一是人工智能基础理论快速积淀。近年来,国内学者在问题求解、演化计算、模式识别、专家系统、智能控制等经典人工智能领域多有建树。特别是在新兴的深度学习理论和推理算法方面开展了大量研究,例如,北京大学提出深度跨媒体学习方法,显著提高了跨媒体检索的准确率;南京大学提出的“深度森林”模型是国际上第一个非神经网络和 BP(反向传播)算法的深度学习方法。在类脑计算方面加强布局,类脑芯片、类脑计算系统、类脑应用等取得积极进展;中国科学院在脑机接口领域取得突破,研发了目前运行最快的头皮脑电(EEG)脑机接口系统;华为公司上线了气象大模型,在一系列气象学家关心的精度指标和极端天气预报中都展现出优势,具有强大竞争力和巨大潜力。
二是人工智能部分关键技术跻身世界先进水平。本轮人工智能技术爆发初期,我国在中文信息处理、生物特征识别、机器翻译、智能处理器、自动驾驶和智能机器人等技术方向上紧跟世界前沿,实现了部分人工智能关键技术突破。麻省理工学院第十七任校长拉斐尔·莱夫评价认为,中国在人脸识别和语音识别等人工智能领域居世界领先地位。主要包含了以下阶段性成果:中国科学院研发推出全球首款商用深度学习专用处理器“寒武纪”芯片,在运行主流智能算法时性能功耗效率大幅超越中央处理器(CPU)和图形处理器(GPU);商汤科技的图像识别技术、科大讯飞的语音识别与合成技术和语言翻译技术的产业化水平目前处于世界前列,受到国际认可。
在计算机视觉方面也取得重大原始创新。北京大学改写了持续近两个世纪的曝光成像原理,发明了脉冲摄影原理,用比特序列逼近高速光电子流,研制出超高速视觉芯片和相机,实现了超高速、高动态、无模糊连续清晰成像。它建立了脉冲视觉算法体系并研制出超高速系统,采用常规光电器件和芯片工艺实现高超声速过程连续清晰成像和实时跟踪识别。其专利获中美欧日韩授权,有望从源头重塑计算机视觉技术和产业体系。
在人工智能基础软硬件方面,华为发布了基于达芬奇架构的昇腾910和昇腾310两款人工智能芯片,力争打造以芯片为载体、从底层算法到应用开发的完整生态,为全球开发者和企业提供新的选择,也为我国企业提供了安全保障。在此基础上,鹏城实验室推出了“鹏城云脑Ⅱ”和正在研制“鹏城云脑” 下一代设施。“鹏城云脑Ⅱ”是基于华为国产人工智能芯片打造的,作为国内首个全面自主可控的E级智能算力平台,具有国际领先的人工智能算力水平,已经在多个国际榜单上取得冠军。该平台约70%的机时对外开放共享,已支撑近千个国产人工智能模型训练任务与人工智能算法发布,成为我国最重要的开放共享、自主可控的人工智能大模型训练平台之一。而“鹏城云脑”下一代设施将是一款面向6G超宽带通信的智能化工具平台,采用了超大规模、高性能计算的体系架构,在芯片和系统全链条上均按照低功耗来设计,预计在2025年完成。“鹏城云脑”大科学装置将进一步推动我国人工智能国产自主产业生态的发展,必将成为支撑新一代智能网络通信创新研究的重大科学基础设施。
三是人工智能加速与千行百业融合发展。智能制造方面,正在大力推进智能制造工厂建设,已实现产品个性化定制;智能医疗方面,已研发人工智能医学影像产品,可用于筛查早期食管癌,其检出率高于医生借助内窥镜平均检出率;智慧城市方面,“城市大脑”已应用于杭州城市交通管理,可有效减少区域通行时间;智能物流方面,人工智能技术被应用于改进物流系统,分拣效率超过人工分拣的10倍多;智能交通方面,首都机场采用人工智能技术实现在50秒内完成1700架次航班的停机位安排,降低了飞机延误率,停机位利用率提高10%;智能安防方面,广州利用人脸识别技术帮助发现及抓获犯罪嫌疑人。
四是人工智能发展的创新生态初步构建。科技部在自动驾驶、城市大脑、智能医疗、智能语音、智能视觉等领域已构建起国家级开放创新平台,助力中小企业科技创新,推动行业技术进步和产业升级。某智能语音平台开发者团队数量超过80万家,已形成了覆盖技术研发、基础平台、物联网、智能硬件等完整人工智能产业链;某自动驾驶开放平台合作伙伴超过120余家,形成了全球规模最大的自动驾驶生态,覆盖了包括整车厂、零部件厂商、出行服务商、初创企业、通信企业、高校和地方政府等产业链各个环节。同时,人工智能领域的众创空间、孵化器、加速器快速发展,创业孵化体系逐步完善。
(二)中美引领大模型发展,我国语言大模型与美国差距正在逐步缩小,视觉、多模态、具身等新一代大模型有望实现齐头并进
目前,国际大模型领域已形成美国引领,中国紧跟的格局。根据中国科学技术信息研究所2023年5月发布的《中国人工智能大模型地图研究报告》,从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,中国在大模型数量方面位居全球第二。
中国大模型研发呈现蓬勃发展态势。截至2023年5月已发布79个大模型,大部分为语言大模型。
国际上的基础大模型主要分为语言、视觉、多模态等主要类别。其中,在语言大模型方面,OpenAI 的 GPT 系列和谷歌 PaLM 2等已形成领先优势,我国已研发出智源“悟道·天鹰”、百度“文心”、华为“盘古”、“鹏城·脑海”、阿里通义等语言大模型,但与海外顶尖水平仍有一定差距。随着人工智能模型开源生态的繁荣,中美大模型的差距将逐步缩小。
在视觉和多模态大模型方面,我国有望扭转跟随局面,实现中美齐头并进。视觉大模型上,智源研究院创新研发路径,首创“上下文图像学习”“以视觉为中心”作为核心建模思想,用图像理解、解释、输出图像,研发出视觉通用多任务模型 Painter,对 Painter 模型针对物体分割任务作出优化后,研发出国际首个利用视觉提示完成任意分割任务的通用视觉模型 SegGPT,已成为与 Meta 发布的基础图像分割模型 SAM 齐名的国际视觉大模型关键里程碑成果。多模态大模型上,智源研究院研发出首个打通多模态输入到多模态输出的统一多模态预训练模型 Emu,超越了此前 DeepMind 的多模态大模型Flamingo,刷新八项性能指标,并且模型能力覆盖图像与文本的生成及视频理解,能完成任意图生文和文生图的多模态任务。中国科学院自动化所研发出的三模态(图文音)大模型“紫东太初”目前已具有全模态能力,达到国际先进水平。
(三)我国人工智能整体发展已进入全球第一梯队
美国智库信息技术与创新基金会(ITIF)2019年发布《谁在人工智能竞赛中获胜:中国、欧盟还是美国?》报告,从人才、研究、企业发展、应用、数据、硬件六个维度,系统性对比中美欧人工智能技术创新与生态构建能力。2021年1月,ITIF 发布该报告的2021年更新版本,指出美国仍然保持着巨大的总体领先优势,但中国得分相比于2019年有明显增长,总排名反超欧盟上升至第二位,仅次于美国。我国的应用场景丰富,相比国外有一定优势。但是,报告也显示,中国在人工智能研究、人才、企业发展等方面与美国相比差距明显。
根据英国媒体机构Tortoise Media发布的2023年全球人工智能指数排名,目前人工智能领域综合情况全球排名前三的国家分别是美国、中国和新加坡。其中,中国在运营环境和政府战略方面领先于美国,在基础设施、科研、发展、商业紧随其后,但在人才方面与美国差距较大。
另据中国科学技术信息研究所2023年7月发布的《2022全球人工智能创新指数报告》,按照2022年人工智能创新指数得分排名,将46个参评国家分为四大梯队,其中,第一梯队国家得分为50分以上,只有美国和中国进入,中国人工智能创新指数已连续三年保持全球第二的水平。
(四)我国人工智能发展的优势条件
目前,我国在人工智能技术上持续深耕、快速积累,在政策、数据和市场应用上具有一定优势。
一是强有力的战略引领和政策支持。2017年《新一代人工智能发展规划》发布后,开启了我国人工智能发展的系统部署。《规划》发布后,各部门和地方积极推动落实,国家发改委、教育部、科技部、工信部等部门相继出台多项举措,北京、上海、天津、重庆、广东等近20个省市出台了人工智能规划和行动计划,纷纷加大研发投入,设立研发机构,制定人才引进、财税优惠等配套政策,带动企业加快智能化步伐,产学研协同推进人工智能发展的格局初步形成。
二是海量的数据资源提供支撑。我国互联网数据资源快速增长,截至2022年底 , 网民规模超10.6亿,我国移动电话用户规模为16.83亿户,其中5G 移动电话用户达5.61亿户。网民使用网络购物的比例超过55%,手机支付用户规模达到5.27亿人。特定应用领域数据规模庞大,医疗门诊总量每年达到81.8亿人次,每年有3亿人次做计算机断层扫描(CT),10亿人次做数字化成像(DR);公共和私人领域装有1.76亿个监控摄像头 ;年度快递业务量超过400亿件 ;每年国内旅游人数超过50亿人次。
三是丰富的应用需求孵化应用场景。我国具有全球规模最大、较为成熟的互联网市场,人工智能在互联网领域的应用空间广阔。我国作为全球制造业大国,各细分领域都面临转型升级,对人工智能应用具有巨大需求。我国新型城镇化加速推进,城镇规模不断扩大,利用人工智能改进城市基础设施、提升城市治理水平潜力巨大。同时,我国老龄化问题日益突出,居民收入水平不断提升,消费结构加快升级,对医疗、教育、养老等智能化产品和服务需求迫切。
四是具有潜力的青年人才快速成长聚集。我国加大对人工智能人才培育。2018年,国家自然科学基金委新设人工智能一级学科代码 F06,加大对人工智能基础研究的支持;国务院学位办2022年底新设智能科学与技术一级学科,全国各大高校加快布局人工智能学院,扩大本科和研究生培养规模。我国人工智能学者数量大幅增加。根据清华大学AMiner数据库分析,截至2023年6月,全球人工智能学者数量共计16.4万人(这里“人工智能学者”指在国际人工智能领域顶级会议或顶级期刊上发表过至少一篇论文的科研人员),其中,我国人工智能学者约3.6万人,占比21.9%,与美国人工智能学者数量(3.7万人)相当。在学者成果产出方面,2022年,我国人工智能论文总量和高被引论文数量已居世界第一,并且我国人工智能专利数量略微领先于美国和日本。
(五)我国人工智能发展的薄弱环节
一是人工智能基础理论和原创算法差距较大。我国人工智能研究起步晚,原创性贡献不多。近年来,随着各国加快人工智能理论创新探索,模型和方法不断有新的突破,包括深度学习模型、生成对抗网络等新的重大成果和原创性理论贡献仍以西方国家为主。大模型构建、训练、调优对齐、推理部署等多个流程使用的主要算法及核心技术大部分来自美国。虽然我国在人工智能领域内高影响力论文数量增长明显,顶级论文和重大理论创新还主要源自美国、英国、加拿大等国家。
二是在高端芯片、关键部件、高精度传感器等方面基础薄弱。在图形处理器(GPU)、专用集成电路(ASIC)和现场可编程门阵列(FPGA)等人工智能芯片方面,英伟达、英特尔、高通、超威等欧美国家企业占据垄断地位:英伟达在GPU领域占据了全球近84%的市场份额,赛灵思(Xilinx)和阿尔特拉(Altera)占据了 FPGA 市场将近61.9%的份额。美国波士顿动力公司的人形机器人产品(Atlas)依靠其在高精度传感器和运动控制算法上的巨大优势,目前已连续完成台阶跳跃、后空翻、单腿三级跳等高难度动作,在智能感知和智能行为融合上达到新的高度。
三是尚未形成具有国际影响力的人工智能开源开放平台。当前,国际巨头企业纷纷建立人工智能开放平台,打通硬件—系统—产业链条,主导建设创新生态。我国在面向特定应用领域已经陆续建立了国家级人工智能开放平台,但在机器学习等通用开源算法平台方面布局不够,且对产业链的带动性不足,国际影响力不够。
四是数据量大质低,缺乏高质量大规模中文数据集。在当前深度学习阶段,数据对人工智能发展至关重要,特别是在大模型时代,数据对大模型智能水平的影响差不多要超过60%。我国的数据资源极其丰富,但是数据的量大质低,很多不能用于模型训练。另外,书籍期刊等版权数据、互联网平台数据等高质量数据割裂、封闭、不易获取,导致我国可用于大模型训练的高质量中文数据集相对缺乏。目前,我国大模型训练主要依赖国际开源数据集,国际数据集中的中文内容少且不规范,Common Crawl 中的中文数据不足5%,基于这些数据集训练的大模型自然是“英文思维”。建设高质量大规模中文数据集,是我国通用人工智能发展的基本前提。国内已有部分机构开展了相关工作,如智源研究院建设了全球最大的中文数据集 WuDaoCorpora,其中文本数据集超过了5T,已对外开放低风险数据200G,被全球数百个大模型科研团队使用。
五是算力资源短缺。大模型的快速发展和持续迭代对算力的需求呈爆炸性增长,由于 GPU 等芯片的供给增长缓慢,导致全球范围内的算力短缺问题普遍存在,我国的算力短缺问题尤为突出。目前,我国大模型研发所需的算力资源主要来源于智算中心、超算中心和云计算中心。其中,智算中心普遍算力规模不高。目前我国有超过30个城市正在建设或提出建设智算中心,算力规模目标大部分在1000P 左右。超算中心中国产人工智能芯片数量较多,但由于很多是早年部署,型号早、性能低,难以用于大模型训练。云计算中心的商业任务占用率较高,千亿级模型的私有化部署成本接近每年2000万—3000万元,成本较高。
六是高水平人才不足。根据清华大学 AMiner AI 2000 全球最具影响力人工智能学者榜单,在全球人工智能高影响力学者(全球最具影响力人工智能学者入选依据 :近十年间,人工智能的20个子领域里论文被引量分别排名前100的学者上榜,各领域排名前10的学者当选当年最具影响力学者)中,美国人数最多,近三年均稳步在1100人以上,占比约六成;中国位列第二,数量稳步增加,超过了230人,占比一成多,但与美国的差距并没有缩小,美国是中国的近五倍。
从以上几点来看,我国发展人工智能既有很好的基础和优势,也面临巨大挑战,需要探索一条适合我国国情的发展道路。应坚持科技引领、应用驱动的战略导向,以促进人工智能与经济社会深度融合为主线,以提升科技创新能力为主攻方向,全面推动人工智能应用。应通过科技引领和应用驱动的双向发力,实现我国人工智能在理论上尽快补上短板,技术上自主可控,产业上占领制高点,全面增强经济创新力和国际竞争力。
三、全面推进中国人工智能高质量发展——勇毅前行
2023年4月28日召开的中共中央政治局会议指出,要重视通用人工智能发展,营造创新生态,重视防范风险。我国人工智能发展要深刻把握国际通用人工智能技术发展趋势,开展前瞻性技术研究,着力实现弯道超车。同时,要加强政策、人才、底层基础软硬件、开源开放等生态环境的打造,营造良好环境。另外,要加强风险研判,积极推进人工智能治理,推动我国新一代人工智能持续健康发展。
(一)持续完善我国人工智能规划和政策体系
面对国际通用人工智能发展新形势、新机遇、新问题、新挑战,围绕《新一代人工智能发展规划》提出的我国到2030年实现人工智能达到世界领先水平的战略目标,《新一代人工智能发展规划》在新时期实施时应突出新变化,形成新的规划任务方向。另外,要针对我国通用人工智能发展的薄弱环节和发展需求,在技术研究、资源开放、场景建设、人才发展等方面制定相关支持政策,打造人工智能高质量发展的支撑政策体系。
(二)加强通用人工智能基础理论研究和关键技术研发
前瞻布局通用人工智能前沿技术研究,开展大模型基础原理和新架构探索,视觉、视频、多模态、具身等下一代大模型研究,利用大模型解决重大科学问题,形成具有国际影响力的通用人工智能原创理论体系。
引领通用人工智能关键核心技术创新,重点突破分布式高效深度学习框架、大规模认知与推理、可控内容生成、高效低成本训练与推理等关键算法研发,建立我国通用人工智能技术创新体系。
(三)夯实人工智能基础软硬件生态底层基础
推动国产人工智能芯片实现突破,面向通用人工智能技术发展需求,能够全面支撑大模型训练、多模态处理、科学计算等场景算力需求,并探索可重构、存算一体、超规格高算力智能芯片等新型架构芯片,提供支撑我国人工智能发展的算力保障。加强自主开源深度学习框架研发攻关,在大模型分布式训练和多端多平台推理部署等方面提升核心能力,研发模型开发、训练、压缩、推理全流程工具。支持人工智能芯片和深度学习框架开展广泛适配和融合优化,打造人工智能国产基础软硬件深度协同生态。
(四)加强数据、算力等资源的汇聚及共享
建立多层次数据开放体系。相关政府部门出台政策措施,推动出版社、杂志社、图书馆、博物馆、档案馆等版权数据或公共数据机构,以及互联网平台对外有序开放数据用于人工智能技术研发,打破数据壁垒。建立我国大规模高质量中文数据集建设的长效机制,整合汇聚大型互联网企业、大模型研发企业、数据服务企业、大型出版社、图书馆、主流媒体、行业组织等机构,建设大规模高质量的语言、语音、图像、视频和多模态数据集,以及医疗、交通等行业数据集,为我国通用人工智能长期健康发展提供基础保障。
夯实算力基础设施建设。加强智算中心建设,逐步提高算力设施国产化率,为大模型研究提供高性能计算资源和服务。推动中国算力网建设,实现国家级超算中心、智算中心、“东数西算”数据中心的互联互通,实现全国大型算力的协同调度和高效计算,推动云、网、算等资源融为一体,形成支撑数字经济发展的国家级算力基础设施和统一算力大市场,为人工智能技术创新和产业智能化转型提供普惠算力。
(五)加强人工智能风险预判和治理体系建设
我国在通用人工智能监管上走在国际前列,2023年7月出台了全球首部生成式人工智能规范性政策文件《生成式人工智能服务管理暂行办法》,为其他国家相关政策的制定提供了借鉴。伴随通用人工智能技术的快速发展,我国应坚持发展和安全并重的原则,建立并完善符合我国人工智能发展需求的治理体系。一是加强对人工通用智能(AGI)发展安全风险的研判,根据风险问题适时调整我国通用人工智能发展策略。二是建立我国特色的敏捷治理体系。通用人工智能发展迅速,新应用新模式层出不穷,应建立符合我国经济、社会发展特色的敏捷治理体系,保持政策灵活性,留足制度发展空间,以保障技术的长远健康发展。三是开展风险防范技术研究,以技术监管技术,针对大模型基础原理、安全与价值观对齐、人工通用智能(AGI)风险控制策略等方面开展深入研究,促进人工智能技术造福于人类。
推动建立健全的人工智能监管方面相关的法律、法规和标准,是保障人工智能高水平提升、高质量发展的重要一环,应逐步完善人工智能的安全保障和伦理规范,保障人工智能的安全和可信度。一是制定和完善人工智能相关法律、法规和标准,涉及人工智能开发、使用、应用等各个环节,明确相关责任和法律后果,规范人工智能的发展和使用。二是加强人工智能的安全保障,强化人工智能的安全性研究和技术保障,防范人工智能被恶意利用和攻击,确保人工智能系统的稳定运行和数据的安全。三是建立人工智能的伦理规范,明确人工智能的道德责任和社会责任,避免人工智能带来的负面影响和伦理风险。四是建立健全人工智能的监管机制,包括人工智能评估、审查、监督、监测等各个环节,加强对人工智能的监管和治理,保障人工智能的安全和可信度。五是加强人工智能的公众参与,包括社会组织、专家学者、公民等各方面的参与,加强社会监督和民主监督,推动人工智能的良性发展。
(六)强化人工智能在服务企业升级中发挥更大作用
人工智能作为一项渗透性极强的颠覆性技术,对实体经济及社会生活的方方面面都具有极其重要的意义,是建设现代化经济体系、实现高质量发展的重要支撑。企业作为社会经济活动的基本单位,直面市场、服务市场,是最活跃的创新力量。要实现传统产业改造,新兴产业不断壮大,现代化产业体系加快形成,就要打好一套“组合拳”。一是龙头企业要发挥引领作用,打造开放、协同、共享的创新生态系统,特别是构建一个包括从基础研究到应用推广的全链式人工智能创新生态系统,助推传统企业向智能化高端化转型。二是加大对人工智能产业的支持和投入,通过设立人工智能创新基金、支持人工智能企业上市等方式,增强该类专精特新“小巨人”利用金融力量为企业不断造血。三是搭建人工智能开放创新平台,通过平台资源和技术赋能服务企业、高校和研究院所,加速人工智能技术的研发和应用,不断提高技术创新能力。四是积极引导推动数据的开放和共享,促进各个领域之间的数据融合和互通,形成全社会共建共享的数据资源库,切实推进人工智能与实体经济深度融合。
(七)加强人工智能教育和人才培养
我国的人工智能发展,关键在人。培养具有创新能力和实践能力的高素质人才非常关键,可通过设立人工智能专业、加强人工智能相关领域的教育和培训、支持高水平人才引进等,逐步构建人工智能人才培养体系和课程体系,提高我国人工智能人才队伍的整体素质。同时,政府还应积极鼓励企业和高校合作,加强人工智能人才培养的实践环节,推动理论与实践的深度融合。此外,应量身定制包括税收优惠、研发经费支持、人才奖励、高层次人才计划等一系列政策措施,鼓励创新创业,加强对人工智能领域人才的引进和扶持,上述在内的多种手段,可为人工智能人才的培养和发展提供有力支持。
(八)加强人工智能国际交流与合作
我国人工智能的发展,应积极参与全球人工智能领域的标准制定和技术交流,加强与国际顶尖人工智能企业和机构的合作,推动人工智能技术的全球创新和发展。通过加强国际合作机制建设,建立人工智能领域的跨国合作框架,促进全球人工智能技术的开放和共享。加强人工智能领域的知识产权保护,建立国际人工智能技术标准和知识产权保护机制,促进人工智能技术的国际化应用和交流。积极参与国际人工智能标准制定,推动人工智能标准化国际化进程,提高我国在国际标准制定中的话语权和地位。加强国际人才交流与合作,鼓励优秀人工智能人才到国外交流和学习,引进国际优秀人才来我国工作和合作。与国际顶尖人工智能企业和机构建立战略合作伙伴关系,共同开展技术研发、应用推广、人才培养等领域的合作,加速形成具有国际竞争力的人工智能产业集群。参与国际人工智能赛事和竞赛,提高我国人工智能技术的国际影响力和竞争力。
(作者为中国工程院院士、鹏城实验室主任)
来源:2023年第6期《党委中心组学习》
监制:徐遥 责编:春华 编辑/制作:孙爽