查看原文
其他

两会 | 张志勇代表:推进行业大模型高质量发展

人工智能的迅速发展为人类社会经济社会发展持续注入新动能。近年来,以大模型为代表的技术突破广泛应用于各个领域,推动产业升级和变革,引发了世界范围内的研究热潮。我国虽在基础理论、原创模型方面较美国有一定差距,但我国是制造大国,拥有健全的工业门类和产业高端化、数字化、绿能化的迫切需求,为大模型创新发展提供了更为广阔的实践空间。2024年全国两会,全国人大代表,中国铁塔党委书记、董事长张志勇提交了《关于推进行业大模型高质量发展的建议》。

张志勇指出,随着各级政府支持政策陆续出台,从算力支持、场景开放、技术突破、产品生态等方面鼓励大模型发展。但现阶段算力资源不足、数据质量不高、场景开放不够、应用部署成本高、模型数据安全风险等问题,对行业大模型的发展形成了一定制约。

一是算力资源不足。目前国内高端智算芯片供不应求,各大云厂商算力面临一定程度紧缺,价格不断上涨。同时,跨数据中心的算力协同方面也存在不小挑战,智算中心算力利用率和效率不够高。能够提供训练和推理一体化算力供给的单体超大规模智算中心较少,其中国产AI训练和推理芯片、深度学习框架占比偏低,自主可控、安全可靠成为行业大模型发展的短板。

二是高质量数据成为掣肘大模型发展的关键。大模型在前期训练阶段和后期调优阶段都需要海量的数据支撑,数据质量直接影响大模型“聪明”程度,训练数据集的分布特征和多样性也会影响大模型的能力。目前市场上缺少高质量的行业公开数据,很多大模型企业使用相同的开源数据集,无法快速帮助其构建契合行业特点、差异化的大模型;而掌握丰富行业数据的企业又缺乏大模型研发能力,掣肘了行业大模型的创新发展。

三是场景开放不够。行业大模型是否好用,取决于应用价值和丰富的场景选择。对行业大模型预训练、模型微调、模型蒸馏过程中,除了投喂大量数据进行训练,还需要保证各个场景的数据质量,使得大模型能够很好地、高质量地掌握该领域行业知识。在开放场景中,相关数据可以通过公开手段获得,但在面向行业的“封闭场景”中,大模型所需的行业多场景优质数据集不容易获得,导致行业大模型自我迭代能力较弱。

四是应用部署成本高。现阶段大模型原生应用或杀手级应用并未形成,短期内行业大模型技术和业务尚未有机融合,研发和应用部署成本高,很难创造额外价值。行业大模型中心侧训练和边缘侧推理的软硬件投入高,如单台算力服务器最大功率是6.5kW,运行一小时需要6.5度电,按照平均工业用电每度0.63元计算,一台服务器开一天(24小时)的电费约200元,如果是1000台服务器,一天的纯电费支出就是约20万元,租用算力的价格也出现了上涨趋势。

五是模型数据安全风险需要关注。如何保证在利用大数据的同时,确保数据的安全,是行业应用大模型必须考虑的问题。目前看,行业大模型研发和应用过程中,面临的生成内容合规可信、模型本身安全(如开源陷阱、数据投毒)、业务数据丢失、个人隐私数据安全等风险需要关注。

基于此,张志勇提出了以下六点建议:

一是提升算力资源供给能力。建立算力资源公共调度平台,促进算力资源协同共享,提升算力资源利用效能。同时,提升自主创新能力,在政策引导、品牌推广、行业采购等层面加大对国产硬件的支持力度,推进AI深度学习框架、AI硬件计算100%国产化。加快推动能够提供训练和推理一体化的单体超大规模行业智算中心建设。

二是提升行业数据供给水平。制定统一标准的数据架构,鼓励各类企业建设高水平行业数据集,加强行业数据流通交易,建立多类多模态新型公共数据集,增强高质量数据供给;制定数据开放相关政策,引导行业龙头企业开放非敏感数据,全面提高数据资源开发利用水平,让数据“供得出”“流得动”“用得好”,为行业大模型成长提供充足“养料”。

三是加快创新应用场景建设。发挥我国应用场景丰富的优势,加强企业主导的产学研深度融合,在国家统筹部署下,引导企业开放应用场景;举办基于生产场景应用的人工智能算法大赛,加快资本、人才、技术、数据、算力等要素汇聚;进一步加强多模态、多场景、多任务的行业大模型人工智能技术研发,促进科技成果转化,推动大模型在行业应用中不断提升能力。

四是降低应用部署成本。打造人工智能创新开放体系,进一步开放算力平台、共性技术平台、行业训练数据集、仿真训练平台等人工智能基础设施;打造协同创新的人工智能产业发展联合体,开源平台和开源生态,促进破除商业化禁用限制,进一步降低算力成本,使大模型的使用“普惠化”。进一步加强中心侧高性能人工智能芯片和低功耗面向多场景、行业应用的边端侧推理芯片的研发,进一步降低使用成本。

五是加强模型数据安全。加快推进人工智能立法,出台暂行办法保障大模型安全发展。构建行业大模型内生安全体系,建立全面的软硬件安全、网络安全、数据安全、模型算法可信增强、个人信息保护的立体化安全保障体系。

六是加强产业政策扶持和人才培养。加快完善相关产业政策,进一步支持算力、数据、工具、平台、应用场景等基础设施建设,持续提升行业大模型创新应用推广、行业数据开放共享、数据安全治理水平,完善行业大模型创新发展的保障体系;特别是随着掌握人工智能基本技能的人力需求急剧增长,要加快人工智能人才的培养和储备,注重应用型人工智能人才培养,满足各行业对人工智能人才的需求。

据悉,中国铁塔正推动高质量完成“天-临-空-地森林火灾协同监测体系集成与应用示范”等国家专项中承担的研发任务。同时,组织“空间治理行业大模型”等重点任务攻关,推动输出高层次有份量的科技成果。

近年来,中国铁塔围绕视觉感知、数据采集、图像分析、信息处理等数字化需求,研发打造了全国统一开放的铁塔视联平台,形成了标准规范、按需定制、丰富多样的“铁塔视联”产品,通过“铁塔﹢5G﹢AI”,为千行百业装配“千里眼”“顺风耳”“智慧脑”,全力服务数字治理、助力数字中国、赋能千行百业。

目前,已有近22万座“通信塔”升级为“数字塔”,广泛服务于环保、林草、农业、国土、水利、交通、应急、政法等40多个关系国计民生的关键领域,助力监管近4.8亿亩农田秸秆焚烧行为,为50万平方公里林区提供防火预警服务,守护超7000万亩耕地、4700多条河道、2300多个水库。

以长江大保护为例,中国铁塔在全国15个省(区、市)利用存量通信铁塔6500座建设高低视频监控点位7207个、雷达监测点位300余个,覆盖超400个区县重点水域,为渔政执法提供智慧监管服务,有效解决违法行为发现难、取证固证难、执法处置慢、人工成本高、监管任务重等难题,显著提升了长江保护数字治理水平。

指导:辛文
编辑、校对:胡媛

延伸阅读:
划重点:2024年政府工作报告中的数字经济
政府工作报告首提“全国一体化算力体系”:为什么?如何建?
两会 | 张立代表:推动产业科技创新是发展新质生产力核心要求
两会 | 杨杰委员:全面推进“AI+”行动,加快形成新质生产力
两会 | 雷军代表:加强人工智能人才培养
两会 | 周鸿祎委员:深化AI多场景应用,支持大模型垂直化产业化发展
两会 | 齐向东委员:创新发展“AI+安全”,护航中国式现代化
两会 | 苗伟代表:提升智能算力供给能力
两会 | 张敏代表:支持在湖北布局算力网络国家枢纽节点
两会 | 张施慧代表:推广智慧农业,助力乡村振兴
两会 | 张志勇代表:通信业如何着力新质生产力?
两会 | 刘庆峰代表:制定《通用人工智能发展规划》
迎两会:一张图看31省份政府工作报告数字经济布局
加油干:一张图看31省份政府工作报告信息通信重点
必藏:一张图看31省份政府工作报告工业互联网布局

推荐阅读
《2023通信产业年度发展报告》发布
重磅:2024通信产业十大技术趋势发布
谁在领航?2023年度十大信息通信业务创新发布
重磅:2023年度中国通信十大事件揭晓
致敬一线:2023年度通信产业技术创新人物揭晓
谁是AI使能者:2023年度AI大模型先锋榜TOP50出炉
百舸争流:2023年度AI竞争力榜TOP50发布
致敬奋斗者!2023通信产业金紫竹奖揭晓
谁在领航?云电脑创新TOP10发布
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存