中国信通院魏凯等:大模型工程化落地的四个抓手
以大模型为核心的人工智能(AI)技术是引领新一轮科技革命和产业变革的重要驱动力,它正广泛改变着人们的生产和生活。AI不再停留于理论探索阶段,而是迅速渗透至千行百业,从医疗健康、教育培训到金融服务、交通运输以及智能制造,AI应用的触角不断延伸,大模型的落地路径逐渐清晰,落地场景逐渐明朗。未来,能否准确捕捉市场需求,落地大模型等AI技术的应用,将成为决定企业竞争力乃至国家发展的关键。这不仅需要我们持续推动底层技术突破,还需要从实践层面进一步加强工程化能力,从而加速产品化和落地进程。
一、大模型代表了人工智能发展新范式
大模型具有规模可扩展性。在大语言模型领域,规模可扩展性表现尤为突出。DeepMind在2020年发布的一项研究报告率先揭示了增加数据量、提升算力和扩大模型参数规模能够有效促进模型性能的持续优化。随后,OpenAI在GPT系列的发展中也验证了这一规律,通过不断投入更多资源,实现了模型性能的显著提升。迄今为止,大语言模型尚未遭遇规模扩展的瓶颈,且视觉模型也具有相似特性,Scaling Law仍然有效。这一现象成为全球对通用人工智能(AGI)即将到来持乐观态度的重要依据。
大模型具备多任务适应性。相比于传统AI模型只能完成一种任务,一个大模型能够涵盖广泛的能力范畴,对下游任务具有极高的适应性和灵活性。由于所有物理信号均可编码至同一高维向量空间,使得大模型具有多模态/跨模态理解和生成能力,增强了大模型对多任务的适应性,进一步强化了业界对于构建平台化人工智能系统的共识。传统上,人工智能应用往往孤立存在,企业内部同时维护成百上千个模型,难以形成协同效应和规模经济。而今,随着大模型多任务适应性的成熟,使人工智能规模化部署成为可能。
大模型表现出复杂推理能力。一方面,大模型能够独立进行高阶复杂推理任务;另一方面,还可通过提供详细的逐步指导,即构建思维链的方式,使模型展现出更高级别的逻辑推理能力。微软曾发布一项研究报告显示,在未对模型进行微调的前提下,仅通过相应的提示策略,GPT-4便化身医学专家。由此表明,通过优化输入内容的详细程度,配置提示词策略,可极大提升模型的性能表现,凸显了大模型强大的推理能力及其极高的可塑性。
大模型具有强大知识吸收与整合能力。一方面,大模型具有强大的记忆力,能够高效地吸收并保存广泛的知识;另一方面,业界正积极探索将大模型与知识图谱和向量数据库技术的深度融合,提升其推理准确性。知识图谱通过实体、属性和关系的明确表述,为模型提供了一个逻辑严密的知识框架,有助于模型理解和推理复杂的信息关联。向量数据库将数据以高维空间中的向量表示,增强了模型对语境和概念相似性的理解,优化信息检索与应用的效率。
二、大模型发展路径逐渐清晰,部分领域应用效果显著
大模型发展路径呈现“一横一纵”格局。横向发展路径是指大模型以通用人工智能为目标,从通用大模型出发向参数量更庞大、模型能力更强、效果更通用的方向发展,需要持续迭代优化。此路径聚焦于构建能够跨越多个领域、执行多样任务的超大规模模型,主要思路是通过单一模型实现所有功能,是通往AGI的理想主义道路。纵向发展路径是指利用大模型构筑智能基座,结合模型微调形成丰富的行业大模型,从而赋能更多行业与场景。此路径降低了特定领域模型应用的门槛,加速技术成果转化,是促进模型技术实际应用的现实主义道路。上述发展路径并无优劣之分,我们需因地制宜地看待,两者均需给予充分重视。
大模型行业落地场景丰富。面对特殊的复杂业务场景,企业需准备大规模预训练数据集,从零开始构建大模型,此方法会消耗高额计算资源,仅适用于少量用户。目前,大部分模型均非从零开始训练,而是通过微调等方式得到,如监督式微调(SFT)、指令微调(IFT)、RAG、AI Agent等,企业可依据项目要求和可用资源,合理选择策略。大模型在行业内落地场景丰富多样,如金融行业,主要应用于营销、客服、风控等场景,有效解决金融领域人力成本高、风险管控滞后等问题,某银行基于AI的智能风控可实现毫秒级别的快速风控,将风险防控准确率提升约2倍;电信行业,主要应用于客户服务、营销推广、网络运维、故障预测等场景,有效解决电信领域用户需求复杂、网络优化难度高等问题,某运营商打造基于网络大模型的网络运维AI助手,使得网络运维准确率达88%以上;政务行业,主要应用于市民咨询、舆情分析等场景,有效解决基层工作强度大、响应速度慢、数据孤岛等问题,某单位利用大模型提升政务工作效率,在接诉即办场景中派单准确率达到87%以上。
大模型在部分领域展现出良好应用效果。各行业期望采纳大模型技术推动业务变革,从而达到降本增效及业务重塑的目标。目前大模型在三大刚需场景展现出良好使用效果。一是内容生成场景,大模型推动生成创作能力的阶跃,为文案、营销和办公领域注入智能化动力,重塑内容生产流程;二是知识管理场景,大模型将企业内不同系统的知识资源进行有效沉淀、管理和运用,如员工培训系统、客服支持系统以及信息检索系统等,提升知识构建及应用效率;三是软件工程场景,大模型在开发、测试、运维等环节的应用,通过代码生成、测试用力生成、运维助手等能力,可显著提高软件研发质效。
三、四方面抓手加速大模型工程化落地
尽管大模型展示了巨大的潜力和广泛的应用前景,但在工程化过程中仍面临诸多挑战,需要从模型服务化、模型研运管理、数据治理及风险管控等方面共同提升落地能力。
构建和落地MaaS体系,推动模型服务以云的方式灵活供给。企业引入大模型首先面临的挑战是工具链不完整、模型建设成本高等问题,需要自行填补诸多空缺而增大了应用复杂度。为此,企业迫切需求一个综合且高效的工具链平台,或者灵活可调用的高效率高性能的模型服务。模型即服务(Model as a Service,MaaS)通过将AI模型及其相关能力打包成可重复使用的服务,使企业能够快速高效地构建、部署、监控、调用模型,无须开发和维护底层基础能力,大大降低AI模型应用的复杂度。
建立运营管理体系,提升模型能力的稳定性及模型管理的可靠性。软件工程领域,DevOps通过整合开发与运维流程,确保了软件产品的高效迭代与稳定运行。随着AI技术的蓬勃发展,特别是大模型时代的到来,AI 领域也亟须一套联结开发团队、算法团队、部署团队、运营团队和风险管理等团队,共同建立研发、部署和运维各环节的标准化模型运营管理体系(MLOps),以提高整体运营效率,提升管理能力和模型能力。大模型时代的MLOps研运范围进一步扩充,从对机器学习模型的管理,扩充至大模型、模型服务、模型应用、模型组件等对象的研发和运营管理,为大模型规模化落地提供管理层面的保障。
提升数据治理水平,强化模型构建和优化质量。大模型等AI的应用过程中,激活并有效利用私域数据成为不可或缺的一环。然而,现状表明我国多数企业的数据治理水平尚处于较低阶段,导致行业间在数据应用能力上的显著差异。据统计,全国范围内的四十万家企业,仅有两千家完成了数据管理能力成熟度的评估,意味着在为AI应用构建数据基础方面,整体准备度是不足的。因此,伴随AI技术的全栈部署和模型微调等实践,通过构建面向AI的数据治理体系,可提高模型训练和微调质量,提升模型推理能力。
构建风险管控机制,助力模型可信能力提升。推动AI应用,尤其是大模型应用的进程中固然伴随风险因素,积极面对并妥善管理风险,是推动AI技术稳健前行的关键。通过构建风险度量体系、风险管控流程、风险规划、风险监测和应对处理机制,方能全面管控AI风险,提升模型可信能力,从而为AI赋能千行百业做好充分准备。
以大模型为核心的人工智能技术已成为我国发展新型工业化过程中的关键技术变量,AI模型的集成应用与新型工业化发展的需求高度契合,为产业升级转型提供了强大动能,为全面实现中国式现代化蓝图具有根本性的战略意义。未来,通过技术能力的持续突破,AI落地场景的持续探索,大模型应用将成为构筑核心竞争优势的关键。
作者简介
魏凯,中国信息通信研究院人工智能研究所所长,正高级工程师,兼任中国人工智能产业联盟总体组组长、国际电信联盟SG16国内对口组组长。研究方向为人工智能技术,牵头完成多项国内国际标准,参与多项国家重大政策文件的研究起草。
秦思思,中国信息通信研究院人工智能研究所高级工程师,主要研究方向为大模型工程化、智能化软件工程、MLOps、MaaS等,牵头系列标准的编制、评测、咨询等工作。担任AIIA智能化软件工程(AI4SE)工作组组长、人工智能关键技术与应用评测工信部重点实验室的人工智能研发运营组组长。
联系方式:
13488684897
qinsisi@caict.ac.cn
校 审 | 谨 言、珊 珊
编 辑 | 凌 霄
推荐阅读
专家谈