大模型将成为AI开发新范式
点击蓝字 关注IDC咨询
北京,2022年6月30日
人工智能的落地已经发展到一定阶段,向前一步的瓶颈在于某一厂商往往不具备足够的可用于模型训练的数据资源,且缺乏充足的算力,很难将偏通用的AI模型落地到企业场景中。行业参与者面对这些挑战推出多项举措,包括自动化机器学习、联邦学习、提供云端算力等,其中大模型是现阶段解决这些挑战的重要途径之一。
什么是大模型?
在大模型的早期阶段,厂商宣传中常提到千亿级、万亿级参数为特大模型、超大模型。而在产业实际落地阶段,不再追求模型参数的数量。IDC认为,大模型是对原有算法模型的技术升级,基于海量数据开发预训练模型,到最终用户环境中使用少量数据即可获得比之前的算法模型更好的结果,其要点在于:
1 预训练型学习了多少数据
2 迁移学习的效果如何
3 部署的整体成本如何
主流的大模型厂商
大模型浪潮最早起源于预训练模型,Google发布的Bert模型即是自然语言处理领域最为典型的预训练模型。OpenAI则提出的GPT模型,尤其是2020年发布的GPT-3模型参数量即达到1750亿,在全球掀起大模型的浪潮。可以说,在AI模型开发领域,经历了预训练模型-大规模预训练模型-超大规模预训练模型的演进。
在国内,IDC观察到目前大力投入大模型的研发和落地的厂商以大型云服务商为主。例如,百度智能云“文心大模型”,包括了NLP大模型、CV大模型以及跨模态大模型,其特色在于注重跨模态技术研发,融入海量知识进行知识增强,应用场景广泛且落地实践丰富。阿里达摩院则推出大模型系列,包括M6大模型、Alicemind系列模型合集,该大模型系列既在阿里内部核心业务场景落地,也在外部医疗、能源、金融行业积累了多个实践案例。华为则从框架层、算力层以及软件层面全面发力大模型,既有内部自主研发的盘古大模型,也开放华为昇思MindSpore框架支持业界进行大模型的训练,华为在大模型领域强调强泛化能力、模型精度的提升以及研发成本的降低。此外,京东云、浪潮以及主流的人工智能研究院也在积极投入大模型的研发,典型的大模型有智源研究院悟道2.0模型、浪潮“源1.0”大模型等。
现阶段如何看待和采用大模型?
随着市场对于大模型的认知逐渐理性和落地,使用大模型的价值也开始凸显,包括:不要求企业具备海量的数据基础、应用大模型的效果更优、降低AI开发门槛等。行业用户可以优先从相对落地的场景开始,例如智能客服、文档内容抽取、知识图谱、OCR等。在选择大模型的时候,可以考虑:大模型学习过的数据量/知识量、经过迁移学习后在本企业应用场景中落地的效果、对于本地算力的需求。
分析师观点
IDC中国助理研究总监卢言霞表示:“大模型的泛化能力强、模型效果更优等特征助力其成为AI开发新范式,也是现阶段AI市场发展的必然趋势。行业用户中AI先行者可以考虑优先在成熟度较高的场景中引入大模型,来适配本行业的细分场景。”
IDC更多中国人工智能、大数据及自动化领域研究相关报告:
中国人工智能软件及应用市场研究报告,2021H2
中国人工智能公有云服务市场研究报告,2021H2
中国智能决策解决方案市场份额,2021:价值凸显,快速发展
中国 RPA+AI 软件市场份额,2021:全面普及,稳步增长
中国数据治理市场份额,2021:广泛落地,持续增长
IDC Perspective: CIO视角——企业数据治理实施部署指南
IDC FutureScape: 全球数据和内容技术2022年预测——中国启示(2022年1月)
IDC PeerScape: 智能决策产品同业洞察(2022年1月)
中国人工智能技术进展与趋势,2022(2022年7月)
Market Share: 智能决策市场,2022(2022年6月)
IDC Perspective:AI在数字人中的应用(2022年6月)
IDC Perspective:AI在游戏中的应用(2022年6月)
IDC Perspective:零售行业大数据实践分析(2022年6月)
如需进一步了解与此研究相关的信息或参与其他相关项目研究,请联系IDC助理研究总监卢言霞(邮箱:ylu@idc.com)。
更多内容推荐
- 全文完 -
更多咨询,请联系:
王勇,IDC中国 助理副总裁
电话:(+86-10) 5889 1588
电邮:fwang@idc.com
刘晓婷,IDC中国 客户支持代表
电话:(+86-10) 5889 1536
电邮:yvliu@idc.com
谢静,IDC中国 市场部
电话:(+86-10) 5889 1558
电邮:mxie@idc.com
扫描微信二维码,关注IDC 研究成果,掌握ICT市场脉搏