大模型转化为生产力,难点在哪儿?
数据智能产业创新服务媒体
——聚焦数智 · 改变商业
在产业界,生产效率优化零点几个百分点,对一家龙头企业可能就是每年上亿元的成本差别。相较于吟诗作画,大模型在产业上更容易带来生产力提升,也更容易找到可持续的商业模式。大模型时代MaaS成风,还是SaaS奇点?
尽管对大模型的产业价值,人们已经不再怀疑,但大模型如何应用仍有诸多问题。
部分业内人士认为具有算法、算力和数据综合优势的企业将模型生产的复杂过程封起来,为千行百业提供大模型服务的 MaaS模式,是大模型商业化的一种模式。
也有声音认为,调用API对许多客户企业,门槛仍然太高。将大模型能力直接融合进语音识别、人机对话等服务,以SaaS形式对外服务,可能是离产业更近的模式,这次也可能才是SaaS真正的元年。
现阶段,各大厂对MaaS仍停留在概念层,在实践上还未真正落地。但从理论出发,MaaS对于IaaS和PaaS在商业模式和开发模式上的改变,将影响到SaaS的方方面面,如SaaS的交付方式和开发模式等。
降低技术门槛、提升产品易用性……面向C端应用,科技巨头们已经动起来了。
微软率先为办公家族装配上了各类copilot,开发者可通过“插件”将应用和服务接入Microsoft 365 Copilot;谷歌也将Duet AI整合进了Gmail、Google Docs等办公软件中。
相对于C端应用的百花齐放,B端应用仍横亘着模型专业深度不足、迭代效率低、数据安全以及高算力成本等问题。
对于绝大多数企业而言,想要搭乘大模型的“快车”实现降本增效,最理性的选择,很可能就是借助外部技术服务商的力量,有针对性地解决场景应用问题,甚至找到“开箱即用”的产品,比如能直接通过自然语言交互,生成海报、视频,营销方案,甚至AI分析报告。
20年产业沉淀,京东大模型的发力点自2月最早对外透露要推出面向产业的大模型后,京东终于在2023京东全球科技探索者大会暨京东云峰会(下称:JDD)上首次展示了言犀大模型,以及言犀AI开发计算平台和落地行业的产品及解决方案。
推出言犀大模型之后,京东也并没有急于推向市场,寻求落地。内部人士告诉数据猿,京东的时间路线图是今年下半年内部锤炼,并针对重点场景和客户进行打磨,2024年初对外开放大模型能力,助力产业降本增效。
来源:京东云峰会
京东集团CEO许冉表示,“过去的人工智能技术发展,曾经数次临近应用爆发的边缘,但最终往往昙花一现,技术没有在产业端形成扎实的应用是重要的原因之一”。
大模型的产业应用,京东并非“新手”。
过去三年里,京东一直持续深耕大模型。2020年,京东自研的全栈AI技术在JDD大会上发布了"言犀"品牌。2021年,京东首创将领域知识注入大模型,提出了十亿级模型K-PLUG。2022年,京东针对模型泛化性不足问题提出了百亿级的Vega模型,并在2023年进行了再升级,推出了Vega v2模型,该模型支持3D并行训练,并能够在云边协同的条件下进行高效推理。
据了解,基于K-PLUG,言犀还推出了数字人SaaS产品,商家在使用数字人时仅需在直播后台上传商品链接,机器便能智能“阅读”商品详情,找到关键的规格、卖点等信息,自动生成更真实、生动、可阅读性强的直播文案。目前,K-PLUG已完成上万份直播脚本生成、30亿字文案写作,其中,人工审核通过率超过95%,带来超过3亿元GMV。
来源:京东云
从填充模型训练“弹药库”、到建设大模型“训练营”,京东云正着力打通技术落地的每一步。
本次发布的言犀大模型,涵盖了基础层、模型层、MaaS、SaaS四层体系。其中,基础层与京东云基础架构紧密结合,可使用户不用迁移,一站式调用大模型的服务;言犀大模型更是以30%数智供应链原生数据+70%通用数据作为训练,并通过京东自研向量数据库Vearch为大模型提供长期记忆,有效解决了产业应用所担忧的“AI幻觉”和泛化问题。
京东的言犀AI开发计算平台,则能够为客户的大模型开发和行业应用开发,提供定制化解决方案。它既具备行业知识库,沉淀了京东自己的零售、物流、健康、金融等行业Know-How,又具备100多种训练和推理优化工具,能将通用模型迅速转化为专业模型。
京东大模型,产业服务三步走京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬博士将大模型锤炼的过程称之为“打磨毛刺”。“技术是创新角度,产品是用户角度。比如一个杯子把手上有毛刺,技术会觉得,我连杯子都给你造出来了,去掉毛刺还不简单?但对客户来说,有毛刺就是不可用。”何晓冬说。而打磨掉毛刺,就需要技术主动向前走一步,去考察产业客户的使用场景。
为了将大模型的技术能力,逐步在产业落地,京东制定了“三步走”战略:
首先,京东把大模型的底层能力解耦出来,推出言犀大模型和言犀AI开发计算平台,为客户提供从数据建设到模型应用的一站式服务。
京东云AI开发计算平台 来源:京东云
其次,到今年年底这段时间,京东将大模型能力融入京东零售、金融、健康领域等成熟的业务中进行锤炼,形成技术产品和解决方案,最终达到让即使欠缺AI基础能力的传统企业也能开箱即用。在本次大会上,京东集团技术委员会主席、京东云事业部总裁曹鹏协同各业务代表,演示了金融、健康、物流等领域的多项解决方案:
在金融营销场景的应用探索中,结合京东金融数十年在行业理解、营销流程、运营策略等知识的积累,运用大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。
来源:京东云
在健康领域,基于累计超3千万高质量临患对话,百万级规模医学知识图谱,医疗专家团队,覆盖线上140余科室的医生、药师、营养师、心理医生,借助大模型的多轮交互、工具调用、总结摘要、图文多模态等能力,对用户病史信息了解的更透彻和全面,保证辅助诊疗结果能够切合用户自身特点,从而提高诊疗效果。
在物流领域,京东物流超脑基于多模态大模型实现实时交互、根因分析和智能决策,并将随着技术的不断更新迭代,逐步具备实时自动生成全局最优的供应链解决方案的能力。针对供应链全链路,提供辅助决策、运营优化,以及一线作业智能助手等能力,实现降本增效。
在电商领域,京东云AIGC内容营销平台,基于京东全品类丰富的商品数据积累和大模型,帮助商家自动化生成商品图片、卖点等营销素材,极大地提升商家运营工作效率和营销内容质量。据了解,通过一张商品图片,可以快速生成电商运营需要的商品主图,营销海报图和商详图等,满足快速开店、上品、营销的需求,每套图成本降低90%,周期从7天缩短到半天。
来源:京东云
最后,预计在2024年初,面向严肃商业场景向外部伙伴开放,让大模型在千行百业的产业场景绽放自己的价值。
写在最后
区别于传统的机器学习和人工智能模型随着数据和模型的扩大,边际效应却逐渐递减,大模型训练成本高,但部署范围与门槛低,边际效应呈递增状态,这是工业化的显著标志,这种技术的底层逻辑预示着一个大时代的到来。
自从去年秋天OpenAI的ChatGPT横空出世,到今年春天GPT4升级版本让全球用户看到了更多元化的想象空间,国内各个大厂随即开始“百模大战”,在追逐和竞争过程中,中国大模型在下一个大时代来临之前找到了自己的方向——让大模型服务产业。
“大模型真正实现自己的价值,一定是在产业应用中。”许冉表示,大模型的价值=算法×算力×数据×产业厚度的平方。“前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后,大模型才有了更重要的实际价值和意义,这将不亚于又一次工业革命。”
在这个过程中,正如许冉所形容的“北坡爬珠峰”。从产业切入大模型,这条路虽然难走,却如同从北坡攀登珠峰,有更波澜壮阔的风景,有巨大的探索价值。
文:月满西楼 / 数据猿