晓多科技江岭:自研电商垂直领域大模型,拥抱AGI | Founders Talk
“
618大促前夕,九合被投企业晓多科技发布电商AI专家大模型——晓模型,以更好的顾客体验助力商家。
晓模型XPT采用了生成式预训练Transformer的深度学习模型,用晓多积累多年的电商业相关7亿+token的领域知识进行训练,提升模型的专业性和准确性,通过生成个性化的服务和营销文案,获得更高的用户满意度和转化率。
同时,借助国家超级计算成都中心的强大计算资源,晓模型XPT能在复杂的电商场景下,快速准确地理解和回复用户的需求,并保证信息更安全。
在今年618大促期间,晓多机器人服务的客户下单金额占整体成交金额比例达48%,机器人接待成交订单总数超过3000万、促进成交总转化603亿元,服务总人数超1亿,XPT晓模型服务客服总人数为2500万人。
九合认为,垂直模型层存在较大的机会,原本存在的行业AI模型会被重新做一遍,对于没有被AI渗透的行业,则是撕开了新的机会。关键在于AIGC垂直模型能否建立壁垒,带来显著的能力提升,和此前的解决方案是否存在质的差异。
围绕垂直模型层的核心问题,我们和晓多科技创始人江岭聊了聊他对垂直领域模型的看法、自研大模型的挑战,以及AGI时代的颠覆与重塑。
”
晓多科技创始人江岭
晓多何时开始关注大模型的发展,以GPT为代表的大模型和此前电商客服行业使用的AI技术有哪些异同?
2020年6月,GPT-3发布,我们就开始关注大模型的发展,并保持技术上的跟进。
2022年中,我们利用大模型实现意图识别的效果,明显好于原来的方法,但由于推理成本比较高,没有规模化使用。
2022年12月,我们成立了XS(eXtremely-Super)级的特别重点项目进行大模型的研究和工程化的攻坚。
原来的电商智能客服使用的AI技术,是判别式、有监督学习的方式,技术架构上是“预设意图”的方式,需要提前预设用户可能问到的意图、并对每个意图提前设置答案。这带来的问题是:人工标注、训练的成本高,交付维护的配置成本高,回复内容比较生硬,非预设的问题不能回复。
而基于大模型的技术,以上问题都能解决,无监督预训练大幅减少了人工标注训练的成本,生成式的方式降低了对预设意图进行配置的成本,但其回复内容存在不可控的问题,需要通过工程方法加强可控性。
晓多为什么选择自主研发大模型,而不是用已有的模型?
已有的通用大模型在真正投入企业级应用时,在垂直领域的专业知识还是不够充分,比如“双风双热管”、“蓝牙5.0”等专用概念的理解是有偏差的;
另外,调用通用大模型存在数据安全的问题,对于我们的企业级客户来说存在隐患;
此外,通用的大模型的训练数据来自各种开放的语料,存在一些有害的的信息,会导致大模型生成敏感、不可控的内容,给我们的客户带来隐患。
为了解决这些问题,我们选择自主研发大模型,我们自主研发的大模型“晓模型”XPT目前还处于初级阶段,但它会通过领域的应用快速成长,持续积累专业know-how,未来真正达到专家级的水平,支撑客户的业务发展。
晓模型是如何训练出来的,技术和工程上有哪些比较大的挑战?晓多是如何突破的?
晓模型是基于生成式预训练Transformer的核心技术架构,经过预训练之后,再进行领域任务的指令微调和人类专家反馈的强化学习。
当模型的参数量非常大时,面临GPU内存无法加载、训练速度慢、推理速度慢等问题,因此解决算力问题是我们面临的核心挑战。
除了自己搭建多机器多GPU的并行计算系统进行实验外,我们还寻求天府新区政府的帮助和引荐,与国家超级计算成都中心合作,与超算中心的技术专家一起,攻克了很多软件适配、大规模并行方面的技术难题。
训练晓模型用的数据有哪些来源,是在多长时间内积累的?基于这些数据,能在哪些场景中提高效率?
训练晓模型的数据,除了通用的开放的数据外,还有我们在电商场景积累了近10年的专业领域数据,包括零售行业的商品知识、商品使用场景的知识、营销服务经验、行业上下游如物流的知识、行业政策等等。
举个例子,ChatGPT生成的商品营销文案,尽管可以通过各种prompt进行风格的变化,但总给人严谨有余、活泼不足的感觉;而晓模型在学习了电商行业的营销话术后,就能够生成淘宝风或京东风、更加活泼,让普通顾客更加喜闻乐见的风格的文案。
晓模型会应用在电商领域的哪些场景?针对之前无法解决的痛点,晓多提供了哪些新的方案?
在电商导购、售后服务、质检、客户声音分析、卖点文案、内容引流等场景,晓模型都能极大地提高业务效率,提升顾客体验。
举个例子,消费者在选购产品时,不同消费者的痛点和诉求是不一样的,而客服人员在繁忙的工作下,一般是用比较标准化的话术介绍产品,消费者会比较无感。
晓模型可以针对当前顾客的痛点,针对性地介绍该产品的特点、性能、使用场景等,这样能够更好地帮助顾客做出决策。
比如同样是笔记本电脑,用户是大学生还是上班族,是用来学习还是用来工作,其关注的产品特性是不一样的,晓模型对产品的介绍能够针对当前消费者更加人性化和个性化(而不是提前预设好各种类型的话术),提升消费者体验,也能够帮助提升客服人员的工作业绩。
展望未来,大模型在电商运营领域能够发挥哪些作用?
大模型的内容生成能力将使电商运营产生很大的变化。很多商家有很好的产品,但由于产品参数、特性比较专业,很难被消费者感知,难免陷入同质化的竞争。
大模型可以分析顾客的声音和关注点,帮助商家精准开发满足顾客需求的产品。
大模型可以针对顾客个性化的需求,辅助生成介绍产品优势和特点、真正打动顾客的文案。
大模型可以为顾客提供个性化、有趣、专业的导购和便捷的服务。
总之,大模型能提升顾客体验,真正帮助商家实现以顾客为中心的经营模式,从而避开同质化竞争、提升经营壁垒,带来业务的高质量增长。
未来晓多将如何持续迭代晓模型?
目前晓模型XPT刚刚推出,在商品卖点生成等部分场景已落地应用,目前处于快速的升级迭代之中。
我们正在开发的下一版本模型,参数量将增长大1倍,模型的推理能力更强,效果更加稳定,将落地更多的业务场景。
我们今年计划将参数量再扩大6倍,并且持续优化模型的性能,届时模型将更加智能,不仅能驱动智能客服的水平提升,从原来的相当于初级客服水平,到高级客服水平,还能赋能更多的业务场景。
从事AI行业近20年,您如何看待AGI时代的来临,您认为AGI将给人类文明和普通人的生活带来哪些影响?
从事AI行业近20年,AI的技术一直处于快速的进步当中,但AGI这么快来临,还是让我们非常惊讶和惊喜。
我认为人类能掌握AGI技术是非常幸运的,在AGI的帮助下,人类有希望大幅提升医疗和健康水平、大幅减少保障基本生活所需的劳动时间,生活将更加富足和精彩;Elon Musk所说的“多星球人类文明”也会更快到来。
根据马斯诺的需求分层,人类有生理需求、安全需求、社交需求、尊重需求、自我实现等需求分层,前三次工业革命规模化地(但不是全部)解决了前三类需求,而人工智能带来的第四次工业革命有望规模化地满足普通人到第五个层次的需求。在AGI的帮助下,个体的能力将极大增强,每个人只要努力都有机会追求自己的梦想。
短期内,对很大部分普通人来说,AGI将对他们原来的工作价值带来冲击,人们需要走出舒适区,保持在学习区,利用AGI大幅提升自己的能力,勇敢追求原来不敢追求的梦想。
AGI将带来的深远影响,还有更多是难以预期的,其影响力可能不亚于发现外星智慧物种,人类作为智慧物种的垄断地位被打破,将对人类文明和人类精神带来颠覆和重塑。