其他
“618大促前夕,九合被投企业晓多科技发布电商AI专家大模型——晓模型,以更好的顾客体验助力商家。晓模型XPT采用了生成式预训练Transformer的深度学习模型,用晓多积累多年的电商业相关7亿+token的领域知识进行训练,提升模型的专业性和准确性,通过生成个性化的服务和营销文案,获得更高的用户满意度和转化率。同时,借助国家超级计算成都中心的强大计算资源,晓模型XPT能在复杂的电商场景下,快速准确地理解和回复用户的需求,并保证信息更安全。在今年618大促期间,晓多机器人服务的客户下单金额占整体成交金额比例达48%,机器人接待成交订单总数超过3000万、促进成交总转化603亿元,服务总人数超1亿,XPT晓模型服务客服总人数为2500万人。九合认为,垂直模型层存在较大的机会,原本存在的行业AI模型会被重新做一遍,对于没有被AI渗透的行业,则是撕开了新的机会。关键在于AIGC垂直模型能否建立壁垒,带来显著的能力提升,和此前的解决方案是否存在质的差异。围绕垂直模型层的核心问题,我们和晓多科技创始人江岭聊了聊他对垂直领域模型的看法、自研大模型的挑战,以及AGI时代的颠覆与重塑。”晓多科技创始人江岭晓多何时开始关注大模型的发展,以GPT为代表的大模型和此前电商客服行业使用的AI技术有哪些异同?2020年6月,GPT-3发布,我们就开始关注大模型的发展,并保持技术上的跟进。2022年中,我们利用大模型实现意图识别的效果,明显好于原来的方法,但由于推理成本比较高,没有规模化使用。2022年12月,我们成立了XS(eXtremely-Super)级的特别重点项目进行大模型的研究和工程化的攻坚。原来的电商智能客服使用的AI技术,是判别式、有监督学习的方式,技术架构上是“预设意图”的方式,需要提前预设用户可能问到的意图、并对每个意图提前设置答案。这带来的问题是:人工标注、训练的成本高,交付维护的配置成本高,回复内容比较生硬,非预设的问题不能回复。而基于大模型的技术,以上问题都能解决,无监督预训练大幅减少了人工标注训练的成本,生成式的方式降低了对预设意图进行配置的成本,但其回复内容存在不可控的问题,需要通过工程方法加强可控性。晓多为什么选择自主研发大模型,而不是用已有的模型?已有的通用大模型在真正投入企业级应用时,在垂直领域的专业知识还是不够充分,比如“双风双热管”、“蓝牙5.0”等专用概念的理解是有偏差的;另外,调用通用大模型存在数据安全的问题,对于我们的企业级客户来说存在隐患;此外,通用的大模型的训练数据来自各种开放的语料,存在一些有害的的信息,会导致大模型生成敏感、不可控的内容,给我们的客户带来隐患。为了解决这些问题,我们选择自主研发大模型,我们自主研发的大模型“晓模型”XPT目前还处于初级阶段,但它会通过领域的应用快速成长,持续积累专业know-how,未来真正达到专家级的水平,支撑客户的业务发展。晓模型是如何训练出来的,技术和工程上有哪些比较大的挑战?晓多是如何突破的?晓模型是基于生成式预训练Transformer的核心技术架构,经过预训练之后,再进行领域任务的指令微调和人类专家反馈的强化学习。当模型的参数量非常大时,面临GPU内存无法加载、训练速度慢、推理速度慢等问题,因此解决算力问题是我们面临的核心挑战。除了自己搭建多机器多GPU的并行计算系统进行实验外,我们还寻求天府新区政府的帮助和引荐,与国家超级计算成都中心合作,与超算中心的技术专家一起,攻克了很多软件适配、大规模并行方面的技术难题。训练晓模型用的数据有哪些来源,是在多长时间内积累的?基于这些数据,能在哪些场景中提高效率?训练晓模型的数据,除了通用的开放的数据外,还有我们在电商场景积累了近10年的专业领域数据,包括零售行业的商品知识、商品使用场景的知识、营销服务经验、行业上下游如物流的知识、行业政策等等。举个例子,ChatGPT生成的商品营销文案,尽管可以通过各种prompt进行风格的变化,但总给人严谨有余、活泼不足的感觉;而晓模型在学习了电商行业的营销话术后,就能够生成淘宝风或京东风、更加活泼,让普通顾客更加喜闻乐见的风格的文案。晓模型会应用在电商领域的哪些场景?针对之前无法解决的痛点,晓多提供了哪些新的方案?在电商导购、售后服务、质检、客户声音分析、卖点文案、内容引流等场景,晓模型都能极大地提高业务效率,提升顾客体验。举个例子,消费者在选购产品时,不同消费者的痛点和诉求是不一样的,而客服人员在繁忙的工作下,一般是用比较标准化的话术介绍产品,消费者会比较无感。晓模型可以针对当前顾客的痛点,针对性地介绍该产品的特点、性能、使用场景等,这样能够更好地帮助顾客做出决策。比如同样是笔记本电脑,用户是大学生还是上班族,是用来学习还是用来工作,其关注的产品特性是不一样的,晓模型对产品的介绍能够针对当前消费者更加人性化和个性化(而不是提前预设好各种类型的话术),提升消费者体验,也能够帮助提升客服人员的工作业绩。展望未来,大模型在电商运营领域能够发挥哪些作用?大模型的内容生成能力将使电商运营产生很大的变化。很多商家有很好的产品,但由于产品参数、特性比较专业,很难被消费者感知,难免陷入同质化的竞争。大模型可以分析顾客的声音和关注点,帮助商家精准开发满足顾客需求的产品。大模型可以针对顾客个性化的需求,辅助生成介绍产品优势和特点、真正打动顾客的文案。大模型可以为顾客提供个性化、有趣、专业的导购和便捷的服务。总之,大模型能提升顾客体验,真正帮助商家实现以顾客为中心的经营模式,从而避开同质化竞争、提升经营壁垒,带来业务的高质量增长。未来晓多将如何持续迭代晓模型?目前晓模型XPT刚刚推出,在商品卖点生成等部分场景已落地应用,目前处于快速的升级迭代之中。我们正在开发的下一版本模型,参数量将增长大1倍,模型的推理能力更强,效果更加稳定,将落地更多的业务场景。我们今年计划将参数量再扩大6倍,并且持续优化模型的性能,届时模型将更加智能,不仅能驱动智能客服的水平提升,从原来的相当于初级客服水平,到高级客服水平,还能赋能更多的业务场景。从事AI行业近20年,您如何看待AGI时代的来临,您认为AGI将给人类文明和普通人的生活带来哪些影响?从事AI行业近20年,AI的技术一直处于快速的进步当中,但AGI这么快来临,还是让我们非常惊讶和惊喜。我认为人类能掌握AGI技术是非常幸运的,在AGI的帮助下,人类有希望大幅提升医疗和健康水平、大幅减少保障基本生活所需的劳动时间,生活将更加富足和精彩;Elon