谁能实现商业化成功落地,谁就可能在“百模大战”中获胜|数据猿直播干货分享
数据智能产业创新服务媒体
——聚焦数智 · 改变商业
自2022年底以来,AIGC火爆出圈,尤其是OpenAI发布的ChatGPT,将人机对话推向了新高度,一时间,围绕大模型的新闻、话题、争论甚嚣尘上。对中国企业来说,“打造中国的OpenAI”是最为迫切的事。
今年3月中旬,百度率先发布大模型“文心一言”,而后阿里巴巴发布“通义千问”、科大讯飞发布“讯飞星火”、腾讯发布“混元”、京东发布“Chat JD”、360集团发布“360智脑”、昆仑万维发布“天工”、华为发布“盘古”、商汤发布“商量”、第四范式发布“式说3.0”……
2023年仅过半,无论是互联网平台企业,还是AI企业、游戏公司都在积极研发并推出自家大模型且迭代速度惊人,大模型在国内遍地开花。
据中信所不完全统计,目前国内10亿参数规模以上的大模型已经发布了79个,预计未来仍将有大模型陆续推出。但活下来的通用大模型,可能最终只有三五个,未来必是一场鏖战。
“百模大战”愈演愈烈,各大厂商都从“大炼模型”向“炼大模型”演进,在通用领域,我们确实需要通过更大的模型获取更好的性能,但在行业专用领域似乎并非如此。如何将大模型能力与行业需求完美融合,落地产品实现商业化,值得深思。
如今,大家对于AIGC的内容生成能力已不再陌生,当最初的新奇体验感退去,人们开始发现,具备内容生成能力的AIGC在帮助人类提升效率的同时,也带来了问题甚至是风险。比如,生成式AI写作虚假小作文导致某公司股价闪崩;AI诈骗爆发,福州市某科技公司法人代表郭先生10分钟内被骗430万;AIGC作为模型,训练过程中人为诱导的系统性偏见与歧视问题以及AIGC生成内容版权归属问题等等。
AI浪潮势不可挡,如何权衡AIGC的发展与规范?要实现AIGC技术的大规模商业化应用,还需要攻克哪些问题?AIGC在场景化应用的进展如何?带着这些问题,让我们一同开启本次AIGC主题直播《AIGC,带着镣铐舞蹈》。
以下为完整直播回放:
实现AIGC的商业化落地,重点有三
人的大脑神经元数量是千亿规模的,其中每个神经原有 1000 个左右的突触。国内百度“文心一言”的大模型参数为2600亿,可见,当前模型的参数规模尚未达到通用人工智能要求的水平。
但从行业应用角度来说,在硬件推理时,可能无法承载超规模大的预训练模型。所以,我们需要在专有领域中针对具体应用进行模型的裁剪和优化,这就意味着,专有领域不需要超大规模的模型。
在弘玑Cyclone战略产品副总裁吴楠看来,大模型想要在to B端实现大规模商业化落地,有三点比较关键:
1、企业需要具备大模型私有化部署的能力
2、大模型能够在特定场景下,满足准确性等方面的性能要求
3、持续迭代,同时需要大幅降低模型训练推理所对应的成本
吴楠认为,通用大模型参数动辄千亿,其承载的海量数据并不适合特定场景应用。在其所服务的中大型企业中,并不需要这种通用人工智能,更为迫切的需要是,基于行业和企业本身,引入大模型的能力。所以很多企业正在通过私有化部署的方式,研究如何将参数规模降低后,利用高质量的行业数据和特定场景对模型进行训练,从而获得达到更好的效果。
目前,我国还处于AIGC商业化落地的起步阶段,可以用现有数据和场景对模型进行训练,并随着新数据和新应用场景的出现,逐步训练提升模型能力,让模型更加智能,形成正循环。未来,数据会成为每一家企业的战略的资产,尤其是这种高质量的数据。
珍岛集团CTO徐有福提到,算力、 算法和数据是AI产业发展的三个核心要素。在算法、算力具备一定优势的前提下,如果数据规模和质量达不到一定要求,生成出来的内容质量也是不可控的。因此在大模型训练前期,需要大量人力对数据进行调优。但随着技术优势的提升,数据量的增大,使用时间越长,大模型生成内容效果就可能越好,越能落地商业应用。这是一个循序渐进的过程。
AIGC全面打入市场营销AIGC作为一种创新型技术赋能手段,正逐渐为各行各业取得实质性突破。在所有商业公司都积极攻城拔寨的营销领域,AIGC已开始崭露头角。
珍岛作为国内知名的企业SaaS智能营销云平台,构建了完整的数字营销工具集供客户使用,覆盖了企业从营销前、营销中到营销后的各个业务环节。对于AIGC在市场营销中的应用,珍岛也做了多年尝试。
珍岛集团CTO徐有福表示,早在2020年就曾基于营销场景通过AIGC生成营销文案,但当时的内容质量并不高。直到2022年11月,OpenAI通过GPT-3.5系列大型语音模型微调而成的ChatGPT发布,珍岛对其进行测试,发现文案生成效果明显优于此前。目前,珍岛也在积极拥抱AIGC技术,接入百度文言一心和ChatGPT等技术能力,打造AIGC在智能营销领域SaaS平台的应用场景。
个性化广告文案创作是珍岛利用AIGC技术在市场营销中最典型的应用。AIGC基于用户行为数据、消费习惯、个人兴趣爱好等,进而生成相应的营销广告。比如用户是一个跑步爱好者,创作的营销内容可能会跟新款跑鞋、赛事信息、训练技巧等相关主题结合生成广告文案,从而提高相关营销广告的点击率和转化率。
除个性化广告文案创作外,珍岛还将AIGC用于营销邮件编写、私域运营、网站建立、客服问答等营销场景,具体来看:
在自动化邮件营销方面,珍岛此前只提供邮件自动化发送的工具,需要运营人员或者客户自己编写对应的营销邮件,再通过珍岛的工具进行分发。而现在,在AIGC的场景利用下,珍岛能够基于营销对象的特性、对象客户,直接利用其智能化工具生成营销邮件,再通过自动化营销工具发送给客户。对于部分潜在客户,后续珍岛会进行后续邮件营销的发送和跟踪。
在私域运营方面,比如社群运营。当有新用户进群,传统方式下可能通过SOP设置统一欢迎语,但现在,珍岛通过AIGC基于新入群用户的画像,用户信息,生成定制性的欢迎语或者进群后针对性的内容打造。而当用户提出疑问,AIGC可以即时生成针对性内容回复,从而替代过去群组回复的方式,大幅提升用户体验和整体效率、效果。
在网站平台建立方面,传统方法都是依据模版建立,需要运营人员或者市场人员人工填写,但AIGC技术的出现改变了这一现状。目前,珍岛将官网模版的可视化建造升级为AI建站,仅需要部分相关关键词或者一些关键性描述(公司名称、公司介绍等),就可以通过AIGC生成相关公司网站。传统模式下人工填写可能需要3-5天完成交付,采用AI建站“一键生成”可能1天即可完成,效率大大提升。
在客服问答方面,可将原有文字生成视频,从而更直观的解答客户问题。此外,直播中珍岛集团CTO徐总也提到,实现这些的前提是珍岛集团基于大模型私有化部署训练的结果。
此前,中国AI布道人陆奇博士在《我的大模型世界观》演讲中提到“新范式”一词。我们当下正处于新范式的拐点。如何理解呢?任何体系,一个人、一家公司、一个社会,甚至数字化本身的数字化体系,都是“三位一体结构演化模式”。
“三位一体”结构包括:信息系统、模型系统、行动系统。换句话说,任何体系都是这三个系统的组合,数字化系统尤其如此。在互联网范式之下,信息无处不在,接下来的15年到20年中,大模型所带来的新范式,也将无处不在。
在大模型带来的新范式中,机器人流程自动化(RPA)颠覆式变革正在进行。
一般而言,RPA是流程驱动的,AI则是数据驱动的,RPA机器人只遵循人为定义的流程,而AI则可以使用机器学习来识别数据中的模式,并持续进行学习。这就使得AI能够像人脑一样,如同人一样辅助RPA更全面、自动地完成任务,因此在AI大模型引领的新范式下,AI技术能够更好地实现RPA的功能补充,辅助企业员工真正实现流程自动化。
来源,陆奇演讲时的PPT
在吴楠看来,AIGC模拟的是人的大脑,RPA模拟的是员工的手。基于大脑和手,AIGC与RPA的结合可以触达的场景非常多。弘玑目前正大力发展的一个方向是AIGA,词尾的A代表automation(自动化)。
信息化时代,企业内部汇集了各式各样的信息化系统,企业员工实际上是被“绑架”在一个个的系统上,在为系统服务。如何能够解放员工,将人的劳动技能数字化,这本身就是RPA叠加AI技术水乳交融的过程。“企业未来做业务搭建,一定是基于一个个原子级的业务组件(行为)去做封装,再基于它们之间的语义关联,然后通过大模型进行快速的、自动的编排,我们称这种方式为生成式的自动化——AIGA。”
在吴楠看来,大模型和RPA不是简单的做加法,而是做乘法甚至是做乘方的模式。“我们认为企业业务系统是信息层,信息层之上是以RPA为代表的行动层,在行动层之上是模型层。模型层能够基于企业的领域知识,解决企业员工意图理解的问题、任务拆解的问题;行动层RPA能自动化地操作企业一个个的信息系统,进而帮助企业员工完成一个个的任务,从而实现生成式的自动化。”
据吴楠介绍,弘玑内部已经证明了这种生成式的自动化的可行性,能够很好地解决传统企业软件静态的、无法快速响应业务需求变化的问题,目前基于弘玑AIGC打造的RPA产品预计很快就可以实现商业化落地,对外发布。
AIGC将逐步革新数字内容的生产和艺术创造AIGC最基本的能力是内容生成能力,包括文本、图像、视频、代码,甚至是多种媒介类型的转换组合生成。比如在艺术领域,美国的一位游戏设计师 Jason Allen用 Midjourney 生成的作品——《Théâtre D’opéra Spatial》(太空歌剧院),在美国的一个艺术比赛中力压一众人类画家,获得了第一名;在音乐创作领域,一些人开始用ChatGPT来作词,然后借助其他AI工具来谱曲,进而快速创作歌曲。
在AIGC所生成的内容大发光彩的同时,人们也开始担心,当AIGC被广泛应用,新闻、社交媒体内容、文学等内容全部都由AIGC来生成,对人类文明是否构成冲击呢?
珍岛集团CTO徐有福介绍到,由于AIGC是模型训练的结果,是根据已有内容生成新的内容,因此在创新层面是有局限的,具体来看:
第一,模型训练数据跟现实世界有时间差,对于最近发生的事情,如果模型没有数据训练,是无法生成相应内容的。
第二,情感缺失。AI本身没有情感和主观体验,虽然可以在写作风格上模仿,在某些领域内容生成的效果不错,但还达不到大师级别的文学作品水平。
第三,在用AI生成文学作品时缺乏一致性,前后生成内容无法衔接。
当然,无法否认的是,AIGC技术凭借比人工更高的效率,能够实现规模化内容生产,确实对初级、通用形式内容生产者具有替代性。因此,AI无法完全取代个人,对于个人来说要学习驾驭AI的能力并适时利用,提升自身能力的同时利用AI提高效率,才是应对AI的合理路径。
AIGC提升内容生产效率的同时,假消息的生产门槛也随之降低,这就导致网络上充斥着大量的低质,甚至是虚假的信息,由此可能会带来一些严重的后果,比如AI诈骗。对此吴楠认为可以从两方面入手解决,首先,要从国家层面加强对大模型生成内容的监管力度,建立健全相应的法律法规,在出现AI诈骗时能够做到有法可依。其次,在大模型训练过程中,技术层面添加“自监督”。
徐有福则认为,内容发布平台应具备责任意识,尤其是AIGC技术出现后,“内容安全审核员”作为互联网信息的“把关人”,角色至关重要。与此同时,要借助政府机构、科研机构、私人企业力量,掌控AIGC内容生成使用方和发布方的全链路,即证据链的确认。在出现AI诈骗等情况的时候,能够通过证据链快速溯源相关人员。
从直播嘉宾弘玑Cyclone战略产品副总裁吴楠 和 珍岛集团CTO徐有福的介绍中,我们看到AI浪潮正滚滚而来。不仅在数字内容、艺术创作领域,RPA系统、智能营销等领域AIGC渗透率也呈现加速态势。可以预见的是,AIGC有望成为数字经济的新引擎,在技术迭代优化及政策推动下,实现AI技术在金融、政府、医疗、工业等领域加速落地。在AIGC引领的时代变革中,为各行各业带来巨大的机遇与挑战。
文:木阳 / 数据猿