查看原文
其他

对话百度技术委员会主席:AIGC会加剧内容人失业吗

林秋艺 真故研究室 2023-01-30

打工人的福音还是噩梦?

文 | 林秋艺‍‍‍
编辑 | 龚    正

近一年来,能自动生成文字、图片、视频、甚至代码的AIGC相继登台亮相,围绕着“创作者是否将被AIGC所替代?”的讨论不绝于耳。AIGC究竟是打工人的福音还是噩梦?
AIGC是指人工智能自动生成内容的生产方式,它被认为是继PGC、UGC之后的新型内容创作方式。据Gartner预计,到2025年,AIGC将占全球所有生成数据的10%。
日前,Open AI发布的“AI聊天机器人”ChatGPT依靠智能对话功能,将AIGC推向风口,国内AIGC已经来到爆发前夜。
百度集团资深副总裁何俊杰曾言:AIGC将颠覆现有的内容生产模式。AIGC的工业化创作能力先天就能够为百度提供海量素材,为百度数字人与图文、视频的内容生态提供支持,此外,百度向内容创作者提供AIGC服务的商业模式,也使其订阅服务成了AIGC的最佳变现方式。
1月5日,我们对话了百度技术委员会主席吴华,据她介绍,目前百度已经推出文心ERNIE 3.0 Zeus、文心ERNIE-ViLG 2.0、VIMER-TCIR等模型。
文心 ERNIE 3.0 Zeus,能够在丰富多样的无标注数据中学习,并在学习过程中融入知识图谱,使得模型能够完成多种语言理解和生成任务。
文心 ERNIE-ViLG 2.0,能根据用户的一句话或者一段描述文本,来生成一幅精美的画作。
VIMER-TCIR模型,则是能够同时实现对多种不同情况的修复和编辑,提升画质来增强视频的清晰度,达到全方位提升视频编辑效率和观感体验。
吴华的核心观点如下:
1、AIGC是一个全新的领域,待攻克的技术关口还很多。目前AIGC已加入了知识增强,通过检索加生成的模式能获得更好的效果。AIGC会不断地学习更好的数据,并且根据用户的反馈更新并优化算法,但其安全性和可控性、生成视频的技术问题等还需突破。
2、任何技术的进步都会带来新的想象空间,从每次技术革新的整体来看,对行业是起到正向促进作用的。AIGC是一个全新的、比较火的领域。在法律法规上,希望能够去推进法律法规的建设,使得各方的权益得到保障,尤其是加强对AIGC的知识产权保护。
3、AIGC现在还处于文案写作、图片的生成阶段,将来是视频的设计,比如说电影、电视剧的制作,可以在这些产业上提升效率,想象空间非常大。不只是AIGC产业,整体的AI产业会促进经济的发展,带来更多的增长空间。
4、目前国内和国外在AIGC方面的工具技术服务差距不会很大。国内的知识增强是全世界独一份的技术;国内的AIGC是产业级的,更多的关注是贴近用户的需求,真正地将大模型应用在产品上。从应用层面上看,国外对于“公有云”的拥抱会更加前沿一些;国内则是以私有化的方式、本土化地做AIGC的工具。
以下为吴华对话实录:
Q1:目前有许多由AIGC生成的画作,并不符合人们心中的美学概念,如何判断以及提升AIGC的内容质量?
A1:从技术上,AIGC在对现有材料的学习中,会不断学习更好的数据,从而提升美感。
从生成内容的安全性和可控性上,可以看到AIGC每次生成的内容都是不一样的。目前整个业界都在做这方面的工作,让用户可以去控制风格。
用户也可以更详细地制定风格或者把想要的元素描述得更清楚些。AIGC作画产品可以进行二次编辑,当效果不符合预期时,用户可以在这个成品图的基础上加入更多的元素,使画作更接近用户心中所想。
Q2:目前AIGC在生成景色、物件、人物肖像这方面的效果会好一些,但在人物的细节部分效果较差。对于细节的刻画和相对具象的场景,AIGC还要从哪些技术领域上进行攻关?
A2:从技术上解决有两方面。第一个方面,加入了知识增强,以前缺少了类似检索的能力。比如先从数据库中检索出一个人形象,再模仿这个形象去生成另一个人的形象,就能比较精准,通过检索加生成的模式去做得更好一些。
第二个方面,通过知识增强,可以使它更集中。比如描绘人的形象时,可以先关注于脸部,再到身体的其余部位,每次生成可以根据不同的元素来清晰地刻画。
Q3:AIGC的创造性和使用搜索引擎时所需要的对信息获取的准确性如何兼得?
A3:有三个方面。第一个方面,在创意生成、个性化内容的满足上,AIGC可以提供新的内容和视角,这是在原来生态上的补充。
第二个方面,在内容的准确性上,通过搜索引擎可以检索到准确的内容,在这个内容的基础上可以做整合和深度满足,通过先检索、再生产的模式,保证内容的可控性。
第三个方面,也是特别重要的一点——时效性。时效性意味着事件是新近发生的,基于新的事件可以根据不同视角给到深度解读。
Q4:人工智能最大的优势在于它可以根据用户反馈不断优化算法。AIGC的大规模知识图谱会根据用户反馈不断调整吗?
A4:知识图谱实际上也是用AI技术建设的。刚开始肯定是用基础的技术去建设现有的知识图谱,后续会根据用户反馈去更新。
大模型做好后,将“理解”这一环增加到知识图谱的构建中,模型的理解能力就会增强,知识图谱的构建能力也会更强,这过程是会迭代的。
Q5:发展AIGC还有哪些技术上的关要待突破?
A5:AIGC包括大模型技术都是一个全新的领域,待攻克的技术关口还很多。
比如,AIGC的安全性和可控性。从用户的角度来看,是不是安全、能不能生成用户想要的内容,看起来是一种需求,但实际上是一个非常难的技术问题:生成的时候,按照理解,模型能不能精准生成。
另一个就是AIGC生成视频的技术问题。现在AIGC能生成的内容很多,文本写作、图片和视频。实际上视频是一个非常前沿的领域,技术上还没完全突破。
能不能基于一些素材生成长视频、长视频的内容是否符合用户需求,涉及到时序建模、图像和文本的联合建模等问题,这也是全世界科学家们都想要解决的问题。
Q6:在AI作画的时代,设计师行业的前景如何?他们应该如何面对AIGC的发展浪潮?
A6:任何技术的进步都会带来新的想象空间,从每次技术革新的整体来看,对行业是起到正向促进作用的。
以绘画为例。摄影技术的发展,对绘画行业也产生过冲击,但最终一方面使得艺术家的方向更多元化;另一方面,摄影技术本身已经成了一个新的艺术方向。还有一个非常重要的点,这种技术的进步使得普通人也能够接触这种艺术作品。
AI技术的发展,更多的还是促进行业的发展,然后促进设计师的行业发展。一方面AI和设计师协同,AI辅助设计师给他更多的灵感、创意和素材,使设计师去产出更好的作品;另外一方面AI本身可能也会成为一个新的创作流派。
Q7:该如何客观理解AIGC带来的冲击性、不确定性?在法律法规和伦理上要同步做哪些准备?
A7:AIGC是一个全新的、比较火的领域。在法律法规上,希望能够去推进法律法规的建设,使得各方的权益得到保障。
具体来说,第一点是,加强对AIGC的知识产权保护,为AI作画等AI创造业务的健康发展打造有保障的法律法规和环境。
第二点是,支持具有独创性的绘画作品或者AIGC作品享有版权,鼓励AIGC平台持续地投入资源,提升内容质量,并且保障平台权益、创作者权益等各方权益。
第三点是,要厘清各方的合规权责,兼顾内容安全和业务创新的发展。比如针对AI作画的一些创新业务,应该做一个分领域分场景的治理。
第四点是,希望行业领先企业分享先进经验,促进行业形成标准,赋能整体行业健康的发展。
Q8:AIGC的产业生态目前处于一个怎样的状况?产业爆发力有哪些想象?
A8:AIGC的产业方面涉及到各行各业,现在处于文案写作、图片的生成阶段,将来是视频的设计,比如说电影、电视剧的制作。AIGC可以在这些产业上提升效率,想象空间非常大。
随着技术的进展,用户的需求也会被激发。很多时候用户需求一直在,但是技术不一定能满足需求,伴随着技术的进步这种需求也会被激发。网友和用户们其实比技术人员更有想象力,AIGC的产业想象空间还有待进一步挖掘。
Q9:AIGC是否有成为中国下一个新经济重要亮点、重大技术突破和重大产业发展的潜力和量级?
A9:从技术的角度来看,大模型技术或者AI技术的发展,在全世界都是能够推动经济发展的。
人工智能作为新的产业革命,能够提升生产效率这是不容质疑的,所以整体的AI产业会促进经济的发展,带来更多的增长空间。整体的AI产业应该是这样趋势,不只是AIGC产业如此。
Q10:目前国内和国外在AIGC方面的工具技术服务,差距或者差异有多大?
A10:很多国外的软件和工具,国内其实也都有。从技术上来看,有两个非常鲜明的特点。
第一个特点是知识增强,这是我们在全世界独一份的技术。做知识增强的原因有两点:第一点是我们指导模型去学习,学习的效率更高;第二点是我们去告诉模型这个知识是否正确,帮它分辨真伪,能使其学习的可控性更好。
第二个特点是国内的AIGC是产业级的。接受用户的反馈,再根据反馈去贴近用户的需求。比如文心和行业头部企业合作行业大模型,包括能源、金融、媒体、制造等行业。
从应用层面上看,国外对于“公有云”的拥抱会更加前沿一些;国内则是以私有化的方式、本土化地做AIGC的工具。
Q11:现在有一种声音,认为国外的ChatGPT是一个颠覆式的创新,您怎么看待这款工具?
A11:我认为ChatGPT不是一种技术的颠覆式创新,而是一种交互方式的革新。
在文心大模型中涉及各种理解和生成的能力都有,但ChatGPT是在展现方式上,使用户能更加容易、以自然语言的方式去实现交互,这对我们来说是一个革新性的认识,有很大启发。
虽然它在用户界面和交互上是一种比较新的模式,但从技术本身来说实际上并没有创新。
其实百度在对话领域的模型里面也属于世界一流水平,例如百度的对话模型PLATO。模型在度晓晓以及百度输入法的林开开、叶悠悠等比较火的虚拟人的形象上,都有使用;在汽车的智舱里面也有使用。
另外,我们更多的关注是贴近用户的需求,真正地将大模型应用在产品上,我们的模型在知识性上也是走得非常靠前的。
Q12:ChatGPT模型的核心、最大的突破在于它的数据量达到了1700多亿参数,这对算法芯片提出了巨大的挑战,您如何看待目前国内的算法芯片困境?
A12:ChatGPT可能是千亿级也可能是百亿级的模型,我们猜测它是个千亿级的模型。千亿级模型的用途不一定是在线服务,也可以离线生产一些内容然后调用。
百度文心大模型的小型化、利用知识增强技术来提升模型的能力,也是在应对芯片算力的挑战。
Q13:未来,是否具备管理AI的可能性?
A13:我从AI的可控性角度以及知识图谱在里面的作用来谈这个问题。模型其实是我们在掌控它的学习,如果故意引导它去学脏话它就会去学,AI本身是没有评判能力的。
在产品服务的过程中,我们让模型朝着正向学习,它就会是正向的。可以通过反馈机制,使得模型朝着正向发展。
另外知识图谱在里面也能起到一定的正向作用,知识图谱告诉模型这个知识是正确的,当我们碰到了跟知识图谱相关的内容时,可以通过正向的反馈去引导模型。
- END-

如果您有线索或想要讨论更多,
欢迎在后台输入关键词“读者群”,加入我们。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存