查看原文
其他

AIGC:虚实共生趋势下的内容创作新范式

紫东君 人民中科 2024-01-09
伴随数据、算法、算力等核心技术的突破,AIGC正推动虚实共生趋势下内容创作的范式转变。
AIGC(Artificial intelligence-generated content)即通过AI技术来自动或辅助生成内容的生产方式。随着技术的不断发展和突破,人工智能对绘画、音乐、游戏、新闻、艺术等内容创作领域的影响和作用越来越大。


随着5G大带宽网络时代的到来,人们对更具有视觉表现力的数字内容越来越渴望。传统数字内容的生成效率已成为新时代的瓶颈。作为下一个探索热点,「AI自动化内容生成」激发了大量行业需求,也让我们看到了人工智能技术新的引爆点。

‍观看视频,了解AI生成内容‍


01

AI降低内容生产门槛


常言道:“科技是生产力,可提高人们生活质量,改善人们劳动方式。”在内容生产领域,我们看到了AI“颠覆”的力量。



从创作者的角度看,内容生态的发展大致可以分成四个阶段:专业生成内容(PGC)、用户生成内容(UGC)、AI辅助生产内容、AI生成内容(AIGC)

PGC(Professional-generated content,专业生产内容)主要是指由专业化团队生产具备较高质量的内容用以商业变现;UGC(User-generated content,用户生产内容)则将消费者和生产者之间的边界混淆,创作者即为用户本身。

这是当前互联网内容创作生态所处的两个阶段,不过其生产潜力也正在逐渐消耗。

为保障质量,PGC往往需要投入大量的研发成本,这是导致国内长视频网站长期亏损的主要原因。相比之下,UGC虽然降低了生产门槛,让社区更为繁荣,但正因为创作自由度高,导致质量难以保证。

实际上,内容创作的过程是创作者对于信息的处理、加工、结构化,以及选择和使用内容载体的过程,而一系列的流程均基于创作者的后天学习,需要付出大量的时间与精力。随着VR/AR、Metavers等概念的爆发,未来的互联网应用正在演变成一个富媒体平台,对高质量、多样性的内容需求越来越大。


当PGC、UGC受产能、质量所限,当人脑的信息处理能力达到极限,亟待新的生产方式带来内容变革。从发展趋势看,AI+内容生产将弥补数字世界内容消耗与供给的缺口。

AI补全《富春山居图》并题诗(上图红框处)

两个月前,百度利用AIGC能力只用了“1秒”就瞬间复原了《富春山居图》残卷,风格与现存真迹的一致程度也让专家大为震撼;腾讯打造的“梦幻写手”(Dreamwriter)新闻写作系统,能够在规定的22种场景中进行写作,具有0.46秒的平均发稿速度;喜马拉雅通过语音合成(TTS:Text-to-speech)技术,能够高效地将新闻、书籍和文章中的大量文字信息转为音频,这些TTS内容在上线后也获得了较大的收听量。

AI技术不仅有助于提高生产效率,而且有助于互动性进一步提升例如,在游戏《AI地下城》(AI Dungeon)中,当用户输入文字后,系统便会使用GPT-3(Generative Pre-Training Transformer)自然语言模型来理解脚本并生成接下去的几段文字,并且基本能够实现前后世界观一致。

不过,将AI技术的发展对应于内容生产,目前更多的是为AI辅助生产,创作并没有跳出PGC与UGC的创作框架,如虚拟人的创建需要人为为其编码基因,设定人设、背景,再与外部环境进行交互,而伴随数据、算法、算力等要素持续迭代,AIGC将是长期的方向。

02

AIGC在文本、音频、元宇宙构建上的突破


AIGC背后,是以人工智能技术为核心,多项关键技术如多模态交互技术、3D数字人建模、机器翻译、语音识别、自然语言理解等能力共同整合加持而成。

从技术能力方面来看,AIGC根据面向对象、实现功能的不同可分为三个层次。

人工智能生成内容(AIGC)的三大前沿能力

目前,AIGC已在文本、音频、元宇宙构建方面有了突破:


围绕文本的AI创建工具功能已实现较大突破。AI技术在文本创作应用包括识别翻译,写作诗歌/小说/新闻等。目前文字识别已经实现了较高的精准度。


内容创作方面同样取得较大进展,生产效率以及互动性进一步提升,如腾讯打造“梦幻写手”(Dreamwriter)的新闻写作系统能够在规定的22种场景中进行写作,具有0.46秒的平均发稿速度;在文字冒险游戏《AI 地下城》(AI Dungeon)中,当用户输入文字后,系统便会使用GPT-3(Generative Pre-Training Transformer)自然语言模型来理解脚本并生成接下去的几段文字,并且基本能够实现前后世界观一致;基于大规模语言模型自研的自然语言处理模型的续写应用“彩云小梦”已经可以实现小说故事的AI创作,只需要给她一个1-1000字的开头,它就能为你续写出后面的故事。


基于音频的AI创作互动性也得到进一步提升。目前AI在乐曲生成、合成讲话、制作歌曲等领域得到应用,并且交互性、实时性进一步增强。Tom Gruber目前已经打造了能够实时动态编曲的自适应音乐平台LifeScore。用户向LifeScore输入一系列的音乐“原材料”之后,AI大师就会改变、提高并实时混音,带来音乐表演。


相较于文本和音频,AI图像/视频/3D模型创作难度相对更高。Lip2Wav AI语音合成技术实现动态视频的唇型转变。2020年印度海德拉巴大学和英国巴斯大学的团队推出了Lip2Wav的AI语音合成程序,创作者只需提供目标语音内容、人物视频,该程序可以直接将动态的视频进行唇形转换,输出与目标语音内容相匹配的视频结果,并且实现了个体的极高相似度,而非普遍适用的通用模型。英伟达推出的Omniverse Avatar是基于语音、机器视觉、自然语言处理等技术形成的交互式AI产品,集成了视频渲染能力(OmniVerse)、语音识别与交互(Riva、Maxine)、自然语言处理(NeMo Megatron)、AI推荐(Merlin),可以有效地形成立体肖像并进行人机对话,可应用于人工智能助理等领域。



03

AIGC未来的商业价值


技术终将服务于商业。作为下一个探索热点,AIGC激发了大量行业需求,正在创造越来越多的现实价值。

人工智能生成内容(AIGC)应用视图

从应用价值方面来看,AIGC将有望成为数字内容创新发展的新引擎,为数字经济发展注入全新动能。


从AI技术当前发展阶段看,AIGC与游戏叙事的联系较为紧密,不仅塑造更广义的互动叙事品类,而且带来了社交玩法和商业模式产生新的启发。


例如,《AI Dugeon》通过AI技术研发出应对多名的玩家的AI模型,能够对不同玩家的互动做出反馈。在商业模式上,《AI Dungeon》则将更高级的AI模型作为增值服务提供给玩家,如更智能的怪物AI模型。在传统的RPG游戏中,氪金获得的宠物是在数值上形成对免费玩家宠物的优势,而在《AI Dungeon》中则体现为智力更高,具有更强的互动性。

在艺术领域,AI的学习与创作能力正在颠覆我们的认知,也让公众对科技与艺术的融合创新有了更大的想象空间。今年6月初,初出茅庐的“AI画家”度晓晓创作的AI绘画数字藏品卖出了超过17万元的高价。而她售卖的四幅画作,平均只需数十秒就能完成。

值得关注的是,AI内容生成技术已经在各类显性的商业场景中落地在人的层面,数字员工在降低劳动成本,提升工作效率,降低人员流动风险等方面有天然的优势。在货的层面,某些电商平台的内容展示更加立体,会从各个角度来呈现客户想要购买的商品。在场的层面,通过线上空间3D化,可以让参与者更加有沉浸感。

首个实现AIGC的数字虚拟偶像希加加

虽然技术的发展与革命一定程度带来了知识产权内容传播与创造的繁荣,但是,相关所有权归属等影响资本信心与产业发展的法律问题并没有得到确认。

今年2月,美国版权局审查委员会(Copyright Review Board)再次拒绝了Abbott先生代理的Stephen Thaler提交的人工智能创作的作品“天堂入口”注册版权的复议请求,重申根据美国《版权法》的规定,要求作品包含人类作者身份。因此由人工智能创作的这幅“天堂最近的入口(a recent entrance to paradise)”作品,不能获得版权授权。

事实上,自从人工智能技术开始应用在新闻撰写、绘画、诗歌写作等领域后,有关人工智能生成物的著作权问题就一直在困扰着学界和实务界,争议颇多。

目前,AIGC的发展应当认为已经超一般的弱人工智能标准,无限地抵进强人工智能阶段,但未实现抵达与超越强人工智能,或称通用人工智能标准。

牛津哲学家、知名人工智能思想家Nick Bostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能”。在超人工智能阶段,人工智能已经跨过“奇点”,其计算和思维能力已经远超人脑。此时的人工智能已经不是人类可以理解和想象。


对于该达成时间,圣达菲研究所的人工智能专家梅兰妮·米切尔(Melanie Mitchell)与埃隆·马斯克(Elon Musk)有过切实的讨论与争议,他们争议的焦点在于该达成时间为2029年。那时的AIGC,将带给我们怎样的惊喜,又将面临怎样的严峻挑战?我们拭目以待。

责编:岳青植
监制:李红梅
参考资料:

1.《AIGC,人工智能的下一个风口?》机器之能

2.《2022年人工智能生成内容(AIGC)白皮书》信通院

3.《600年传世名画「重生」,李彦宏定义AIGC》36氪

4.《人工智能技术趋势的六大影响:从大数据到大模型,从UGC到AIGC》腾讯研究院


往期回顾

9.30"清存量 控增量" | “白泽”降“谣”记

9.29互联网50年演进:从Web1.0到Web5.0

 

 

9.27 人工智能通用化 | 多模态认知计算让AI走向“多专多能”


关于人民中科人民中科智能技术有限公司,是人民网与中科院自动化所共同发起设立的“人工智能技术引擎”和科技成果转化平台,拥有世界领先的内容理解技术,核心产品是跨模态智能内容搜索引擎“白泽”,初始应用场景是数字世界的安全,目标是成为全球内容科技领导企业。


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存