查看原文
其他

AI复原《富春山居图》背后,李彦宏要用AIGC颠覆内容行业

关注文化科技的 文化产业评论 2022-11-20
第3597期文化产业评论
点上方蓝字「文化产业评论」关注并星标

7月21日百度世界大会活动现场,百度只用了“1秒”就瞬间复原了《富春山居图》残卷,背后依托的正是人工智能技术中的AIGC能力(人工智能自主生成内容)。复原《富春山居图》到底是“工匠的技术”还是“画家的艺术”,殊难定义。这背后其实关联着一个更大的话题——在内容创作领域,人工智能已经展现出了相当的实力,但它真正能够像人类艺术家一样真正的、富有灵性的“原创”?还是惟妙惟肖的模拟、仿效人类的创作? AIGC的出现到底意味着什么?是一次新的文艺复兴还是整个人类内容消费方式的彻底改变,这些,都没有确定的答案。


编审 | 时光 
编辑 | 时光
来源 | 36氪



《富春山居图》,画中之兰亭。

这幅出自元代画家黄公望笔下的纸本水墨画,被誉为中国十大传世名画之一,主要记载了江南秀美的山川景色。但遗憾的是,画作几经易手,又因当时的收藏者“焚画殉葬”险些被毁,导致作品一分为二,断为一大一小两段,也就是后来人们所熟知的前半卷“剩山图”和后半卷“无用师卷”。

合璧联展固然是一种让画作穿越历史、合体呈现的方式,但是否有更好的形式能让更多人可以一睹传世艺术品的全貌?

这个难题最终在百度世界大会上得到了解答。

7月21日百度世界大会活动现场,百度只用了“1秒”就瞬间复原了《富春山居图》残卷,背后依托的正是人工智能技术中的AIGC能力(人工智能自主生成内容)。

△AI补全《富春山居图》过程

△文心大模型为《富春山居图》题诗

只要在百度APP搜索“富春山居图”,你就能参与到这一传世之作的“虚拟修复”中,仅需不到1秒,在中间空白处简单勾勒几笔,便能像专业画家般写意山川,补全你心中的《富春山居图》。
复原《富春山居图》到底是“工匠的技术”还是“画家的艺术”,殊难定义。这背后其实关联着一个更大的话题——在内容创作领域,人工智能已经展现出了相当的实力,但它真正能够像人类艺术家一样真正的、富有灵性的“原创”?还是惟妙惟肖的模拟、仿效人类的创作?这一点至今尚无定论。 

基于此,百度创始人李彦宏提出了一个全新的观点——未来十年,AIGC(人工智能自主生成内容)将颠覆现有内容生产模式,可以实现“十分之一的成本和以百倍千倍的生产速度,生成AI原创内容”。

AIGC的出现到底意味着什么?是一次新的文艺复兴还是整个人类内容消费方式的彻底改变,这些,都没有确定的答案。

AI复原《富春山居图》背后


关于AI最终是否具有自我意识,乃至于是否具有人格这件事,已经展开过激烈且漫长的辩论。

近来,在硅谷掀起的又一次「AI是否有人格」讨论同样如此。谷歌人工智能伦理团队的一名工程师坚持认为,在经过了一段时间的测试后发现,一个用人工智能算法搭建出的智能聊天机器人程序 LaMDA 有了类似于7、8岁儿童的“自主情感”,也就是人们所谓的人格。

但最终的结果是,谷歌方面驳回了这一说法,并称公司数百个研究人员和工程师均与该程序进行了对话,发现LaMDA根本不具备自主情感。该名工程师也被强制要求带薪休假。

看来,尽管AI是否真正具备人格的还没有定论,但在一些领域,AI驱动的数字人已经做到了让人们的肉眼真假难辨的地步。

例如,2021年英伟达曾经放出消息,称在其举办的GPU大会上人们看到的英伟达CEO黄仁勋实际上是个“假人”。消息一出舆论哗然,因为在视频中人们的确看到的是黄仁勋本人,标志性的皮衣,甚至是动作、表情、头发都与他本人并无二致。据英伟达后来透露,这的确是AI生成的内容。

不过这一次大胆尝试同样耗费巨大:英伟达动用了34个3D美术师、15个软件研究人员,做了21个版本的黄仁勋,最终才呈现出这样一个真假难辨的“数字人”。

仅仅是6个月后,百度就联合央视新闻推出了AI手语主播,同样有着真人般的皮肤、头发、眼睛,而且形象更亲近自然,可以24小时不间断为观众播报奥运情况。

朱广权还和这位手语主播来了一次现场battle,主持人妙语连珠,但手语主播同样对答的有来有回,且可以根据播报实时调整手语手势。后来据百度方面分享,想要打造如此高质量的手语数字人,需要的是语音、视觉与自然语言处理等AI技术的共同发力。

在这之后,今年夏天,百度推出的数字人度晓晓开始挑战更多我们过往对AI的能力认知。

度晓晓先是用平均1秒的时间尝试了多篇高考作文,围绕围棋中的本手、妙手和俗手,在40秒时间里创作了40多篇文章。而后她又“亲自”创作了艺术画作——“无界”系列,后者在百度App上线24小时内实现了17万元的销售额,创下数字藏品领域的新纪录。

这显然已经不是个例,在今年百度世界大会期间,全新数字人希加加又一次亮相,首次挑战登上央视新闻演播厅,成为大会AI策划官和主持人。

作为AI驱动的数字人,希加加的能力更胜一筹,可以秀出主持、对话、跳舞等才艺,还利用AI技术修复了《富春山居图》残卷,在更加复杂的环境中实现对人工智能技术的应用。

这和AIGC又有什么关系呢?

事实上,传统的所谓的数字虚拟偶像,只不过是具备3D视觉效果的“动画人”,他或者她表现的一切,是人类加工的结果。而希加加这样的数字人,它的面部表情、形体表达、语音表述、回答内容、肢体反应、情绪反馈等外在表现和交互内容,都是由AI实时生成的。而如果我们把一个表情、一句对话、一个手势都看做是包含有信息量的“内容”的话,那么希加加则可以认为具备了AIGC能力。

△百度AI数字人希加加现场作画


AI是否进化出了独立意识?


人们对于具有独立意识的AI的一切想象,大多呈现在科幻电影和小说中。

1968年,斯坦利·库布里克用四年的时间制作出一部属于哲学意味的科幻巨制——科幻电影《2001太空漫游》。片中,人类进行了一场木星登陆计划,而为了进行漫长的星际漂流,他们在飞船中使用了一部名为“HAL9000”的高智能电脑,它是一个典型的具有一定自主意识的智能化系统的雏形。

电影《her》的步子迈的更大,片中的人工智能拥有独立的意识,和人类开始了真实的恋爱;《银翼杀手2049》中,复制人与真人无异;《机械姬》更是直白的表现了“图灵测试”,从而进一步探讨,当AI拥有自我意识后会给人类带来怎样的影响。

为了让这种畅想可以更进一步投射进现实世界,来自全球的科学家开启了众多前沿探索。

时间来到2022年,围绕弱人工智能的探索已经涉及千行百业,我们的每一次搜索、拿起手机的每一次拍照、和小度音箱的每一次对话,都来自AI的加持。由此我们开始基于现实而非文艺作品开始认真的讨论,当人工智能越来越能让机器像人一样思考和行动时,是否有一个奇点,会出现真正具有意识和人格的强人工智能,以及这到底是人类的福祉还是挑战。

在很多单一闭环内的智力比对已经显示了人工智能的潜质,早期如2016年,Google旗下的DeepMind智能系统——AlphaGo一次又一次的击败了人类顶级棋手;而在2019年,DeepMind打造的另一个人工智能——AlphaStar AI,通过大量的算法演练,在《星际争霸》这款游戏中打败了欧洲的顶尖职业选手。游戏的环境比围棋更加复杂,这也使得更多的研究人员认为,AlphaStar的胜利宣告着AI发展道路上的又一个里程碑诞生了。

但是,以上的里程碑事件大多是一个单一闭环里,人工智能用有目的性的“穷举”、监督学习、强化学习等方式来和人类进行有条件、有前提的较量,这种“智能”有太多的前提条件。

下一个里程碑何时出现?在一些人士看来,AIGC的大规模应用可以看作是另一个节点。

根据李彦宏的判断,AIGC将走过三个发展阶段:第一个阶段,被称之为AIGC的“助手阶段”,AIGC用来辅助人类进行内容生产,比如生产有声书、赋能视频创作等等;第二个阶段,被称之为AIGC的“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面。第三个阶段,即AIGC的“原创阶段”,AIGC将独立完成内容创作。

正如百度创始人李彦宏在大会现场所言,“AIGC(人工智能自主生成内容)是PGC、UGC之后,全新的内容生产方式。它不仅会提升内容生产的效率,也会创造出有独特价值和独立视角的内容。”

△百度创始人、董事长兼首席执行官 李彦宏


为什么是百度领跑AIGC?


AIGC话题的终极挑战在于,人类还没有完全理顺AIGC第三阶段的原理。

从某种程度上,任何一个人类在幼年时的学习都是从模仿开始的,在“模仿”这一点上,人工智能已经做的很不错;当人类经受了一定的训练后,则会开始尝试初级的创作,比如一篇作文,就可以看做是不同语素在语法规范下的有条件穷举和组合,而对此人工智能也颇为擅长。所以,用人工智能生产一些标准化、消费级的内容,是完全可以实现的。

问题的关键在于,真正的、具有独特风格、促进人类文明发展的创作,譬如达芬奇的《蒙娜丽莎》、比如贝多芬的《命运交响曲》、比如李白的《将进酒》,这些能够让人类产生灵魂震颤的、依赖我们至今尚未完全了解其原理的“灵感”所产生的旷世佳作,是否是人工智能在原创内容上的终极挑战呢?

如果人工智能不能挑战这些,我们还将抱有人类的某种优越感;而如果人工智能能够实现这些,我们将迎来一个精神文明极大丰富的超文艺复兴时代。

而如果这些和元宇宙结合起来的话,那么,每个人都会拥有自己的日升月落、每个人都可以订制自己的巴比伦花园、每个人都可以设定自己的精神伴侣的人格与气质……这些亦真亦幻的沉浸式体验,将把人类文明带向什么方向,是我们无法预测的。

也许,到了那一天,我们每个人都会沉浸在自己内化的世界里——这或许也解释了为什么我们至今没有遇见外星的高级文明——一部分科学家认为,如果人类创造颅内高潮的方式可以由外而内,而不是由内而外的实现的话,高级文明将不再有探索宇宙的动力,而把动力放在探索内生世界的满足上,而在这个世界里,一切的一切都是内容,都需要AI即时的生产,这几乎已经是关于人类文明演进的终极畅想。

这种幻想让人兴奋,但也让人恐惧。幸好,我们还在一个非常初级的阶段里探索AIGC的革命,那么一个小问题是,为什么率先登上这艘战舰的是百度?以及百度到底能用其改变什么?

过去多年,百度在人工智能领域的投入有目共睹,其连续多年保持着超过15%比例的研发投入金额,2021年,百度核心研发投入比例达到23%。

作为坚定的技术至上论者,李彦宏曾经有过一番著名的言论,“我曾经说过一句话,有1块钱的时候,我们会投进技术里;有1个亿,我们会投进技术里;有100个亿,我们还是会投进技术里。最前沿的技术浪潮是等不来的,我们必须提前10年、20年去投入和布局。”

正是在这样的背景之下,百度酝酿出了多个核心产品。

百度文心大模型,作为真正的产业级大模型,其作用正是不断降低AI的应用门槛,实现AI的真正普惠。

△文心全景图


百度开源深度学习平台飞桨,具备深厚的技术积累,愈发完善的体系,因为百度一直在基于开发者更大的支持力度,也使得飞桨的落地应用越来越丰富。根据IDC报告,作为深度学习框架,飞桨在国内的市场份额排名位居首位。

事实上,正因此也让百度有了更强的规模化落地实力。不久之前,百度集团副总裁袁佛玉也介绍,“随着百度AI算法的突破,我们能让数字人制作成本十倍、百倍地下降,还能让数字人生产周期,从动辄几个月,缩短到小时级别。数字人的制作成本,将从百万级降低到万元级别。”

并且,随着大模型技术的不断突破,百度正在加速AIGC向原创阶段发展演进。

目前,AI数字人对话能力,使用的便是对话生成大模型-文心PLATO;数字人画画能力,使用的是文心大模型-跨模态图文生成模型ERNIE-ViLG。随着大模型技术的不断成熟演进,人工智能将更加具备创造性,也就是说,由技术创造的数字人们也会朝着更具人格的形态靠近。

“熟读唐诗三百首,不会作诗也会吟”,人的学习和记忆能力始终是有限的,但对于大模型而言,永远不会有这种限制。在未来的某一天,当技术跨越某个奇点,真正意义上的AI原创内容终究会出现。

现如今,技术、趋势无一不在朝着全新的方向演进,或许没有人能拒绝这样一场激动人心的探索与尝试。

以一种创新者的姿态,百度正在给行业带来越来越多改变。届时,放眼更加广阔的领域,经过越来越多成规模的创作探索,一个真正的元宇宙世界终将呈现在人们眼前。


 话题互动 

您对AI或将颠覆内容生产模式有何看法?

欢迎在留言区发表您的观点


 加入私密社区 


 推荐阅读 



 主题阅读 

⊙深度解析!一文读懂虚拟数字人!为何会成为元宇宙最火概念?(下载)

⊙万字复盘 | 虚拟偶像发展史:到底如何成功?

⊙做不好VR,元宇宙连门都找不着


 推荐收听 
 订阅关注 

行业窗口与顶尖新媒体【文化产业评论】已运维3000多期(持续8年有余,跨越3000多天),推送文化、旅游、体育领域专业优质文章7000多篇。【文化产业评论】始终秉承权威、专业、准确、及时、实用的特点,聚焦文化、旅游、体育等行业前沿动态、发展思考,直面新时代行业发展重大问题,融汇行业内外精英的观察和理解,得到了全国从中央到地方各级政府公务员、企事业单位负责人、精英从业者的高度关注与大力支持,亦架设起沟通各方的畅通渠道,是中共中央宣传部、国家发展和改革委员会、文化和旅游部 、国家广播电视总局、国家电影局、国家新闻出版署、国家文物局、国家体育总局等有关部门,各地市政府,以及全国各文化、旅游、体育企业的重要助手。欢迎订阅关注!


交流/咨询/合作请加主编微信号:7759813

点击下方【阅读原文】加入「文化产业评论」,这里,是你的舞台~


喜欢这篇吗?分享、点赞、在看,都安排上~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存