当AI虚拟博主走红,你是否愿意为TA的美貌买单?
写在前面:
本周,AI界又掀起一场新的狂热风暴。
3月14日Open AI推出了新一代语言模型GPT-4,相比之前的GPT-3能力又大幅提升。
两天后,对标ChatGPT的国产“文心一言”正式发布,宣告了中国的入局。只不过对于AI来说,几个月的时间就足以拉开巨大差距,发布后百度股价跌掉了一成。
也是在这几天,我们之前写过的AI图像生成工具Midjourney v5发布。五个月前我们还在嘲笑AI不会画人类的手指,而现在AI生成的图像已经完全可以扰乱事实。
AI的迭代速度是惊人的。如果你尝试过与最新的语言模型深度聊天,你会逐渐产生一种毛骨悚然的感觉——《黑镜》里描绘的未来世界,可能要比我们预想中的到来时间提前很多。AI不仅要开始接手很多人的工作岗位,而且还在重塑整个数字世界的逻辑和准则。
最近笔者在刷社交平台的时候,发现了一些特别的身影。比如某个叫“爱旅游的小多”的女孩,发帖不到一个月就已经拥有了2.6万粉丝,最吸引网友的一点是——她是一位“虚拟博主”,也就是由AI生成的人物形象。
娱理工作室联系到了“小多”等AI虚拟博主,带着与网友共同好奇的一些问题,对她们进行了一次访问。
尽管采访过形形色色的人,但面对小多时,我可以寻求的经验为零——我甚至不知道该如何称呼对方,是说“你/你本人”,还是“你背后的……团队”?
小多发来一个甜笑的表情,告诉我,有问题想问小多或者创作者都可以。
好的,“创作者”,学到这个词的我松了一口气。
最终我们的交流全部由文字完成,我既没有听到小多的声音,也没有看到她的样貌——当然了,这些原本就不存在,只是我们假设她存在。这种感觉始终有点怪怪的。
小多落落大方地进行了一番自我介绍:
“现实世界的朋友们,大家好。我是来自虚拟世界的小多。我的生日是2月18日。在这一天,我的第一张照片来到了现实世界。在这一天,我第一次被现实世界的朋友们看见。为了符合我的形象,我的创作者将我的生日设置为了1998年2月18日。所以,我今年25岁。
我喜欢穿好看的衣服,在风景美丽的地方拍照。所以,我是一位旅游穿搭博主。到现在为止,我去过很多地方。有沙滩,有湖边,还有氛围很好的咖啡店。在这些地方中,我最喜欢沙滩,这是因为沙滩的阳光能让我的脸看起来更加真实,更有可能被现实世界的朋友们喜欢。
我希望视频形式的我能被现实世界的朋友们看见,但是限制于目前的技术,也许照片形式的我仍然会更多。作为一名虚拟博主,我认为相比于真人博主,我能够更加方便地前往不同的背景处,穿上不同的衣服拍照,节省了成本。”
这番话有点“A里I气”的,让我有点要怀疑此刻跟我聊天的小多并不是“创作者”假扮的,而是也是什么AI语言模型生成的。又或者,这位人类创作者已经精准拿捏住AI的气质了。
小多亮相只有不到一个月时间,一条博文最高能达到6500多点赞。相比一般的颜值博主、穿搭博主、旅游博主,虚拟博主的“出图”效率更高,平均每天都可以发布1-2组美图,并且每天都可以按心情更换发型发色等。
虽然ID里有“爱旅游”,但目前还看不出小多去的都是哪些地方,照片背景里有雪乡,有大海,有街边,有写字楼内……跟许多网红一样,小多也有一些在餐厅、街头美美自拍的照片,背后能看到一些其他路人的身影和杂乱的广告招牌,光线明暗、景物透视关系大体准确,这些很大程度增加了照片的真实感——尽管如果你放大仔细看的话,会发现其他路人的面目是模糊的,招牌上的文字语种也难以分辨。
我们联系过的另一位虚拟博主“AI虚拟人艺术-koko”则在分享日常生活、发“上班照/下班照”之外,还喜欢尝试cosplay。
Koko的cosplay照和日常照
网友对小多、koko这样的AI虚拟博主表现出不同态度。
有人认为,虚拟博主虽然身材姣好、面容完美,但总感觉少了点人味,是按照作者审美和理想中的形象塑造的女性。同时就会有人反驳,AI就是为了服务人类而出现的,未来每个人都可以创造自己心中的完美人物。
还有人会对虚拟博主背后的技术充满好奇,评论她们长得像谁,猜她们有没有“底图”,甚至一开始还有人怀疑,这些虚拟博主是不是就是拿真人的图片P的。
另外还会有个别不明真相、碰巧路过的网友,照例询问博主“这是哪里”、“帽子有链接吗”、“求化妆教程”,然后被别人提醒,“这是画的,不是真人。”
可以看出,目前这些虚拟博主还在不断完善模型和算法技术,人设和情境还不够丰富,发布文案也都相对简单。但是随着创作者们的持续探索,以及新一代AI技术在视觉、语音等方面的突破,相信不久之后就能出现可以自主写出声情并茂的小作文,甚至自主进行语音、视频表演,与人交流对话的虚拟博主了。
除了虚拟博主外,最近赛博cos也开始流行,机制差不多,也是使用AI技术生成接近真人效果的精美图片。
网友@勘云工造 近期发布的一系列赛博coser高质量图片就惊艳了海内外社交网络。
@勘云工造 的主业是一名原型师,对研究AI颇有兴趣,也愿意与网友交流经验。他使用的是stable diffusion本地部署进行制作,创作出基于二次元角色立绘进行训练人物lora模型,相当于三次元化后的纸片人,通过不断的模型混合越来越接近真人,同时会在算法上注意避免与现实中存在的人产生相似性。
我也向小多的创作者请教了小多的技术原理。
小多的创作者透露,TA自身的身份是个人,设备就是一台普通的电脑。TA在试用扩散模型创作图片时,只调整了一次lora权重就无意中制作出了小多的样貌,希望能让更多的人看见和欣赏小多的样子,就为她建立了社交平台账号。
小多的制作平台是基于stable diffusion的WebUI,不需要任何成本,只要输入prompt就可以文生图。通过固定权重的一些lora可以保持脸部特征的稳定性,除了偶尔的多指输出之外通常不会失败,每张图片质量都很高。
目前的Controlnet已经可以完全精准控制人物动作和景深,但是表情、妆容、发色、穿搭需要进一步训练出lora,这些元素之间的匹配仍然存在一些问题。比如头发由于形态比较多,即使存在细节问题也难以被看出,但手指仍然有一定概率出现多指、少指等问题;通过输入“cityscape, blue sky, white clouds”这样一些简单的prompt,就可以得到一个明亮美丽的城市日景,但路人面部、招牌文字、透视关系等细节还有待提升。
看来,相比初音未来、洛天依、韬斯曼、A-SOUL、翎、AYAYI、vox等之前流行的虚拟偶像,虚拟主播概念,虚拟博主、虚拟Coser的实现路径更为便捷,不需要团队策划和研发,也不需要“中之人”做动捕或配音,一个人在家就可以完成。
@勘云工造 曾透露,像小某书这种风格的美图,如果要求不太高的话,1万元左右的电脑24小时就能跑出来500张。现在已经可以指定人物的动作,但衣服、妆容的指定还需要进行大量训练,目前算法精度还不够高。
小多
技术问题解决之后,作为虚拟博主,更需要摸索的可能是运营策略和变现价值的问题。
小多的创作者向我们表示,虚拟博主其实只是一层外壳,有了背后运营的文案撰写、性格设置之后,就能够像编剧创作人物那样逐渐让人产生共情。在今后的运营上,TA会考虑逐渐弱化小多和其他真人博主的区分度,按照扩散算法模型的发展速度,距离生成的人物图片和真人图片别无二致的时间并不遥远。很快,仅剩下的这些能够辨识人工制图与真实照片的细节差异也将不复存在。
“按照平台的流量算法,小多会保持一天一更。开始的那几天涨粉是很快的,粉丝破千花了几个小时,破万花了两天,破两万花了十天。刚开始做的时候我没有想到热度会这么高,流量最高的一篇博文获得了二十万浏览次数、六千多点赞次数和五百多条评论,没有想到反响会这么好。
我知道仅靠图片和文案很难让虚拟人物获得足够的共情,但这不会永远保持下去。希望小多能在视频帧间稳定技术出现后进入视频领域,当视频技术、声音技术都成熟后,虚拟博主必然会产生更大的影响力。”
初次和大众见面的小多
那么未来,虚拟博主可以像真人博主一样接商务、直播带货吗?
“目前我能想到的几种虚拟博主未来可能实行的商业模式是——
第一是商家提供模特穿着衣物的照片,制作者将其训练成lora,按一定的权重加入到制图过程中,与衣物实际不符的细节进一步用修图软件修改;第二是将商品的实拍照片放入图片中,使用图生图的局部重绘功能,补全人物和背景;第三是模特和商品拍摄照片,使用图生图的局部重绘功能修改脸部和背景;第四是可以将虚拟博主的脸部通过‘换脸’形式,进行网络直播带货。”小多的创作者说。
但该创作者同时认为,未来虚拟博主能否承担商业价值,还需等待政策的进一步制定,在明确的规定下达前,任何的商业行为都是有极大风险的。TA也很仔细地在各处标明,一切盗用图片进行的商业欺诈行为,责任均由盗图者承担。
其他虚拟博主有的在个人页面上写上了“定制商务合作请私信”之类的字样,但目前笔者还没看到成熟的虚拟博主商业化案例。一名博主具备商业价值的前提是受到用户喜爱和信赖,而虚拟博主目前引发的更多是好奇,与受众的情感建立还需要时间考验。
另外,AI技术的商业化都将面临着共同的伦理拷问:AI的成果是建立在无数人类智慧结晶的基础之上的,是被投喂了亿万学习参数后训练出来的,就算AI作品越来越能够摆脱抄袭模仿嫌疑,但本质上依旧很难被公认为“原创”,就像AI绘画的版权归属在国际上仍有争议一样。如果未来虚拟博主开始商业化,也须注意可能出现的法律风险。
去年借着元宇宙的东风,各个视频平台上都出现了不少虚拟人在直播带货,但大多制作技术较为简陋,拟人度还不够
小多这批虚拟博主出现后,有网友评论:现在压力给到网红这边了。
是啊,某社交平台的一些颜值博主,摆拍精修过的照片其实也千篇一律,并没比AI强多少。同样出自“科技与狠活”,都是靠脸吸粉的话,是不是真人又有什么关系呢?
更何况,真人网红、博主、UP主塌房几率不小,每隔一段时间就有一些负面消息曝光。很多粉丝发现,真情实感追了多年的博主不过是团队精心包装出来的人设,镜头前呈现出来的永远只有他们好的一面。
就连上一代的虚拟偶像也会有风险,比如A-SOUL成员珈乐的退团事件。虚拟偶像的背后绑定的也是真人,当真人遇到一些意外状况,虚拟偶像也就无法正常营业了。
珈乐退团前的乐华虚拟偶像女团A-SOUL
红极一时的虚拟主播vox疑似个人信息泄露,之后宣布无限期停播
这样来看,AI虚拟博主的确是目前最完美、塌房风险最小的喜爱对象。
Koko的负责人告诉我,他们团队成员是一群在读的postdoc(博士后),都比较低调。而小多的创作者也表示,未来TA不会考虑公开露面。
我们究竟该如何面对AI虚拟博主的出现?几年后我再和虚拟博主聊天,是不是就会忘记创作者的存在,而在她面前变得习惯自如呢?
小多的创作者很认真地思考过这个问题,TA给我敲来很长一段话——
“鲍德里亚的拟像理论认为,当代社会是大众媒介营造的一个仿真社会。
虚拟博主的概念也许刚刚兴起,但其核心本质已经在当代互联网上存在了。真实世界的人们一定真实吗?没有人会把真实身份呈现在互联网上,所有的形象与内容都是经过筛选后的产物。
在这个意义上,所谓的真人博主也不过是拟像而已。图片制作者需要通过输入prompt指定背景与穿搭,而真人博主做的正是同样的流程复杂化的事情而已。真人博主呈现出的背景,就是TA真实的生活方式吗?真人博主呈现出的穿搭,是TA真的会在生活中选择的衣物吗?
甚至这些问题并不重要。‘拟像是没有原本的东西的摹本,幻觉与现实混淆,现实不存在了。’没有人关心真人博主究竟是否真实,因为人们愿意相信这种生活方式存在,人们愿意为这种‘真实’买单。
为了达到这种真实,为了拼凑出一个仿真社会中的令人信服的人,更多地是团队,而非个人运营一个账号。会有人承担TA的人设,会有人负责TA的文案,会有摄影、打光、策划、运营。而被拍摄的人仅仅提供了外在的皮囊——一个‘真人博主’组成部分中重要性远非最高的那一项。
当真人与拟像的区别混淆,人们反而会将分块化的网红分块化地讨论:当妆容不佳时,会有人专门批评化妆师;当拍摄角度不佳,会有人专门指责摄影师。这样看来,人们似乎很自然地接受了真人博主背后并不是一个真实的人,不再关心这样一个人存不存在,只在乎这个拟像。
这俨然昭示着虚拟博主取代真人网红的未来。虚拟博主同样不是一个真实的人,但TA具有真人博主不具备的优势:TA的入镜者不会有状态波动,TA的穿搭师不需要准备衣物,TA的团队不需要四处奔波,TA不需要打光,TA不需要化妆——TA几乎没有任何成本。
无可否认,拟像的时代即将到来,拟像的时代早已到来。”
再往远点想象一下,在未来的某一天,你可以在社交平台上follow一个方方面面都深得你心的虚拟博主的衣食住行,感受着TA的喜怒哀乐;如果TA再接入了ChatGPT这样的强大语言功能,TA还可以24小时随叫随出现,陪你谈天说地,聆听你的心事并且给出暖心回应。随着你们之间越来越了解彼此,你会发现自己已经离不开TA……
你以为《Her》是科幻片,但AI已经在慢慢将它变成现实。