AIGC在游戏里「打怪升级」
互动话题:
你会因为AIGC开启电子游戏体验吗?
作者|卢枫
来设想三个场景:
一,给不玩游戏的人(这里指的是狭义上说的电子游戏),去解释AI(人工智能)技术突破的过程和电子游戏之间的关系:可以参考1997年在国际象棋游戏上打败世界冠军卡斯帕罗夫、由IBM开发的象棋电脑「深蓝」计算机,和2016年在围棋游戏上击败韩国知名围棋国手李世石、由谷歌研发的机器人Alpha Go。
二,给玩电子游戏的普通玩家,去解释AI技术已经如何作用到了游戏体验本身,即参与到了游戏内容生产过程中来(AIGC):今年8月,YouTube用户Art from the Machine发布了名为Mantella的AI Mod(模组),将ChatGPT、以及文本转语音工具xVASynth、语音识别模型Whisper应用于单机游戏《上古卷轴5》(Skyrim)中,实现了游戏内超千个NPC的智能语音交互,NPC能够基于自身属性和游戏环境理解玩家语音输入,并用符合角色身份的语气进行回应。
图片来源:InWorld AI
三,给不玩游戏、但是看影视作品的人,去解释与AI技术关系紧密的游戏,是怎样影响到狭义上说的「内容」:任天堂和照明娱乐联合出品的《超级马里奥兄弟大电影》,以13.37亿美元的票房,排在今年上半年全球电影票房榜首,这是一部游戏改编电影。
图片来源:West Vancouver Memorial Library
IP和游戏边界都在不断拓宽。电子游戏任务的多样性和复杂性,使其被看作是构建类人级别AI的理想场景之一。一方面,和其他大多数行业一样,烧钱的游戏也受困于成本、效率和质量的「不可能三角」,AIGC给了打破这个「不可能」的机会,入行门槛降低,新玩家也有了入局的新可能。毕竟,游戏行业因为常年被大厂商垄断,难有黑马闯出的现象已持续良久。另一方面,电子游戏也以相对较低的成本为训练人工智能体构建起了环境。
还有一个让这一切变得更加合理化和可预见的背景信息:如今以不同的身份出现在泛内容行业里的人,很多是穿梭于游戏世界成长起来的。英雄联盟首部动画剧集《英雄联盟:双城之战》的动画导演克里斯蒂安说过,很多从小就玩游戏的人已经长大,已经有足够的阅历和经验来做这些事情。
上篇:游戏是AIGC的试验场
AIGC的优势是既能提供相对高质量的产出,又能节省开发的时间和资源。放之于游戏,目标则是以多模态的方式,甚至在几乎没有人工干预的方式下,创作原创的图像、视频、音乐和文本等内容。
由厦门大学游戏哲学研究中心发布的《游戏人工智能发展报告2023:历史演变、技术革新与应用前景》显示,与AIGC紧密关联的「程序化内容生成」,已经在游戏关卡、游戏图像、游戏文本和游戏音乐领域实现了突破,并开始展现出覆盖游戏创作全过程的潜力。
生成式AI在游戏领域的应用。图片来源:Andreessen Horowitz
具体来看——
「关卡」是绝大多数游戏中最常见的元素,但同时对创作者的约束和要求也很高。例如,不能有无法通过的区域阻挡玩家通关,不能设计出现无法战胜的敌人等。这其中,「超级马里奥」以其生成开源框架的引领性,身为关卡生成研究者们所青睐,也为后续的开源框架生成提供了一个试验场,包括2016年基于自编码器方法的关卡生成技术、2020年基于强化学习的关卡生成技术等。目前马里奥的关卡,已经可以根据特定的难度、关卡风格、目标、背景音乐甚至玩家的操作习惯等相对应自动生成。
类似这样、可以对关卡实施「训练」的过程,也同样见于含有类迷宫环境的地牢游戏、第一人称射击游戏和解谜游戏等。核心在,「关卡」即对应「场景」,不论是希望自动创建的关卡是有趣、还是具有挑战性,亦或是两者兼备,都是在追求场景的丰富性。而这,其实是AIGC应用于绝大多数内容类型中的优势。
各式各样的AI绘画已经「飞入寻常百姓家」,游戏图像生成可以看作是这其中的一个分支。在许多游戏,尤其是特定固定风格的游戏中,游戏美术常常是开发耗资最大、同时耗时最长的部分。AIGC可以对2D平面图实现「文生图」、「图生图」,也可以基于面部捕捉等技术进行3D形象生成,这些应用在传统游戏开发的流程中早已屡见不鲜。不过,「开源」在很长一段时间里都没有实现进一步突破,直至2022年「稳定扩散」(Stable Diffusion)模型(AI绘画软件)的出现,即便是个人也可以在网络端训练出专属的模型。有评论称,AIGC就此真正成为了「生产力工具」。
Stable Diffusion。图片来源:YouTube
文本和音乐更是几乎所有游戏都会包含的要素。游戏文本包括物品或任务的解释说明,也包括人物动画、剧情文本。游戏文本不仅要求与场景的匹配性,也关系到和不同玩家的交互性。随着GPT-3、GPT-4、GPT-5等大语言模型的相继发布、和「业界顶流」ChatGPT等语言生成应用的出现,用文本生成模型辅助游戏开发变得日益顺畅。
举例来说,《人工智能地牢》(AI Dungeon)是一款可供单人和多人的文字冒险游戏,可以根据玩家输入的文字指令,生成与之相关的成本,从而提供某种类似「桌上角色扮演游戏」的体验。一个对话框的页面,像极了用户与ChatGPT交互的场景。音乐也是类似的,AI作曲、AI编曲、AI识曲并自动调整,都已不再是新事物。
打造智能NPC和与之对应的虚拟玩家,是AI技术在游戏领域的另外两项重要应用。前者是在游戏之中创建类人的智能体;后者则是在游戏之外,不构成游戏本身。如今,在深度学习技术的加持下,已经有工具能够实现自动生成NPC(也就是AI NPC或者类数字人),并将其匹配进不同的游戏开发引擎中,正如前文提到的《上古卷轴5》中的AI Mod。
至于虚拟玩家,不仅可以参考单机游戏的不断「训练」,玩家甚至提出了更高的期望。比如,当人类玩家队友中途退出或掉线后,能有AI程序接替继续。王者荣耀已经做到了这一点,即便有队友离开了游戏,也可以由AI进行托管操作。根据一些玩家的反馈,目前「托管AI」的水平和普通玩家接近,但是配合程度要差一些。
说到底,AIGC本质上是一种AI赋能技术。AIGC带给游戏的改变,包括生产方式和游戏内容两方面。游戏本身有着特定的框架,即提供了约束,也让人机互动之间的场景变得相对明确。AIGC在其中不断「试炼」,让人们有理由期待,AIGC未来可以自行创造出一套高效又高质的游戏开发流程,甚至不排除未来玩家可以自己生成完整游戏。电影《头号玩家》——游戏⾏业中公认为未来游戏的终极形态——有一句经典台词,「谢谢你玩我的游戏。」
一个更加真实、不断趋近于完美的虚拟世界也变得值得期待,特别是随着越来越多的电影从业者和演员,正在直接参与到游戏的制作中,例如,《权力的游戏》作者乔治·马丁为游戏《艾尔登法环》撰写背景故事。
下篇:盘点现有「AIGC+游戏」应用
与AIGC向前并行的是,游戏行业正在打开新的大门。
在国内,今年以来,腾讯、网易、完美世界、世纪华通、巨人网络、中手游等游戏厂商纷纷入局押宝。今年7月发布的《中国游戏产业AIGC发展前景报告》显示,从AIGC的布局来看,已有超六成头部游戏企业明确布局AIGC领域,且有实质性动作;在布局的方式上,有8家游戏企业布局自研大模型。在网易公司高级副总裁王怡看来,「面对狂飙式的AI技术革命,游戏产业已经走到了技术守家、人才发家、场景跨万家的关键转型期。」
AIGC并不是一个有关未来的命题。因此,对关注现有应用的人们,来点实用的——
按照理解程度的从简到繁,综合「腾讯互动娱乐游戏策划」的梳理,AIGC在游戏领域的基础应用可以分为文本和图像、音频和视频、三维等。
文本领域,语言模型及产品在ChatGPT爆火后迎来了一波井喷,如Newbing、Claude、Meta LLaMA、斯坦福Alpaca、国内的清华系公司智谱科技研发的ChatGLM、复旦MOSS、百度的文心一言、阿里通义千问等。在图像生成领域,MidJourney、Stable Diffusion、DALL·E2等工具正在「瓜分天下」。基于Stable Diffusion的商业工具如NovelAI Image Generator、Leonardo.AI、Scenario.gg也开始出现,并应用在游戏原画、场景、图标设计等领域。著名的Adobe今年3月也加入了「战斗」,推出了自己的AI生图工具Firefly。
图片来源:Leonardo.AI
早在2016年,一款名叫AIVA的AI音乐生成器就已经被开发出来,可以为游戏、电影、广告等创作配乐,甚至获得了法国音乐版权组织(SACEM)的认证。此后AI作曲工具层出不穷,包括Mubert、Jukebox、Melodrive等。虽然AI作曲的质量仍无法与人类艺术家的作品相比肩,但是,在一些低成本、小制作的游戏中,这类「罐头音乐」的内容已经能够达标配乐需求,且成本低、效率高。视频生成的工具中,既有Runway Gen-2、NVIDIA VideoLDM等可以实现「文生视频」,也有Ebsynth和mov2mov可以提供「图生视频」。后两者的方案生成,同样是基于Stable Diffusion。
Ebsynth。图片来源:Reddit
数字人,是三维生成领域关注度非常高的一个分支。区别于视频驱动的虚拟人,3D数字人拥有一个或从骨骼、或从BlendShape驱动的三维模型,可以从多个角度、高保真地模拟真人活动。在国外,美国游戏厂商、「虚幻引擎」(Unreal Engine)背后开发商 Epic Games今年上线了MetaHuman Creator;在国内,一家名为影眸科技的AI初创公司打造出ChatAvatar产品,从文生3D头模侧面提供了新思路。
ChatAvatar。图片来源:There’s An AI For That
1号结语
就在当下,在杭州,电子竞技将首次以正式比赛项目身份出现在亚运会舞台。就像要去重新看待「打游戏的孩子」一样,不论是游戏还是技术,亦或是二者相互扶持着、在通往未知的形态「打怪升级」的过程一样,不要盲目,但应充满希望。
电影《头号玩家》还有这么一句台词「当我们这代人在游戏里砥砺成长,超越地域结交最真实的友谊,跨过虚拟收获最纯真的爱情。当游戏为代表的流行文化终于戴上光环,成为被传颂的伟大故事,让我们激动欢笑流泪,这意味着,一代人的怕与爱被认可了。」
最关键的是,中二的人永不老,难道不是吗?
参考文献
1.腾讯游戏学堂《“全要素生成”会是未来的游戏形态吗?一文看懂AIGC在游戏领域的应用》
2.厦门大学游戏哲学研究中心《游戏人工智能发展报告2023:历史演变、技术革新与应用前景》
3. 新声Pro《游戏改编电影应该怎么做》
《传媒1号》原班打造视频评论新号:
《主编浅度》
“ 视频号同步上线,敬请关注