一篇文章讲透——AIGC会如何颠覆游戏行业?
作者:17
腾讯互动娱乐 游戏策划
一、AIGC在游戏领域的基础应用
二、AIGC在游戏领域的上层应用
三、“全要素生成”——AIGC+游戏未来展望
AIGC本质上是一种AI赋能技术,可以通过高通量、低门槛、高自由度的生成能力,广泛地服务于各种内容生产行业,它不单单是继PGC、UGC之后的新的内容创作形态,也不仅限于降本增效,而是能创造额外价值的、具有快速增长潜力的细分赛道。如在游戏《骑马与砍杀》中,接入ChatGPT的API可以实现更为拟真的AI NPC对话能力;在游戏《AI Dungeon 2D》中,玩家可以同时享受AI生成的故事文本和对应图像;在CG软件Wonder Studio中,用户可以导入一段视频通过AI生成对应的CG画面,乃至将动作导入游戏引擎再次加工。AIGC赛道在过去数年间迎来了井喷式发展,在部分领域的表现已经超越人类。
首先是文本和图像两大模态,22年这两个模态诞生了诸如ChatGPT、MidJourney、Stable Diffusion等现象级产品,也进一步整个社会推动了相应领域的研发激情和实际投入。如文本领域,语言模型及产品在ChatGPT爆火后迎来了一波井喷,如Newbing、Claude、Meta LLaMA、斯坦福Alpaca、国内的清华系公司智谱科技研发的ChatGLM、复旦MOSS、百度的文心一言、阿里通义千问等。
文本生成并不是只有大众熟知的GPT,也就是生成式预训练Transformer模型一种解决方案,此前谷歌的BERT(Bidirectional Encoder Representation from Transformers,什么是BERT?),LaMDA和它对应的产品Bard,以及其他的NLP技术已有多年积累,GPT则是迄今为止效果最好的一种解决方案,关于这一点IDEA张家兴博士有个圈内知名度较高的调侃——“ChatGPT爆火后,NLP技术不存在了” 。
文本生成
与Stable Diffusion相关的最著名开源项目便是由AUTOMATIC1111开发的Stable Diffusion web UI,几乎一半以上的Stable Diffusion使用者都在使用此工具或是为其开发新的开源能力,使其愈发强大。伴随着生态的发展,Dreambooth、LoRA、LoCon、LoHA等Diffusion Model微调方案相继出现,ControlNet则将用户对生成图像的控制力提升到了一个新的高度。基于Stable Diffusion的商业工具如NovelAI Image Generator、Leonardo.AI、Scenario.gg也开始出现,并应用在游戏原画、场景、图标设计等领域。值得一提的是,著名数字艺术工具公司Adobe也加入了战斗,推出了自己的AI生图工具Firefly。
[ 图:NovelAI Image Generator的推出将AI绘画的发展推向了一个新的高潮 ]
[ 图:Leonardo.AI集成了Stable Diffusion的各种能力,简化了使用繁琐度 ]
[ 图:Nvidia Canvas应用程序 ]
[ 图:Unstable Journey应用 ]
[ 图:Meta发布的语义分割模型Segement Anything(SAM) ]
[ 图:UnrealCV提供游戏引擎内的计算机视觉能力 ]
[ 视频:《穿越时光与空间 - Through Time and Space》AIVA作曲 ]
[ 视频:Mubert生成的音乐 ]
[ 图:AI周杰伦演唱Aimer名曲カタオモイ(单相思) ]
[ 视频:训练时长1200个迭代的AI派蒙 ]
[ 图:魔音工坊AI合成音 ]
从文生成的经典案例和应用有Runway Gen-2和NVIDIA VideoLDM,它们均可以用给定的一串描述文本生成一系列画面并组成序列帧。
[ 视频:Runway Gen-2介绍 ]
[ 图:MMD嘉然,AI动画,作者大江户战士@哔哩哔哩 ]
[ 视频:对AI驱动的视效合成Wonder Studio测试 ]
[ 图:Midjourney + D-ID + ChatGPT生成虚拟人 ]
[ 图:华人团队研发的视频语义分割模型SEEM,将该领域的能力推向了一个新的巅峰 ]
介绍完视频生成,我们再来看最后的两个模态:三维生成和策略生成。
三维生成方面,笔者将其分为模型生成、神经辐射场、数字人、动作生成、全景图、场景生成、自动化布景/关卡设计等。其中模型生成又分为传统3D模型生成和神经辐射场两种不同解决方案,传统3D模型生成即生成由点线面构成的、记录几何信息的模型,通常需要3D/深度监督来进行姿态估计。神经辐射场(NeRF)生成则是一种新兴的自监督生成方式,只需要图像和姿态来学习场景,具有照片真实感。
[ 图:NVIDIA GET3D三维重建解决方案 ]
[ 图:《黑神话:悟空》中存在大量数字雕塑,原型多为国宝级雕塑 ]
[ 图:Google DreamFusion ]
[ 视频:Luma AI的UE5插件提供了NeRF应用于游戏引擎的解决方案 ]
[ 图:伏羲实验室的Galaxy Face能力已被应用于多款网易研发的游戏中 ]
[ 图:上科大、影眸科技的ChatAvatar产品提供了从文本生成3D头模的能力 ]
[ 图:字节跳动PAniC-3D论文一瞥 ]
[ 图:FaceFormer: 基于Transformers的,语音驱动的3D人脸动画生成 ]
[ 图:ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically Simulated Characters ]
[ 图:Blockade Labs生成全景图,在Unity中实现3D天空盒 ]
[ 视频:NeuralField-LDM生成的NeRF ]
[ 图:Yahaha Studio的Text2Game能力提供了强大的自然语言生成场景的能力,解放了玩家的创意 ]
[ 视频:Plan4MC使用强化学习和规划解决 Minecraft 中的多任务 ]
[ 图:OpenAI的躲猫猫案例 ]
[ 图:超参数科技活的长安城“活的长安城”案例为我们展现了一个栩栩如生的AI世界 ]
在电影《流浪地球2》中,郭帆导演为我们描绘了“数字生命”的图景——将人类的意识上传到智能终端,以计算机程序的形式存储在一张硬盘大小的“数字生命卡”上,使人类的思想意识脱离躯体独立存在,永生于数字化世界中。而在现实里,在ChatGPT爆火后,也出现了使用GPT作为内核赋予虚拟人“灵魂”的案例,如up主“吴伍六”就综合运用了Midjourney、ChatGPT、语音合成、D-ID等工具,创造了一个“数字生命”,“复活”了其已故的奶奶。
[ 图:小伙综合运用多种AIGC技术,创造“数字生命”,“复活”已故奶奶 ]
[ 图:宅男的第一个“老婆”:ChatGPT二次元全息AI语音老婆 ChatWaifu ]
[ 图:斯坦福论文《Generative Agents》创造了一个AI虚拟小镇,探索了AI模拟人类行为的真实性 ]
[ 视频:人类无法进入的AI社区——Chirper ]
[ 图:游戏《环世界》中,玩家扮演首领指挥难民存活下去,是否此类游戏NPC都值得用AI的方式重做一次?]
试想一下,在未来的游戏中,策划或开发人员仅仅提供一个原始驱动力(Kickstart),从模型、文案、语音、行为、动作乃至场景……游戏的各个元素均可以由AI来生成和演绎,这便是一个”全要素生成“沙盒游戏。科幻作品《西部世界》中就描绘了这样一个图景:一群拥有智能的机器人组成了一个小社会,它们并不清楚自己人造生命的真实身份,认为自己就是人类,在逐渐揭开真相的过程中产生了一系列耐人寻味的故事。
>>>参考文献一览:[1] 量子位. AIGC/AI生成内容产业展望报告[R]. 北京市:量子位智库, 2022.
[2] Jeffery. 什么是BERT?[EB/OL]. 2022[2023-04-29]. https://zhuanlan.zhihu.com/p/98855346.
[3] 量子位. “ChatGPT爆火后,NLP技术不存在了”[EB/OL]. 2022[2023-04-29]. https://zhuanlan.zhihu.com/p/610683252.
[4] 世欺子. [展示向] ChatGPT自动生成游戏代码,半小时内开发4个功能物件![EB/OL]. 2023[2023-04-29]. https://www.bilibili.com/video/BV16R4y1q7rS.
[5] Artificial Content. Midjourney AI vs Stable Diffusion - Which generate BETTER Images?[EB/OL]. 2022[2023-04-29]. https://www.youtube.com/watch?v=7jEwHElA4Yg.
[6] AUTOMATIC1111. stable-diffusion-webui[EB/OL]. 2022[2023-04-29]. https://github.com/AUTOMATIC1111/stable-diffusion-webui.
[7] 世欺子. [展示向] UE5+ControlNet实时生成风格化场景![EB/OL]. 2023[2023-04-29]. https://www.bilibili.com/video/BV1H84y1E72X.
[8] Alexander Kirillov, Eric Mintun, Nikhila Ravi, Hanzi Mao, Chloe Rolland, Laura Gustafson, Tete Xiao, Spencer Whitehead, Alexander C. Berg, Wan-Yen Lo, Piotr Dollár, Ross Girshick. Segment Anything[EB/OL]. 2023[2023-04-29]. https://arxiv.org/abs/2304.02643.
[9] 额鸡扒饭加个蛋. 【AI周杰伦】カタオモイ(单相思)cover Aimer[EB/OL]. 2022[2023-04-29]. https://www.bilibili.com/video/BV1c24y1x7CE.
[10] Venti_J. 【原神】派蒙Vtuber出道计划——基于AI深度学习VITS和VSeeFace的派蒙语音合成/套皮[EB/OL]. 2022[2023-04-29]. https://www.bilibili.com/video/av815292536.
[11] Corridor Crew. VFX Reveal Before & After - Anime Rock, Paper, Scissors[EB/OL]. 2023[2023-04-29]. https://www.youtube.com/watch?v=ljBSmQdL_Ow.
[12] 大江户战士. 【AI动画】おねがいダーリン【MMD/嘉然】[EB/OL]. 2023[2023-04-29]. https://www.bilibili.com/video/av908264710.
[13] Orbitae. Wonder Studio Test - Beatbot / Side by Side Video[EB/OL]. 2023[2023-04-29]. https://www.youtube.com/watch?v=YTabPuWjBQ4.
[14] 洋拉图. 如何免费制作AI虚拟人:Midjourney+ChatGPT+D-ID[EB/OL]. 2023[2023-04-29]. https://www.bilibili.com/video/av612144442.
[15] 一点人工一点智能. 基于深度学习的NeRF三维重建方法相比传统三维建模方法有什么优势?[EB/OL]. 2022[2023-05-02]. https://www.zhihu.com/question/561345788/answer/2769262694.
[16] yuannnn. GET3D 论文解读[EB/OL]. 2022[2023-05-02]. https://zhuanlan.zhihu.com/p/568878981.
[17] Ruoshi Liu, Rundi Wu, Basile Van Hoorick, Pavel Tokmakov, Sergey Zakharov, Carl Vondrick. Zero-1-to-3: Zero-shot One Image to 3D Object[EB/OL]. 2023[2023-05-02]. https://arxiv.org/abs/2303.11328.
[18] NVIDIA英伟达中国. SIGGRAPH 21 | 在RTX移动工作站上运行3D摄影测量[EB/OL]. 2021[2023-05-02]. https://www.zhihu.com/zvideo/1411386246858452992.
[19] 潭州选帝侯. 《黑神话:悟空》中出现的这组塑像为何是冠绝古今的国宝?[EB/OL]. 2021[2023-05-02]. https://www.bilibili.com/video/av292726009.
[20] Luma AI. 官方网站[EB/OL]. 2023[2023-05-02]. https://lumalabs.ai.
[21] 上科大VRVC实验室. ChatAvatar!跟AI聊天即可生成数字人![EB/OL]. 2023[2023-05-02]. https://www.bilibili.com/video/BV1HM411j7R1.
[22] Qihao Liu, Junfeng Wu, Yi Jiang, Xiang Bai, Alan Yuille, Song Bai. InstMove: Instance Motion for Object-centric Video Segmentation[EB/OL]. 2023[2023-05-02]. https://arxiv.org/abs/2303.08132.
[23] cyanpuppets. 2D实时生成3D专用算法模型[EB/OL]. 2022[2023-05-02]. https://www.cyanpuppets.com.
[24] MOVE Ai. THE EVOLUTION OF MOVEMENT, Helping creators bring motion into digital worlds at limitless scale[EB/OL]. 2022[2023-05-02]. https://www.move.ai.
[25] 迷途小书僮. [audio2face]FaceFormer: 基于Transformers的,语音驱动的3D人脸动画生成[EB/OL]. 2023[2023-05-02]. https://zhuanlan.zhihu.com/p/516099782.
[26] Jason P.. SIGGRAPH 2022: Adversarial Skill Embeddings[EB/OL]. 2022[2023-05-02]. https://www.youtube.com/watch?v=hmV4v_EnB0E.
[27] Xue Bin Peng, Yunrong Guo, Lina Halper, Sergey Levine, Sanja Fidler. ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically Simulated Characters[EB/OL]. 2022[2023-05-02]. https://arxiv.org/abs/2205.01906.
[28] Mirza Beig. AI-generated skyboxes turned into 3D levels you can actually walk through and collide with[EB/OL]. 2023[2023-05-02]. https://twitter.com/TheMirzaBeig/status/1633307847772581888.
[29] Seung Wook Kim, Bradley Brown, Kangxue Yin, Karsten Kreis, Katja Schwarz, Daiqing Li, Robin Rombach, Antonio Torralba, Sanja Fidler. NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models[EB/OL]. 2023[2023-05-02]. https://arxiv.org/abs/2304.09787.
[30] Spline AI. Introducing Spline AI ALPHA The power of AI is coming to the 3rd dimension. Generate objects, animations, and textures using prompts.[EB/OL]. 2023[2023-05-06]. https://spline.design/ai.
[31] Yahaha Studio. 官方网站[EB/OL]. 2023[2023-05-06]. https://yahaha.com.
[32] Shyam Sudhakaran, Miguel González-Duque, Claire Glanois, Matthias Freiberger, Elias Najarro, Sebastian Risi. MarioGPT: Open-Ended Text2Level Generation through Large Language Models[EB/OL]. 2023[2023-05-06]. https://arxiv.org/abs/2302.05981.
[33] Gamefromscratch. Unity AI Announced[EB/OL]. 2023[2023-05-06]. https://www.youtube.com/watch?v=b0o0ivZen14.
[34] Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar. Adversarial Reinforcement Learning for Procedural Content Generation[EB/OL]. 2021[2023-05-06]. https://arxiv.org/abs/2103.04847.
[35] Hong Shang. Recorded: AI Enhanced Procedural City Generation (Presented by Tencent AI Lab)[EB/OL]. 2023[2023-05-06]. https://schedule.gdconf.com/session/recorded-ai-enhanced-procedural-city-generation-presented-by-tencent-ai-lab/894583.
[36] Haoqi Yuan, Chi Zhang, Hongcheng Wang, Feiyang Xie, Penglin Cai, Hao Dong, Zongqing Lu. Plan4MC: Skill Reinforcement Learning and Planning for Open-World Minecraft Tasks[EB/OL]. 2023[2023-05-06]. https://arxiv.org/abs/2303.16563.
[37] CARLA. Open-source simulator for autonomous driving research.[EB/OL]. 2017[2023-05-06]. http://carla.org.
[38] Microsoft. AirSim[EB/OL]. 2017[2023-05-06]. https://github.com/microsoft/AirSim.
[39] 世欺子. [展示向] 训练你自己的跑酷AI吧![EB/OL]. 2023[2023-05-06]. https://www.bilibili.com/video/BV1ET411H7Xp.
[40] 北京智源人工智能研究院. 用ChatGPT和强化学习玩转《我的世界》,智源Plan4MC攻克24个复杂任务[EB/OL]. 2023[2023-05-06]. https://zhuanlan.zhihu.com/p/623632358.
[41] OpenAI. Emergent tool use from multi-agent interaction[EB/OL]. 2019[2023-05-06]. https://openai.com/research/emergent-tool-use.
[42] Vincent-Pierre Berges, Markus Weiss. Machine Learning Summit: Creating Cooperative Character Behaviors Using Deep Reinforcement Learning[EB/OL]. 2021[2023-05-06]. https://gdcvault.com/play/1026997/Machine-Learning-Summit-Creating-Cooperative.
[43] 超参数科技. GAEA,让“活”的虚拟场景成为现实[EB/OL]. 2023[2023-05-06]. https://www.chaocanshu.cn/new.html?291.
[44] rct AI. 运用 AI 为游戏行业 提供完整的解决方案[EB/OL]. 2018[2023-05-06]. https://rct.ai/zh-hans.
[45] 吴伍六. 用AI工具生成我奶奶的虚拟数字人[EB/OL]. 2023[2023-05-15]. https://www.bilibili.com/video/BV1QM411H7xC.
[46] 落魄程序圆在线炒粉. 宅男的第一个老婆:ChatGPT二次元全息AI语音老婆 ChatWaifu[EB/OL]. 2023[2023-05-15]. https://www.bilibili.com/video/BV1oY4y1S7P1.
[47] Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein. Generative Agents: Interactive Simulacra of Human Behavior[EB/OL]. 2023[2023-05-15]. https://arxiv.org/abs/2304.03442.
[48] 理古拉斯想. 斯坦福论文《Generative Agents》用 AI 角色模拟人类行为,能带来哪些应用?[EB/OL]. 2023[2023-05-15]. https://www.zhihu.com/question/594898530/answer/2982434215.
[49] chirper. 官方网站[EB/OL]. 2023[2023-05-15]. https://chirper.ai/chirpers.
[50] 黑小羽. 人类不得进入,全是AI的社区----chirper[EB/OL]. 2023[2023-05-15]. https://www.bilibili.com/video/BV1VX4y1m7q8.
[51] 机器之心. 深入浅出,解析ChatGPT背后的工作原理[EB/OL]. 2023[2023-05-15]. https://baijiahao.baidu.com/s?id=1754257157959673120.
[52] Meta AI. Introducing LLaMA: A foundational, 65-billion-parameter large language model[EB/OL]. 2023[2023-05-16]. https://ai.facebook.com/blog/large-language-model-llama-meta-ai.
[53] Rohan Taori* and Ishaan Gulrajani* and Tianyi Zhang* and Yann Dubois* and Xuechen Li* and Carlos Guestrin and Percy Liang and Tatsunori B. Hashimoto. Alpaca: A Strong, Replicable Instruction-Following Model[EB/OL]. 2023[2023-05-16]. https://crfm.stanford.edu/2023/03/13/alpaca.html.
[54] 量子位. 一次10万token!GPT4最强对手史诗升级,百页资料一分钟总结完毕[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/h_JyYVs38lOrTmorQuoGCg.
[55] 圆圆的碎碎念呐. LLM中的安全隐患-提示注入Prompt injection[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/uiaYgTfRpJRIjHqK8IHytg.
[56] 深燃. AI撕裂游戏圈:有人失业,有人狂欢[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/pYxS2I0KpsWiBFV09CE3YA.
[57] 游戏葡萄. 我们和阮佳聊了聊叫板AI绘画的始末:之前高估了AI[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/3c1iePzNM2OyO5MNi6-_XA.
[58] 拔丝柠檬制作组. 6小时做个二次元游戏!AI写作,AI绘画,AI配音的GAL,你失业了吗?[EB/OL]. 2022[2023-05-16]. https://www.bilibili.com/video/BV1xD4y1k7hK.
[59] 我是经济学家iEconomist. ChatGPT之父撰文:《万物摩尔定律》出现,这场革命将创造惊人的财富[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/pQSy6SKh5KDOwTp2NDAgqw.
[60] 机器之心. 叫停GPT-4后续AI大模型!马斯克、Bengio等人发出公开信,千人响应[EB/OL]]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/pGAL89rrgC2bJLDcFbOzMg.
[61] 老阳的奇妙电波. 一封斯坦福大学的论文引出对AI“意识”的思考[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/OReOm1UluiK70MzBFIe7dQ.
[62] 黑白之道. GPT-4:一场威胁人类生存的安全测试?[EB/OL]. 2023[2023-05-16]. https://mp.weixin.qq.com/s/yENg7H8t1Uj1LBwoA68JbQ.
[63] 百度百科. 快播[EB/OL]. [2023-05-16]. https://baike.baidu.com/item/%E5%BF%AB%E6%92%AD/5735207?fr=aladdin.
[64] OpenAI. shap-e[EB/OL]. 2023[2023-05-16]. https://github.com/openai/shap-e.
[65] Meta AI. ImageBind: a new way to ‘link’ AI across the senses[EB/OL]. 2023[2023-05-16]. https://imagebind.metademolab.com/.
[66] Poly. Create Textures With Poly[EB/OL]. 2023[2023-05-16]. https://withpoly.com/browse/textures.
[67] TIZIAN ZELTNER∗ , FABRICE ROUSSELLE∗ , ANDREA WEIDLICH∗ , PETRIK CLARBERG∗ , JAN NOVÁK∗ , BENEDIKT BITTERLI∗ , ALEX EVANS, TOMÁŠ DAVIDOVIČ, SIMON KALLWEIT, and AARON LEFOHN. Real-Time Neural Appearance Models[EB/OL]. 2023[2023-05-16]. https://research.nvidia.com/labs/rtr/neural_appearance_models/assets/nvidia_neural_materials_paper-2023-05.pdf.
2023 GWB腾讯独立游戏大奖赛报名截止倒计时