点击上方蓝字CG世界关注我们
“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”
中国很有影响力影视特效CG动画领域自媒体
编辑:木木
2022年马上就要过去啦,在这一年里我们和各位小伙伴一起分享了超实用的CG干货也一起讨论了各种CG趣闻,因为有你们的陪伴,所以每次写起文章来都是满满的动力!
作为年度总结文章,小编打算盘点一下今年大家关注度最高,且在CG领域贡献最大的AI技术和软件,这些都是许多艺术家潜心钻研的结果,虽然有些内容已经发布了好几个月,但现在看起来依旧会被这些技术所折服。好啦,事不宜迟!咱们现在来一起回顾下2022年共发布了哪些令人期待的内容吧~(咱们按照时间线来整理哦!)
Plask是在1月份发布,开局就十分强劲!由Plask AI开发,是一款基于网络、人工智能驱动的3D动画编辑器和动作捕捉工具,为动画师免费提供强大的动作捕捉工具集。
Plask具备所有常见的动画工具,而且它还有一个非常显著的特点就是能够使用任何视频作为动作捕捉来为角色制作动画,这一切都要基于该工具的AI设置。
用户可以直接在Plask上传任何视频或使用任何相机记录动作以捕捉关键帧,Plask会自动重新定位、装配和优化编辑器上的输出,非常方便。
该动画工具可以免费试用,所以完全可以尝试一下,没准会开辟一个新的动画方式。
BlendArMocap是Blender的一个新的免费附加组件,在2月份发布,这也是基于动作捕捉而设计的,一种无标记动作捕捉解决方案,允许用户使用网络摄像头执行手部、面部和姿势检测。此外,该插件还具有将检测到的数据轻松传输到Rifigy Blender的能力,从而实现方便、无缝的工作流程。
https://cgtinker.gumroad.com/l/rotom
同年2月,一位工科学生Priyanjali Gupta创建了一个AI模型,可以将美国手语 (ASL) 实时转换为英语。该模型使用Tensorflow对象检测API,并使用来自预训练ssd_mobilenet模型的迁移学习构建。数据集是通过运行Image Collection python文件手动创建的,像一些常见的“你好”、“我爱你”、“请”、“是的”、“谢谢”……都可以轻松识别。
这是一款由NVIDIA研究团队在3月中下旬所推出的新技术,可以将多个2D图像转换为3D场景,称之为Instant NeRF。
该技术使用神经辐射场,是一种特殊的人工智能,可以训练从不同角度拍摄的2D图像重建3D场景。根据NVIDIA的说法,Instant NeRF是现有最快的NeRF 之一,因为它只需要几秒钟就可以读取几十张静态照片,然后可以在几十毫秒内渲染生成的3D场景。而且能够预测3D空间中的任何关键点以便填补空白和重建场景,甚至包括一些遮挡问题,智能技术也可以轻松解决。
除此之外,Instant NeRF还可用于为虚拟世界创建化身或场景,以3D形式捕捉视频会议参与者及其环境,或为3D数字地图重建场景。要说2022四月份有啥大事发生,那么必须提到Epic Games发布的Unreal Engine 5稳定版本。其实这个软件都不用太多介绍,基本没人不知道,关于UE5也有两个核心功能,第一个是Nanite,它允许艺术家创造尽可能多的几何细节。包含数亿或数十亿个多边形的电影质量源艺术可以直接导入虚幻引擎(从ZBrush雕刻到摄影测量扫描再到CAD数据的任何内容)。
第二大功能Lumen是一个完全动态的全局照明解决方案,可立即对场景和光线变化做出反应。系统可以在环境中以从千米到毫米的尺度呈现漫反射与无限反射和间接镜面反射。
除了UE5,Epic Games还发布了Lyra,一款旨在帮助创作者掌握引擎新版本的入门游戏。
Lyra Starter Game接手了ShooterGame在UE4中的角色,展示了从移动设备到高端PC的可扩展性以及使用Epic在线服务 (EOS) 的跨平台多人游戏。项目还提供两种不同游戏模式的选择:Expanse(团队死亡竞赛)和Convolution。
Lyra新手游戏还有新的UE5人体模型Manny和Quinn作为可玩角色。这些人体模型与超人共享相同的核心骨架层次结构,具有兼容的动画系统。
在UE5发布几天后,OpenAI就推出了DALL-E 2,其实早在2021年1月,OpenAI就推出了DALL-E,这是一款很神奇的神经网络驱动工具,能够根据文本输入创建任何图像。今年推出的DALL-E 2,对系统进行了一个新的改进,可以生成更逼真、更准确的图像,分辨率更高。此外,DALL-E 2可以根据字幕对现有图像进行逼真的编辑。它可以在考虑阴影、反射和纹理的同时添加和删除元素。
在4月中旬,开发人员Igor Santesteban、Miguel A. Otaduy和Dan Casas 推出了SNUG,这是一种新的神经网络,用于为参数化人体所穿的服装添加3D变形。该框架采用无需地面实况样本的方案进行测试,使团队能够交互式地操纵主体的形状参数,同时在测试期间无需任何操作即可产生高度逼真的服装变形。
五月份和六月份没什么太大的CG事件,咱们直接来看7月。
7月有一个叫做Buildify的免费几何节点库,由Pavel Oliva发布,专门为Blender开发。
该工具包可以使Blender用户能够立即重塑新的建筑物,简单总结共有三个特点。一是,易于使用,将所有模块放入集合中,只需拉伸、复制和粘贴面,建筑物就会自动生成。
二是,模块化方法,用户可以使用预制节点组来制作各种架构样式以满足需求。三是,对Blender-OSM插件的原生支持,使用基于现实生活位置的数据与程序生成相结合。https://paveloliva.gumroad.com/l/buildify
推广
同样在7月份,NVIDIA和斯坦福大学的一组研究人员推出了EG3D,这是一种新的混合显式-隐式网络架构,可以实时生成人脸、猫脸的高分辨率多视图一致的2D图像,并为生成的图像提供高质量的3D几何。EG3D的框架利用了最先进的2D CNN生成器,例如StyleGAN2。该项目的目标是提高3D GAN的计算效率和图像质量,而不会过度依赖影响多视图一致性和形状质量的近似值。
8月份的新鲜技术是由艺术家Robin Rombach、Andreas Blattmann、Dominik Lorenz、Patrick Esser和Björn Ommer所带来的,他们一起研究并发布了Stable Diffusion的代码。能够根据文本提示和草图创建出色的图像,同时还提供了大量的免费工具集,只需要点击几下就可以把用户所想的作品生成出来,该团队致力于用AI改变“一切”。
目前,所研发的内容仅要求用于学术研究目的,还未全面公开,但不排除未来会考虑面向大众。
9月也算是“AI热潮”全面爆发的一个月,AI的广泛程度愈演愈烈。基于Web的机器学习视频编辑器Runway的开发人员顺势推出了一个文本转换视频的功能,简而言之就是AI系统允许Runway的用户使用语言文本描述就可以生成一个视频。该工具可以免费试用,感兴趣的可以尝试一下!
软件固然重要,但是硬件也是缺一不可,关于NVIDI推出的RTX4080和4090GPU咱们公众号可是有着重测试过【点我跳转】。首先是基于Nvidia新Ada Lovelace架构的GeForce RTX 4090。新的GPU 带来了24GB的G6X显存。该GPU将比Nvidia之前的旗舰解决方案RTX 3090 Ti GPU快两到四倍。
RTX 4080 GPU,具有两种内存配置:12GB和16GB,两块GPU均使用美光GDDR6X显存,但是细节和规格却有所不同。
12GB拥有7680个CUDA核心,而16GB拥有9728个CUDA核心,游戏性能可达到GeForce RTX 3080 Ti的2倍。
NVIDIA推出新的GPU后,AMD紧随其后,推出两款新的GPU——RX7090XTX和RX7090XT。由该公司的RDNA3架构提供支持。RDNA 3是世界上第一个使用chiplet的产品架构。这些小芯片包括一个 5 纳米 GPU 计算芯片和一个 6 纳米内存缓存芯片。图形处理器拥有580亿个晶体管,可管理高达24GB的GDDR6 RAM,性能高达61 teraflops。这两款显卡都支持DisplayPort 2.1,这意味着显卡将提供更高的刷新率支持。据 AMD 称,得益于图形加速器,一些游戏将能够以1440p甚至4K的三位数帧速率运行。
针对4K 游戏,AMD表示在该分辨率下它应该比现有的RX 6950 XT卡快1.7倍。同时,GPU的功耗仅为355瓦(相比之下,旗舰 NVIDIA RTX 4090 的功耗为450瓦)。该显卡将配备96个主频为2.3Ghz的计算单元,并具有24GB的 384位GDDR6内存。
GPU RX 7090 XT
这款显卡相比于RX7090 XTX来说较弱一点,它有84个计算单元,基本时钟速度为2Ghz,320位内存总线速度稍慢。
GETD也是NVIDA研究团队在9月份下旬所推出的,这是一种新的生成模型,能够创建具有复杂拓扑结构和丰富几何细节的全纹理3D网格。经过一系列二维图像的训练,AI能够生成种类繁多的资产,包括汽车、椅子、动物、摩托车、人物角色和建筑物等。据该团队表示,这一功能的实现要归功于最近在可微分表面建模、可微分渲染以及2D GAN方面的成功。
该功能的原理是利用DMTet从SDF中提取3D表面网格,并查询表面点处的纹理场来获取颜色,然后使用2D图像上定义的关键内容进行测试,再基于光栅化的可微分渲染器来获取RGB图像和轮廓,利用两个2D鉴别器,分别在RGB图像和轮廓上,对输入内容进行分类。
在10月份举行的Adobe MAX 2022会议期间,Adobe团队发布了该公司的数字建模和雕刻工具——Adobe Substance 3D Modeler 1.0。该软件其实在4月下旬的时候就首次推出测试版,由Substance 3D团队与VR雕刻工具Oculus Medium的创建者联合开发。该工具最显著的特点就是它允许3D艺术家在桌面和VR上雕刻和创建项目,并可以随时改变模式。
而这次正式发布的1.0新版本,带来了一个全新的雕刻工具集,使用Clay、Erase和Buildup工具,用户将能够添加和移除3D粘土,Crease还可以用在造型雕刻上,而Warp和Elastic工具使用户能够通过拉伸来修改造型的形状。此外,1.0版Modeler首次推出Stamps系统,该系统使用户能够通过用网格在模型表面上冲压来向模型添加细节。而且,该工具支持所有常见的导入和导出交换格式(USD、OBJ、FBX、GLB),并允许用户将绘画输出为具有UV或顶点颜色的纹理。
在11月初的时候,Sparseal团队发布了CozyBlanket 2.0版本,这是专门针对Ipad的应用程序,这次发布的新版本提供了全面改进的视口渲染,在重新拓扑阶段提供更好的对比度和可读性,还添加了通过在展开阶段绘制网格边缘来绘制、删除和扩展UV的功能,引入了创建切线空间的功能从烘焙阶段导入的Target网格的法线贴图和彩色贴图等内容。
在CozyBlanket 2.0发布一周后,一款叫做Move AI的软件再次掀起AI热潮,这是一款无标记动作捕捉程序,能够使用高级AI程序从视频中提取自然的人体动作。使用该软件,只需要一台相机,就可以轻松捕捉数字角色的动作,并自动将数据重新定位到角色。此外,该工具允许用户将此数据直接导出到任何游戏引擎或数字环境中。总结来看的话就是可兼容性强操作还简单。所以一经发布,受到许多人的追捧和尝试。RealityScan是由Epic Games所推出的一款3D扫描应用程序,它可以让用户把手机照片转换为高保真3D模型。操作也非常简单,就是对你想要转换的3D对象拍照,在上传到软件中,RealityScan会使用云处理自动组装模型。
这个软件目前支持Ios,用手机或者Ipad都可以下载体验,该软件后续也将会不断完善和改进并有望在23年推出Android版本。
ChatGPT算是一个压轴智能了,它可以用“万能”来形容了,虽然12月刚刚推出,但是用户满意度却出奇的好。ChatGPT作为一款AI模型,以对话的形式进行交互,来完成后续内容,在不到一个月的时间里,该AI被证实可以用来创建电影大纲、用于Blender的Python脚本、还可以创作说唱押韵歌词……真的是说唱歌词,还能创建故事以及角色,只需要用户跟Ai进行简单的对话,它就可以生成你想要的故事角色,甚至还可以对角色进行详细的描述(是不是很神奇!)
(艺术家Martin Nebelong根据ChatGPT的角色描述生成的作品▲)AI爱好者Guy Parsons,他使用ChatGPT生成了整个电影剧本的大纲,包括电影情节的描述、详细的角色描述、关键位置、电影的标题和标语等等。
2022年真的是AI技术前所未有提高的一年,各个工作室、艺术家展现自己超高水平就为了推出绝无仅有的AI程序。当然,有人认可就有人否定,随着AI技术的不断发展,成千上万的艺术家对AI持有反对态度,甚至要求A站删除一些AI内容,更别说用AI生成的图像作品,对于一些相关版权问题存在疑虑,更是让人难以接受。人工智能发展固然重要,至少,咱们今天所盘点的AI技术确实真的很强,但也确实减少了人类本身的一种创作方式,对于AI你有哪些看法呢?
在面对质疑和抗议的状态下,2023年的AI会继续持上升趋势,擦出更大的火花吗?咱们拭目以待!