Unite 2017 | 基于Animation Instancing的大规模人群模拟 | 自由微信

Unite 2017 | 基于Animation Instancing的大规模人群模拟

金晓宇 Unity官方平台 2018-11-15

在Unite 2017的国内技术专场，Unity技术团队为参会者们带来了Unity引擎功能相关的技术分享。今天这篇文章，将由Unity技术支持工程师金晓宇为大家分享基于Animation Instancing的人群模拟技术，对于大型MMO游戏非常实用。

在实际开发中，可能经常会遇到类似需求：一个体育场中有大量的观众，或者有成百上千的僵尸在街道上游荡。对于这些类似的需求，如果采用传统的动画方式，CPU计算骨骼和蒙皮的压力会非常大。因为每一个角色都要有一个骨骼和蒙皮的计算过程，即使他们都播放的是同一个动画；除此之外，每个角色都至少有一个DrawCall，频繁的向GPU提交数据也为CPU带来了更多的压力。

上图是运用Animation Instancing的一个场景截图，这个场景中大约有30000个角色，每个角色有1～2千面，帧数可以稳定在60帧。Animation Instancing对于骨骼动画的限制较小，场景中的角色类型丰富，动画多样，非常适用于模拟大规模群体动画。

分析

本质上讲，Animation Instancing可以看做是GPU Instancing的扩展。因为他们的基本原理是相同的，只是在实现方法和细节上有所区别。我们都知道，GPU Instancing不支持带有骨骼动画的Mesh。这是因为带有骨骼动画的Mesh由于骨骼驱动蒙皮的原因其顶点数据（坐标）是不同的。

如果熟悉骨骼动画就会知道，动画在某一帧输出的最终Pose只有一个。然后通过这个Pose计算蒙皮，来确定最终的顶点位置。那么什么时候顶点位置是一样的呢？当然是没有动画的时候，也就是没有施加Pose的时候。即是处于绑定姿势(T-Pose)状态下的Mesh顶点位置一样。

因此很自然的就可以想到，我们所需要的顶点数据就是处于T-Pose下的数据。那么现在还有一个问题，动画该怎么处理呢？因为我们需要动画的Pose来计算蒙皮。如果能把Pose当做物体的独有数据提交给GPU，就可以在GPU计算蒙皮了，并且只需要提交给GPU一次就可以画出多个角色来了。

通过上面的分析，我们就可以组织我们所需要的数据了。

顶点数据：角色处于绑定姿势的顶点数据，以及骨骼索引及其权重
角色的独有数据：世界矩阵、骨骼动画数据、动画索引、当前动画播放时间（Normalized Time）

LOD

由于需要同屏绘制大量角色，所以LOD会带来很可观的性能提升。这是因为通常场景中会有很多角色离Camera比较远，因此这些角色没有必要使用高精度的模型，根据与Camera的距离，可以动态切换不同精度的模型。

而LOD应用在Animation Instancing上也是非常简单的。在不使用LOD时，角色只有一个顶点数据（如果这个角色只有一个材质的话）。

如果有LOD的话，只需要为每一个LOD等级生成一个顶点数据。再动态的根据离Camera的距离来切换顶点数据。这个过程是在CPU完成的，为了节省CPU资源，这个过程是不需要每帧进行的，比如我们可以每20帧来进行一次计算。

那么LOD会带来哪些好处呢？

首先它可以降低渲染的面数。同时这会为我们带来一个额外的好处：降低蒙皮的计算量。因为我们是在GPU计算蒙皮的，顶点数少了，自然蒙皮的计算量也少了。

其次它可以降低Overdraw。这是因为距离越远，一个高精度的Mesh就有更多的顶点集中在一个像素中，这会造成大量的Overdraw，而一个低精度的Mesh就可以大大降低这种可能性。

Animation Texture

为了节省在运行时计算骨骼的开销，我们可以把动画数据烘焙到Texture上。之后在运行时就可以采样这张Texture来获取到所需要的动画数据了。

这张Texture的结构大致如下图所示：

它由4个像素作为一个矩阵。一个Pose由N个矩阵组成。

GPU Skinning

最终我们需要在GPU来计算蒙皮，通过采样Animation Texture可以获取到我们所需要的蒙皮矩阵，再根据当前顶点所受影响的骨骼来计算蒙皮。如下面公式所示：

其中K是蒙皮矩阵，B是绑定姿势，C是当前姿势，V是顶点位置，w是骨骼权重。

优化

由于我们要实现成千上万的角色，也就是有成千上万的GameObject，而通常这些GameObject都会有Update方法。而这个数量级的方法调用开销已经是不可忽略得了。所以把这些GameObject的更新方法放在一个Manager中来调用是十分必要的。其次还需要特别注意Struct的拷贝开销。

Unity支持最大每顶点4根骨骼，因此我们也要支持每顶点最大4根骨骼。这里是有优化空间的，特别是加入LOD之后，对于那些离Camera非常远的角色，可以适当减少每顶点受影响的骨骼数目。比如离Camera非常远的角色我们让它每顶点只受一根骨骼影响，这虽然会使动画不太精确，但是实际影响不大。

在采样Texture时，虽然我们是用4个像素组成一个矩阵，但是矩阵的最后一维始终是(0,0,0,1)，所以最后一维的采样是可以省略的。这可以使我们每根骨骼少采样一次。

优点

避免骨骼动画的计算开销（Animator.Update()）
在GPU计算蒙皮（MeshSkinning.Update()）
降低了CPU到GPU的数据传输
适合于大规模群体动画模拟的场景，如战争中的军队、体育场中的观众等

局限性

无法使用blend tree
不支持IK
动画精确性降低

当前，以即时战略、MMO游戏为代表，对大规模的群体动画的需求已经越来越多了。宏大的游戏场面可以大大增加游戏的沉浸感。而Animation Instancing就是一个实现大规模群体动画的十分合适的技术。

更多Unity相关技术文章

Unity 2017中的混合光照

eaglEEye性能测试平台详解

Unity 5导入Blender资源完整指南

Unity中如何使用Raymarching实现惊艳的图形效果

Unity 5 教程 | 低多边形场景的光照与后处理

点击“阅读原文”进入Unity官方中文社区！

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

96岁的朱总理

“上海王”柯庆施之死的真相