查看原文
其他

让45W TDP CPU稳跑75W的秘密:Blender渲染测试(含Optix去噪点)

唐僧 huangliang 企业存储技术
2024-12-09

接上篇:《17寸全面屏轻薄本拆解:Precision 5750移动工作站(上)

性能、可靠性和音频设计:Precision 5750移动工作站(下)

 

这两天研究笔记本/移动工作站的散热性能测试,有点小收获。Intel Core i7-10875H CPU跑到75W功耗可能不算什么漂亮数字,之前我有看到资深媒体朋友这样写过:

 

“桌面温度25到27(电脑左右两边),后部脚垫垫高一个手机,dell power manager设定为极速,充点阈值设定为50-60。禁用Intel智能调优以获得稳定数据,pwm风扇拉满3300RPM,屏幕亮度降到最低(这个很重要)

单烤FPU35min结果如下

最高跑到100瓦单cpu功耗,此时整机功耗154.5瓦(个人见过最高是170w瞬间功耗)长时间压力单U 75瓦完全稳定,此时温度接近100。可以看到这个时候整机功耗已经是123.5瓦了”

 

DIY精神没的说!其实我的“优化”方法也包含在其中,关键是对于大多数用户长期使用来说,不太适合搞的这么极端,在不破坏使用体验和RAS(可靠性、可用性)的条件下,我会给大家2点散热优化建议

 

下面先看性能测试。

 

BlenderGPUOptixRTX光线追踪)渲染支持

 

本次测试选用最新版本的Blender2.90.1——一个开源且比较流行的3D动画软件。Blender较早的版本就开始支持GPU渲染(CUDA),应该是从2.8.1之后又加入了RTX光线追踪(Optix)的支持。

 

首先是FishyCat模型,上面的238秒是用Quadro RTX 3000显卡渲染的速度,移动工作站的8CPU还达不到这么快。

 

当前版本BlenderOptiXRTX光线追踪)的支持还是实验性的。在我测试的N卡移动工作站上,只有CUDAOptiX都选中才能使用Cycle渲染引擎中的GPU选项。

 

这台Dell Precision 5750移动工作站配置的显卡是Quadro RTX 3000 Max-Q 6GB,在GPU渲染时CUDA单元占用率100%,显卡部分整体功耗稳定在TDP 65W左右。

 

GPU渲染比CPU快早已是不争的事实,接下来我想重点说下Core i7-10875H CPU的性能发挥。上面图表大家都看到了,这颗8CPU75W功耗下的渲染时间缩短了13%

 

注:无论何种测试条件,45W TDPCPU在刚开始跑时都可能Turbo100W出头的功耗,所谓 “@45W” 只是指没有任何优化动作下的性能,并不代表整个运行过程中都没有高于45W

 

两个简单操作,CPU轻松提升至75W(稳态)


上面的截图就是在Blender CPU渲染测试中,左边用AIDA64做的功耗监测(但没有同时跑它的压测)。在75WCore i7-10875H816线程)可以长时间稳定达到3.46GHz左右的全核Turbo频率。下面就是2点简单优化操作:

 

1、笔记本后部垫高一点

这个对散热进风比较有帮助

 

2、使用Dell Power Manager电源管理软件,在散热管理中设置为“疾速”,经我实际体验满载温度和噪音增加不大,均在商用环境可接收的范围内。

 

如果不愿安装Dell Power Manager,也可以在移动工作站的BIOS设置中修改,如下图:

这张照片来自Precision 7550,下一篇我争取再讨论它。Dell 10Core CPU商用笔记本BIOS里都有这个散热管理选项,默认是Optimized(优化),改为Ultra Performance即可。

 

如果只垫高笔记本尾部,而不修改Precision 5750出厂默认的散热设置,在Blender测试中就会看到CPU功耗在45W-68W左右周期性波动变化。在我的测试中,3.26GHz大约就是这个过程中i7-10875H CPU频率的高点。

 

Optix去噪点渲染 vs. CPU去噪点算法

 

另一个Blender测试场景Classroom(教室)。无论选择CPU还是GPU渲染,如果直接用初始化后的默认选项达不到上面这个画质。

 

如上方对比图,Classroom场景渲染应该打开去噪点功能,才能获得正常理想的最终图像质量。

 

需要注意的是,只有在渲染设备设为GPU时,Denosing(去噪点)Optix选项才能正常工作。而在CPU渲染时,可以选择另外2种去噪点算法NLM或者OpenImageDenoise,初步观察画质差别不大。

 

也就是说,Blender在这点上与我在《SolidWorks渲染测试:CPU & GPU光线追踪性能、画质对比》中看到的情况不同。相比之下,SolidWorks Visualize渲染器可以说重度依赖NVIDIA GPU,如果用CPU在其中想达到类似Iray引擎去噪点的画质,需要提高通道数到1000默认值10倍),速度就比较难看了。

 

根据测试数据图表,Quadro RTX 3000显卡在打开去噪点之后,只增加了14秒(5%)的渲染时间,比CPU使用去噪点之后的性能开销小一点。

 

在同样不开去噪点的情况下,(稳态之后)跑到75Wi7-10875H CPU渲染比散热优化前快了107,仍然有大约10%的性能优势。

 

总结 & 建议


Precision 5750移动工作站配置的QuadroRTX 3000 Max-Q Design显卡规格参数,分享给大家。

 

在真实应用中,能同时把CPU(全核)和GPU同时跑满的情况并不多,因此上文中我没有使用测试软件做极限的“双烤”;而CPU在单核Turbo到比较高(4.5GHz以上)时功耗只有20多瓦。根据多年来的经验,大批图形工作站用户对主频(单核)性能比多核更加敏感。

 

因此本文给出的建议,对于全核CPU负载,或者CPUGPU同时有较大压力的应用效果更明显。Precision 5750毕竟是一款轻薄型17寸移动工作站,130W电源适配器,在双烤压测下GPUCPU也分别能达到65W + 50W左右。如果用户还想要更好一些的性能,还可以考虑Precision 7550或者7750

 

我再次认识到:对于笔记本散热支架/底座而言,额外带风扇可能都是次要的,关键是要让进风口不被遮挡!

 

最后这张图来自jd.com,散热支架/底座如果选便宜的花不了多少钱。工欲善其事,必先利其器:)

 


扩展阅读:企业存储技术》文章分类索引(微信公众号专辑)



:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流技术,。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage

长按二维码可直接识别关注


历史文章汇总:http://chuansong.me/account/huangliang_storage

http://www.toutiao.com/c/user/5821930387/



点击下方“阅读原文”,查看更多历史文章

↓↓↓

修改于
继续滑动看下一个
企业存储技术
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存