英伟达推出RTX 30系列显卡,性能翻倍,价格亮了
Geforce RTX 30 系列显卡,采用三星8nm制程工艺,集成280亿个晶体管。
”
作者 | 吴优
经历了漫长的等待,终于在今天,英伟达CEO黄仁勋在自己厨房发布了英伟达最新一代GeForce RTX 30系列显卡,包括GeForce RTX 3070、RTX 3080和RTX 3090。
黄仁勋称,无论性能还是能效,安培架构GPU都是图灵架构的两倍,而英伟达基于安培架构的全新GPU在性能、能效和功耗上,均达到世界一流水平。
那么,最新推出的GeForce RTX 30系列显卡究竟如何?
1
9月中旬上市,价格同前代泰坦相当
黄仁勋表示,GeForce RTX 30 系列的价格同上一代RTX价格相当,但速度提升一倍。
目前,英伟达官网已经挂出GeForce RTX 30系列显卡上市情况,作为GeForce RTX 30系列显卡的旗舰产品,RTX 3090将于9月24日上市,其首发价格为1499美元(国行价11999元),取代了Titan系列,创下单个GPU GeForce卡的价格记录。
RTX 3080将于9月17日上市,价格为699美元(国行价5499元),RTX 3070的价格为499美元(国行价3899元),与上一代RTX 2080 Super和RTX 2070 Super价格相同。
那么,GeForce RTX 30系列显卡自身性能是否与其售价相匹配?
总体来看,RTX 30系列显卡包揽GPU界的多项第一,首款搭载镁光24G GDDR6X 显卡的游戏图形卡,是有史以来最快的存储装置;首批支持最新显示标准HDMI 2.1的PC CPU,能实现4k高刷新率和运行8k游戏;首批带有AV1解码器的离散GPU,使用户能在台式机和媒体中心中使用AV1。
另外,相比于上一代旗舰级显卡GeForce RTX 2080 Ti,GeForce RTX 3090的性能要强大很多。
具体而言,RTX 3090的等效CUDA核心数为10496个,大约是RTX 2080 Ti的两倍以上。同前代泰坦一样,RTX 3090 拥有24G的显存,但型号从DDR6升级为DDR6X,显存速度19.6Gbps,显存位宽384bit。在散热效率方面,RTX 3090的TDP达到350W,比前代泰坦增加了100W,这是因为RT3090采用了正反双面风扇的散热设计。
另外,RTX 3080等效核心8704个,显存速度19Gpbs,显存位宽320bit,TDP320w。RTX 3070 的等效CUDA核心数为5888,比2080和核心数多1536颗,同时前者TDP比后者低30w。
2
基于安培架构,三项技术性能翻倍
与上一代RTX不同的是,新一代RTX是基于安培架构而非图灵架构,这使得GeForce RTX 30 系列显卡性能得到了提升。
雷锋网(公众号:雷锋网)此前报道,今年5月份,英伟达推出了安培架构计算卡A100,是当时全球最大的7nm芯片,面积高达826平方毫米,集成540亿个晶体管,相比Volta架构实现了高达20倍的性能提升,并且可以同时满足AI训练和推理的需求。
不过,此次发布的GeForce RTX 30 系列属于消费级显卡,采用的是三星8nm制程工艺,集成280亿个晶体管。
根据黄仁勋的介绍,RTX GPU 拥有三项基础处理技术:英伟达在15年前首次推出的可编程着色器、用于加光线三角形和光线边界框相交的RT Core,以及称为Tensor Core的AI处理管线。
Tensor Core可加速用于深度神经网络功能的线性代数,这也是现代AI的基础所在。尤其是在图形领域,可以使用Tensor Core通过英伟达研究多年的DLSS将低分辨率的图像还原称高分辨率,从而提高画面帧率,增强视频的画质。
具体而言,在游戏中增加光线追踪会增加计算工作负载,使用着色器会降低帧速率,增加RT Core可将着色器工作负载减少60%。
RT Core 实际上每秒执行34 TFLOPS 浮点运算的着色器,而在进行光线追踪时,图灵相当于每秒执行45 TFLOPS浮点运算。即使是使用RT Core ,也要消耗大量时间,因此RT Core和着色器必须同时运行。同时使用时,即使是20毫秒,每秒也只有50帧,这对前几代产品而言,性能仍然落后,例如,2018年,英特尔基于图灵架构的GeForce RTX 20系列GPU就在光线追踪方面引起过许多争议。
不过,要是加上Tensor Core,就可以实现高分辨率和高帧率,TRX的性能得以提升。
黄仁勋表示,新款RTX GPU 基于安培架构在性能方面实现了巨大飞跃,安培架构每个时钟执行2次着色器计算,执行一次着色器算力为30 TFLOPS ,图灵架构为11,安培架构翻倍了吞吐量。
另外,安培架构的RT Core可达58 RT TFLOPS,图灵架构为34。安培架构全新的Tensor Core硬件处理稀疏网络的速率是图灵的两倍,可自动识别并忽略次要的DNN权重,相较于图灵 tensor Core 的89 tensor TFLOPS ,安培为238。
在这三项基础技术上,新一代RTX性能提升均为上一代的两倍。
3
搭配新工具,游戏爱好者的新选择
在此次发布会上,除了新一代图像显卡,英伟达还推出了Nvidia Reflex、Nvidia Broadcast、Omniverse Machinima和图像增强工具DLSS 2.0,这对游戏玩家而言意味着更优质的画面、更低的延迟以及更安静的环境。
黄仁勋表示,Nvidia Reflex可在CPU和GPU中优化渲染管道,最多可将延迟时间减少50%,该项工具将同Game Ready Driver一起推出。Nvidia Broadcast可以实现虚拟背景和音频降噪,还可以实时追中主播头部,让主播居于画面正中央。
Omniverse Machinima是一款面对动画特效制作人员的动画制作专业软件,支持Maya、3D max等主流动画软件。
在光追技术方面,黄仁勋表示,“现在,全球排名前二的最受欢迎游戏,《我的世界》和《堡垒之夜》,都已支持光追。”
另外,英伟达还宣布推出专为电竞设计的拥有360Hz刷新率 G-SYNC显示器,内置精确的延迟分析工具,今年秋天宏基、华硕、微星、外星人等品牌将上市这款显示器。在英伟达的测试比较中,360Hz显示器能够帮助玩家更好地定位和追踪对手。
总体看来,RTX 30系列显卡的性能强劲,或将是游戏爱好者的新选择。
此次消费级GPU的推出,网友纷纷回应“NVIDIA YES”,这样一款国行价3899元但性能强劲的GPU,你会购买吗?
注:本文图片源自英伟达官网
往期推荐