NVIDIA在CES 2022大展上,正式发布了GeForce RTX 3050桌面版GPU。从最早的2020年末传出相关消息,到2022年初发布,期间多次传出NVIDIA推出该款GPU的时间,最后跨过了整个2021年我们终于看到这款显卡。相比于此前推出的GeForce RTX 3060/RTX 3060 Ti,这次桌面平台上的GeForce RTX 3050更加贴近主流用户,而且首次将最新的光线追踪技术带到了“50”系列桌面GPU上。
NVIDIA表示,75%的游戏玩家依然在使用GeForce GTX显卡,而其中相当部分将是GeForce RTX 3050的目标群体,其未来会取代GeForce GTX 1650系列的位置。GeForce RTX 3050的核心代号为GA106-150,仍然是基于GA106核心,与GeForce RTX 3060较为接近。
GA106-150核心介绍
GeForce RTX 3050采用了新的GA106-150核心,其实就是把完整的具有3组GPC的GA106核心屏蔽1组GPC而得来,故而一共具有10组TPC即20组SM单元,硅晶片的生产工艺依然是三星为NVIDIA定制的8nm工艺。
下面是GeForce RTX 3050与GeForce GTX 1650和GeForce RTX 3060的规格对比表:
与上代同样定位的GTX 1650相比,RTX 3050宏观上最大的变化就是加入了Tensor Core和RT Core,这是从0到1的质的变化,不仅如此,这一大步的变化还是直接就给用上了第三代Tensor Core和第二代RT Core,正是如此飞跃性的提升,才让RTX 3050也可能以入门卡的定位却还能胜任流畅运行光线追踪游戏的使命。
除了从0到1的的加入了Tensor Core和RT Core,RTX 3050相比GTX 1650在其他方面的提升也非常巨大,制程工艺从12nm提升到8nm,CUDA单元数量从896个提升到2560个,是GTX 1650的将近3倍!纹理单元从56个增加到80个,光栅单元则保持32个不变。
显存部分RTX 3050相比GTX 1650提升非常巨大,显存类型从GDDR5进化到GDDR6,显存容量从4GB增长到8GB,在最能反映显存性能的显存带宽方面,从128GB/s增长到224GB/s,是GTX 1650的1.75倍。
CUDA单元数量提升到将近3倍,显存带宽提升到1.75倍,还加入了第三代Tensor Core和第二代RT Core,时钟频率也有一定幅度的提升,随之而来的,其价格和功耗也有一定幅度的提升,新的RTX 3050的发售建议零售价为1899元,入门显卡已经来到两千元附近了,曾经几百上千元买个入门级游戏显卡的日子已经过去了,不过算上其性能的提升,其实性价比还是增加了很多很多的。
功耗方面,之前的GTX 1650公版方案的功耗是75W,理论上可以做出无需外接供电的显卡,不过可能是受市场偏好的影响,实际的DIY市场上GTX 1650显卡几乎没有见到无需外接供电的游戏显卡,而这一代RTX 3050公版方案的功耗提高到130W,理论上6pin的供电接口就够用了,不过实际估计也很难见到,绝大部分显卡应该都会配备8pin的供电接口。
最后,与RTX 3060相比的话,除了频率之外,RTX 3050的大部分规格都差不多是RTX 3060的7成左右,作为入门的50系列与甜点定位的60系列,用传统的印象相比这个差距其实偏小,说明入门的RTX 3050的性能保留的还是很不错的,不过这个差距幅度其实也与上一代的GTX 1650与GTX 1660差不多。
而基于新一代Ampere架构的GeForce RTX 3050显卡也具有这一代Ampere显卡的一些通用特性,并且相比上一代Turing架构有很大的进步。
NVIDIA Ampere架构简介SM单元的进化RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。DLSS的全称是Deep Learning Super Sampling,翻译成中文就是深度学习超级采样,它的作用是通过降低游戏内的渲染分辨率,同时以拉伸来提高显示分辨率,例如1080P的渲染分辨率以及4K(2160P)的显示分辨率,来达成提升帧数的目的。
此外,将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
NVIDIA Reflex伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。
硬件部分是Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。
而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。
NVIDIA BroadcastNVIDIA Broadcast是为直播主们推出的,这用到RTX GPU的AI能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。
在安装了NVIDIA Broadcast软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到RTX GPU的AI能力来做一些AI增强效果,耳机和麦克风现在支持了降噪功能,AI会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。
而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过Broadcast进行处理,再传到OBS这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。
华硕ROG STRIX RTX 3050 O8G GAMING显卡外观
RTX 3050并没有创始人版本,所有都是非公版出货,本次拿来做首发评测的是一张华硕ROG STRIX RTX 3050 O8G GAMING,作为一张入门级型号的显卡,华硕ROG STRIX RTX 3050 O8G GAMING看起来其实很威猛的。这与其隶属于ROG STRIX这个高端系列有关。
华硕ROG STRIX RTX 3050 O8G GAMING整体非常巨大,采用了明显的越肩设计,正面是三个大尺寸的轴流风扇,都是90mm规格的,均配备9片扇叶,配合其阻隔环的设计,可以将直接吹向显卡散热片的风量大大提升。
仔细观察扇叶,可以看到中央风扇的扇叶与两边风扇的方向是相反的,这种相邻风扇正反转的设计可以减少显卡散热器工作时候的空气乱流,以提高散热效能。除了增强散热效果之外,降低不必要的噪音也很重要,华硕ROG STRIX RTX 3050 O8G GAMING具有待机停转功能,当核心温度较低时,散热风扇会一直保持静止,以得到绝对的静音。
翻到显卡背面,华硕ROG STRIX RTX 3050 O8G GAMING具有与其PCB相比更长的金属背板,在完全覆盖PCB之余,还在显卡尾部形成了穿透式的通风设计,让经过散热鳍片的热风可以被吹向机箱风扇的风道,让整个机箱的散热风道更加合理。
并且华硕ROG STRIX RTX 3050 O8G GAMING是具有两套风扇调节方案的,一个性能模式,一个是静音模式,玩家可以通过背板这里的小拨片一键调节,而无需通过软件进行设置,非常方便。
I/O 挡板这边,华硕ROG STRIX RTX 3050 O8G GAMING采用了304不锈钢的支架,并且采用了比公版豪华些的视频输出接口设计,一共有2个HDMI接口和3个DP接口, HDMI接口是2.1版本的,可以支持8K 60FPS的视频输出。
与这一代采用其他更高阶GPU型号的ROG STRIX系列显卡相比,华硕ROG STRIX RTX 3050 O8G GAMING在风扇直径和扇叶数量方面略有缩减,但是与其他同样搭配RTX 3050 GPU的显卡相比,华硕ROG STRIX RTX 3050 O8G GAMING算是非常高端的配置了。
华硕ROG STRIX RTX 3050 O8G GAMING显卡拆解
拆解后可以清楚的看到华硕ROG STRIX RTX 3050 O8G GAMING的散热器与GPU接触的部分采用了镜面抛光处理,最大化提升平整度,以让其与GPU核心的接触呈现最紧密的状态,增加导热效率,提升散热效果。
连接纯铜底座与大面积散热鳍片的热管一共具有5根,均为6mm规格,进行了镀镍处理,可以很好的防止氧化。多处高发热的电子元器件部分都覆盖有高导热的导热硅胶贴,增加导热效果。
华硕显卡采用了全自动的生产线,所以PCB上非常的整洁,PCB上最显眼的肯定还是RTX 3050的GA106-150核心,它周围有4颗显存颗粒环绕,均为美光的D9ZPM显存,这是GDDR6显存,等效数据速率14Gbps,单颗2GB容量、32bit的位宽,一共4颗组成8GB容量和128bit位宽。
供电方面该卡采用了8相供电,其中6相供电给GA106-150核心,2相供电给显存,核心与显存供电的MosFET均是来自威世半导体的SiC654A,PWM主控可以看到一颗uP9512R。
测试平台与说明
从GPU-Z可以看到,华硕ROG STRIX RTX 3050 O8G GAMING显卡的基础频率为1552MHz,Boost频率为1860MHz,Boost频率相比公版方案有大幅度的预超频,显存等效数据速率为14Gbps,并且华硕ROG STRIX RTX 3050 O8G GAMING的风扇具有待机停转的功能,通过GPU-Z的传感器监测页面可以看到待机状态下,风扇转速为零。
此外,华硕ROG STRIX RTX 3050 O8G GAMING的默认温度上限是83摄氏度,玩家可以选择向上解锁到90摄氏度,由于Boost频率相比公版方案有大幅度的预超频,该卡功耗上限默认为150W,高于公版方案的130W,并且玩家还可以选择向上解锁到最大165W。
测试平台如上表所示,主板采用的是ROG STRIX Z690-A GAMING WIFI D4吹雪主板,内存用两根XPG 龙耀D50 DDR4-3600 16GB组成双通道,其中BIOS设置方面,除了开启XMP让内存运行在3600MHz频率上之外,同时在主板BIOS中打开Resizable BAR的支持,其他均采用默认设置。
代表各款GPU型号的显卡分别是:XFX讯景 RX 5500 XT黑狼版,4GB显存版本,Boost频率1845MHz;XFX讯景 RX 6500 XT黑狼版;XFX讯景 RX 6600黑狼版,Boost频率2491MHz;EVGA GTX 1650 XC ULTRA,4GB GDDR5显存,Boost频率1860MHz;华硕ROG STRIX RTX 3050 O8G GAMING,Boost频率1860MHz;iGame RTX 3060 Mini OC 12G L,采用公版BIOS档,Boost频率1777MHz。
3DMark理论性能测试我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
由于参加测试的显卡中有4GB显存的显卡,并且性能羸弱,所以渲染分辨率相对高的项目中得分可能会有较大的波动,其中还是FireStrike项目的得分最具有参考意义。通过理论测试的结果可以认为,RTX 3050相比GTX 1650有至少70%的性能提升,而如果面对4GB显存不够的情况下,前者相对的提升还更大。
而与RTX 3060相比,RTX 3050大约有RTX 3060的72%的性能,由于它们8GB和12GB的显存容量都足够充裕,所以每项测试项目中的差距都是这个数左右。
与竞争对手AMD刚出的新卡RX 6500 XT对比的话,还是注重看FireStrike项目,RTX 3050似乎仅比RX 6500 XT高出5.6%的成绩,但是我们知道这一代A卡的理论测试成绩普遍相对其游戏实际成绩而言偏高,相信RTX 3050的实际游戏成绩还是会比RX 6500 XT高出绝对不止5.6%的幅度,不仅如此,RTX 3050的显存为8GB,相比RX 6500 XT充裕许多,也会使得它在对显存需求较大的游戏中有更好的表现。
不过,由于代表RTX 3050的显卡是华硕ROG STRIX RTX 3050 O8G GAMING,这张卡相比公版RTX 3050的频率方案是有预超频的,所以的出来的性能结果相比公版RTX 3050的频率方案是略有提升的,由于RTX 3050并没有公版,具体提升不好估计,笔者根据经验判断可能提升有2%左右,这点也是要考虑到的。
1080P分辨率实际游戏测试传统光栅化游戏画质对比测试考虑到RTX 3050的目的定位,这部分测试均将游戏画质设置为预设里面的高画质,不开启光线追踪、DLSS以及FSR,默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。
统计多款的游戏实测结果可以得到,RTX 3050相比GTX 1650在游戏平均帧数方面提升高达77.9%,相比AMD上一代的RX 5500 XT提升达34.6%,相比AMD刚发布的RX 6500 XT提升达41%。大约为RTX 3060和RX 6600的75%。
实时光线追踪画质对比测试这部分测试均将游戏画质设置为预设里面的高画质,并且将光线追踪开启至“高”,默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。
游戏开启光线追踪的话,RTX 3050的平均帧数是RTX 3060的73.3%,与传统光栅化下的差距差不多,而与RX 6500 XT比的话,就比较复杂了,这涉及到RX 6500 XT本身光追性能羸弱并且显存只有4GB各方面的原因,不同游戏中表现的差距幅度差异较大,一个明显的规律是:越是光线追踪效果比较复杂的游戏设定下,RTX 3050领先RX 6500 XT越多,甚至与RX 6600都打的有来有回。
总的可以认为,RX 6500 XT是无法不借助FSR等技术在光线追踪效果下玩AAA大作的,而RTX 3050则是有一定的可玩能力,并且在对性能要求较高的情况下,RTX 3050的光追游戏表现甚至强于RX 6600,在对性能要求不高的情况下,则是光追游戏表现弱于RX 6600。
游戏实测方面由于与对比显卡的差距幅度较大,尽管笔者认为华硕ROG STRIX RTX 3050 O8G GAMING相比公版RTX 3050的频率方案可能提升有2%左右,在如此大的差距幅度下也对结论并无影响了。
RTX 3050令人欣喜的游戏能力上面的游戏测试中,一方面对比的显卡中有4GB显存的,这些显卡在如今AAA大作的预设最高画质下会出现显存不够的情况,有的会导致测试结果会出现较大波动,故而考虑到尽量实用且公平的情况下所有传统光栅化游戏画面均设置为高来进行测试,但是可以看到在预设高画质下RTX 3050可以说游刃有余,还是可以继续挑战更高画质。
另一方面,实时光线追踪的游戏测试部分,尽管N卡拥有A卡不支持的DLSS,但是为了公平(渲染出一样的画面质量)N卡也没有开启DLSS,并没有完全体现出N卡的价值。综上,笔者对RTX 3050又进行了一系列测试。
以下游戏测试的传统光栅化游戏画面均设置为预设最高画质,开启了实时光线追踪的均为光线追踪“高”设置,支持DLSS技术的均开启DLSS,支持DLSS 2.1及以上版本的均开启至“性能模式”(所测游戏中,除了《尘埃5》和《孤岛惊魂6》其他几款游戏均支持DLSS技术)。
此外默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除以上所述之外其他选项均为默认设置,且均采用游戏自带的Benchmark输出结果如下:
通过测试可以看到,传统光栅化游戏画面下,即使是如今很新的AAA大作,绝大部分RTX 3050还是可以以最高画质流畅运行,而在借助了DLSS之后,光线追踪方面也可以都达到60帧左右的流畅度,表现非常的好。
温度表现:满载最高56.7摄氏度温度测试是在裸机平台的环境下进行,环境温度约为19.7℃,使用3DMark Time Spy压力测试作为满载项目,数据通过GPU-Z的Log to File功能记录,以下为满载温度的测试曲线:
华硕ROG STRIX RTX 3050 O8G GAMING具有风扇待机停转功能,所以上面测试的待机温度是风扇停转下的温度,尽管风扇停转,该卡的待机温度也非常的低,十分钟的待机过程中最高仅有35.9摄氏度,热点温度也最高才48.4摄氏度,非常的清凉,都没有触发风扇主动散热。
满载状态下,该卡最高温度仅仅才只有56.7℃,并且这个最高温度是触发风扇主动散热前的,风扇转动之后的温度都比这个还要低。关注最热点温度的话,也最高才68.4摄氏度,同样是触发风扇主动散热前的。
满载GPU核心实际频率:维持在2010MHz在进行温度测试的3DMark Time Spy压力测试过程中,我们也记录了显卡的在满载状态下的GPU核心实际频率如下图所示:
在满载状态稳定之后,华硕ROG STRIX RTX 3050 O8G GAMING的实际GPU核心频率一直稳定在2010MHz,比其Boost频率还要高出很多,另外,核心频率曲线图如此平稳也是甚为罕见了。
功耗测试:满载功耗平均为134W通过我们手中的PCAT套件,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
统计功耗测试的结果算出,华硕ROG STRIX RTX 3050 O8G GAMING的整卡待机功耗平均为12.7W,满载功耗平均为134W,峰值功耗到过146。对于这样级别的显卡功耗来说,电源的话一个550W的电源就足够了。
RTX 3050的官方标称功耗是130W,而华硕ROG STRIX RTX 3050 O8G GAMING由于Boost频率相比公版方案预超频,故而略超130W,考虑到华硕ROG STRIX RTX 3050 O8G GAMING已经相比公版频率方案有较大幅度的超频,这里就不再单独对这款非公版的RTX 3050进行超频测试了。
总结:无暇之作,入门级显卡也能流畅光追对于GeForce RTX 3050,笔者愿意用完美无瑕来称赞它,特别是相比较AMD刚发布的Radeon RX 6500 XT这张卡的话。首先GeForce RTX 3050的标准显存配置为8GB,可以无压力的胜任AAA大作在1080p分辨率下开启最高画质而不会出现显存不够的尴尬,多出的余量还可以让玩家放心应对之后几年的游戏环境。
N卡大容量显存的布置思路可以看出来至少从GeForce RTX 3060就开始了,当初GeForce RTX 3060的发布表示配备12GB的显存其实给人感觉对于游戏玩家有点过于充裕(相对其性能能胜任的游戏环境来说),而来到GeForce RTX 3050上,显存顺理成章变为8GB,这个显存容量搭配GeForce RTX 3050的性能,则给笔者的感觉是黄金搭档,非常平衡。
显卡迷你天梯榜 (完整显卡天梯榜)
其次GeForce RTX 3050的游戏性能也是令人尤为满意,先说最令人吃惊的光追游戏性能表现,作为一张“50”级别的入门级显卡,在1080p高画质搭配高光追设置下,GeForce RTX 3050居然可以搭配自家的DLSS技术在那些对性能要求极其高的游戏中也能达到超过帧的流畅度,比如《光明记忆》达到62帧,《地铁:离去(增强版)》达到72.94帧。对于《尘埃5》和《孤岛惊魂6》这样的光追效果不甚严苛的游戏,不借助DLSS也可以稳稳超过60帧。而且传统光栅化的游戏测试中,GeForce RTX 3050相比RX 6500 XT提升达41%,是远远甩开的程度。
再者Radeon RX 6500 XT还有标配只有2个视频输出就接口以及砍掉了视频编码的短板,这方面GeForce RTX 3050都显示出碾压性的优势,所以Radeon RX 6500 XT要说能有优势的只有价格和功耗了,然而,相对于其能给到的体验来说,1599元与1899元的差距并没有那么大,同样功耗方面107W与130W也难以感到痛痒。
在目前的市场下,可以预计GeForce RTX 3050必将大卖,首发过后的实际的市场价格会高于建议零售价看来也是不可避免的了,而且估计溢价幅度还会不少,具体还是得看供货情况了。
,