梦晨 Pine 发自 凹非寺
量子位 | 公众号 QbitAI
矿难来袭、玩家盘算何时下山之际,老黄带着他的40系显卡来了!
首发三款高端型号,RTX4090 24GB、RTX4080 16GB和12GB显存两版。
话不多说,直接上规格:
三款游戏帧数测试,在4K分辨率、全高设置、开启光追与DLSS情况下,4090提高到上代旗舰3090Ti的2-4倍,4080与3080Ti对比也提高到原来的2-3倍。
来看一组实机画面对比,来自《微软模拟飞行》。
另外英伟达还与波兰蠢驴合作,给《赛博朋克2077》开发了“全极致光线追踪模式”,软硬协作榨干所有性能,帧数直接x4。
要达成这些效果,靠的是全新GPU在制程工艺、硬件架构、软件算法上的一系列改进。
台积电工艺、DLSS3放大招全新架构Ada Lovelace,切换到台积电4N定制工艺(5nm),专为生产GPU优化的那种,而Ampere时代用的还是三星8nm。
新工艺加持下,RTX4090塞进了760亿个晶体管、1.8万个CUDA核心,比上一代增加70%。
同时与上一代架构Ampere对比,能效比也有较大提升。
一个重头戏是DLSS3,这一次AI能力不仅用于超分辨率,还会用于插帧。
老黄说,以后你看到的游戏画面中大部分像素都不是直接渲染出来的,而是AI预测的。
接下来,英伟达把新架构下的SM多单元流处理器、负责AI计算的Tensor Core与负责光追的RT Core都升级至新一代。
SM多单元流处理器方面,最大的更新是“Shader执行重排列”技术(Shader Execution Reordering)。
老黄讲到,光追吃性能的主要原因是GPU内部高度并行化、擅长做大量重复性高的工作。而光追场合下光线不断反射与全场景内不同材质交互并不能发挥GPU优势。
这项技术负责动态调度工作负载、合理安排计算资源,能给光追带来2-3倍性能提升,光追之外的综合游戏性能也提升25%左右。
这是与CPU乱序执行同等重要的计算革新。
张量核心Tensor Core,用了数据中心GPU H100的同款,新增FP8精度数据格式支持,吞吐量增加5倍。
光线追踪核心RT Core方面, ray-triangle交叉吞吐量提高两倍以上,还新增了Opacity Micromap引擎专攻树叶、粒子和栅栏这种光线通过缝隙的场景。
总的看下来,新显卡架构主要性能提升都是围绕光追,还有那么多不支持光追的老游戏怎么办?
为解决这个问题,英伟达推出游戏MOD开发工具RTX Remix。
一边玩游戏一边打开它,就能直接从GPU渲染指令里拦截游戏的图形资产,包括几何建模、材质、灯光、摄像机位置等。
在AI辅助下给这些资产增加细节、超分辨率、增加物理性质、添加光追和DLSS支持都不在话下。
还能一键打包成MOD发布,让老游戏也能焕发第二春,比如让20年前的《上古卷轴·晨风》画质超过最新的《上古卷轴·天际》。
英伟达官方为经典解谜游戏《传送门》制作了光追MOD,将以免费DLC的形式稍后发布。
全在讨好玩家,除了价格
相较于RTX30系列,40系列显卡的性能增强够有诚意了,那么价格如何呢?
直接来看黄老板给出的价格:
RTX 4090定价1599美元RTX 4080(16GB)定价1199美元RTX 4080(12GB)定价899美元。
在国内,目前给出的售价是:
RTX 4090 12999元起RTX 4080(16GB)9499元RTX 4080(12GB)7199元。
为了方便比较,也顺便把之前国内RTX30系列的官方售价摆上来:
RTX 3090 11999元RTX 3080 5499元RTX 3070 3799元
从给出的定价来看,90系列的变化幅度并不是很大,国内售价在原来的基础上涨了一点,算得上是“高性价比”(但这价格依旧是普通网友可望不可及)。
对比之下,80系列新出的两款显卡涨价就比较明显,RTX 4080(16GB)相较于3080涨价近50%,被外界认为是对标RTX 3070的RTX 4080(12GB)也涨了近50%。
网友直呼:这根本没想让我们买40啊。
(看来黄老板饱受矿难其害,不知道手里还有多少30系显卡)
不过游戏发烧友们也可以再等等。
在得知英伟达要发布40系列显卡后,AMD也坐不住了,后脚就透露消息称:11月3日会发布RX 7000系列显卡。
并且还放出了一张性能对比图,称其性价比高,能效好。
值得一提的是,虽然这次RTX40系列相较于30系列性能翻倍,但功耗方面却没有很大的涨幅。
RTX 4090功耗正如之前传言一样为450W与3090Ti持平,RTX 4080(16GB)为340W,RTX 4080(12GB)为285W.
对于RTX4090,英伟达建议使用850W的电源,12GB的RTX 4080需要700W的电源,16GB需要750W的电源。
不仅如此,英伟达此次还升级了散热系统,进一步优化了双轴流通系统,将风扇尺寸和翅片体积增加了10% ,并升级为23相电源。
(这尺寸倒是越来越大了)
甚至有网友调侃称:
除此之外,大家的AI导师李沐也第一时间给出了自己的看法。
4090相比3090Ti,AI训练来说重要的参数都没增强,增强多卡并行的NVlink还给砍了,不如再等等4090Ti。
这次的40系新卡,你冲吗?
参考链接:[1]https://www.nvidia.cn/geforce/graphics-cards/40-series/[2]https://www.youtube.com/watch?v=Uo8rs5YfIYY
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
,