在显卡世界里,英伟达和AMD一直在打仗,争夺“地球上能耗比王座”这一至高荣誉。最近的一场战争是在2020年10月29日,AMD用RDNA2(对应RX6000系列)砍翻了英伟达的安培架构(对应RTX30系列)。

英伟达卧薪尝胆,君子报仇,两年不晚。

2022年9月20日,英伟达在秋季GTC大会上,正式发布RTX40显卡,宣称能耗比翻倍提升,这是什么概念?

要知道,对CPU来说,其灵魂是IPC,每一代提升20%都属于“吓人”的进步。

对显卡来说,其灵魂是能耗比,提升30%要把人吓一大跳,提升50%会吓得人血压飙升,提升100%会吓得心率失常。

rtx 3060显卡首发价(才买的RTX3090Ti就落后RTX4090RTX4080来)(1)

全新架构

RTX40显卡采用革命性的全新架构,命名为Ada Lovelace(阿达·洛芙莱斯),Ada是英国著名诗人拜伦之女,数学家,计算机程序创始人,被誉为:第一位给计算机写程序的人 。

Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,Ada拥有众多创新技术,主要有:

1、采用全新SM多单元流处理。

Ada的SM多单元流处理器包含一个重要新技术,叫做:SER(Shader Execution Reordering着色器执行重排序),该技术可以实时重新调度任务,动态调整工作负载,让原本低效的流程变得异常高效,可将色器性能最高提升 2 倍,RTX30系列最快的GPU(RTX3090Ti)为40 TFLOPS,RTX4090Ti超过90TFLOPS。体现在游戏中,可将帧率提升 25%!这项技术和CPU乱序执行一样,属于一项重大创新

2、第 3 代RT Core (光追核心)

Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能惊人地提高了 2.8 倍。

第3代RT Cores包含了两个全新硬件单元:

Opacity Micromap引擎将光线追踪的Alpha-Test 几何性能提升2倍。

Micro-Mesh引擎可以提升几何图形的丰富度且不会带来更多的BVH构建和存储资源消耗。

3、第 4 代 Tensor Core(张量计算核心)

采用全新的 8 位浮点 (FP8) Tensor Engine 使得吞吐量相较之前提高到令人难以置信的 5 倍之多。

4、DLSS3

这是一款由 AI 驱动的性能倍增器,由第4代Tensor Core和RTX40系列GPU的全新光流加速器驱动,这个全新的AI功能可以在不涉及图形管线的前提下生成全新的帧,而不仅仅是像素。相较于单纯的渲染,游戏性能最高可提升4倍。

光流加速器可将后续帧的像素运动数据输入至 DLSS 神经网络,在 GPU 中生成新的帧,即使是在 CPU 资源紧张的情况下也能确保加快性能。在图灵和安培架构时已有光流加速器,但当时性能弱,英伟达没怎么提及。Ada架构大幅度提升了其性能,终于可以拿出来“显摆”了。

rtx 3060显卡首发价(才买的RTX3090Ti就落后RTX4090RTX4080来)(2)

在微软模拟飞行 (Microsoft Flight Simulator)”中,整个地球以真实比例 (1:1) 进行渲染,使用 DLSS 3 可使图形性能提升一倍,从而大幅改善玩家的游戏体验。

5、AV1双编码

AV1编码效率提升40%,是主播和视频编辑者的福音。

总的来说,Ada的性能表现,英伟达用了“不可思议”这个词语,把传统光栅化游戏性能提升到安培的2倍,对光追游戏性能的提升最高达4倍。在衡量显卡是否领先的关键指标——能耗比,由于制程和架构的双重升级,Ada是安培的两倍。(即在相同功耗下,性能翻倍)。

从下图可以看出,图灵到安培的能耗比提升比较正常,Ada的提升是吓人的,仿佛从RTX30一下子来到了RTX60系列,已经不像是提升一代的产品。

rtx 3060显卡首发价(才买的RTX3090Ti就落后RTX4090RTX4080来)(3)

这次发布了三款产品,英伟达宣称:

RTX 4090,速度是RTX 3090 Ti 的2倍。(注:对比TSE,前者网透为20190分,后者=11096,提升82%,这是光栅化性能,把光追算部分权重后,综合达到2倍)

RTX 4080 (16GB), 其运行速度可达 RTX3080 Ti 的 2 倍。(注:前者预估TSE=15000,后者TSE=9670分,换算后,光栅化性能为RTX3090Ti的1.35倍)

RTX 4080 (12GB) ,超过RTX 3090 Ti 。(注:前者预估TSE=13300,光栅化性能为RTX3090Ti的1.2倍)

rtx 3060显卡首发价(才买的RTX3090Ti就落后RTX4090RTX4080来)(4)

按GTX10、GTX16、RTX20、RTX30和这次的RTX40的迭代关系,站长推测——

RTX4070会取代RTX3090

RTX4060会取代RTX3080

RTX4050会打败RTX3060,甚至可以和RTX3060Ti一战。

与其说Ada的进步太吓人了,不如说英伟达太吓人了。这有点像两个赛车手在飙车,英伟达长期领先,AMD好不容易来个弯道超车,还领先了两圈,没想到英伟达换装了飞机发动机,速度直接翻倍,观众都没看清楚就飚得没了影子。

Ada这么猛,AMD的RDNA3能追上么?

,