在显卡世界里,英伟达和AMD一直在打仗,争夺“地球上能耗比王座”这一至高荣誉。最近的一场战争是在2020年10月29日,AMD用RDNA2(对应RX6000系列)砍翻了英伟达的安培架构(对应RTX30系列)。
英伟达卧薪尝胆,君子报仇,两年不晚。
2022年9月20日,英伟达在秋季GTC大会上,正式发布RTX40显卡,宣称能耗比翻倍提升,这是什么概念?
要知道,对CPU来说,其灵魂是IPC,每一代提升20%都属于“吓人”的进步。
对显卡来说,其灵魂是能耗比,提升30%要把人吓一大跳,提升50%会吓得人血压飙升,提升100%会吓得心率失常。
全新架构
RTX40显卡采用革命性的全新架构,命名为Ada Lovelace(阿达·洛芙莱斯),Ada是英国著名诗人拜伦之女,数学家,计算机程序创始人,被誉为:第一位给计算机写程序的人 。
Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,Ada拥有众多创新技术,主要有:
1、采用全新SM多单元流处理。
Ada的SM多单元流处理器包含一个重要新技术,叫做:SER(Shader Execution Reordering着色器执行重排序),该技术可以实时重新调度任务,动态调整工作负载,让原本低效的流程变得异常高效,可将色器性能最高提升 2 倍,RTX30系列最快的GPU(RTX3090Ti)为40 TFLOPS,RTX4090Ti超过90TFLOPS。体现在游戏中,可将帧率提升 25%!这项技术和CPU乱序执行一样,属于一项重大创新。
2、第 3 代RT Core (光追核心)
Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能惊人地提高了 2.8 倍。
第3代RT Cores包含了两个全新硬件单元:
Opacity Micromap引擎将光线追踪的Alpha-Test 几何性能提升2倍。
Micro-Mesh引擎可以提升几何图形的丰富度且不会带来更多的BVH构建和存储资源消耗。
3、第 4 代 Tensor Core(张量计算核心)
采用全新的 8 位浮点 (FP8) Tensor Engine 使得吞吐量相较之前提高到令人难以置信的 5 倍之多。
4、DLSS3
这是一款由 AI 驱动的性能倍增器,由第4代Tensor Core和RTX40系列GPU的全新光流加速器驱动,这个全新的AI功能可以在不涉及图形管线的前提下生成全新的帧,而不仅仅是像素。相较于单纯的渲染,游戏性能最高可提升4倍。
光流加速器可将后续帧的像素运动数据输入至 DLSS 神经网络,在 GPU 中生成新的帧,即使是在 CPU 资源紧张的情况下也能确保加快性能。在图灵和安培架构时已有光流加速器,但当时性能弱,英伟达没怎么提及。Ada架构大幅度提升了其性能,终于可以拿出来“显摆”了。
在微软模拟飞行 (Microsoft Flight Simulator)”中,整个地球以真实比例 (1:1) 进行渲染,使用 DLSS 3 可使图形性能提升一倍,从而大幅改善玩家的游戏体验。
5、AV1双编码
AV1编码效率提升40%,是主播和视频编辑者的福音。
总的来说,Ada的性能表现,英伟达用了“不可思议”这个词语,把传统光栅化游戏性能提升到安培的2倍,对光追游戏性能的提升最高达4倍。在衡量显卡是否领先的关键指标——能耗比,由于制程和架构的双重升级,Ada是安培的两倍。(即在相同功耗下,性能翻倍)。
从下图可以看出,图灵到安培的能耗比提升比较正常,Ada的提升是吓人的,仿佛从RTX30一下子来到了RTX60系列,已经不像是提升一代的产品。
这次发布了三款产品,英伟达宣称:
RTX 4090,速度是RTX 3090 Ti 的2倍。(注:对比TSE,前者网透为20190分,后者=11096,提升82%,这是光栅化性能,把光追算部分权重后,综合达到2倍)
RTX 4080 (16GB), 其运行速度可达 RTX3080 Ti 的 2 倍。(注:前者预估TSE=15000,后者TSE=9670分,换算后,光栅化性能为RTX3090Ti的1.35倍)
RTX 4080 (12GB) ,超过RTX 3090 Ti 。(注:前者预估TSE=13300,光栅化性能为RTX3090Ti的1.2倍)
按GTX10、GTX16、RTX20、RTX30和这次的RTX40的迭代关系,站长推测——
RTX4070会取代RTX3090
RTX4060会取代RTX3080
RTX4050会打败RTX3060,甚至可以和RTX3060Ti一战。
与其说Ada的进步太吓人了,不如说英伟达太吓人了。这有点像两个赛车手在飙车,英伟达长期领先,AMD好不容易来个弯道超车,还领先了两圈,没想到英伟达换装了飞机发动机,速度直接翻倍,观众都没看清楚就飚得没了影子。
Ada这么猛,AMD的RDNA3能追上么?
,