本次测试包括以下内容:大约需要15到18分钟的阅读时间
- GeForce RTX 2080 Founders Edition 介绍
- 深度学习超采样DLSS
- DHR 测试
- 多款游戏测试
- 功耗表现
- 温度以及频率表现
- 超频
- 散热方案(拆解)
- 风扇以及噪音表现
- 总结
RTX 2080 于2018年9月19号,解禁了测,国外著名硬件媒体「Tomshardware」就第一时间带来了评测报道。一起看看
值得注意,RTX 2080 在传统性能表现上虽然比 GTX 1080 Ti 快上一点,但差距不大,而且价格高出许多,如果不是想体验一下光线追踪的魅力,不是一个好的选择。
这次测试的是 Nvidia GeForce RTX 2080 founderS Edition版本也就是我们所说的公版,RTX 2080 使用的是阉割的TU104 GPU。
完整的TU104 GPU核心共有48个SMs,每个拥有64个CUDA核心、8个张量核心、1个RT核心、4个纹理贴图单元、16个加载/存储单元、256KB的寄存器以及16KB的L1缓存/共享存储。
完整的 Turing Tu104
阉割后的 TU104 GPU 是 46 个SMs,共有 2944个CUDA核心、368个张量内核、46个RT核心、64个ROPs,184个纹理贴图单元,4MB的L2缓存,256-bit 14Gb/s 的 GDDR6 显存,显存带宽为448 GB/s 比前任 GTX 1080 高 100 GB/s。
就连 NVlink 都被阉割了,只剩一个 X8 双向50GB/s 的链路。
▲Turing Vs. Pascal
英伟达的RTX 2080 Founders Edition 版显卡,基础频率为1515MHz,动态加速频率为1800MHz。FP32 计算能力为 10.6 TFLOPS 低于 GTX 1080 Ti (11.3 TFLOPS),但高于GTX 1080 (8.9 TFLOPS)。 当然了,更快的founders edition 版本需要更多的电力,TDP 为 225W 比常规的 RTX 2080 高出10W,更是比GTX 1080 高出 45W,对于一张225WTDP的显卡,使用6PIN+8PIN的供电接口足矣。
把散热都拆开后 RTX 2080 的 PCB 比RTX 2080 Ti的更简洁一些,使用的元件也少点,例如供电部分,采用的是8相(GPU)+2相(显存)的设计方案,其中GPU的8相有6相来自外接供电2相来自PCIe插槽。
▲RTX 2080 founders edition PCB 正面
▲RTX 2080 Founders Edition PCB 背面
▲RTX 2080 founders edition 输出端口
GPU供电设计:
GPU供电采用的是 uPI 的 uP9512 PWM控制芯片,该芯片提供 8 通道的控制,根据uPI,uP9512 是专为“下一代”GPU”所设计, 能给提供可编程的电压输出,以及可精确调节电压以及电流输出曲线,更适合瞬态的电流负载。
uP9512 支持 NVIDIA 开放的 PWMVID 电压调节 type 4i 技术,输入经过缓冲以及滤波后可提供精确的参考电压,输出电压受输入得到精确的控制,集成的SMBus接口提供了足够的灵活性,使得效率及性能都得到充分的优化。同时也方便了与相应软件的通信。
所有13个电压调节电路都配备了一个安森美的FDMF 3160智能电源级模块,集成了PowerTrench MOSFET和驱动器集成电路。
像往常一样,电感线圈是密封的铁氧体磁芯,但这一次它们是矩形的,为电压调节器电路腾出空间。
显存供电:
显存芯片MT61K256M32JE-14:显存集由来自第二个uP 9512的两个阶段供电。同样的FDMF 3160智能电源级模块。电感为 470 mH比在GPU上使用的更大,但它们在物理尺寸上是完全相同的。
输入滤波通过三个1μH线圈进行,其中三条连接线中的每一条都有一个匹配的分流。这是一个非常低的电阻,电压降被平行测量并传递到遥测。通过这些电路,NVIDIA可以精确地限制板卡的功率。对于那些喜欢多BIOS的人来说,可能会有点失望,因为这张卡只配备了一个BIOS。
如何测试GeForce RTX 2080测试配置:
- 主板:MSI Z170 gaming M7
- CPU:Core i7 7700K@4.2GHz
- 内存:芝奇 F4-3000C15Q-16GRR 套装
- SSD:英睿达的MX200 SSD,
- SSD:1.4TB 英特尔 DCP 3700 SSD
参与测试的显卡:
- GeForce RTX 2080
- GeForce RTX 2080 Ti
- Titan V
- GeForce GTX 1080 Ti
- Titan X
- GeForce GTX 1080
- GeForce GTX 1070 Ti
- GeForce GTX 1070
- Radeon RX Vega 64、56
- 所有卡片都是创始人版本,或者是参考模型。
测试的游戏包括:
- 奇点灰烬:扩展版_Ashes of the Singularity: Escalation,
- 战地1_Battlefield 1, (2016)
- 文明6_Civilization VI,
- 命运2_Destiny 2,
- Doom,
- 孤岛惊魂5_Far Cry 5,
- 极限竞速7_Forza Motorsport 7,
- GTA5_Grand Theft Auto V,
- 地铁:最后的曙光_Metro: Last Light Redux,
- 古墓丽影:崛起Rise of the Tomb Raider,
- 全境封锁_Tom Clancy’s The Division,
- 幽灵行动:荒野_Tom Clancy’s Ghost Recon Wildlands,
- 巫师3_The Witcher 3
- 魔兽世界:争霸艾泽拉斯_World of Warcraft: Battle for Azeroth
我们试着加入:怪物猎人:世界、古墓丽影:暗影、德军总部2,以及其他几个游戏,但由于图灵显卡的驱动原因,所以不得不放弃这些计划。
我们使用的测试方法来自PresentMon:包括DirectX、OpenGL和Vulkan的性能。简而言之,所有这些游戏都是使用OCAT和我们自己的PresentMon内部GUI的结合来评估的,并通过AIDA 64进行日志记录。
测试中所用的都是目前最新的驱动程序。对于NVIDIA,GeForce RTX 2080 Ti和2080 使用的是Build 411.51版本驱动。其他显卡用Build 398.82进行测试。Titan V 也是 411.51,以确保性能没有变化。AMD的显卡使用肾上腺素版18.8.1,目前来说是最新的。
深度学习超级采样(DLSS),首次尝到质量与性能在我们深入了解GeForce RTX 2080在我们的基准测试套件中的性能之前,我们先来了解一个情况:测试的游戏都没有光线追踪的支持。事实上,Windows 10 甚至还不支持这个功能,除非你处于开发模式。对于英伟达,“DirectX光线追踪和Windows ML将作为即将到来的2018年10月10日更新中的一部分提供给客户。”
不过,可以参考支持DLSS的最终幻想XV 的 Windows 演示版本。DLSS允许图灵显卡使用一半的输入资源进行渲染之外,实现的细节还比较少,张量核心会填充其余部分以创建最终的图像。
在DLSS真正证明自己之前,我们预计游戏玩家会不相信输入样本可以被删除以节省渲染预算,然后使用AI填充。我们仔细研究了演示,一遍又一遍地运行两个版本,以确定任何突出的差异。
确实 DLSS 极大的提高了 RTX 显卡的性能(使用DLSS的GeForce RTX 2080比使用TAA的GeForce GTX 1080 Ti快40%)。
HDR:改进了性能和输入延迟
NVIDIA 的上一代 PASCAL 架构在开启 HDR 功能是会带来可见的性能损失,新的图灵显卡由于架构的改进已经把这种损失降低了很多。
为了测试这一理论,我们把宏碁掠夺者x27调到强制60Hz,并设置 Windows 以 10 位 RGB 输出(通过显示器的OSD确认)运行。
战地1 HDR测试
有趣的是,在《战地1》的测试中,开启HDR之后,游戏运行开始时那些卡顿消失了,三张显卡的最低帧数都有所提高。
这也有助于提高 GeForce RTX 显卡的平均性能,GTX 1080 Ti 也有好处。不过由于在HDR模式下大多数测试的(最高)帧率都比较低(如我们的百分位图中的金线所证明),平均性能略微落后于SDR结果。
命运2 HDR测试
《命运2》测试中,开启 HDR 后 GeForce RTX 2080 Ti、GeForce RTX 2080 以及 GeForce GTX 1080 Ti 速度都损失了6%~7%。
孤岛惊魂5 HDR测试
在《孤岛惊魂5》的测试中,HDR 虽对性能有所影响,但不严重。
极限竞速7 HDR测试
《极限竞速7》的测试中,开启HDR后,GTX 1080 Ti与只有轻微影响的 RTX 显卡形成鲜明的对比。
HDR对这些游戏的影响各不相同。《战地1》和《惊魂5》展示了明亮的白色(至少在我们的户外基准场景中是这样),而《命运2》的入门场景在火与影的对比中表现得更为深刻。不管图灵处理HDR内容是否比Pascal好。都不要低估 HDR 在游戏中的体验差异(这也适用于Radeon的所有者)。
测试结果:奇点灰烬 & 战地1奇点灰烬:扩展版(DX12)
在《奇点灰烬:扩展版》的测试中我们尽可能的提高设置,最大化的压制显卡的性能,例如 4x MSAA 和几个终极级别的选项。虽然游戏支持多种图形api,但我们使用directx12作为基准测试。
▲在2560x1440的分辨率时,GeForce RTX 2080 Founders Edition 几乎完全不能与 GeForce GTX 1080 Ti 拉开差距 ,这并不好,因为 GTX 1080 Ti 的售价比它便宜100美元。
▲把分辨率提高到4K并没有任何帮助,甚至在这个游戏中,GTX 1080 Ti 比 GeForce RTX 2080 更快(尽管RTX 2080确实比它的前辈快了27%)。
战地1 (DX12)
▲《战地1》2560x1440的测试中两张基于图灵的RTX显卡都得到了巨大的提升,轻松超越了Titan V,GeForce RTX 2080 的速度比 GeForce GTX 1080 Ti 快19%,比其前身 GeForce GTX 1080 快 42%。
▲在4K分辨率中,更多的着色器和显存带宽使得 Titan V 在 GeForce RTX 2080 前面扳回一局。但 800 美元的 2080 Founders Edition卡仍比GeForce GTX 1080 Ti 领先20%,比 GTX 1080 领先 43%。
测试结果:命运2 & 毁灭战士
命运2(DX12)
▲《命运2》 在 2560x1440 分辨率测试中,尽管 RTX 2080 比 GTX 1080 快 33%,但考虑到价格后,与 GTX 1080 Ti 比较更加合适,就其本身而言,3%的优势不足以让你在新款RTX 2080上多花100美元。英伟达必须指望客户在这个价位上更重视光线追踪和DLSS等前瞻性功能。
▲来到4K,GeForce RTX 显卡起码比 GTX 1080 Ti领先 8%,两张RTX显卡与GTX 1080 Ti 都提供了可玩的帧率,但我们不建议在如此小的优势上花更多的钱。
毁灭战士(vulkan)
▲在2560x1440分辨率中,高端的显卡已经被200FPS的帧数限制所束缚,即使是开启了SMAA。
▲3840x2160分辨率时,GeForce RTX 2080 与 GTX 1080 Ti 之间的差距不大。RTX 2080 比前身 GeForce GTX 1080 快了37%,但英伟达创始人版的价格也高出70%。追求价值的人不会被打动。
测试结果:孤岛惊魂5 & 极限竞速7
孤岛惊魂5(DX11)
▲类似的情况也发生在2560x1440的《孤岛惊魂5》中,GeForce RTX 2080比GeForce GTX 1080 Ti快一点,但与溢价不对等。
▲即便在4K分辨率,GeForce RTX 2080也比GTX 1080 Ti快不到10%,但在RTX 2080 Founders Edition 上的花费要高出近15%。
极限竞速7(DX12)
▲两张 RTX 显卡在《极限竞速7》中都快到飞起,2080 平均帧率比 GeForce GTX 1080 Ti高28%,同时比 GeForce GTX 1080 高出40%。
▲与GTX 1080相比,40%的优势可以延续到3840x2160。不过,实际上,所有这些显卡都能以4K流畅的运行游戏。
测试结果:GTA5 & 地铁:最后的曙光
GTA5(DX11)
▲尽管年代久远,GTA5 仍然是 Steam 上最畅销的游戏。不幸的是,在我们的测试平台上,更强大的图形功能并不能像更快的CPU那样给游戏带来更多的好处。这次GeForce RTX 2080 落在GeForce GTX 1080 Ti 之后。
▲切换到4K分辨率并禁用4x MSAA 对消除图形瓶颈没啥帮助。RTX 2080 领先GeForce GTX 1080 Ti 2%,但价格高出24%,比网上最便宜的1080 贵了 70%。
地铁:最后的曙光
▲《地铁:最后的曙光》,分辨率 2560x1440 启用超级采样。结果是Radeon RX Vega 64、GeForce GTX 1080、GeForce GTX 1070 Ti、Radeon RX Vega 56 和 GeForce GTX 1070 的 FPS 平均值低于60。
另一方面RTX 2080 虽然没能与 GTX 1080 Ti 拉开差距,但至少能提供了可玩的帧率。
▲分辨率提高到4K时,又出现了另一个分水岭。GeForce GTX 1080 不够快无法胜任 3840x2160 的分辨率。虽然 GeForce RTX 2080可以,但 GeForce GTX 1080 Ti 则能以更低的价格实现4K。
测试结果:古墓丽影:崛起 & 全境封锁
古墓丽影:崛起(DX12)
▲很多显卡在2560x1440的《古墓丽影:崛起》中提供了很好的性能,即使 2x SSAA。GeForce RTX 2080达到了2080 Ti 平均帧的80% 与GeForce GTX 1080 Ti 基本持平。
▲GeForce RTX 2080和 GTX 1080 Ti 在 4K 测试中也不相上下,平均帧数都超过了60帧,但是在第99个百分位数的帧率却低于40帧。
全境封锁(DX12)
▲在 2560x1440 的《全境封锁》中图灵显卡被 Titan V 超越,而 GeForce RTX 2080 落在了 GeForce GTX 1080 Ti 后面。AMD的Radeon RX Vega 64 也变得重要起来,紧跟着 RTX 2080,平均速度为81 FPS。
▲使用超高的设置,在4K分辨率下玩游戏确实需要一张强大的显卡。根据我们的经验,如果您愿意接受中等质量的设置,GeForce RTX 1080 Ti 就足够了。不幸的是,GeForce RTX 2080 也需要同样的妥协。
测试结果:巫师3 & 幽灵行动:荒野
幽灵行动:荒野 (DX11)
《幽灵行动:荒野》中使用的是非常高的细节设置,而没有使用最高超预设选项,唯一原因是为了避免超预设的效果选项,在GeForce和Radeon 卡之间造成不公平的比较。
显然,在 2560x1440 分辨率如果你想把图形质量提升到更高的水平,RTX 2080 的性能是足够的,但仅仅领先于GTX 1080 Ti 4%并不是特别鼓舞人心。
▲平均54.1帧的速度,与我们认为的高质量4K流畅体验相差甚远,GTX 1080 Ti 则更低,你可以在GeForce RTX 2080 Ti 上挥霍一下,以获得 4K 的终极体验,也可以降低到 2560x1440 并保持华丽的视觉效果,或者调回到 4K 在质量设置上妥协以获得更好的帧率。当然,要掌握一个完美的平衡是比较难的。
巫师3(DX11)
▲在 2560x1440 的分辨率下,你不需要GeForce RTX 2080 或 2080 Ti 就可以享受超高质量预设。例如400美元的 GeForce GTX 1070 Ti 就能非常流畅的运行。
▲4K,《巫师3》虽然已经超过3岁,它任然是我们测试的游戏之中独特的一个,直到现在,我们认为GeForce GTX 1080 Ti 的 66 FPS足够流畅能有良好游戏体验。但这是少数几个在 GeForce RTX 2080 上值得多花100美元的情况之一。
魔兽世界:争霸艾泽拉斯(DX12)
▲《魔兽世界》是另一款从CPU升级中获益比800美元显卡更多的游戏,由于《争霸艾泽拉斯》在其定制引擎中增加了directx12的支持,我们决定使用4x MSAA 设置来测试游戏。
如果你已经在使用高端的 Pascal 显卡,图灵显卡不会因为分辨率更高而领先。GeForce RTX 2080 排在顶部这一点就证明,这个测试平台存在严重的其他的瓶颈(CPU)。
▲切换到 4K 并禁用 MSAA 对前五名的影响不大。GeForce RTX 2080 几乎与 Titan V 相当,比 GeForce GTX 1080 Ti 高出近4%。
功耗:GeForce RTX 2080 在我们的游戏负载中以及压力测试都是相同的~225W。顺便说一句,这正是英伟达在其规格中声称的显卡功率等级。
空闲测量值为 17W 相比上一代是一种倒退,后者在这种情况下使用的功率较少。再说一遍,GeForce GTX 1080/1080 Ti 显卡上没有NVLink控制器,即使处于闲置状态,NVLink控制器也可能增加5~6瓦的消耗。
这张 RTX 2080 的核心电压(VDDC)远低于我们从 GTX 1080 上观察到的电压,并随着温度的上升而降低。
主板 PCIe 的 12V 线路电流峰值为 4.3A,很好的控制在 5.5A 的限制之内,英伟达完美的平衡了设计方案,为发烧友们留下了充足超频空间。
上面的图片展示的是,空闲时的功耗,游戏负载的功耗,以及在压力测试中的功耗。下面的图片是相应负载中的电流数值。
温度 和 频率虽然我们不喜欢英伟达的新的散热方案,会把热量排到你的机箱里,但显然它有出色的表现。降频现象并没有上一代那样剧烈。而一个良好的散热意味着GPU可以运行在更高的速度。
此外,开放测试设置与封闭的情况之间的频率几乎没有任何差别。
超频Nvidia正在尽其最大的能力,尝试使用一个 API/DLL 包来尝试超频,像EVGA和MSI这样的合作伙伴可以将这些包构建到它们的实用程序中。NVIDIA 新的 Scanner 程序内带智能自动超频功能,能根据上一次超频失败的结果自动提高电压,再次尝试相同的频率,如此反复试错,直到电压到了最大值并遇到最后一次错误,那么根据之前稳定的结果,一个新的频率电压曲线就生成了。
这在实践中非常有效,尽管经过一个小时的手工调整,我们的结果还是低于我们的预期。如果您宁愿节省时间并允许这种一键式的超频,我们不会劝阻您;这项技术完成了英伟达所说的它应该做的事情。
使用EVGA的 Precision X1 测试版,我们的GeForce RTX 2080 在 NVIDIA 的新算法里达到稳定的 2025 MHz。对于这个“平淡”的结果,我们认为是GPU 的体质所致,而不是 Scanner 软件的错误。同时,我们的 GeForce RTX 2080 Ti 在开放式的测试中随着温度的提升最终稳定在1935 MHz(没有任何风扇曲线调整)。在一个封闭的情况下,它达到了1860MHz。
GeForce RTX 2080:温度和频率速率下面的图表记录了15分钟的温升情况,包括游戏负载与压力测试,值得注意的是:开放式的测试与封闭式的测试虽然有4°左右的温差,但它们之间的频率几乎没有变化。
▲温度与频率曲线(上方是游戏负载,下方是压力测试)
接下来,我们用红外热成像仪拍摄开放式以及封闭式环境在游戏负载以及压力测试时的温度。从这两个例子来看,温度的情况显而易见。但是,两个工作负载都没有发现什么不妥。NVIDIA 散热方案再一次展示很强的能力。
▲游戏负载时的温度 (上方是开放式测试,下方是封闭环境)
▲压力测试时的温度 (上方是开放式测试,下方是封闭环境)
NVIDIA新的散热方案:深度拆解
NVIDIA Founders Edition 显卡有两个8.5厘米风扇,每个风扇有13个叶片,以尽可能快、均匀地将热量从 TU104 输送出去。铝制的护罩如果不用蛮力就很难拆开(或者一种我们没有的特殊工具——在这一点上,蛮力看起来是更好的选择)
虽然看起来不像上一代的Founders Edition卡那么壮观,但 GeForce RTX 2080 的散热器是相当巨大的,去掉热垫(和硅脂),重量为935克。
下面的图片显示的是真空均热板(类似热管)的底部(背板以及PCB已被移除)。NVIDIA说,散热鳍片是直接焊接在均热板上的,所以很难将这两部分分开。
GeForce RTX 2080 安装板的底座与我们在 RTX 2080 Ti 上发现的不同,因为这两种卡都采用不同的布局。这解释了它们的轻微重量变化。其他的一切,从均热板到散热鳍片到风扇,都是一样的。
GeForce RTX 2080 的背板布局也是独一无二的。最明显的是,NVIDIA将热垫放置在不同的位置,对应于PCB顶部的元件。
风扇速度 & 噪音借助双风扇的散热方案 NVIDIA 可以自由定义一个保守的设定。当显卡持续运行一段时间后GPU的温度上升到68°时,风扇的速度明显的增加了,我们还看到,尽管无论处于何种环境它都能保持积极的频率,但是当 GPU 上升到目标温度时,风扇的速度明显会比开放式的环境更高。
即使有一个大而重的均热板的帮助,也没有“空间”让风扇的速度慢下来,因为转速是英伟达设定的。不过,另一方面,你可以把它们的转速调高,以获得更高的GPU boost 频率。但你真的想这样吗?
GeForce RTX 2080 Founders Edition 显卡在整个频带内都保持着低噪,风扇也安静得令人愉悦。在频谱分析中出现了一个与速度有关的峰值。在测量上它没有问题,实际上也是什么都听不到。
电压调节电路的背景噪声也可以在我们的图表展示了出来。然而,它又一次几乎消失在了声场中。测量输出略低于40分贝(A加权)是值得称赞的。英伟达无疑成功地制造出了一种在各方面都优于其前一代散热解决方案。
总结NVIDIA使我们很容易爱上GeForce RTX 2080 Ti,这是图灵显卡的旗舰型号,使用先进的TU 102 GPU,速度比前一代更快效率更高,搭配 11GB 的 GDDR6 显存,第一次在桌面平台上体验到超过600 GB/s 的显存带宽,一块巨大的均热板,尽可能安静地处理 260W 的热量。
NVIDIA在今天的“比赛”中达到了以往前所未有的成绩,GeForce RTX 2080 Ti 完全能够流畅的在 4K 分辨率和超高的质量设置下运行游戏。只有另外一个显卡可以与之媲美:强大的 Titan V。当然,1200美元是一大笔钱。但1200美元用于做一些以前不可能做到的事情,咬咬牙也是可以接受的。
现在,GeForce RTX 2080,Nvidia的第二快图灵卡的问题是,它只比 GeForce GTX 1080 Ti 快一点点。此外,NVIDIA 公司基于 Pascal 的旗舰产品,目前售价比 RTX 2080 Founder Edition 便宜约100美元。两张卡都不能在不妥协的前提下 流畅运行 4K 游戏。如果您想提高细节设置,它们都需要偶尔降到 2560x1440。事实上,更容易将它们视为高刷新 QHD 监视器的理想伙伴。
NVIDIA 试图通过将 RTX 2080 与 GeForce GTX 1080 进行更有利的比较。但是,最便宜的GTX 1080 与 GeForce RTX 2080 Founders Edition 之间的差价超过300美元。这就像一年前将GeForce GTX 1080 Ti 与 GTX 980 进行了比较;只是它们处于不同的级别。
请注意,我们讨论的不是光线追踪是否是作为购买 GeForce RTX 2080 或不购买 GTX 1080 Ti的理由。毫无疑问,图灵的新技术吸引着我们。如果第一款支持实时光线追踪的游戏让我们大失所望,我们会改变想法。所以,我们不会建议在目前为那些不能完全被利用的硬件支付额外的费用,而仅仅基于它将来应该能做什么。这是对的,因为 RTX 2080 的 RT 核心只有 RTX 2080 Ti 的三分之二,我们还不知道它的运行状态如何。
总有一天,基于 PASCAL 的 GeForce GTX 显卡会逐渐减少,从而消除了 GeForce GTX 1080 Ti 和 RTX 2080 之间的选择。到那时,我们希望在700美元的范围内买到 RTX 2080,用一个更有能力的继任者取代 GTX 1080 Ti。
不过,就目前而言 GeForce RTX 2080 感觉像是 GTX 1080 Ti 的候选,它更快,更昂贵,具有更大的潜力,但不是我们现在就要匆忙入手的东西。
PS:原文以及图片来自 tomshardware,翻译苦逼,给点鼓励哈,转载请注明出处。
,