G84 与 G86 这两款芯片的生存年代都不算长 (最主要的原因是阉割太多导致性能根本没竞争力),其中面向中阶市场的 G84 就是后来的 GeForce 8600 系列,有较高阶的 8600 GTS (675/1450/2000 MHz) 、降频后的 8600 GT (540/1188/1400 MHz,亦有采用 800 MHz DDR2 内存的版本) 以及仅供 OEM 出货用的 8600 GS (540/1180/800 MHz,搭配 DDR2 内存) 三个版本。

高通和nvidia(的首款统一渲染器架构)(1)

至于采用 G86 核心的显示适配器则是后来的 GeForce 8500、8400、8300 系列,是系列当中唯一可以制成半高卡的版本,型号有 8500 GT (450/900/800 MHz,128-bit DDR2 内存)、8400 GS (450/900/800 MHz,64-bit DDR2 内存) 与 8300 GS (450/900/800/64-bit DDR2 内存,只提供 OEM 出货用) 三款,值得注意的是,只有后两者没有支持 SLI 技术 (不过会有人想拿 8500 GT 来做 SLI 吗?)。

G84 与 G86 瑕疵,差点成为 NVIDIA 历来最大危机

如果照当时的销售情况与性能表现来说,G84 与 G86 应该是没办法给人们留下太多深刻印象的,不过这件事情却在 2008 年 G9x 核心推出一段时间,正好是搭载 G84 与 G86 芯片的计算机服役约一年之后有了转折。

在 2008 年许多计算机厂商 (特别是笔记本电脑的部分) 发现自家的产品返修率突然提高了许多,而且有很多案例的问题都是屏幕出现雪花纹、画面无法正常显示或是开机后没画面,后来在网络上有消息来源指出这些问题是由于 G84 与 G86 芯片所以用的黏着材料所具备的热膨胀系数与芯片的其他部位并不相同,在经过长时间使用受热之后就会逐渐发生芯片脱落甚至短路的情况,最终导致显示适配器完全失去作用,这问题在温度经常变化的笔记本电脑上会更明显且更易出现。

后来 NVIDIA 方面提列了两亿美元损失用于善后这次事件,而这次事件在后来也没有越演越烈,且在桌面计算机的部分 G84 与 G86 没有获得使用者太大的青睐而是以 OEM 出货为主,因此在各大计算机厂商更新 BIOS 修改风扇运作逻辑与召回维修之后,这个问题没有压垮 NVIDIA (其实当时还一度传出连 G9x 都有问题,NVIDIA 的股价跌了好几天,市值瞬间蒸发了很多)。

第 1.5 代 Tesla 架构-G9x 系列核心

之后又过了半年,在 2007 年秋天 NVIDIA 端出了代号 G92 的核心,昭告了 G9x 世代的开始,然而相较于 G80 来说,G9x 的改变其实并不算多,因此还不足以被称为第二代 Tesla 架构,更逞论被认为是下一世代的 GPU 架构了,但 G9x 世代绝对是重要的一代,理由很简单,因为这代超级长寿,被 NVIDIA 改过 N 次名字 (看看上面精美的系列编成),所以能见度也超级高。

架构只有小幅改变,自打脸的 TMU 设计

高通和nvidia(的首款统一渲染器架构)(2)

G9x 系列核心与上一代的 G8x 系列核心基本上主要的不同出现在内存控制器、 PCI Express 接口与制程三个部分,以系列当中规模最完整的 G92 来说,上图中的架构与 G80 的差异基本上只出现在内存控制器略有减少 (基本上这是为什么要叫 G92 而不叫 G90 的原因),内存带宽从 384-bit 降回 256-bit (为了降低成本,因为这跟内存颗粒芯片的数量需求有关系),从这里可以看出 G92 一开始推出的目的并不是为了取代 G80 (G92 在理论上性能不会比 G80 强太多,甚至在某些时候是落后的)。

高通和nvidia(的首款统一渲染器架构)(3)

不过比较特别的地方是出现在 TMU 的部分,还记得 NVIDIA 曾经信誓旦旦的说 G80 里面 TAU 与 TFU 的数量呈 1:2 是最有效率的比例吗?在 G92 当中 NVIDIA 就自己打脸自己给大家看了,实际上 G92 与较晚推出的 G84、G86 一样都是使用 1:1 对称的 TMU 结构。

第二代 PureVideo HD 与取消 NVIO 芯片设定

在 G84、G86 与 G92 当中,PureVideo HD 技术的功能有获得一些提升 (NVIDIA 其实常常这样,最高阶的核心反而缺掉这些额外功能,对,我就是在讲 GTX 980),包含了新的 BSP 引擎,可以进行 H.264、VC-1 与 MPEG-2 格式影片的硬件译码,并且在硬件上处理全部的 CAVLC 与 CABAC 译码操作。

高通和nvidia(的首款统一渲染器架构)(4)

上面这张图显示了从 GeForce 6 系列到 G70、G80、G84、G86、G92 历经三次变化的 PureVideo 技术,绿色方块表示该部分在当时仍然需要交给 CPU 处理,而无法由 GPU 全权负责,除此之外 G9x 也跟 G84、G86 一样,把 LVDS 与 RAMDAC 塞回 GPU 芯片里了,因此不再有 NVIO 系列芯片的存在 (嗯,NVIDIA 当年死不承认把 NVIO 拉出来的理由,一直说是为了方便未来有新接口的时候可以快速引入,现在又自打脸了)。

PCI Express 2.0 支援

硬要说的话这是 G9x 系列芯片在架构上唯一带来的新东西 (除此之外其实就像 G80 与 G84 加起来除以二的结果),透过将传输接口从 PCI Express 1.1a 升级到新的 PCI Express 2.0,带宽加倍之后可以有效缓解 GPU 性能越来越强但传输接口的带宽逐渐不敷使用的问题。

高通和nvidia(的首款统一渲染器架构)(5)

制程提升

G9x 系列核心的另一项重点就是制程提升,得益于 G9x 系列核心根本没有甚么太大的架构变革,加上市面上还有大量 G8x 系列核心产品、AMD 短期内还爬不起来等因素因此 NVIDIA 很放心的在 G92 上面使用了新的制程,一举从原本的 90/80 奈米制造工艺跳到新的 65 奈米制程。

G92 核心-历来最长寿的 NVIDIA 核心

看完 G9x 核心系列为数不多的改进之后,接下来是时候来看 NVIDIA 历来最为长寿的一款芯片了,这款芯片真的可以说是 NVIDIA 前无古人后无来者的传奇,到目前为止还没有任何一款产品能够在改名次数、横跨年代方面击败 G92。

高通和nvidia(的首款统一渲染器架构)(6)

G92 这款芯片是整个 G9x 核心家族当中规模最大、最为完整的一款,具有 8 组 TPC 与 128 个 SP,基本配置与 G80 一模一样 (除了内存控制器从六组被砍成四组之外),得益于采用了全新的 65 奈米制程,因此在晶体管数量又进一步成长到 7.54 亿个的状况下 (大部分应该是出自于补齐的 TMU 吧),芯片仍然比 G80 还要小上不少 (从 484 平方公分下降到 334 平方公分)。

高通和nvidia(的首款统一渲染器架构)(7)

为什么我要一直强调 G92 这款核心是传奇呢?这要从第一款采用 G92 核心的显示适配器开始说起,照理说从 G92 的命名来看这款产品应该是用于 GeForce 9 系列的东西,不过第一款基于 G92 的显示适配器其实是 GeForce 8800 GT,而且让人匪夷所思的是,这款产品的 TPC 数量居然是奇数的七组,连带的 SP 也就被删减为 112 个了,显然定位比 8800 GTX 还要来得低,更别提要上打 8800 Ultra 了 (而且当时 NVIDIA 并没有透漏实际上完整版 G92 有 8 组 TPC 的事实,8800 GT 只给七组其实是良率考虑下自主屏蔽的结果,所以推出的时候让很多人摸不着头绪)。

高通和nvidia(的首款统一渲染器架构)(8)

尽管推出时的奇怪规格让大家感到无言,但 GeForce 8800 GT 应该无庸置疑是截至当时为止最强大的单槽显示适配器 (很特别吧?),而且应该也是单槽显示适配器当中散热器看起来质感最高的 (整片钢琴黑烤漆还带银色厂徽贴纸耶,这通常是顶级卡才有的待遇 XD),后来在 2007 年底 NVIDIA 才推出完整具有 8 组 TPC 的 G92 核心,并且将其命名为 GeForce 8800 GTS (嗯,这名字用过了,不过 NVIDIA 不 Care 这件事情,导致当时买这款显示适配器之前都还要先问是 G80 还是 G92,虽然有经验的人可以从内存大小看出来就是了,因为内存控制器只有四组,所以容量是 512 MB 而不是过去的 640 MB 那种奇怪的数字,至于频率的部分则是 600/1500/1800 MHz),不过看到这里为止你应该会觉得 G92 实际的定位比 G80 低吧?这在之后的要介绍的 9800 GTX 会造成很诡异的现象 (9800 GTX 跑不赢 8800 Ultra)。

高通和nvidia(的首款统一渲染器架构)(9)

上面这张就是基于 G92 核心的 GeForce 8800 GTS「第二版」,由于多了一组 TPC 加上频率设定较高 (650/1625/1940 MHz),因此采用了双槽散热器,不过由于加厚且变圆所以看起来质感没有 8800 GT 好,在 2008 年初 NVIDIA 则又追加了一款较低阶的 8800 GS (550/1375/160 MHz),不过又更进一步阉掉一组 TPC 与一组内存控制器,所以 TPC 只剩下六组,也就是 96 个 SP,内存带宽也只剩下 192-bit。

高通和nvidia(的首款统一渲染器架构)(10)

至于 G92 上市时为什么没叫做 GeForce 9 系列呢?NVIDIA 的说法是当时他们还没准备好其他等级的 GeForce 9 系列显示适配器,所以就把 G92 归进 GeForce 8 系列里了 (这理由有人相信?),后来在针对中阶市场设计的 G94 核心 (稍后介绍) 上市之后,NVIDIA 才真正开始推出 GeForce 9 系列的产品,不过因为没端出新的东西 (仍然是 G92 的无限重生),这正式揭开了 NVIDIA 又一次「大改名时代」的序幕,不过 NVIDIA 可能也怕 9 系列的第一款旗舰直接端出改名产品有点没意思吧,所以第二款 GeForce 9 系列显示适配器是大有来头的 9800 GX2。

高通和nvidia(的首款统一渲染器架构)(11)

还记得我们之前曾经介绍过 7950 GX2 跟 7900 GX2 吗?9800 GX2 (600/1500/2000 MHz) 是 NVIDIA 的第三款单卡双芯片显示适配器,由两颗完整的 G92 核心组成,在很长的一段时间内我觉得 9800 GX2 是历来「外型看起来最有质感、看起来最有份量」的显示适配器,正反面都采用了钢琴烤漆,并且贴上了超大的烫银类金属厂徽当装饰,同时它也是 NVIDIA 后来习惯用散热器把整张卡包起来的始祖 (8800 GT 则是正面全包的始祖 XD),不过实际上这么设计是因为 9800 GX2 的两张 PCB 是采面对面的方式设计,因此从外面看来只有很复杂的电路与电容器而已,因此不得不用个外壳包起来以改进外观和做绝缘处理。

高通和nvidia(的首款统一渲染器架构)(12)

将 9800 GX2 拆开之后的画面其实真的还蛮壮观的,近几年来说很少看过这么复杂的电路板出现在计算机里面 (当今的主流平台主板上的零件密度都远低于这个)。

高通和nvidia(的首款统一渲染器架构)(13)

两颗 G92 核心之间就是靠着那条金色扁平电缆沟通的,之所以设计成这样,其实充满了巧思,如果你对 7950 GX2 的做法还有印象的话,当时 NVIDIA 将两张 PCB 使用相同的方向迭起来,这意味着第二张 PCB 的散热器必然会受到第一张 PCB 所发出热量的影响,而造成子卡的散热效果不彰,而且这种做法两张卡之间的联机所需要的线路势必得要更长,但对于这类双层显示适配器来说最脆弱、最容易出错却也最为关键的正是那条联机。

高通和nvidia(的首款统一渲染器架构)(14)

至于这两张卡之间的沟通则其实是由上面那张主卡 G92 核心的左下角那颗小芯片 (BR-04) 负责的,这颗芯片可以将 PCI Express 2.0 x16 通道拆分成两条供两个 G92 核心使用。

G92 开启的「大改名时代」

看完比较特别的 9800 GX2 之后,我们接下来就要开始回顾 NVIDIA 那些年改过名字的显示适配器到底有多少了,有了 9800 GX2,那理所当然要有单芯片的 9800 GTX 对吧?没错,的确是有,在 9800 GX2 上市一个月之后 NVIDIA 就宣布推出 9800 GTX 作为「新世代单芯片旗舰」了。

高通和nvidia(的首款统一渲染器架构)(15)

不过听到这消息之后第一个问题就是,9800 GX2 不是采用 G92 吗?9800 GTX 应该不会采用更高级的「G90」之类的东西来僭越自家旗舰吧?但继续用 G92 的话不是就跟 GeForce 8800 GTS 第二版一模一样了吗?

高通和nvidia(的首款统一渲染器架构)(16)

正当许多人觉得 NVIDIA 应该不至于这么做的时候,NVIDIA 用身体力行的方式告诉大家它是不会轻易放弃改名战法的,没错,9800 GTX 也是 G92,所以其实 9800 GTX 就只是 8800 GTS 第二版的超频版而已 (频率提高到 675/1688/2200 MHz),除此之外唯一的差别是新增对三路 SLI 的支援,更讽刺的是这张卡是在 2008 年 04 月 01 日上市的,也就是愚人节 XD。

高通和nvidia(的首款统一渲染器架构)(17)

而除了 9800 GTX 之外,NVIDIA 也一不做二不休把 8 系列当中曾经出现的阉割版 G92 也通通改名到 9 系列来了,举例来说阉掉 1 组 TPC,只剩下 112 个 SP 的 8800 GT 就变成 9800 GT (600/1500/1800 MHz)、更进一步阉掉两组 TPC,剩下 96 个 SP 的 8800 GS 就直接转生成 9600 GSO (550/1375/1600 MHz),不过不要以为就这样结束了,G92 的改名转生次数还多着呢。

G92 制程升级版:继续改名,一路改到挂!

在 2008 年 07 月,也就是 9800 GTX 上市三个月后,NVIDIA 为了进一步降低 G92 的生产成本,发布了新版本的 G92 (称为 G92b),在架构与内容上都与原本的 G92 完全一样,但是制程进一步提升到 55 奈米制造工艺,这使得 G92 的成本实质上与过去的中阶 GPU 来说已经没有太大的差距 (种下了之后 G92 可以继续玩改名的远因)。

高通和nvidia(的首款统一渲染器架构)(18)

第一款基于 G92b 的产品就是 9800GTX ,得益于进步的制程,NVIDIA 得以将这款 GPU 的运作频率进一步再拉高到 738/1836/2200 MHz,再次延续了老 G92 的生命,同时循往例有制程提升必然有良率不足导致阉割版的定律,推出了删减 1 组 TPC 的 9800 GT (被标成第二版 600/1500/1800 Mhz 或「绿色版 GE」550/1375/1800 MHz,后者核心电压略低)。

高通和nvidia(的首款统一渲染器架构)(19)

而 NVIDIA 的改名战法依然没有在此止步,而是继续往下一代的 GeForce 100 系列和 GeForce 200 系列推进,熟悉 NVIDIA 的人会知道 GeForce 100 系列本来就是改名出给 OEM 厂商的因此 GeForce GTS 150 实际上就是 9800GTX (连频率设定都一样) 并不让人意外,但 GeForce 200 系列的情况就让人无言了。

高通和nvidia(的首款统一渲染器架构)(20)

推出于 2009 年的 GeForce GTS 250 其实就是 GeForce 9800 GTX 的再改名版 (而且频率反而调降了,只剩 702/1512/2000 MHz),而 GeForce GTS 240 则是 9800 GT 的再改名版 (频率调高为 675/1620/2200 MHz),GTS 230 也有部分版本是基于 G92b (但是阉掉两组 TPC 的版本,500/1242/100 MHz,而且只能搭 DDR2 内存),这意味着 G92 从 2007 年出生,一路到 2009 年都还作为新型号推出,在市面上至少生存到 2011 年为止!

G94/G96/G98 核心架构

实际上 GeForce 9 系列的首发是 G94 核心,这应该是 NVIDIA 有史以来第一次进入新系列时是以中阶产品打头阵吧,针对中阶市场推出的 G94 核心其实本质上与 G92 很像,只是 TPC 的数量最多只有 4 组 (G92 的一半)。

高通和nvidia(的首款统一渲染器架构)(21)

至于 G96 则是更进一步砍到只剩下一组 TPC,因此 SP 的数量只剩下 32 个,G98 则是最为惨烈的版本,最多只有「半组 TPC」,TPC 当中只剩下一组 SM 的意思 (16 个 SP),最少则只剩下半组 SM (8 个 SP),内存控制器的部分理所当然砍到只剩下一组 (64-bit)。

基于 G98 的历代入门产品

高通和nvidia(的首款统一渲染器架构)(22)

由于 G94/G96/G98 的型号同样非常混乱且经历无数次改名,所以我打算从状况比较简单的 G98 开始讲起,作为第一代 Tesla 架构当中最低阶的核心,G98 与 G92 一样都是从 GeForce 8 系列就开始出现了,第一款产品是推出于 2007 年的 8300 GS (仅限 OEM 出货,只有 8 个 SP,450/900/800 MHz,DDR2 内存) 与 8400 GS 第二版 (只有 8 个 SP,567/1400/800 MHz,DDR2 内存,说起来第一版明明是有 16 个 SP 的 G86 呢)。

高通和nvidia(的首款统一渲染器架构)(23)

在进入 GeForce 9 系列之后 G98 被改名为 GeForce 9300 系列重新发售,分成频率为 540/1300/1000 MHz 的 9300 GE 与频率为 567/1400/1000 MHz 的 9300 GS,同样都采用 DDR2 内存,并且只有 8 个 SP。

高通和nvidia(的首款统一渲染器架构)(24)

G98 的最后一次登场则是在 GeForce 100 系列,最入门的 GeForce G 100 实际上就是 9300 GS 改名而来,仅针对 OEM 厂商发布。

基于 G96 的历代低阶产品

高通和nvidia(的首款统一渲染器架构)(25)

至于 G96 的部分,实际上性能跟 G98 差不了多少 (毕竟也是只剩下一组 TPC 了),因此主要仍然只见于低阶产品,是 G9x 系列核心当中衍伸型号最少的一种。

高通和nvidia(的首款统一渲染器架构)(26)

G96 在 9 系列时期 (2008 年) 被命名为 9500 GT (具备 32 个 SP,550/1400/1600 MHz) 与 9400 GT (具备 16 个 SP,550/1400/1600 MHz) 发售,并在后来推出了移转到 55 奈米制程的版本 (G96b),在市场中混和销售。

高通和nvidia(的首款统一渲染器架构)(27)

后来的唯一一款衍生型则是 2009 年发布的 GeForce GT 120,与其他 100 系列相同是仅供 OEM 厂商出货用的版本,是 9500 GT 的更名版本。

基于 G94 的历代中阶产品

高通和nvidia(的首款统一渲染器架构)(28)

G94 的架构基本上就是 G92 阉掉一半而来 (比较特别的是 G94 是 NVIDIA 少数封装的时候装斜 45 度角的芯片),因此在性能上还有做为中阶产品的实力,在这样的状况底下 G94 先后的改名次数其实跟 G92 已经相去不远了。

高通和nvidia(的首款统一渲染器架构)(29)

基于 G92 的首款产品-GeForce 9600 GT (650/1625/1800 MHz) 推出于 2008 年 02 月,实际上是 GeForce 9 系列的第一款产品,具备完整的四组 TPC (也就是 64 个 SP) 与 256-bit 的内存带宽,由于是第一款导入 65 奈米制造工艺的型号,因此后来有又阉割掉一组 TPC (9600 GSO 512 MB,650/1625/1800 MHz,剩下 48 个 SP) 与进一步阉掉一组内存控制器 (因此带宽剩下 192-bit) 的版本 (9600 GS,500/1250/1000 MHz)。

高通和nvidia(的首款统一渲染器架构)(30)

在上市几个月后与 G92 一样也推出了进一步升级到 55 奈米制程的版本-G94b,最初作为 9600 GSO 512 MB 第二版与 9600 GT 绿色版 GE (600/1500/1400 MHz) 推出,后来被改名为 GeForce 100 系列中的 GeForce GT 130 (类似 9600 GS) 与 GT 140 (类似 9600 GT),不过最特别且容易让人混淆的还是 GeForce 200 系列当中的 GT 230,同时有基于 G94b (48 个 SP,650/1625/1800 MHz,GDDR3 内存) 与 G92b (96 个 SP,500/1242/1000 MHz,DDR2 内存) 两个版本,幸好只供 OEM 出货,否则低阶入门市场铁定大乱。

,