在文章开始之前,先跟大家说点题外话:正在看这篇文章的您听说过“全球超级计算大会”么?全球超级计算大会(英文全称Supercomputing Conference,简称SC)由IEEE计算机学会(IEEE Computer Society)、美国计算机协会(Association for Computing Machinery,ACM)联合主办,探讨全球IT科技领域在高性能计算、网络、存储及分析方面的最新技术、产品和发展趋势。该盛会每年举办一次,每次都有几百家来自世界各地的企业、大学、超算中心、HPC研究机构和协会参展。

amdapu和intel超线程区别(超算的核心长啥样)(1)

蓝宝石 FirePro S10000产品综述|图片(3)|参数|报价|点评(27)本地参考底价 26600.00元

  为什么提到SC?因为在SC上参展的超级计算机大部分使用的是GPU进行运算。在GPU加速领域上,AMD、Intel以及NVIDIA的竞争越来越激烈,这三方每年都推出其超算领域的新产品,来提高并行加速计算的效果。根据趋势来看,采用GPU并行加速计算的超级计算机是逐年增多,在2010年还不足10台,目前已经有近百台超算采用GPU并行加速。

amdapu和intel超线程区别(超算的核心长啥样)(2)

DRC Computer在SC 2015展览会的Demo

大家都知道,GPU(图形处理器)对于我们普通用户来说,主要的作用是三维图像和特效处理功能。然而GPU不仅可以应用在3D图形处理方面,其还可以进行高密度运算,称为GPU通用计算。GPU通用计算就是利用GPU来进行通用科学与工程计算。由于GPU天生的架构和多核优势,其在浮点运算、并行计算等部分计算方面可以提供数十倍乃至于上百倍于CPU的性能,这也就是为何超算越来越多的采用GPU的原因。

amdapu和intel超线程区别(超算的核心长啥样)(3)

拥有48000个Xeon Phi协处理器的天河二号超级计算机

说到用在超算领域的GPU,NVIDIA的超算卡叫做Tesla,AMD的超算卡为FirePro S,Intel则为Xeon Phi协处理器。这三种GPU各有各的特点,超级计算器的制造者在选择上也是“萝卜青菜各有所爱”。例如美国的Titan采用NVIDIA的GPU,戴尔的Stampede采用的是英特尔Xeon Phi,我国的天河一号采用的是AMD的GPU。

amdapu和intel超线程区别(超算的核心长啥样)(4)

AMD FirePro S10000超算卡

今天我们要测试的正是来自AMD的超算卡,采用28nm Tahiti架构双芯设计的蓝宝石 PGS AMD FirePro S10000。这块卡于SC 2012上发布,是目前AMD最强的双芯超算卡,专为高性能计算和图形密集型应用、虚拟桌面基础设施(VDI)和工作站图形应用而设计,能胜任计算密集型应用程序,帮助科研人员和工程师更快地取得结果。该卡虽然已经上市有三年多了,但其具备的1.48TFLOPS的双精度峰值浮点性能即使在现在也是出类拔萃。

amdapu和intel超线程区别(超算的核心长啥样)(5)

蓝宝石 PGS AMD FirePro S10000*2

一张卡的运算性能已经如此恐怖,那么两张卡呢?我们这次将对景丰生产的一个超算工作站主机进行一系列运算测试,该机搭载了两块蓝宝石 PGS AMD FirePro S10000超算卡,让我们看看理论单精度11.82TFLOPS,双精度2.96TFLOPS的工作站有着怎样的运算实力。

FirePro S10000详细规格介绍

蓝宝石 PGS AMD FirePro S10000的图形核心基于28nm工艺打造,使用2个Tahiti GL-Pro核心,是首款AMD的双核心超强专业显卡。其拥有6GB GDDR5的高规格显存,显存位宽为384bit,带宽高达480GB/s。其单精度浮点运算可达5.91TFLOPS,双精度可达1.48TFLOPS,是目前罕见的双精度超越1T的超强运算显卡。

amdapu和intel超线程区别(超算的核心长啥样)(6)

蓝宝石 PGS AMD FirePro S10000

蓝宝石 PGS AMD FirePro S10000采用GCN架构,拥有3584个流处理器,核心频率为950MHz,等效显存频率5000MHz,并支持专业应用不可或缺的ECC。该卡采用双8pin辅助供电,TDP设计为375w,每瓦特双精度3.94GFLOPS。

amdapu和intel超线程区别(超算的核心长啥样)(7)

蓝宝石 PGS AMD FirePro S10000

蓝宝石 PGS AMD FirePro S10000支持AMD PowerTune和ZeroCore Power能源管理技术,允许动态引擎频率管理及动态电源管理,并且搭配4个Mini DisplayPort接口和1个DVI接口,扩展能力优秀。支持全新的DirectGMA技术,让各类SDI I/O产品能直接与显示适配器进行传送数据,提供超低延迟的GPU加速运算。

amdapu和intel超线程区别(超算的核心长啥样)(8)

蓝宝石 PGS AMD FirePro S10000

凭借AMD GCN架构,蓝宝石 PGS AMD FirePro S10000提供的OpenCL优化驱动程序可以为大量超算应用提供性价比极高的体验。相比于曾经世界上最强悍的拥有9000多颗处理器的超算机“ASCI Red”,FirePro S10000显卡的单精度浮点性能已达到ASCI Red的2.47倍之多,堪称性能巨兽。

测试平台硬件环境一览

本次显卡性能测试平台采用由景丰公司生产的KF-S610S100B塔式超算服务器,主机详细硬件规格如下表所示:

测 试 平 台 软 硬 件 配 置
核心配件
CPUIntel至强E3-1231V3
主板永擎C226 WS
核芯显卡
内存金士顿8GB DDR3-1866 x4
硬盘金士顿SV300S37A
电源景丰1200w
系统及驱动程序
操作系统Microsoft Windows 7
主板驱动Intel芯片组驱动
显卡驱动AMD Catalyst Pro(15.201.2401 WHQL)
DirectX环境DirectX 11

amdapu和intel超线程区别(超算的核心长啥样)(9)

测试用主机:KF-S610S100B塔式超算服务器

amdapu和intel超线程区别(超算的核心长啥样)(10)

内部结构一览

测试平台软件环境一览

为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。

测 试 平 台 软 件 环 境
操作系统Microsoft Windows 7 旗舰版
(64bit / 版本号:7600)
主板芯片组驱动Intel Chipset Device Software
(WHQL / 版本号:9.2.3.1022)
显卡驱动 AMD Catalyst Pro
(版本号:15.201.2401 WHQL)
桌面环境Microsoft Windows 7 旗舰版
(2560×1600 / 32bit / 60Hz)

产品:FirePro S10000 蓝宝石 显卡

4S10000的Sandra 2015 GPU运算性能测试

S10000的Sandra 2015 GPU运算性能测试

Sisoftware Sandra是一款可以全面考察工作站整体性能的软件,拥有超过30种以上的分析与测试模组,特别是针对处理器、内存、显卡、硬盘等核心硬件,包含有多个细分测试项目;此次测试我们主要考察S10000的性能,故只进行GPU项目的测试,首先是GPU运算性能测试:

amdapu和intel超线程区别(超算的核心长啥样)(11)

GPU运算性能测试结果

定位旗舰级的蓝宝石 PGS AMD FirePro S10000超算卡的双卡平台浮点着色性能达到恐怖的11581.01百万像素/秒,居然达到了五位数,性能堪称恐怖;而平台的双精度着色性能则为3434.95百万像素/秒,是对手家的超算卡的双精度运算性能的几倍,S10000当之无愧是目前AMD所有专业卡中计算性能最强,更是所有专业卡中双精度计算能力最强的超算卡。

S10000的Sandra 2015 GPU加密解密性能测试

接下来是有关蓝宝石 PGS AMD FirePro S10000的加密解密性能测试,我们把解密项目设置为高安全性,高安全性使用的是AES256 SHA-2-256加密方式来测试其性能,测试结果如下:

amdapu和intel超线程区别(超算的核心长啥样)(12)

GPU加密/解密性能测试结果

通过测试结果我们可以看出,蓝宝石 PGS AMD FirePro S10000超算卡双卡平台的密码学带宽为110.25GB/s,加密带宽/解密带宽(AES256-ECB)为97.83GB/s,散列带宽(SHA2-256)为124.24GB/s。如此强大的加密/解密能力让该卡在面对高密度运算时也能得心应手,在大数据的计算与处理方面,其表现让人无可挑剔。

S10000的LuxMark通用计算性能测试

LuxMark考验的是显卡的OpenCL运算能力,测试时使用GPU-Only模式,单纯考验显卡GPU的性能。首先将测试环境设置为Sala(Medium Benchmark:488K triangles),以下是蓝宝石 PGS AMD FirePro S10000在该项测试中的表现:

amdapu和intel超线程区别(超算的核心长啥样)(13)

LuxMark Sala测试结果

通过测试结果可以看出,蓝宝石 PGS AMD FirePro S10000双卡平台的OpenCL计算能力是十分强大的,在该项目中获得了8560分的成绩,性能十分强悍。接下来看一看在更高运算要求的Room(Complex Benchmark:2016K triangles)选项下蓝宝石 PGS AMD FirePro S10000双卡平台的成绩:

amdapu和intel超线程区别(超算的核心长啥样)(14)

LuxMark Room测试结果

在Room项目中,蓝宝石 PGS AMD FirePro S10000双卡平台获得了4453分的成绩,极高的分数证明了其不俗的Open CL运算能力。通过LuxMark的测试成绩可以看到为什么S10000在实际应用中如此强大,因为这些实际应用软件都已经加入了OpenCL的支持,而这恰恰是单卡双精度运算高达1.48TFlops的S10000的制胜利器。

S10000的GPC Benchmark OCL测试

通用计算测试程序GPC BenchMark OCL是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。与目前流行的一些OpenCL、Direct Compute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。而该软件集合了高性能计算领域多种常见的基础算法和应用,能比较全面地评估GPU及其它OpenCL计算设备在通用计算应用中的性能。

amdapu和intel超线程区别(超算的核心长啥样)(15)

GPC Benchmark OCL

在GPC BenchMark OCL中,所有测试都会在CPU和GPU运行并给出性能结果,接下来就让我们看看Intel 至强 E3 1231V3和蓝宝石 PGS AMD FirePro S10000在GPC Benchmark OCL中的得分:

amdapu和intel超线程区别(超算的核心长啥样)(16)

GPC Benchmark OCL测试结果

通过结果我们可以看出,在通用计算领域,CPU完全不是GPU的对手。至强E3 1231V3作为一款高主频服务器CPU,其强大的性能毋庸置疑,但在蓝宝石 PGS AMD FirePro S10000面前则完全不能与之相提并论,E3 1231V3的最终得分为345.2分,而S10000双卡平台则拿到了29030.8的分数,是前者得分的84倍!

S10000的HashCat解密性能测试

HashCat使用GPU超强的运算能力来暴力破解密码,支持的哈希(hash)编码种类达到一百五十多种,随着软件不断更新将支持更多的哈希编码类型。HashCat系列软件在硬件上支持使用CPU、AMD GPU以及NVIDIA GPU来进行密码破解,提供了Windows、Linux平台的版本,而驱动方面仅需要安装官方指定版本之外提出的显卡驱动程序即可。本次测试中使用的为oclHashCat 2.01,来测试蓝宝石 PGS AMD FirePro S10000双卡平台在解密方面的性能。

amdapu和intel超线程区别(超算的核心长啥样)(17)

oclHashCat使用界面

amdapu和intel超线程区别(超算的核心长啥样)(18)

oclHashCat测试结果

凭借着4枚GPU的高密度配置,蓝宝石 PGS AMD FirePro S10000破解9位密码仅用了5分多钟,而破解10位密码则是花了半天的时间,速度也是很惊人的。作为对比,普通高档民用主机想要破解一个9位密码可能需要几十小时甚至几天的时间,由此可见蓝宝石 PGS AMD FirePro S10000超算卡运算效率之高。

FirePro S10000测试总结

“专业的事交给专业的去做”,这句话是对蓝宝石 PGS AMD FirePro S10000这块实力强大的超算卡最好的形容。5.91TFLOPS的单精度浮点运算性能和1.48TFLOPS的双精度浮点运算性能是这块卡强大运算实力的保证。无论是在通用计算性能测试还是在加密解密测试中,蓝宝石 PGS AMD FirePro S10000都表现得十分出色,交出了一份令人满意的答卷,体现了其在超算领域的强大竞争力。

amdapu和intel超线程区别(超算的核心长啥样)(19)

蓝宝石 PGS AMD FirePro S10000

随着网络时代的高速发展,信息技术的不断创新以及计算器应用的普及以及深化,物理、化学、生物、医学等领域对高性能计算器的依赖正逐渐加深。而蓝宝石 PGS AMD FirePro S10000正是为满足各领域对于大规模数据的分析与处理的需求而诞生的。无论是模拟运算、密码破解乃至大数据分析,该卡都能很好地胜任。

amdapu和intel超线程区别(超算的核心长啥样)(20)

蓝宝石 PGS AMD FirePro S10000

除了在运算实力上的突出优势,许多AMD独特的技术也赋予到这块高端显卡中。RapidFire技术,提供超低延迟的GPU加速运算。AMDPowerTune能源管理技术,允许动态引擎频率管理及动态电源管理。诸多先进的技术大大提升了显卡的品质和用途,而且被动式散热设计是针对耗电强大的专业服务器和专业运算设备最为适当且优异的选择。

amdapu和intel超线程区别(超算的核心长啥样)(21)

蓝宝石 PGS AMD FirePro S10000

蓝宝石 PGS AMD FirePro S10000专为大型数据中心而设计,为IT管理人员提供出色的解决方案,显卡出色的高密度超级计算能力和杰出性能表现力能够降低整体的运营成本并节约处理信息所时间。专业化的设计能够满足独特的系统应用,提高资产的利用率,并且在相同的资源消耗下提供最大的处理能力。

amdapu和intel超线程区别(超算的核心长啥样)(22)

蓝宝石 PGS AMD FirePro S10000

领先的虚拟化技术,使得蓝宝石 PGS AMD FirePro S10000可以支持大量的并发用户计算会议等一系列最新虚拟化技术,满足当下大型数据中心对于虚拟化技术的多项要求。出色的高密度计算能力体现了蓝宝石 PGS AMD FirePro S10000专业显卡专为严苛需求而设计的不俗品质,是大型数据中心和IT管理人员的首选。

,