去年年底,高通在美国夏威夷举办了一年一度的骁龙技术峰会,峰会上最受瞩目的依然是新一代旗舰移动处理器骁龙855。据发布会上介绍,今年的骁龙855不仅仅在性能上有了大提高,还在即将来临的5G及AI方面着力发展,能给消费者带来更优秀的5G通讯及AI性能娱乐体验。
今年骁龙855在核心性能及配置上均有了大幅提高,那么骁龙855在性能跑分方面究竟有多么强大呢?现在就让我们跟随外媒Anandtech,一起来窥探这枚芯片的性能。
新的7nm骁龙855芯片组中,采用了四个新的Kryo 485 CPU基于ARM的新的Cortex A76核心,并且Kyro 485扩充了重排序缓冲区(CortexA76公版为128条目)、和优化了预取器和对分支数据结构进行了优化。
骁龙855的CPU集群虽然仍使用“4 4”的big.LITTLE配置,但实际上芯片中的大核是不相等的,采用了“1 3 4”的配置,大核心集群实际上为“1 3”设计,当中的一颗大核使用了最高频率可达2857MHz的设计,并为其配备了512KB L2缓存;剩余的3颗大核心的最高频率为2439MHz,配备256KB L2缓存。
另外,高通针对这个“1 3”大核心集群采用了异步时钟设计,但4颗核心仍然共享相同的电压平面。高通解释说这是一种在电源效率效益、实现复杂性和支持电力传递组件(增加额外电压平面会增加另一个带电感和电容器的PMIC导轨)之间的折衷。
骁龙855相比骁龙845有着高达45%的性能提升,如果要追溯到五年前的话,骁龙855的性能相当于在骁龙845 CPU性能的基础上,增加了一个骁龙800的CPU性能。
本次测试用的是高通最新的骁龙855 QRD平台(Qualcomm Reference Design,高通参考设计)。
骁龙855内存延迟问题明显
骁龙845上高通在缓存和内存之间增加了一级3MB系统缓存,该缓存位于内存控制器的前面,来作为一个新的缓存层次结构,主要是为处理器范围里各种IP块充当缓冲区,从而减少内存访问量来提高系统电源效率。
高通在骁龙845中引入这个IP模块是值得令人高兴的,但这是一把双刃剑,虽然可以减少内存访问量,但也会使得内存延迟增加了30%(与835相比),同时也会限制一定的处理器性能。但遗憾的是高通已经确认在新的骁龙855中,依然是使用了和骁龙845相同的IP模块。
从测试结果可以得出,骁龙855和845在2.8GHz的频率下,L2缓存延迟有改善的现象,两者的DSU系统缓存均为2MB,延迟现象也是基本一致,而麒麟980虽然有着4MB的系统缓存,但响应时间是要比前两者慢了20%。
在线性图上,可以更清楚地看到内存延迟的差异。骁龙855比845稍微提高了内存延迟,这很有可能是采用了频率更高的LPDDR4X 2133MHz内存,因为骁龙855比去年的845采用的1866MHz内存速度提高了14%。
如果和麒麟980相比的话,两者使用了相同的CPU微架构,同样频率的内存,但骁龙855的内存要明显高于麒麟980。
CPU性能及功耗
SPEC2006是一个重要的基准测试软件,它与其他测试软件的区别在于所处理的数据集更大更复杂,可充分展示微架构的更多细节,特别是在内存子系统性能方面。
另外,本次测试使用的是骁龙855 QRD平台,和日后上市的骁龙855手机性能表现会存在差异,本次测试结果仅供参考。
从结果可以看到,骁龙855的表现非常出色,基本与麒麟980相当。骁龙855的性能比起前作骁龙845提升了51%,能耗效率提升了39%;并且在SPECfp2006测试中,骁龙855相比骁龙845的性能更加是提升到了61%。
骁龙855与麒麟980相比,在SPECint2006测试中略微领先麒麟980 4%,在SPECfp2006测试中则领先9%。
骁龙855与麒麟980相比的话,一方面骁龙855的速度提高了9%,而且还承诺了一些微结构特性,这些特性带来了更大的L3缓存和内存延迟优势。
在绝大多数的工作负载中,两个芯片组是并驾齐驱的,只是在一些关键方面存在分歧。在内存层次结构要求较低的工作负载中,骁龙855更容易展示频率优势。在更敏感的延迟工作负载中,这种差异会缩小或逆转。
比如在462.libquantum测试项中,骁龙855领先麒麟980达31%,这不是单纯提高频率和缓存延迟低一点所能做到的,高通只是简单称这主要是因为其架构上的特殊改进,但没有告诉改进了哪里。
而在458.sjeng项目中,骁龙855的性能落后麒麟980大约13%;在429.mcf测试中(内存延迟敏感的测试项),骁龙855的表现又非常出色,这已经违背了骁龙855的内存延迟高于麒麟980的事实,莫非骁龙855有着更好的L3缓存延迟?
在447.dealII和453.povray这两项中,骁龙855的领先幅度达到了17%和22%;而在另一部分对内存敏感的项目中,骁龙855又被麒麟980追平。
总的来说,骁龙855的CPU性能并不令人失望。性能平均领先于麒麟980,虽然不是很多,并且这两个芯片组在大多数情况下是并驾齐驱的。
有着强劲的推理性能,但缺少张量API
骁龙855上还搭载了Hexagon 690的DSP,该DSP依然是来自Qualcomm的自主设计。Hexagon 690 DSP的标量性能是上代的1.2倍,向量拓展指令集的数量比上代翻番,变成了4个,而且还新加入了一个张量(tensor)加速器,主要用来进行AI及多维数学等神经网络的计算。
我已经询问了高通关于新的张量加速器,但高通不愿透露更多关于这个IP块性能的信息,并且高通在平台上公布了总共“7顶”计算能力,但却不愿意透露包括张量加速单元在内各部分的具体性能信息。
另外,张量加速单元目前的API支持情况却并不完善,高通还表示今年晚些时候才会将相关特性提供给NNAPI,目前只有公司内部的测试软件才能调用这个张量加速单元。这也意味着,我们有限的“AI”基准没有一个能够真正测试张量模块,因此大部分的测试结果仅仅Hexagon 690作为DSP在传统矢量管线方面的改进。
本使用的AI-Benchmark软件是由瑞士ETH苏黎世计算机视觉实验室的Andrey Ignatov开发的新基准测试程序,也是第一个广泛使用Android 8.1新NNAPI,而不是依赖每个SoC供应商自己的SDK工具和API,能够更准确地表示展现出使用NNAPI的应用程序的神经网络性能。
在CPU运行的第一组负载测试中,骁龙855的表现比较一般,因为属于短时间突发的工作负载,因此性能更受系统调度程序以及CPU达到其最大操作性能点所允许的速度的影响。
这项测试适用于大多数硬件加速设备的8位整数量化模型,结果显示骁龙855的性能均处于领先地位。在先锋基准项目中可以看到HVX单元的性能翻了一倍,骁龙855完成运算所用的时间不到骁龙845一半;而在卡通基准项目中,骁龙855的加速速度要快更多,与过去的芯片组相比,高通在这里的驱动程序可能有了显著的改进,并且能够更好地利用硬件。
在FP 16工作负载测试中,由于麒麟的NPU公开了对其硬件的支持,要比骁龙855表现出色。但高通在GPU上运行这些工作负载表现也是尚可,因为新平台的NNAPI功能更加成熟。
在FP 32工作负载中对骁龙855也有了明显的改进,终于能够充分利用GPU加速,这给新芯片组带来了相当大的领先优势。
总的来说,骁龙855可以在骁龙845的基础上提供2.5到3x倍的性能提升。
另外,高通还展示了运行InceptionV 3的内部基准测试,这是由HVX单元以及新的张量模块来进行共同加速的,推理性能达到148次/秒,与AIMark相同型号的手机相比,这个数字提高了26%。
系统性能测试
性能其实不仅取决于硬件,很大的程度上海取决于软件。在这里,CPU调度程序和系统API可能会对设备的性能体验产生很大影响。
在PCMark的Web浏览2.0测试中,骁龙855的表现并不是很理想。由于某种原因,骁龙855 QRD甚至无法与骁龙845的设备拉开优势。
骁龙855的视频编辑的分数也是相当平庸。
文字编辑测试中骁龙855 QRD恢复了应有的性能,性能表现和麒麟980相当。
在图片测试中,骁龙855 QRD表现还算抢眼,但却不及小米MIX 2S和一加6两款骁龙845机型。
在数据测试项目中,骁龙855性能依然是比较出众的,但却和麒麟980一起输给谷歌Pixel 3。
总体而言,在PCMark中骁龙855的结果有点令人失望,因为它似乎没有获得比Pixel 3更高的排名,而且搭载麒麟980的华为Mate 20岁也遥遥领先。
在其他基于Web的基准测试中,如Speedometer 2.0和WebXPRT 3中骁龙855相比骁龙845的性能提升其实只有不到20%,与麒麟980相比差距也比较明显。
性能调度测试
为了能够检测调度程序和DVFS机制,在骁龙855 QRD上快速运行了这个检测程序:
在测试中可以看到骁龙855 QRD从休眠状态到最大性能状态过程耗时为100Ms,表现中规中矩,而谷歌Pixel 3表现则最抢眼,完成整个过程仅需要30ms,三星S9 用时为135ms,采取的方式为一级一级提升频率。
其实和麒麟980相比,骁龙855的调度过程还不算慢,但主要问题是体现在骁龙855将负载从小核心迁移至大核心时会出现约3ms的停顿。
GPU与功耗
在GPU方面高通的宣传是比较保守的,称骁龙855比上代骁龙845性能要提高20%,但这就明显和其宣称新GPU的ALU规模增加50%明显不符,因为骁龙855用上了全新的7nm工艺,大部分人都会认为骁龙855的GPU性能会提升很多。
无论是在Aztec High还是Aztec Normal测试场景下,骁龙855的图形性能相比骁龙845提升幅度基本是达到了20%,但明显落后于苹果的A12。
但在能耗比测试中,骁龙855的表现则十分优秀,仅落后苹果A12些许,而且大幅度领先麒麟980。
T-Rex测试场景中,骁龙855的性能提升幅度比较有限,但由于T-Rex是比较旧的测试场景,因此参考价值不如曼哈顿3.1和Aztec Ruins Vulkan测试场景。
在能耗方面,骁龙855相比骁龙845提升了大约30%,由此可以看出骁龙855的性能提升虽然不是十分明显,但能耗比表现非常优秀。
总结
骁龙845在2018年里可以说是取得了相当不错的成绩,因为高通为各个手机厂商提供了一颗全面稳定且性能优异的旗舰芯片,也被各手机厂商广泛使用。
而看回2019年的骁龙855,CPU性能方面骁龙855在稳态工况下表现得非常好,可以看出高通对架构的优化是比较妥当的,但缓存/内存子系统仍然遗留着骁龙845中的延迟问题。
对于测试中骁龙855存在的异常表现,高通也表示会对其进行研究。希望今后高通能加大对这颗芯片的优化,因为在今年将会有一大批搭载骁龙855芯片的机型上市,至于其市场表现如何就会留到今年揭晓了。
注:本文数据及文字来源外媒Anandtech
,