对于高通2015年在高端SoC市场的表现,我想没有什么好掩饰的,虽然高通仍然在SoC研发行业居于领先地位,但它们的首款ARMv8 AArch64指令集SoC——骁龙810却远远达不到此前的预期,这可能是因为高通自家的芯片设计出了问题,当然,也有可能是因为受制于20nm平面工艺制程,最终骁龙810并没有释放出高主频Cortex-A57大核的真正实力,面对三星赌博跨越式发展拿出来的14nm FinFET芯片Exynos 7420,颜面上确实有些挂不住。
不过,以上都算是对于过往的追忆,已然是过去时。在现在这个时间点上,我们还是要放眼未来才好。高通对于自身的情况必然十分清楚,面对三星第二代14nm FinFET工艺更强劲的Exynos 8890处理器,高通也不敢轻敌,花大成本拿出来了全新的Kyro CPU架构、全新Adreno 530 GPU以及一系列新特性,目的自然是试图夺回昔日28nm工艺节点上像Krait CPU架构那样的绝对优势。
于是乎,我们看到高通今年对于宣传骁龙820显得格外卖力,不仅早早的就开始透露相关新特性,选择的场地规模也是空前绝后,就在上个月,高通正式发布了骁龙820处理器,对这颗2016年旗舰手机将搭载的顶级SoC的性能以及功耗进行了初步的展示,看上去十分美好。
不过,遗憾也是有的,高通骁龙820已经确定搭不上圣诞假期的顺风车,真正的量产要等到2016年一季度才能正式开始,消费者朋友们恐怕还要继续看一段时间的幻灯片。
好消息是,就在上个月的骁龙820发布会之后,高通向在场的软件开发商和媒体提供了骁龙820的MDP设备(Mobile Development Platform,移动开发平台),也就是高通自家生产的骁龙820开发机或原型机。这样,软件开发者们就可以提前着手针对骁龙820设计打造新的应用软件,比如画面更加逼真酷炫的游戏,媒体也可以借此一睹骁龙820在十分贴近最终软硬件形态设备上的实际表现。另外,提供MDP原型机,也是高通的一贯传统了,此前的骁龙800、805、810都是如此。嗯,不知道还有多少人记得去年骁龙810的那台4K分辨率原型机呢。好吧,既然已经拿到了骁龙820原型机,那么下面我们就跟随外媒AnandTech的视角一起来看看骁龙820的实际性能表现。
• 骁龙820 MDP/S原型机简介:首先来介绍一下这台高通骁龙820 MDP/S原型机,它已经囊括了除基带芯片在内的所有系统元素,配备一块6.2英寸的2560*1600分辨率屏幕、3GB LPDDR4内存(1804MHz,而不是常见的1555MHz)、64GB UFS内置存储、2100万像素后置摄像头、支持802.11ac WiFi网络连接、自带Sense ID超声波指纹识别模块,外观上虽然和市面上的零售机型有较大差距(基本上就是个平板电脑,最终放到轻薄的智能手机中时,功耗和散热问题仍然值得进一步关注),但配置上基本八九不离十了,2016年的旗舰机型差不多都会用这个配置。
值得一提的是,高通给的这台骁龙820 MDP/S仍然存在一些驱动上的问题,因此我们仍然未能完成SPEC CPU 2000部分性能测试,驱动完善之后,也会单独进行实测解析。
• 高通骁龙820详细架构参数回顾:至于骁龙820处理器本身,此前已经有过不少详尽的介绍,这里再简单回顾下,它在CPU部分采用了全新的Kyro架构四核心配置,其中两个高性能核心主频为2150MHz,另外两个低功耗核心主频为1593MHz,两个集群的架构都是相同的,只是配备了不同的缓存,在电压/主频调教上有所差异。
GPU部分,高通骁龙820搭载了Adreno 530,在它身上有一些目前我们只在桌面级PC设备中才能见到的元素,例如Adreno 530可以与CPU共享虚拟内存,这就使得OpenCL寄主程序与设备内核可以共享虚拟寻址空间,GPU与寄主程序间进行列表或树形结构数据传输时也会更加高效。另外,Adreno 530的底层架构支持Renderscript、OpenCL 2.0、OpenGL ES 3.1 AEP以及VulKan。
最后,虽然在此次测试中并不包含,但我们还是想说一下骁龙820的全新DSP模块,Hexagon 680,它与Hexagon Vector扩展(HVX)一起,具备了对于VR虚拟现实、增强现实、图像编辑、影像编辑、视觉计算等应用场景的处理能力,这就可以极大的分流CPU与GPU的负担,效能上会更加给力,骁龙820的HVX拥有1024位的向量数据寄存器,同时具备每条指令四通道的寻址能力,也就是说单个周期最高可达4096位,性能相当给力。
一、高通骁龙820 Kyro架构CPU性能实测
下面我们开始进入测试部分的核心,也就是对于骁龙820 Kyro架构CPU的测试。首先,从骁龙800、810以及820的CPU核心参数对比来看,Kyro与Krait架构看起来十分相似,整数运算单元和FP ALUs的数量也是完全一致,单从以上列表来看,我们猜测,高通此次的Kyro架构,很有可能就是基于Krait修改而来,不过,这只是我们的初步猜测,接下来的测试将会揭示两者间的具体差异。
除了上面所说的内容,CPU究竟有多少个处理单元组成,以及如何将任务负载分配给它们同样十分重要,这也就是为什么许多厂商都可以拿出类似的核心单元配置,但最终的IPC却完全不同的最大原因。这也正是ARM在Cortex-A72上所采用的思路,也就是说,骁龙820的Kyro其实并非前所未有、也并非意料之外。
▼下面来看看我们对于骁龙820缓存所做的延迟和分层结构测试,从实际结果来看,骁龙820的L1缓存与此前并没有太大差异,但L2缓存部分仍然成谜,因为目前我们的测试工具无法获取骁龙820单个Kyro集群的L2缓存数据,根据高通内部人士的透露,骁龙820的两个高性能Kyro核心拥有1MB L2二级缓存,其余的两个低功耗Kyro核心则只有512kb的L2缓存,这直接影响了两者之间的性能表现,但这只是透露的消息,仍然需要进一步的查证。
有一点非常令人惊讶,那就是骁龙820本身竟然没有L3三级缓存,最高一级就是L2,这也就是说骁龙820的两个Kyro核心集群以及CPU和GPU之间,都不会有任何的缓存回写操作,只是简单的一致性,L2缓存之外就是设备的主内存了。
从GeekBench 3的内存性能测试来看,骁龙820的内存带宽相比骁龙800/801和810都有大幅度的提升,尤其是流复制部分比骁龙810的两倍还要多,从其他测试结果来看,骁龙820明显的改进了与主内存之间延迟,看来高通这次是对内存控制器以及通用内存架构进行了明显的改进,更加接近内存控制器所能提供的最大理论带宽。
▼下面来看看骁龙820的SPECint2000性能测试,这里我们并没有适配Kyro的单独编译器,因此只能使用A57的来对骁龙820的原型机进行测试,因此数据上可能不是特别准确,但我们仍然在部分测试环节看到了52%的性能提升,不过要知道骁龙820在主频上相比810也更有优势,与主频更高的Exynos7420相比较时,这个优势就会回落到33%,总体而言,在SPECint 2000测试中,骁龙820相比810提升幅度大约在5-6%左右。
▼再来看看GeekBench 3测试,除了整数外,它也包含了更多的浮点类型测试。首先在整数测试环节,骁龙820的表现在不同项目中各有不同,比如AES中反而落后骁龙810约10%,但在SHA2中,却又大幅领先62%,所以你不能说Kyro比A57各方面都强,毕竟骁龙810的小核也有四个Cortex-A53,并不是完全的摆设而已。不过,对于日常绝大部分使用场景来说,单线程性能都要比多线程重要的多,使用体验上会感受的更加明显。
▼来到浮点测试环节,采用Kyro架构的骁龙820完全占了上风,总体大幅领先骁龙810(仅在曼德布洛特多线程运算中落后3%),这也意味着骁龙820现在可以更好的利用每一个执行单元参与计算。
• 网页性能测试
▼从架构角度对比过骁龙820和810之后,我们再来看看更多高水平的测试项目,和此前一样,同样是从网页浏览部分开始。
从测试结果来看,Google Chrome对于骁龙820 Kryo架构的优化几乎为零,高通也已经提前对此进行了告知,稍后Chrome也会对Kyro进行单独的优化。
其次,就高通骁龙820 MDP/S原型机本身自带的原生浏览器来看,它相比现有的Exynos7420和骁龙810提升巨大,绝对占据目前安卓阵营中的头把交椅,但相比苹果的A9 SoC还是有一定的差距。
• Basemark OS Ⅱ性能测试
再来看看Basemark OSⅡ测试,从总体得分来看,骁龙820相比现有的安卓设备领先幅度超过20%,尤其是在内存和图形方面优势巨大,但系统部分的分数仍然低于三星的最新设备。对比苹果iPhone6s Plus来看,骁龙820虽然在个别场景下有所领先,但总体仍然落后。
• PCMark性能测试
最后我们使用的测试软件为PCMark,骁龙820凭借更好的总体成绩再度摘得头名,单项测试中同样有所差异,例如由于Chrome等浏览器的优化不给力,网页浏览后面就被甩在了A57设备后面,视频播放能力稍微落后于搭载骁龙810的HTC One M9,文本编辑处理能力也没有超越三星的Galaxy S6。但在图像编辑方面,骁龙820的表现可谓一骑绝尘,大幅领先现有的设备,比第二位的小米Note Pro高出近34%。
二、高通骁龙820 Adreno 530 GPU测试
① 3DMark Ice Storm Unlimited测试:
在GPU测试环节,我们首先使用的是3DMark的Ice Storm Unlimited,总体得分受到了物理部分跑分的拖累,最终表现反而落后于现有的Exynos 7420和骁龙810,毕竟物理计算主要看CPU能力,四核心配置的Kyro还是输给了八核心的Exynos7420和骁龙810,如果单把图形(OpenGL ES 2.x)一项拿出来单看的话,骁龙820的表现绝对一骑绝尘,领先当前的所有安卓设备。
② GFXBench测试
再来看看更纯粹的GPU测试,骁龙820在GFXBench测试环节中表现出了巨大的优势,在曼哈顿ES 3.1、曼哈顿ES 3.0以及霸王龙测试场景下,骁龙820的原型机都表现出了52%或更高的优势,即便是面对目前最强的苹果A9上的Power VR GR7600,骁龙820的Adreno530也能胜出一筹,离屏性能明显更强,绝对堪称当前最强悍的GPU。只是在屏上环节,由于原型机的2K分辨率高出苹果1080P不少,因此才有所落后。
③ GFXBench混合测试:
奇怪的是,GFXBench混合测试并没有显示出同样的差距,就拿离屏ALU性能测试来看,骁龙820相比骁龙810的提升幅度仅有10%,这显然不是骁龙820所能提供的全部游戏能力。我们也一直怀疑骁龙810的Adreno 430也存在某种瓶颈,或许是ALU/纹理数组无法得到全部利用,如果真是这样的话,高通仅通过纠正该问题就可以在几乎不改变混合性能的前提下,大幅提升渲染能力。另外,我们也发现,骁龙820的驱动仍然存在一些问题,这可能与原型机这个早期设备有关。
总结
高烧不退的骁龙810已经注定成为史上最尴尬的一枚SoC,高通也在2015年里遭到了三星的全面压制,但是正因为有了这样的经历,大家才更期待高通在骁龙820身上能带来怎样的转变,换句话说,如何纠正自己的错误才是高通所面临的最大问题。
从此次的实际测试数据来看,高通显然又重新找回了自己的发展道路,在CPU以及GPU测试环节都有所改善,要知道的是,这还是在原型机、驱动不完善、软件未作优化的情况下测得的数据,后期还有不小的优化空间。性能提升固然值得称赞,但经历了骁龙810事件后,大家的关注点也都转向了每W性能或者说效能,毕竟实际设备不可能像现在的MDP/S原型机一样厚重,在有限的机身空间内,骁龙820的实际表现具体如何仍然值得关注,这里讨论原型机的发热情况也确实意义不大,要知道骁龙810的4K原型机也同样不存在发热问题,但是,实际的表现大家都懂的。
放眼整个行业来看,高通骁龙820在CPU方面依然将会面临来自ARM的Cortex A72以及三星M1的挑战,毕竟从原始性能来看,Kyro并没有将A72甩开很远,再加上华为麒麟950或是联发科Helio X20已经将其主频提升至2.3和2.5GHz的水平,因此高通骁龙820在CPU上要想胜过它们并不轻松。另一个值得关注的就是软件层面的优化程度,毕竟目前绝大多数软件都没有针对骁龙820做出专门的优化,骁龙820的功力究竟能在实际应用中发挥出几成也非常值得关注。GPU方面,骁龙820的Adreno530表现足够给力,甚至力压苹果A9的PowerVR GT7600,相信这一优势也会在最终的零售设备上得到展现。
• 感谢IT之家网友 樱花庄的白猫 投递新闻线索。
微信搜索“IT之家”关注抢6s大礼!下载IT之家客户端(戳这里)也可参与评论抽楼层大奖!
,