北京时间8月31日晚上8:00,华为在德国IFA大展上,正式发布了全新一代旗舰芯片——麒麟980。

一周后的9月5日,麒麟980技术沟通会在上海召开。

相对于IFA的亮相,华为fellow艾伟对国内媒体进行了更加详细的介绍与讲解,我们也因此得知了更多关于麒麟980的技术细节。“Fellow”相当于华为研发领域序列最高的科学家,在华为8万名技术工程师中仅30余名,艾伟也是华为芯片业务——麒麟的产品规划负责人。

下面,就让我用尽可能通俗易懂的文字,将艾伟先生的专业解读“翻译”给大家。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(1)

首次商用TSMC 7nm制造工艺

只要稍微具备一定IT基础知识的人都知道,在半导体领域,先进的工艺就意味着更高的性能与更低的功耗。不过随着行业不断逼近摩尔定律的“极限”,想要驾驭更先进的工艺,势必需要芯片设计方与代工厂深度合作。

目前,手机所使用的芯片普遍采用了10nm制程工艺,而麒麟980则首次商用了领先的TSMC 7nm制造工艺。与10nm工艺相比,7nm工艺性能提升20%,能效提升40%,晶体管密度提升到1.6倍。

在制程工艺升级演进的同时,伴随而来的是对芯片设计的挑战升级,7nm芯片的设计难度大大增加。从芯片工艺上看,7nm相当于70个原子直径,逼近了硅基半导体工艺的物理极限,麒麟980需要克服复杂的半导体技术效应及晶体管本身的三维电阻电容带来的影响。

艾伟在随后的专访中透露,芯片行业都是应用一代、研发一代、预研一代的“滚动研发”模式,麒麟980的立项时间是2015年,共有1000多位高级半导体专家参与,进行了超过5000次的工程验证。对于外界称华为斥资3亿美元研发麒麟980的消息,艾伟称“芯片行业是一个投入巨大、风险巨大的投资”,并且按照行业规律,伴随每一代工艺的提升,对应的投入都要翻倍。华为对麒麟芯片的投入也是每隔2-3年投入就会翻倍增长的,而且伴随芯片创新,这种投入是一年比一年多,具体到麒麟980的投入并不好界定,但“投入远远超过3亿美元”。

这也就意味着,全球首款采用7nm芯片的麒麟980,是华为历史上投入最多、创新力度最大,同时也是成本最高,甚至是挑战最大的一代核心处理器。

艾伟称,麒麟980挑战最大的,是三年前就要准确判断7nm制程能不能在2018年10月这个时间点量产,如果最后产品准备好了,但芯片因7nm的技术问题未能量产,那么就会造成很大的产品事故。

一款芯片的设计周期看似长达三年,但其实工作节奏非常紧密。以麒麟980为例,2015年立项,历经了超过36个月的研发,2016年完成定制特殊基础单元构建高可靠性IP论证,进入SoC工程化验证已是2017年,再去掉早期芯片验证的时间,实际剩下的量产周期仅约半年左右,对于麒麟研发团队而言实际上只有两次机会,也就是只能允许一次投片修正,否则就会影响芯片的正常流片、量产和终端适配,造成产品延期上市甚至是项目失败。

为此,艾伟表示,“从芯片企业未来趋势来看,伴随创新难度加大、投入加大,成本和风险提升,这个行业的商业回报率越来越低,未来只有少数玩家可以留在牌桌上,‘余总之前预测全球手机品牌越来越少也是基于同样的原因推断’。”

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(2)

我们现在无时无刻不在使用手机,对操作的流畅性和APP响应的及时性也提出新的要求。为了应对这一挑战,麒麟980在首次实现了基于Cortex-A76的开发商用,全新设计Kirin CPU子系统及Flex-Scheduling智能调度机制,并首次商用Mali-G76 GPU,支持LPDDR4X颗粒,主频最高可达2133MHz。

华为公布了一些内存延迟和带宽数据:在GeekBench 4的测试中,麒麟980的延迟为138ns,骁龙845为176ns。

“2 2 4”三档能效架构

CPU方面,麒麟980首次实现基于Cortex-A76的开发商用,与上一代相比单核性能提升75%,能效提升58%。麒麟980还全新设计了Kirin CPU子系统,除了在CPU核心上针对终端业务进行了适配和优化外,对CPU调度算法、总线设计等细节均进行了深度设计,保证Kirin CPU子系统从SoC整体设计上,更大地发挥出性能和能效优势。

Kirin CPU子系统推出了Flex-Scheduling智能调度机制,设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构。相对于传统的大小核两档位设计,三档能效架构提供了更为精确的调度层次,让CPU在重载、中载、轻载场景下灵活适配,大大降低了CPU在实际综合业务场景下的功耗。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(3)

举个简单的例子,如果只是上班路上听听音乐,那么调用小核就搓搓有余。而晚上睡觉前躺着刷微博、购物等社交场景,大核也足以应对。但遇上玩游戏,特别是大型3D游戏,就必须启动超大核,甚至多核全开。灵活的调度策略可以在性能体验和功耗控制间找到最佳平衡。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(4)

全新Mali-G76 GPU,能效提升178%

在麒麟芯片的“传统弱项”GPU方面,麒麟980首次商用了Mali-G76 GPU,与上一代相比性能提升46%,能效提升178%。其AI调频调度技术,能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程中存在的性能瓶颈,及时进行调频调度。

尤其是在游戏场景下,使用AI调频调度技术预测游戏每帧负载,预测准确性相对于传统预测方法可以提升30%以上,有效提升了游戏平均帧率,大幅降低游戏抖动率,减少游戏卡顿,这对于手游用户来说至关重要。

而基于Mali-G76的麒麟980与GPU Turbo带来的新“软硬”系统级整合,图形效能终于可以对骁龙旗舰完成逆转超越。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(5)

从华为公布的数据来看,以3D手机游戏《NBA2K18》为例,麒麟980平均帧率接近60FPS,游戏整体体验超过业界同期水平。

艾伟表示:“今年10月16日首发搭载麒麟980处理器的华为Mate 20,将是年内能买到的性能最好的旗舰手机”。为什么有这样的自信?艾伟向我们透露:“余总在内部经常讲的一句话就是:‘没有足够的创新就不要做了’,每年手机产品线都有不少被余承东‘腰斩’的产品,对于麒麟来说,每年迭代的巨大投入之后,有没有足够的创新让产品线满意,让终端用户和市场满意,唯一衡量的标准就是销量与口碑。”

第四代自研ISP,拍照能力继续突破

作为手机日常使用的核心功能,拍照能力的提升一直是麒麟芯片关注的重点。麒麟980采用了全新升级的第四代自研ISP,像素吞吐率比上一代提升46%,能够分区域调节图像色彩与灰阶;与麒麟970相比,支持更多摄像头,适配多摄像头带来全新拍照体验。

此外,麒麟980还推出全新HDR色彩还原,能够分区域调节图像色彩,实现照片色彩与细节的平衡。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(6)

针对暗光拍摄场景,麒麟980采用全新Multi-pass多重降噪技术,精准降低夜景照片中的噪点,细节保留更加完整,夜拍效果更加通透清晰。同时,运动场景下大幅提升跟踪准确率,在拍摄运动中的人物时,人脸识别检测率提升至97.4%。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(7)

视频方面,麒麟980采用视频专用的Pipeline“处理流水线”技术提升视频清晰度,视频拍摄时延降低33%。稍显遗憾的是麒麟980的视频编码能力,仍然维持在4K@30fps的水平上,对于一款全新的SoC来说不够完美。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(8)

双核NPU,每分钟识别图像4500张

在双核NPU的移动端算力加持下,麒麟980能使人脸识别、物体识别、物体检测等AI场景,采用更高精度的深度网络,具备更佳的实时性。实现每分钟图像识别4500张,识别速度相比上一代提升120%;多人姿态估计实时帧率高达30 FPS,无论是表演节奏感极强的舞蹈,还是在镜头前快速跑步,都能够实时绘制出人体的关节和线条;强大的物体检测能力可以准确识别多种物体,并可以做到拍照预览的实时物体跟踪。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(9)

麒麟980还带来了“慧眼2.0”,在手机视觉入口提供了一个“感知、测量、认知、计算”的端到端完整解决方案,人工智能技术深度参与视觉处理的各个环节,通过后台基础算法的极大提升和流程优化,让用户明显感知到体验的大幅增强。

在AI能力上,麒麟980提供高精度人脸识别与肢体检测识别,结合自研ISP强大的图像处理算法,使得在暗光夜晚和白天高动态场景下,都能准确识别拍摄主体和运动对象,并且保持着每秒30帧实时跟踪运动主体。

此外,精细化的视频分割、主体抠图等能力,也极大丰富了小视频类应用的创作灵感。更为重要的是,华为对第三方APP开放上述能力,加上具备不间断执行各种AI任务的基础能力,构成了“慧眼2.0”的核心。

对于用户来说,可能最直观的感受主要有:麒麟980将原来物体识别能力,从轮廓,扩展到物体姿态和形状细节;实时图像处理,从图片升级为视频;实时图像智能分割能力,从粗略到精准。

艾伟接受采访时表示,华为希望将麒麟980的融合能力通过开放架构提供给更多开发者,包括Hi AI Foundation、Kirin AR DDK、Kirin Camera DDK等,将麒麟980的AI算子、人体骨架姿态预估及跟踪、前端物体识别和更好的成像能力等赋能开发者,建立更加丰富的AI生态。艾伟透露,在过去一年中,搭载麒麟970的华为AI智能手机全球出货量超过数千万台,这为AI开发者奠定了非常好的基础,希望Mate 20发布会后,会有开发者站出来,推出一个属于自己的“吓死人的创新应用”。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(10)

麒麟980支持Caffe、Tensorflow、Tensorflow Lite等主流框架,具有强大的深度学习框架兼容性;提供了离线编译、在线编译、8bit量化等一系列完整工具链,既可以大大降低端侧模型部署的工程难度,也能利用NPU差异化优势发挥出最强算力; 支持CPU、GPU、NPU、DSP等的异构计算,方便深度学习算法在麒麟980的自动灵活调度执行。

伪基站识别技术覆盖2G至4G网络

在华为的传统强项通信方面,麒麟980率先支持LTECat.21,支持业界最快的下行1.4Gbps速率,更灵活的应对全球不同运营商的频段组合,为用户提供在不同的运营商网络下的高速体验。

华为还宣布麒麟980与5G芯片Balong 5000相结合,提供5G手机解决方案。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(11)

实时在线类应用尤其在线大型游戏,对移动通信网络的信号强弱的感知非常敏感,海思半导体团队深度挖掘高铁、地铁、高速公路、密集商业区等全场景下影响游戏体验的通信问题,100多位深度游戏玩家,在全球50个重点城市,测试30000多小时,找到了移动通信下的游戏体验的问题所在,并进行了专项优化,有效降低了游戏时延,减少了游戏卡顿,移动网络下的游戏表现更稳定。

此外,麒麟980配套使用的手机WiFi芯片Hi1103,率先支持160MHz带宽,理论峰值下载速率可达1.7Gbps,是业界同期水平的1.7倍。同时,Hi1103支持业界领先的L1 L5双频GPS超精准定位,L5频段下定位精度提升10倍,有效改善手机定位精准度。

当前,伪基站攻击方式出现了新升级,不仅可通过短信嗅探、监听用户的正常通信,还可以充当用户和真实基站之间的“中间人”,将用户信息通过伪终端传递给真实基站,让用户在不知情的情况下,遭受信息安全的威胁,甚至带来财产损失。

麒麟980在用户通信联接安全上下足了功夫,针对新出现的伪基站攻击方式,进一步在芯片层面增加了安全机制,全面升级了识别2G伪基站的技术,同时率先支持识别4G伪基站,提升用户在移动通信网络下的安全能力,大大降低了受诈骗的概率。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(12)

10月16日Mate系列将全球首发

过去十年间,华为研发累积投入达3940亿元,仅2017年研发投入就达896亿元,占比公司营收的14.9%,超过苹果,位列全球研发投入排名第六位。目前,华为员工有18万名,其中8万名都是研发人员。2017年向欧盟申请专利高达2398项,位列全球第一。

麒麟芯片就是这种坚持重技术投入的典型收获。坚定的使用自家芯片,倒逼麒麟芯片业务坚持瞄准世界一流技术,超前规划,才有了今天在华为手机在发布节奏、产品规划、AI创新上的步步领先。这些成绩背后,是华为长达27年的芯片巨额投入,三代华为人为此坚守与奋斗。

此次麒麟980的发布,无疑是华为多年投入与积累的又一次开花结果,要知道,台积电的7nm工艺也将成为苹果A12和高通骁龙855的选择。其中,骁龙855的亮相至少要等到年底,首发机型上市则要到2019春季。也就是说,从Mate 20发布到2019春季,麒麟980将是Android阵营唯一的7nm SoC。

昨天,华为举办的“华为P20系列手机创作的影像艺术展”上(点击查看详情),官方再次强调,首款搭载麒麟980芯片的手机就是10月16日即将发布的华为全新旗舰Mate20系列,届时我们也会第一时间为大家带来详细报道,敬请关注。

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(13)

华为980和骁龙845的gpu谁更好 华为麒麟980技术解读(14)

点击下方阅读原文,关注电脑报新媒体矩阵更多精彩

,