华为说这个技术还真吓人。为什么呢?

我们知道,GPU 英文全称"Graphic Processing Unit",即"图形处理器"。

gpu用到解密技术了吗(吓人的技术GPU到底是什么鬼)(1)

若你现在还以为GPU只是一个图形处理器,你就OUT了。

一般而言,CPU 擅长处理不规则数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序,这类程序任务拥有复杂的指令调度、循环、分支、逻辑判断以及执行等步骤。

GPU 擅长处理规则数据结构和可预测存取模式,特别适合那些超大规模的并行密集运算多线程程序。而异构计算的理念就是同时结合CPU 和GPU 的运算能力,让它们能够各展所长,从而兼具两者的优势,实现协同计算、彼此加速的。

gpu用到解密技术了吗(吓人的技术GPU到底是什么鬼)(2)

要研究一个东西,就要先研究它的历史。

那么,首先让我们来看看GPU的历史吧。。。

一 GPU的历史

但是,CUDA有一个非常大的缺陷就是。。。只能在NVIDIA的GPU上使用,你说郁闷不。

2007 年12 月,AMD 在Brook 的基础上推出了Fire Stream 通用计算开发工具,而CTM 改称CAL。可是,AMD突然又放弃Brook ,转而采用OpenCL(Open Computing Language)作为新的GPU计算开发语言。

2008年,NVIDIA推出了改进版GT200架构,进一步提升了性能和编程效率。与G80相比,GT200并没有实质性的变化,只是增加了晶体管,并改进了合并访问要求。2010年,NVIDIA推出了全新设计的Fermi架构,Fermi是依据高性能计算用户的要求全新设计的,提供了很多科学计算迫切需要的特性,如浮点原子函数、双精度支持、IEEE-754(2008)浮点标准等。

从GTX200到HD4870系列开始,AMD和NVIDIA两大厂商都开始提供对双精度运算的支持,这正是不少应用领域的科学计算都需要的。

2011 年,AMD 推出了其APU 架构,通过在同一芯片上集成CPU 和GPU,APU 能够提供极高的CPU 和GPU 之间的数据传输速度。但是目前AMD 还不能集成高性能的CPU 和GPU,因此其计算能力并不太高。

2012 年,AMD 推出了其新的GPU 架构GCN,GCN 吸取了NVIDIA GPU 的成功经验,放弃了VLIW,转而采用标量运算。其旗舰产品HD7970 性能大幅提升。

2012 年3 月,NVIDIA 推出了Fermi 的改进架构Kepler。Kepler 极大地降低了能耗,而在编程上面,相比Fermi,有许多大的增强,如动态并行、更快的原子操作、内核可以给自己分配计算任务、分离编译等。

2013 年,AMD 升级了其GCN 架构,推出了GCN 1. 1。相比GCN,GCN 1. 1 可集成更多核心,效率也更高。2014 年,NVIDIA 推出了Kepler 的升级版Maxwell,Maxwell 提升了核心的计算效率,降低了指令延迟。

二 GPU在显示上的能力

GPU Turbo还能够帮助实现HDR的游戏效果,有效地增强画面细节,提升画质。

为什么说HDR能提高画质?HDR到底是什么鬼?

玩摄影或图像视频处理的都知道。HDR就是高动态范围。

gpu用到解密技术了吗(吓人的技术GPU到底是什么鬼)(3)

​​

大家一定听过微软的体感游戏机XBOX ONE X吧?

6 Teraflop GPU可呈现更多细节,更顺畅地显示动画,让4K环境和角色更显逼真,前所未见。

XBOX ONE X对电视显示的要求是比较高的。

电视需要支持4K ULTRA HD,HDR。

HDR,全称High-Dynamic Range,是目前影像届火爆的标准,可以让你的显示画质提高到一个全新的层次,对比度更强大,光线处理更鲜明,更加真实感,现场临场感更强。

说白了就是明暗差别。能分辨的明暗层级越多,层次越多,图像越清晰。

你对比带HDR和不带HDR的图像就知道了。

GPU Turbo是一种软硬协同的图形处理加速技术,恰恰就起到了大幅提升手机性能但又有效平衡功耗的作用。它不仅打破了软硬件边界,将系统底层对传统的图形处理框架进行了重构,使得GPU图形运算整体效率提升60%,SoC能耗降低30%,提高图形渲染效率,让手机在长时间的游戏状态下保持画面平滑,不卡顿,带来高帧率状态下的持续稳定。

华为的余承东在现场介绍称,这项技术能让热门游戏满帧跑,即便是千元机也能玩大型游戏。"我们的团队报告我这项技术的时候,真的吓了我一大跳!"余承东说。

这个月从华为P20pro,Mate10等旗舰机开始,GPU Turbo这项技术都将通过EMUI推送升级。

gpu用到解密技术了吗(吓人的技术GPU到底是什么鬼)(4)

三 GPU在深度学习以及区块链等新兴领域上的强大能力

更重要的是,GPU已不再仅仅是一个图形处理器了,它已经脱胎换骨,成为人工智能时代的重要核心。

目前深度学习一般都使用GPU的模式训练网络,推断网络。

这种核心数的差异直接决定了GPU更适合深度学习。

GPU的核心一般比CPU多几个数量级,目前主流的NVIDIA的显卡,一般有几千个流处理器。如NVIDIA TITAN V显卡具备110万亿次深度学习浮点运算能力,5120个CUDA核心数。CPU内核数却只是个位数。

我们知道,目前的深度学习网络主要是卷积神经网络,其主要的运算是卷积运算。而卷积运算说到底就是矩阵乘法运算。矩阵乘法运算就是许多乘加运算的并行。

看出来没,这些运算有个神奇的特点:类型高度统一,相互无依赖。因此具有多核心的GPU更适合这一计算密集型的任务。

比特币挖矿的矿机处理器就是用的GPU。

由此可见,GPU Turbo这门技术,华为绝不仅用于一个游戏这样的一个小小的领域而已,已为深度学习运算整装待发。

gpu用到解密技术了吗(吓人的技术GPU到底是什么鬼)(5)

,