GPU市场再起风云,继N卡、A卡之后,国产“摩卡”正式上线!

新一代gpu进展(看得见摸得着的国产GPU来了)(1)

就在11月3日,GPU独角兽公司摩尔线程召开2022年秋季发布会,正式发布了基于MUSA架构的第二颗多功能GPU“春晓”以及相应的一系列硬件产品——有大众消费者期待并即将上市的中国首张游戏显卡,也有利好开发者的MUSA开发套件,还拿出了首个元宇宙计算平台。软硬都有的实力,产品刷新的速度,让人很难相信这是一家成立仅两年的公司,但有着“中国英伟达”之称的摩尔线程确实做到了。

首款国产游戏显卡真的来了摩尔线程大秀软硬件肌肉

开场环节,摩尔线程CEO张建中首先感谢了各界合作伙伴用户的合作与支持,有了真实可靠的应用和不断扩展的业务场景才意味着产品完整落地。首颗“苏堤”GPU光速前进,得到不少认可,有PES完美体验系统联盟协同打造更优质PC、工作站和数据中心服务器,也有中国移动、中国电信等共同推进云计算和元宇宙国产化生态的建设。

新一代gpu进展(看得见摸得着的国产GPU来了)(2)

第二颗基于MUSA架构的多功能GPU“春晓”正式登场,晶体管规模达220亿,拥有4096个MUSA核心、128个张量计算核心,支持主流的FP32、FP16、INT8等计算精度。四大计算引擎全面升级,现代图形渲染、智能多媒体、AI计算加速、物理仿真都有数倍不等提升。

但真正让现场沸腾和惊喜的还是首款面向玩家打造的国产游戏显卡MTT S80,主频1.8GHz、搭载高达16GB的GDDR6现存,显存位宽为256bit。得益于“春晓”GPU先进性,这也是首款PCIe 5.0接口显卡,配备3个DP 1.4a和1个HDMI 2.1接口,可输出8K画面。

对于通用图形接口的兼容性,会对全新GPU产品的大众使用体验产生不小影响。经过半年多软件的攻关,摩尔线程已经成为国内率先支持Windows环境和DirectX图形接口的GPU公司,并且实现了对数十款主流PC游戏的兼容运行,可以在Windows系统下高分辨率流畅游玩。

新一代gpu进展(看得见摸得着的国产GPU来了)(3)

MTT S80显卡对《暗黑破坏神3》和《极品飞车14》等游戏的全屏抗锯齿、高精度贴图、大地图世界、多样特效都有到位支持,并且都能以高分辨率高帧率运行。摩尔线程更与Unity、虚幻引擎、国产引擎光线云,还有腾讯网易等主流游戏公司展开合作,持续优化游戏体验。

摩尔线程还将支持MTSS时空超分辨率技术,可以将低分辨率画面实时重构为高分辨率输出,类似英伟达的DLSS、AMD的FSR、英特尔的XeSS。PES控制中心带来GPU功能管理和驱动更新的图形界面,还可截图、监控运行状态,未来有望提供超频选项和更多定制化内容。

新一代gpu进展(看得见摸得着的国产GPU来了)(4)

看得出来,摩尔线程为做好一款服务大众用户的游戏显卡付出了不少努力,CEO张建中表示,希望未来的消费者提到显卡时,除了N卡A卡还能有摩尔线程的“摩卡”。目前摩尔线程MTT S80显卡已经完成了首批生产与备货,将在2022年11月11日在京东开启限量销售。

基于“春晓”GPU,摩尔线程还带来了面向服务器的MTT S3000显卡:主频来到1.9GHz、显存为32GB的GDDR6、显存带宽为448GB/s,支持FP32、FP16、INT8等主流计算精度,FP32算力可达到15.2TFLOPS,一大亮点是具备GPU弹性切分、SR-IOV隔离等虚拟化技术。

新一代gpu进展(看得见摸得着的国产GPU来了)(5)

新款服务器显卡延续了对开发者的友好态度,兼容PyTorch、TensorFlow、百度飞桨、计图等多种主流深度学习框架,还能帮助用户把CUDA上开发的代码和模型无缝迁移到MUSA架构上。摩尔线程也公开了自研推理引擎TensorX,让“春晓”实现了相较“苏堤”的四到五倍效率提升。

摩尔线程还为普通用户和开发者提供架构完备的MUSA软件栈,其中有包含编译器、AI算子库、通用计算库等工具的MUSA开发套件。开发者可以直接调用GPU底层计算能力,也可以在上层进行高可用度的应用开发,方便利用搭载摩尔线程多功能GPU的硬件设备完成各种计算目标。

新一代gpu进展(看得见摸得着的国产GPU来了)(6)

云原生GPU能力得到升级:MT Mesh 2.0可以对GPU算力进行弹性切分,在云桌面场景下实现了不需要重启便可使用的全球第一款动态弹性虚拟GPU切分技术。摩尔线程宣布正在与腾讯先锋合作打造领先的云游戏解决方案,在安卓容器云加速技术ACX加持下可通过浏览器访问以1080P分辨率渲染的《王者荣耀》云游戏。

摩尔线程带来国内首个元宇宙计算平台MTVERSE及众多软硬件产品:AlphaCore物理仿真引擎带来更真实的实时高精度烟火模拟、逼真的流体模拟仿真、天气与云层模拟、多物理场交互,数字人技术有了从形象到对话的生产线,还有通过语句或关键词输出图形的AIGC内容生成器“马良”。

新一代gpu进展(看得见摸得着的国产GPU来了)(7)

MCCX元计算一体机问世,则将为元宇宙应用开发提供坚实的算力底座,方便用户快速部署提供了AI、渲染、编解码等元算力应用场景的硬件解决方案,有内置4块MTT S3000和8块MTT S3000两种规格可选。摩尔线程希望提供近似“开箱即用”的体验——内置MUSA架构计算卡更有整套软硬件环境,这简直是要“让用户在收到当天就能部署好应用进行产出”的节奏。

对话张建中:培养驱动研发人才,备战国际化竞争

国产GPU从诞生之初,就伴随着性能和IP的争议,但实际上不需要在意这些“质疑”,重要的是企业如何在市场环境和供需关系变化之下,为急切需要图形渲染和AI计算的用户提供相应产品。解决有没有的问题才是我们国家的当务之急。不懂的可以参照CPU的自主创新路径,饭都是要一口一口吃的。

新一代gpu进展(看得见摸得着的国产GPU来了)(8)

坚持自研计算核心、张量核心,现已推出了第二颗多功能GPU产品的摩尔线程,在技术路线上选择两条路同时走路:一方面兼容已经有一定用户规模的业界标准生态,比如兼容CUDA,Open GL、Open CL等;另一方面也在打造基于国产GPU的本土生态,以MUSA为核心,这次就提供了非常多的开发套件,方便开发者根据实际情况选择。

纵观GPU的发展历程,做好图形支持从来就不是易事,从底层的图形学方向到上层的DirectX图形接口支持都是如此。纵使强如英特尔这样的全球半导体巨头,在下定决心发力消费级独立显卡时,也遭遇了驱动软件与产品性能暂时不能充分匹配,需要用户等待后续更新驱动,才能释放更多性能潜力的情况。

关于驱动长期研发,张建中表示:“软件的开发和适配这条路是很长的一条路,不是今天请两个高手就可以把驱动程序开发结束,它是一个很长的过程。”图形接口、操作系统都在不断演变,因此驱动迭代会是一个持续性优化的过程,摩尔线程将会继续投入以满足更多游戏需求。

新一代gpu进展(看得见摸得着的国产GPU来了)(9)

张建中也坦言,国内并没有现成的图形驱动人才库,因此摩尔线程必须得自己培养人才投入研发。对人才的求贤若渴,也让摩尔线程得到正向反馈,这家公司从各大高校发掘了有潜力的研究生、博士生加盟,经过一年半年后已经凸显出相应实力,摩尔线程还希望能和国内的高校展开合作,培养更多计算机图形学和AI计算人才。

近几年的半导体创业热,多少和市场侧传来的需求有关,较为明显的需求导向带动了多家创业企业飞速成长。摩尔线程以快节奏响应市场,不仅在创立第18个月就正式发布首款GPU,并且能够在企业采购中见到采用相关显卡产品的国产化整机,有力回击了“PPT造芯”传闻。

新一代gpu进展(看得见摸得着的国产GPU来了)(10)

不过摩尔线程似乎并不满足于此,张建中说第一款新品已经很好满足了国内操作系统和硬件生态的GPU需求,“春晓”提升整个国产生态系统体验,协同国产软件充分发挥优势后,接下来希望可以成为GPU行业的主流产品,能够适配国际上的生态环境,尽可能地参与国际化竞争。

张建中分享了对于摩尔线程未来行业生态位的期望:“我们希望不止是一家全功能的GPU公司,还能够打造一个真正的应用平台,让客户真正使用起来。现在你要问我的话,我们还处在初级阶段,所以希望认认真真,踏踏实实走好每一步,把自己的技术基础打得更扎实一点。”

新一代gpu进展(看得见摸得着的国产GPU来了)(11)

在高手云集、创业者经验丰富的半导体行业,创业公司往往都会显露出好高骛远的态度,这能帮助一家企业迈向成功,却并不是必要品。相比之下,摩尔线程在产品和交流中表达出的务实显得弥足珍贵,这或许是一家公司能走得更远的重要财富,做好自己才能更好地达成目标。

激动过后国产GPU需要更多理性和耐心

国产GPU真的很“热”,但光有热度还不够,还要有沉得下心的毅力,不断投入研发、迭代产品、构建生态和体验。就如我们所感受到的那样,国产创新这条路布满了荆棘,进入其中的企业只有备足充分粮草披荆斩棘,熬过无法“一步登天”的长周期,最终才能站上真正的高点。

如果以行业领先的GPU企业为参照,成立两周年的摩尔线程其实刚走过0到1的起步阶段,用MUSA架构展示了新创企业的决心和实力。现在正在1到10的蓄力阶段,进行搭建生态储备人才这样漫长又细致的工作,未来更需要有能力、有思想完成10到100,追赶上行业最前沿。

新一代gpu进展(看得见摸得着的国产GPU来了)(12)

2007年的夏天,英伟达对外正式宣布的CUDA计算架构,通过搭建开发平台和驱动更新释放出隐藏在显卡中的通用计算能力。而后这十余年里,GPU计算颠覆了人们利用计算机工作学习的方法,还推动图形渲染、人工智能、智慧城市等前沿技术蓬勃发展,成为当今科技中流砥柱。

在现在来看,摩尔线程打造出MUSA架构,快速迭代GPU软硬件产品并着手搭建一整套开发者体系、云计算生态和相关能力,就像是要吸收CUDA成功经验打造出又一个通用计算能力所驱动的平台,而且还是又快又稳地在推进着节奏。将其戏称为“小英伟达”,似乎恰如其分。

新一代gpu进展(看得见摸得着的国产GPU来了)(13)

短短7个月时间,摩尔线程便带来性能有显著提升的第二款GPU产品,增强了开发者生态和相关套件能力,还回应消费市场呼声推出游戏显卡。如此用实力说话,其实是在不平凡的时代传递了看得见摸得着的技术自信,我们可以放心去相信,国产GPU将会迎来更美好的明天。

曾几何时,我们还在感慨中国芯片被庸碌之辈窃走功名和关注,缺乏真正有能力有态度去引领和支撑的企业;曾几何时,我们还在期待,到底什么时候可以用上国产显卡;在短短的几年之间,摩尔线程和一众GPU创新企业就已经开始真刀真枪做出产品,不是在热钱驱使下贸然沽名钓誉,而是真真正正有技术架构和演进路线,有望满足市场期待。

新一代gpu进展(看得见摸得着的国产GPU来了)(14)

纵观整个国际的大环境,中国半导体产业的自主创新已经是一条不得不走的路,唯有躬身入局者才能体会其中的艰辛。就如摩尔线程在DirectX支持路线图中所诚恳表达的那样,将国产GPU做到尽善尽美是攀登高峰一般的挑战:高山上的风景固然美丽诱人却无法一步登顶,其中更是隐藏着无数阻拦前行的障碍,但要是沉下心脚印踏实地走下去,终有一天能够踏上顶峰。

,