玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(1)

据平头哥官方网站新闻报道,在性能方面,玄铁910支持16核,单核性能达到7.1 Coremark/MHz,主频达到2.5GHz,比目前业界最好的RISC-V处理器性能高40%以上。

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(2)

什么是CoreMark

在嵌入式系统行业用于评价CPU性能指标的标准主要有三种:Dhrystone、MIPS、CoreMark,其中CoreMark是一种新兴流行的嵌入式系统处理器测试基准,被认为是比Dhrystone和MIPS更具有实际价值的测试基准。

EEMBC(Embedded Microprocessor Benchmark Consortium)即嵌入式微处理器基准评测协会,是一家非盈利性组织。

EEMBC’s CoreMark® is a benchmark that measures the performance of microcontrollers (MCUs) and central processing units (CPUs) used in embedded systems. Replacing the antiquated Dhrystone benchmark, Coremark contains implementations of the following algorithms: list processing (find and sort), matrix manipulation (common matrix operations), state machine (determine if an input stream contains valid numbers), and CRC (cyclic redundancy check). It is designed to run on devices from 8-bit microcontrollers to 64-bit microprocessors.

CoreMark是由EEMBC的Shay Gla-On于2009年提出的一项基准测试程序,其主要目标是测试MCU或者CPU的核心性能。

CoreMark标准的测试方法很简单,就是在某配置参数组合下单位时间内跑了多少次CoreMark程序,其指标单位为CoreMark/MHz。CoreMark数字越高,意味着性能更高。

CoreMark程序使用C语言写成,包含如下四类算法:矩阵运算(通用矩阵运算)、数组(查找和排序)、状态机(用来确定输入流中是否包含有效数字)、CRC(循环冗余校验),都是在真实的嵌入式应用中很常见的操作,这也是CoreMark比其他测试标准更有实际价值的原因所在。

CoreMark指标的影响因素

根据SiFive提交给EEMBC网站的数据显示:

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(3)

从以上两条数据,不难发现,只有1个线程时是2.01 CoreMark/MHz,当为4个线程时其值为8.02 CoreMark/MHz,存在一定的倍数关系。

我们来具体分析一下SiFive所提交的4线程的数据,其主频为1.5GHz,4核,其CoreMark/MHz = 12028.27/1500 = 8.02

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(4)

根据其上图显示,他的编译选项为:-O2 -g -DMULTITHREAD=4 -DUSE_FORK=1 -DPERFORMANCE_RUN=1 -lrt

其中-DMULTITHREAD=4 ,-D是gcc的编译选项,表示可以定义宏,意思是代码中有一个宏定义为MULTITHREAD,其值为4,图中的Parallel Execution值为4:Fork,表示fork出了四个进程,这两个值都是为了说明同一个功能,表示开了4个线程在运行和测试。

但SiFive提交的数据还没有被EEMBC所认可。在该网站上搜索平头哥相关信息,阿里还没有提交相关数据给EEMBC。

根据阿里在大会上发布的对比数据,玄铁910与SiFiveU74进行了对比,性能提升了40%以上,其中U74是1.6GHz,2核的处理器。

下图为U74的一些架构设计及其指标:

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(5)

U74发布了MIPS和CoreMark的基准测试数据,但阿里只发布了CoreMark的测试基准指标。SiFive并没有将U74的测试基准指标提交EEMBC网站上。

阿里宣称其单核性能达到7.1 Coremark/MHz,这是一个比较高的指标了,注意这里的是单核性能,不是所有核的加在一起是7.1。与Intel i7的指标对标一下,就明白7.1 Coremark/MHz的所表达的含义:

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(6)

玄铁910的单核性能与Intel i7有的一拼了,相信阿里在这方面不会造假,毕竟这个造假成本太高了!

在平头哥还没有发布玄铁910之前,SiFive U74可以说是业界最强的RISC-V处理器了。

综合以上分析,不难发现影响CoreMark计算的影响因素有:主频、线程数量、编译选项等各种因素。而这次阿里没有透露更多的内容,所以我们目前只能根据有限的信息进行推测。

玄铁910和SiFive U74最大的区别是:玄铁还没有流片量产,而SiFive U74已经开始商用了,所以两者的差距不是一丁点。

玄铁的架构设计

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(7)

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(8)

其采用了多cluster扩展,每个cluster 1-4核心可选配,1-4 cluster可选配,最多可提供16个核。

根据平头哥官网介绍,玄铁910实现性能的突破得益于两大技术创新:采用3发射8执行的复杂乱序执行架构,是业界首个实现每周期2条内存访问的RISC-V处理器;基于RISC-V扩展了50余条指令,系统性增强了RISC-V的计算、存储和多核等方面能力。

重点介绍一下第一个创新,其关键词为:3发射(超标量)、12级流水线、深度乱序执行架构。对比下SiFive U74-MC,它是2发射,8级有序流水线设计:

玄铁开源e902处理器性能(阿里发布的处理器玄铁910)(9)

业界也有类似的设计,如ARM A12。ARM A12是双发射、乱序执行架构,整数流水线10-12级。

总结

阿里平头哥发布的玄铁910芯片,一定会是中国芯片产业的一个标志性事件,开创了我国硬件开源的先河。

本文仅对玄铁910的性能指标进行了解读,其他方面的解读,可以参考我的前一篇文章《这次阿里发布的玄铁910芯片,充分暴露了它的IoT梦想,很伟大》。

虽然玄铁910还没有流片量产,但阿里也深知中国的芯片产业道路充满了荆棘,在这里预祝阿里披荆斩棘,所向披靡!

,