电子发烧友网报道(文/周凯扬)就如同智能手机10余年前在移动通信掀起的革命一样,以太网的格局也在慢慢发生变化,数据中心里的以太网通信正在被SmartNIC改写。SmartNIC作为这个时代智能网卡的代名词,提供了远高于CPU的通信效率,加上可编程的特性,足以跟上网各协议不断的变化的步伐。

再次以我们的手机为例,手机的负载在近年来其实增长并不大,即便存在图形计算或是AI计算的压力,但基本都能胜任它们被赋予的角色。正因如此,摩尔定律的推进得以为其提供源源不断的“芯”动力。但这在数据中心端是恰恰相反的,我们所追求的科技小型化在这里并不适用,庞大的机架与复杂的线路比比皆是。

这是因为数据中心工作负载的增加速度要远快于摩尔定律,虚拟化与微服务将不少数据中心CPU性能分得一干二净。服务器因为运行数据中心软件定义的网络架构而处于满载状态,这个占比在每年3000多万出货量的服务器中达到了三分之一。SmartNIC作为分担这些负载的重要组成部分,已经在数据中心普及了。

考虑到目前数据中心与云计算成了销售占比与利润率最高的业务,不少厂商都将SmartNIC视为一块香饽饽。一些大力发展数据中心的厂商也开启了疯狂收购,将知名的SmartNIC难入麾下,比如被英伟达收购的Mellanox,被AMD收购的Xilinx。除此之外,不少云服务厂商,例如微软的Azure以及亚马逊的AWS,也纷纷开始自研自己的SmartNIC。

英伟达

英伟达的ConnectX-7是一块针对现代云计算、AI以及传统企业负载的SmartNIC,支持1/2/4个NRZ、PAM4网络端口,在不同的端口配置下最高可做到400Gb/s的带宽。ConnectX-7集成了最新PCIe 5.0 x16/x32的主机接口,不仅支持PCIe FHHL/HHHL这样常规的PCIe智能网卡配置,也支持OCP 3.0 SFF这样的小卡。

绿色计算原理与应用(数据中心突破摩尔定律的利器)(1)

ConnectX-7上的英伟达自研芯片 / 英伟达

ConnectX-7这张卡最强大的地方不在其带宽,而是在与其配套的技术上。内建了英伟达的交换与数据包处理加速技术(ASAP),通过ASIC嵌入式交换机,既裸机服务器提供了极高的性能和效率,也为虚拟化和容器提供了SDN加速。

同时ConnectX-7也通过RoCE和GPUDirect Storage这样的技术,实现了高性能的存储和数据访问,对于NVMe-oF这种存储架构来说也可以通过RoCE和TCP同时加速,可以说是与当下主流的数据中心架构兼容了。

中科驭数

国内其实也有不少在发展智能网卡的公司,中科驭数正是其中一家。中科驭数的SWIFT-2100N是一款主打高性能和超低时延的SmartNIC,基于其自研KPU架构的DPU芯片打造而成,实现了芯片级的网络卸载,支持全硬件有状态TCP、UDP、ARP、ICMPv4和IGMPv3协议的卸载。

绿色计算原理与应用(数据中心突破摩尔定律的利器)(2)

中科驭数DPU / 中科驭数

既然主打高性能和低时延,我们就来看一看这方面的性能。SWIFT-2100N在DPU的加持下,INT8算力最高可以达到18.6TOPS,片外内存容量64GB,总带宽可达77GB/s。在时延方面,其内部TCP/IP协议处理时延在200ns左右,1/2RTT时延低于1.2us,网络抖动小于20ns,如此优秀的时延表现特别适合一些金融计算、视频点播场景。

英特尔

绿色计算原理与应用(数据中心突破摩尔定律的利器)(3)

除了Xilinx之外,同为FPGA厂商的英特尔也有自己的SmartNIC,其N6000-PL基于自家的Agilex高性能FPGA,在英特尔以太网控制器E810和PAC N3000的支持下,提供了2x100GE的连接性,支持多种通信负载,比如开源虚拟交换机、vRouter、5G用户平面功能和分段路由版本、vRAN等等。

在接口上,N6000-PL支持PCIe 4.0 x16以及DDR4内存。FPGA提供的极高灵活性让N6000-PL成了不少移动网络基础设施虚拟化部署的首选。比如启碁和Silicom都推出了基于N6000-PL的智能网卡,或用于4G/5G的vRAN,或用于5G NR的前向纠错和前传网络紧急同步。

小结

尽管现在的SmartNIC提供了足够的网络性能,不过如果你的使用场景属于世界上最大的几个数据中心,或是通信需求特别高的话,还是需要用到DPU。正如Broadcom曾经提出的一种比喻,SmartNIC就像是大服务器中的小服务器,而DPU则是可以作为独立的网络端点,但不管怎么说,SmartNIC都将在大数据驱动的网络环境下留下自己的重要印记。

,