在前几周的系列介绍中,我们从不同角度了解到英特尔最新推出了Ethernet 800系列网络适配器如何满足高性能存储的高速传输需求,使用具有ADQ加速技术的英特尔Ethernet 800系列网卡,如何提供更高的性能和更低的延迟,今天我们将继续详解Ethernet 800系列网络适配器的关键技术。
关键特性
☞QSFP28,单口或双口
☞PCle3.0 和 4.0,×16
☞以太网端口配置工具(EthernetPort Configuration Tool,EPCT)
☞应用设备队列(ApplicationDevice Queues,ADQ)。
☞动态设备个性化(Dynamic DevicePersonalization,DDP)。
☞支持RDMA iWARP和RoCEV2
Ethernet 800系列通过创新性地提高应用效率和网络性能,以优化高性能服务器工作负载,如NFV、存储、HPC-AI以及混合云。
提升云应用性能
为云工作负载(包括边缘服务、web服务器、数据库应用程序、缓存服务器和存储目标)按需交付高带宽,并提升应用程序吞吐量。
◆ADQ使用增强流量导向技术提升了应用程序响应时间的可预测性
◆DDP增强了包分类能力,对某些云工作负载,可提供高达3倍的吞吐量
◆同时支持RDMA iWARP和RoCE v2传输协议,为存储目标提供高速低延迟连接
优化电信类负载
为高带宽网络和通信工作负载(包括移动核心(mobile core)、5G RAN和网络设备)提供包分类和排序优化
◆DDP支持通信领域现有的和新的特定协议,能将某些NFV工作负载的包处理效率提高3倍
◆支持IEEE 1588v2精准时间协议(Precision Time Protocol),在5G RAN部署中能够实现高精度时间同步
◆增强的数据平面开发工具包(DataPlane Development Kit,DPDK)支持,提高了包处理速度
用EPCT灵活配置多端口
E810-CQDA1和CQDA2网络适配器支持多种系统配置,以满足用户所需的工作负载需求。更多可用端口与速度的组合简化了验证和部署。
利用EPCT,英特尔E810(双端口或单端口)可以编程为许多不同的物理网络适配器,其最大吞吐量为100Gbps
英特尔Ethernet 800系列网络适配器关键技术:
ADQ:提高横向扩展的可预测性
随着现代数据中心的横向扩展,提供弹性并可预测的应用程序级性能成为关键挑战之一。ADQ技术通过为关键负载建立专用队列,大幅减少了性能抖动,显著提高了应用程序的可伸缩性和可预测性。
更低的抖动增加了应用响应时间的可预测性,这不仅能给任务分配更多的计算服务器,还能让更多的用户访问系统,并提供更好的最终用户体验。即使应用规模不大也能从更高的一致性中获益,让其能够更容易满足SLA。
ADQ使用一种优化应用程序线程到设备数据路径的方法来实现针对特定应用程序的数据控制、传输和速率限制。这种专用队列和调整网络流量的能力不仅提高了应用性能,还降低了延迟并提升吞吐量。
利用动态设备个性化(DDP)提高包处理效率
DDP通过对数据包过滤,并结合增强的DPDK,可支持云和NFV等场景下的高级数据包转发和高效的包处理。
英特尔 Ethernet 700系列首次引入了DDP技术,一些协议可以添加到固件中的默认协议集中。而英特尔Ethernet 800系列固件在驱动程序初始化阶段就加载了一个增强DDP配置文件,以及许多用于特定工作负载的协议,从而获得更高的灵活性。当系统中存在多个800系列适配器时,每个适配器上的流水线都可以使用不同的DDP配置文件进行独立编程。
IEEE1588精准时间协议(PTP)
英特尔Ethernet 800系列支持IEEE 1588 PTP v1和v2两个版本,提供纳秒级时间精度,能够准确报告每个数据包的接收时间。这种级别的时间精度有助于确保从5G RAN到金融服务、工业自动化和能源监控等领域网络部署的精确同步。
通过远程直接内存访问(RDMA)提高吞吐量和降低延迟
RDMA通过消除TCP/IP堆栈进程、内存拷贝以及应用程序上下文切换等三个主要的网络资源开销,为现代高速以太网提供高吞吐量和低延迟性能。英特尔Ethernet 800系列网络适配器支持所有主流存储传输协议,包括iWARP、RoCE v2和NVMe over TCP等。
RoCE(RDMA over Converged Ethernet):
RoCE v2用以太网替代InfiniBand物理层和数据链路层,运行在UDP/IP之上,并可在IP网络上路由。
iWARP,基于IETF标准协议:
在常见的TCP/IP协议之上交付RDMA。iWARP RDMA通过标准网络和传输层运行,并与所有以太网网络基础设施一起工作。TCP提供流控制和拥塞管理,无需建立无损以太网。iWARP是一个可高度路由和可扩展的RDMA实现。
保护、检测、恢复
零信任基于这样一种理念设计,即在授予访问权之前,您需要对任何试图连接或获得准入的内容进行验证。
英特尔Ethernet 800系列通过保护、检测和恢复三种安全机制以及硬件信任根(Hardware Root of Trust)为平台提供弹性保护。通过这种设计,其内建的故障检测可保护固件和关键设备设置,并进行自动设备恢复以确保设备回到其最初的编程状态。
英特尔Ethernet 800系列适配器基于Ethernet Controller E810,总体特性如下:
主机接口
- 符合目前0.9版本的PCle 4.0标准
- 256个non-posted请求的并发
软件界面
- 基本模式VF兼容Intel Adaptive Virtual Functions Specification(Intel自适应虚拟功能规范)
- Tx / Rx队列
-2048Tx队列和2048 Rx队列
-队列动态分配到functions和VSls
- 中断
-2048个中断向量,以灵活的方式分配给队列和其他用例
-多重中断调节方案
-20,000,000次中断/秒
- 控制队列(Control Queues,又名管理队列,Admin Queues)
-针对PF-VF和驱动-驱动的邮箱队列
-针对软件-固件控制流的管理队列
-针对软件访问E810内部IP的边带队列(Sideband Queues)
- 256个Tx门铃(DB)队列
- 512个Tx完成队列
- 每Tx队列有一个量子描述符(QD)队列,量子信息也嵌入到Tx门铃中
- 可编程的Rx描述符字段
包处理
- 增强的数据平面开发工具包(DPDK)
- 通用功能
-解析、交换、ACL、分类、包修改等阶段
-可编程数据包处理流水线
-基于配置文件
-可编程操作
-阶段之间传播优先级
- 解析器
-可解析高达504B包头
-基于解析图
-基于会话的解析
-可编程解析引擎
- 二进位分类器(VEB Switch)
-768交换端口(VSls)
-可编程的转发规则
-风暴控制
- ACLs
-8K可编程TCAM条目
-平铺能力宽度可达n*40b
- 分类过滤器
-基于哈希的统计分布
-基于英特尔 EthernetFD流的分类
-基于流的iWARP和RoCE流识别
-可编程规则
- 修改
-插入(Tx),删除(Rx),和包VLAN修改
-L3和L4校验和与CRC
虚拟化
- 通过VMDQ和SR-IOV实现主机虚拟化
- 最多256个SR-IOV虚拟功能
- 隧道包的无状态卸载(网络虚拟化支持)
- 恶意VF保护
- 虚拟机负载均衡(VMLB)
- 高级的信息包过滤
- VLAN支持VLAN标签插入、剥离和包过滤,最多可支持4096个VLAN标签
- 带有网络服务标头(NetworkService Headers,NSH)的VXLAN,GENEVE, NVGRE, MPLS, VXLAN-GPE
- 英特尔以太网自适应虚拟功能驱动程序(Intel Ethernet Adaptive Virtual Function drivers)
RDMA
- 支持iWARP and RoCEv2
- 256K队列对
- 发送队列推送模式
注意:当E810配置为>4端口操作时,不支持RDMA。
QoS
- WFQ传输调度程序有九个可编程层
- 共享流水线,避免starvation
- 通过802.1p PCP或差异化服务代码点(Differentiated Services Code Point,DSCP)值的QoS
- 包调整
可管理性
- SMBus操作可达1Mb/s
- 符合DMTF的NC-SI 1.1接口,100Mb/s
- MCTP over PCIe与SMBus
- 通过本地BMC实现企业级管理方案
- SNMP和RMON统计计数器
- 看门狗定时器
- PLDM over MCTP;PLDM监控;PLDM固件升级:PLDM for RDE
- 固件管理协议支持
电源管理
- 支持PCI电源管理状态D0, D3hot, D3cold
- Do, D3hot和D3cold中的APM WoL支持
时钟同步
- 每个Rx包的时间戳
- 可选择的Tx包时间戳
- 支持IEEE PTP1588v1/2
- 与其他本地平台同步时间戳
Pre-Boot
- 与HTTPS启动兼容的签名UEFl选项ROM
安全机制
- 基于硬件的信任根
- 基于NVM Read与Power On之上的身份验证
- 内置固件/关键设置故障检测与自动设备恢复
,