在高速网卡中实现可编程传输协议
扫描二维码
随时随地手机看文章
随着数据中心网络需求的不断提升,尤其是对数据速率和延迟的严格要求,网络协议栈正逐渐从软件转向硬件实现。这一转变旨在以低延迟和低CPU利用率实现100 Gbps甚至更高的数据速率。然而,传统的网络接口卡(NIC)中的网络协议栈通常采用硬连线方式,这限制了传输协议的创新和灵活性。为了解决这一问题,本文提出了一种名为Tonic的可编程硬件架构,旨在高速网卡中实现灵活且高效的传输协议。
一、背景与挑战
在数据中心网络中,传统的软件网络协议栈尽管一直在努力提高其性能和效率,但在100 Gbps以太网上,它们往往会消耗高达30-40%的CPU周期。为了降低CPU利用率和提高性能,多个供应商开发了完全在NIC上运行的硬件网络协议栈。然而,这些NIC通常仅实现了两种主要的传输协议(如RoCE和TCP),并且这些协议是硬连线的,只能由供应商进行修改。
这种硬连线方式限制了传输协议的创新和适应性。例如,尽管近年来提出了许多用于可靠传输和拥塞控制的新算法,但现有的硬件堆栈通常只支持一小部分这些算法。此外,当运营商需要修改数据传输算法以避免网络中出现活锁时,他们必须依赖NIC供应商进行更改,这增加了操作的复杂性和成本。
二、Tonic架构概述
为了克服这些挑战,我们设计并开发了Tonic,这是一种用于传输逻辑的灵活硬件架构。Tonic旨在高速网卡中实现可编程传输协议,同时满足100 Gbps的数据速率要求。
Tonic的核心思想是识别跨不同传输协议的传输逻辑的通用模式,并基于这些模式创建一个高效的硬件“模板”。这个模板允许用户使用简单的API进行编程,而无需深入了解高速硬件编程的复杂性。
三、Tonic的设计与实现
Tonic的设计主要围绕以下两个方面:
可编程传输逻辑:
传输协议的实现涉及多种功能,如连接管理、数据缓冲区管理和数据传输。然而,其核心任务是决定传输哪些数据段(数据传输)和何时传输(拥塞控制),这些统称为传输逻辑。Tonic通过提供一个可编程的传输逻辑架构,使用户能够修改这些核心功能,从而实现灵活的传输协议。
高效硬件模板:
尽管不同的传输协议在连接和数据缓冲区管理方面存在差异,但它们有几种共同的模式。例如,不同的传输协议使用不同的算法来检测丢失的数据包,但一旦数据包被宣布丢失,可靠传输协议就会将其重传。Tonic利用这些通用模式创建了一个高效的硬件模板,该模板可以支持多种传输协议的传输逻辑。
四、代码实现与实验验证
我们在Verilog中实现了Tonic原型,并在FPGA上进行了实验验证。实验结果表明,Tonic能够支持多种协议的传输逻辑,并满足100 Gbps背靠背128字节数据包的时序要求。
以下是Tonic原型的一部分Verilog代码示例:
verilog
module tonic(
input wire clk,
input wire rst,
// 输入端口,用于接收来自传输层的数据和元数据
input wire [31:0] data_in,
input wire [15:0] meta_in,
// 输出端口,用于将数据发送到下游DMA流水线
output wire [31:0] data_out,
output wire valid_out
);
// 内部信号定义
wire [31:0] buffer[0:2047]; // 用于存储未完成的数据段
wire [15:0] meta_buffer[0:2047]; // 用于存储元数据
wire [9:0] stream_id; // 流标识符
wire [11:0] byte_count; // 未完成字节数
// 传输逻辑实现(示例)
// ...(此处省略了具体的传输逻辑实现代码)
// 数据输出逻辑
assign data_out = buffer[stream_id];
assign valid_out = (byte_count > 0) && (/* 其他条件 */);
// 其他逻辑(如连接管理、缓冲区管理等)
// ...(此处省略了其他逻辑的实现代码)
endmodule
请注意,上述代码仅为示例,并未包含完整的传输逻辑实现。在实际应用中,需要根据具体的传输协议和需求进行详细的实现。
五、结论
Tonic作为一种用于高速网卡中可编程传输协议的灵活硬件架构,为传输协议的创新和灵活性提供了新的解决方案。通过识别跨不同传输协议的通用模式,并基于这些模式创建高效的硬件模板,Tonic能够在满足100 Gbps数据速率要求的同时,支持多种传输协议的传输逻辑。实验结果表明,Tonic具有可行性和高效性,有望在未来的数据中心网络中得到广泛应用。