为高频交易而生的加速卡,以超低时延发挥AI交易策略潜能|AMD推出Alveo UL3422金融科技加速卡
扫描二维码
随时随地手机看文章
金融行业的竞争日益激烈,速度和效率已经成为决定成败的关键因素。无论是银行业、支付、保险业,还是证券交易、外汇、及大宗商品交易,快速准确的交易执行都是获取收益的核心。随着技术的进步,尤其是电子交易的普及,高频交易(High-Frequency Trading,HFT)逐渐成为市场中的重要力量。HFT以超高速的交易执行为特色,旨在通过捕捉瞬息万变的价格波动获取利润,因此对交易速度和延迟的要求极高。对于HFT公司而言,交易速度、准确性和一致性是成功的基石——最大限度地降低交易延迟不仅提升了交易的效率,还在市场中构建了独特的竞争优势和盈利能力。
高频交易对基础设施性能的极致要求使得硬件加速成为关键。为了实现从数据接收到交易执行的超低延迟,HFT公司越来越多地依赖FPGA加速卡这种高效、灵活的硬件加速器。FPGA能够在纳秒级的时间内处理复杂的交易算法,为HFT提供了强大的速度和一致性支持。
正是在这种需求驱动下,AMD推出了最新的Alveo UL3422金融科技加速卡。这款加速卡不仅能够满足HFT对超低时延的要求,还支持硬件自检功能,确保在实时交易中始终保持最佳状态。
满足高频交易三大核心需求,AMD Alveo UL3422来了
“高频交易就是使用算法能够实现非常迅速地从tick-to-trade这样一个交易的特征。它使用非常复杂的算法,以及要求非常高的硬件。通常是利用市场上非常小的价差以及市场的低效,在短时高频发生的交易,通过这样的方式来获得利润。”AMD自适应和嵌入式计算事业部Alveo加速卡高级产品线经理Shyam Chander总结到了高频交易有三大关键特点:首先是极低时延,几微秒的延迟差异可能就意味着利润与亏损的天壤之别;其次是关键基础设施,许多HFT公司通过在交易所租用服务器或部署设备实现服务器共置,以此确保尽可能低的交易延迟,市场数据的传输速度和设备布置也直接影响交易效率;最后是强大的算法,自适应计算能够帮助交易商优化算法和实现监管合规,进一步提升交易效率与精准性。这些特点使HFT能够在瞬息万变的市场中占得先机。
而AMD最新推出的Alveo UL3422金融科技加速卡专为高频交易需求设计,通过FPGA加速实现了纳秒级的超低延迟,为全球交易提供快速的tick-to-trade响应能力。
据悉,Alveo UL3422是AMD Alveo超低时延加速卡系列的最新成员,基于前一代Alveo UL3524产品打造,保持了UL3524的许多核心优势,同时优化了性价比。Alveo UL3422具备三大优势:首先,它采用专门设计的芯片和GTF收发器,确保在交易执行中达到极低的延迟标准;其次,其全高半长的纤薄尺寸,使其具有高性价比和灵活的部署性,降低了高频交易基础设施的进入门槛;最后,Alveo UL3422支持轻松开发,用户可借助AMD开发工具优化性能,实现RTL流和硬件灵活配置,便于构建完整的交易生态系统。
此外,Alveo UL3422配备的自检(self-test)功能可在运行过程中自动监测硬件状态和性能,及时发现并修复异常,保障系统稳定性、准确性和低延迟,确保高频交易策略的精准执行。
如上图所示,Alveo UL3422加速卡采用纤薄小巧的设计,基于Virtex™ UltraScale+ VU2P FPGA单片架构,配备单一插槽并搭载专属开发的GTF收发器,能够实现超低延迟的交易性能。其紧凑的尺寸结合高效设计,配备多个网络节点、板载内存及板对板连接,相较于前代Alveo UL3524产品具备更高的经济性。
此外,Alveo UL3422提供10G和25G双网络端口,支持多卡互联,并优化了FPGA的操作能力,满足复杂金融应用需求。考虑到金融服务对时间精度和准确性的严格要求,该加速卡还具备与外部单元的交互功能,确保精准的时间戳标记。
低于3ns的收发器延迟,助力20ns以下的交易执行“超低延迟”
在“Tick-to-Trade”流程中,超低延迟基础设施是实现高频交易(HFT)性能的核心。从市场数据的接收到交易指令的执行,每个阶段都需要极致的速度和效率,这正是AMD最新的Alveo UL3422加速卡所擅长的领域。
数据传输馈送系统是整个交易过程的起点。这一系统负责从市场接收实时数据,包括价格变动、交易量等关键信息,并将这些数据快速传递到下一个阶段。这一环节中的数据传输速度至关重要,直接影响后续分析和决策的效率。超低延迟的实现确保了交易系统能够以最快的速度响应市场变化,从而获取交易先机。
接收到的数据被迅速传输到算法交易平台,该平台通过高度复杂的算法对市场信息进行实时分析和处理,生成交易指令。算法交易平台是实现高频交易的核心,要求极低的计算延迟,以确保在最短时间内得出交易决策。
在生成交易指令后,系统会进行风险控制,通过交易前风险检查控制系统来验证指令的合规性和风险性。这个环节确保每笔交易符合监管要求,降低系统性风险,避免高风险交易的产生。对于高频交易来说,风险控制过程需要极高的效率,以避免交易延迟,因此这一步骤也必须在极短时间内完成,以确保交易的持续顺畅。
通过风险检查的交易指令最终被提交至交易订单服务器(匹配引擎)进行撮合执行。匹配引擎根据订单需求迅速完成交易撮合,从而实现订单的即时执行。交易订单的撮合执行需满足SEC等监管机构的合规要求,确保交易的合法性和合规性。整个“Tick-to-Trade”流程至此完成,通过超低延迟的基础设施优化,就确保了高频交易系统能够以最快速度、最高效率在市场中捕捉利润机会。
AMD Alveo UL3422在整个“Tick-to-Trade”基础设施中发挥了关键作用,其超低时延性能(ULL)使得它在数据传输、算法交易和交易前风险控制等环节中都具备卓越的加速效果。在数据传输阶段,UL3422确保市场数据能够迅速且无延迟地传输至算法交易平台,使系统能够快速响应市场变化。在算法交易平台环节,UL3422通过其FPGA加速能力高效处理复杂算法,提供纳秒级的决策速度,以快速生成交易指令。接着,在交易前风险检查阶段,UL3422进一步保障了风险控制的及时性和合规性,确保每笔交易都符合SEC等监管要求。
据Shyam Chander介绍,AMD针对不同延迟需求和算法复杂度的交易解决方案,以支持不同的高频交易场景。
· < 20 纳秒的超低时延(FPGA加速):该级别适用于对执行速度有极致要求的交易策略,例如套利。此方案使用超低延迟的FPGA硬件实现,确保在极短时间内完成交易执行,帮助交易者在市场上获得速度优势。而AMD Alveo UL3422的收发器延迟低于3ns,仅为2.34ns,与UL3524一致,因为两者都采用了相同的GFY收发器IP。而此前UL3524创下的世界纪录交易延迟仅为13.9ns。
· < 100 纳秒的低时延(FPGA和自适应SoC):此级别适合多赢家或计算密集型的交易策略。通过FPGA结合自适应SoC的硬件架构支持,这种方案可以更高效地执行复杂算法,满足多个算法密集型的需求。AMD的Alveo V80满足的就是这方面的要求,无论是从计算还是内存的资源方面都能够适配相应的交易。
· < 1000 纳秒的低时延(CPU和低时延NIC):适用于需要复杂CPU计算的交易场景,通过CPU结合低时延网络接口卡(NIC)实现。该方案在延迟上略高,但仍能支持复杂的计算需求,适合需要较高延迟容忍度的交易策略。像AMD Alveo X3522、CPU如EPYC和锐龙也都能够满足这一非常复杂的计算和交易需求。
以FPGA灵活计算为基础,发挥交易中的AI算法之力
随着越来越多的交易商在交易管线中引入人工智能,AI交易策略逐渐成为金融科技领域的新趋势。传统上,机器学习并不是交易管线的一部分,但现在监督学习和机器学习引擎正被广泛应用于交易流程中,尽管金融科技领域对此应用的细节鲜有公开。然而,这一趋势的出现确实展现了AI在提升交易效率和精度方面的潜力。在这种背景下,FPGA在结合AI交易策略方面具备明显的优势。
据Shyam解答:首先,FPGA的可编程性使其能够灵活适应各种算法需求,实现利润最大化等不同目标,且与ASIC等硬件不同,FPGA能通过编程实现无缝连接,从而具备高度的适应性。此外,金融科技对超低时延有着严格要求,FPGA通过其GTF收发器可实现20纳秒以内的数据传输,满足了这一超低时延的需求。这些优势使FPGA成为AI交易策略的理想加速计算平台。
“对于高频交易商来说,他们非常专注于基础设施,因为基础设施是他们是否能够盈利的关键。”Shyam分享到。
从世界交易所联合会统计的全球25大证券交易所的主机共置需求分布来看,为了实现最低时延,交易所和高频交易商需将服务器部署在靠近交易所的数据中心。这种主机共置策略需要大量资本支出和运营支持,包括机架空间、电力、网络连接和数据传输,以确保交易速度和稳定性。同时,各区域的市场份额分布以及基础设施战略对盈利能力的意义重大。
而此次最新推出的AMD Alveo UL3422具备精简优化的设计,与上一代相比提升了性价比,并且采用全高半长的紧凑尺寸,非常适合1U服务器的空间需求,同时支持2U和4U服务器的灵活配置。它已在Hypertec ORION HF X410R-G6和Dell PowerEdge R640等服务器上完成了兼容性测试,能够实现高效稳定的性能。这款加速卡针对机架空间、功耗和主机共置进行了优化,能够在高密度环境中高效部署,满足企业对低成本高性能计算加速的需求。
据悉,AMD Alveo UL3422加速卡的相关参考设计、工具与生态系统的IP都已经推出,而且这款产品现在已经在量产中。