0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于菲數(shù)科技FA728Q加速卡實現(xiàn)低時延LLT應用

英特爾FPGA ? 來源:英特爾FPGA ? 2024-08-30 17:13 ? 次閱讀

菲數(shù)科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎設施開發(fā)高性能FPGA加速卡。

概 述

基于FA728Q FPGA的加速卡現(xiàn)已出貨,它是一種基于PCIe*、搭載Stratix10 FPGA的高性能加速卡

菲數(shù)科技使用OFS基礎設施加速其自定義FPGA接口管理器 (FIM) 的開發(fā),該管理器包括一個集成的TCP/IP卸載引擎

在運行LLT等時間關鍵型應用時,F(xiàn)A728Q加速卡的TCP傳輸時延不到100納秒

要 點 綜 述

LLT和其他時間敏感型應用是FPGA加速的理想使用場景。為了滿足這一市場需求,菲數(shù)科技開發(fā)了基于FA728Q FPGA的加速卡。FA728Q加速平臺為最終用戶提供了強大的FPGA資源、充足的存儲容量和易于使用的界面。菲數(shù)科技使用OFS基礎設施來加速、簡化、標準化其加速主板的開發(fā)。OFS基礎設施提供了一種強大的方法,支持以“量身定制”的方式加速FPGA解決方案的開發(fā)。借助OFS基礎設施,菲數(shù)科技將其TCP/IP卸載引擎集成至開源的基礎FIM中,它通常被稱作FPGA“shell”。

背 景 信 息 和 挑 戰(zhàn)

LLT以電子方式執(zhí)行金融證券交易,盡可能地減少訂單輸入與訂單之間的時延。如今,大型投資銀行、對沖基金和其他金融機構普遍使用該方法。過去,交易是手動執(zhí)行的,而不是以電子方式執(zhí)行,交易的時間長則數(shù)分鐘,短則數(shù)秒。然而,隨著硬件和相應軟件技術的進步,人們可以對系統(tǒng)進行編程,根據(jù)特定的市場信號和動態(tài)自動做出買入或賣出決策,從而將交易執(zhí)行時間縮短到毫秒級。近年來,隨著基于FPGA的加速產(chǎn)品的大規(guī)模出貨,交易時間進一步縮短至數(shù)微秒,甚至不到1微秒。

同時,LLT系統(tǒng)越來越多地使用復雜的交易算法模型來進行訂單薄交互。這些算法模型是根據(jù)每家交易公司的特定交易策略而專門定制的。解決方案需要借助通用處理器和專用協(xié)處理器的算力,以滿足交易公司在異構計算等方面的功率和性能要求。FPGA非常適合實施定制的交易算法,但是這款硬件加速設備的編程非常耗時,并且隨著FPGA家族的優(yōu)化升級,也很難遷移。

菲數(shù)科技是一家總部位于中國的公司,致力于滿足數(shù)據(jù)中心異構計算和高性能計算(包括LLT細分領域)領域的需求。他們向市場交付了基于FPGA的硬件加速器平臺、FPGA加速知識產(chǎn)權(IP)功能和基于FPGA的平臺設計服務。

解 決 方 案

為滿足LLT應用的低時延、標準化和可移植性要求,菲數(shù)科技開發(fā)了FA728Q加速卡,用于對集成式TCP/IP卸載引擎進行實例化。為此,菲數(shù)科技修改了開源版OFS中提供的基礎FIM。得益于可組合的架構和“量身定制”的方法,該公司使用OFS,將其算法輕松地移植到FA728Q加速卡,同時,該公司利用OFS提供的其它基礎設施,包括OFS軟件驅動程序和庫,從而盡可能地減少應用的修改。

wKgZombRjTWATqiRAAA32svSFbU746.jpg

運行在主機上的軟件

PCIe* 加速卡

wKgaombRjTWAQQcoAABDrmxAVHA844.jpg

圖 1. FA728Q上實施的采用TCP/IP卸載引擎 (TOE) 解決方案的OFS

OFS是一種開源硬件和軟件基礎設施,提供了所有必要的關鍵設計、軟件和基礎設施組件,支持快速開發(fā)基于FPGA的自定義主板或工作負載。OFS基礎設施由 FIM(通常被稱作“shell”)和加速器功能單元 (AFU) 區(qū)域(一種用于工作負載開發(fā)的指定區(qū)域)組成。借助OFS、FPGA主板或FIM,開發(fā)者可以利用開源基礎設施或基礎FIM,根據(jù)目標應用或行業(yè),快速開發(fā)量身定制的主板FIM。OFS還附帶了oneAPI加速器支持包 (ASP),開發(fā)者可以利用它對FPGA硬件和設計流程進行抽象化。OFS節(jié)省了開發(fā)者的時間,提高了不同F(xiàn)PGA代際間的可移植性,其采用行業(yè)標準接口,并且使用oneAPI提供可選的高層次設計流程。

FA728Q加速卡現(xiàn)已出貨,它是一款基于PCIe的高端FPGA加速主板,可提供 32GB板載DDR4內存和3個QSFP28插槽,每個接口支持高達100GbE。FA728Q加速卡還可以通過OFS基礎設施啟用oneAPI,以支持客戶在RTL中實施內核,或者將算法從CPU/GPU遷移到C/C++等高級設計語言。oneAPI基礎工具套件也可以助力客戶在內核中采用FPGA資源,從而進一步縮短上市時間。

wKgZombRjTWAbmDRAAGZ5zadHgo811.jpg

表 1. FA728Q規(guī)格

菲數(shù)科技還開始開發(fā)基于AgilexFPGA的主板,包括使用Agilex7 FPGA I系列的FA927S卡和使用Agilex7 FPGA F系列的FA925E卡。

FA927S卡可提供高達116Gbps的收發(fā)器速率,并且支持PCIe 5.0 x16和 Compute Express Link (CXL)。它面向帶寬密集型應用,現(xiàn)在已用于基于RTL 的開發(fā)中。FA927S卡已于2024年第一季度支持OFS。

另一方面,F(xiàn)A925E卡提供了4個8GB內存條和4個4GB DDR4內存條,板載內存總計高達48GB。FA925E卡專為對外部內存容量和帶寬要求較高的應用而設計。它全面支持OFS。2023年底已量產(chǎn)。

這兩款加速卡的規(guī)格如下表所示。

wKgZombRjTWAW1GVAAKOELtFWoA132.jpg

表 2. FA927S規(guī)格

wKgaombRjTWANbvOAAIkvkT_Bks457.jpg

表 3. FA925E規(guī)格

成 效

菲數(shù)科技在FA728Q卡上實施的卸載引擎IP功能針對時延和性能進行了優(yōu)化,以滿足LLT要求。在加速模式下,TCP的傳輸時延低于100納秒,可為時間關鍵型網(wǎng)絡應用建立穩(wěn)定的低時延連接。下表顯示了各種連接所測量的時延。

wKgZombRjTWAHDU6AAHAVER28Yc856.jpg

表 4. TOE的規(guī)格

注:

1) 一個時鐘周期為6.4納秒;

2) TX時延計算的是從數(shù)據(jù)包EOP的下降邊緣到XGMII TXC中的有效數(shù)據(jù)的時間;

3) RX時延計算的是從數(shù)據(jù)包SOP到XGMII RXC中的有效數(shù)據(jù)的時間

FA728Q卡還提供了高帶寬PCIe 3.0 x16和DDR4接口。

wKgaombRjTWAAUILAAHxM5IcZdg693.jpg

表 5. 每個接口提供的帶寬

板級支持包

wKgZombRjXuAb1_JAAFyJOd6AGk412.png

圖 2. OFS平臺中的高帶寬數(shù)據(jù)路徑

如何使用OFS和菲數(shù)科技解決方案 開始進行FPGA加速

FPGA開發(fā)者可以利用FA728Q加速卡和基于OFS的主板,借助開源文檔和源代碼來構建自己的自定義工作負載。

下表概述了開發(fā)者應如何使用菲數(shù)科技加速主板,開始開發(fā)基于FPGA的工作負載。

wKgZombRjYmAEZqTAAIUCm923p4259.png

您可以訪問https://github.com/OFS,獲取開放式FPGA堆棧的基礎源代碼和文檔。請注意,您可以在OFS主板目錄中瀏覽所有基于OFS的第三方主板。

客戶評價

“OFS幫助我們更輕松、更快速地構建客戶所需的加速平臺,為客戶提供從軟件、API 、驅動程序到底層硬件的一整套方案?!?/p>

—— 菲數(shù)科技有限公司

Cheng Ailian

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1620

    文章

    21509

    瀏覽量

    598865
  • 英特爾
    +關注

    關注

    60

    文章

    9745

    瀏覽量

    170639
  • 加速卡
    +關注

    關注

    1

    文章

    53

    瀏覽量

    10912
  • LLT
    LLT
    +關注

    關注

    0

    文章

    2

    瀏覽量

    5582

原文標題:菲數(shù)科技使用FA728Q加速卡加速低時延交易(LLT)應用

文章出處:【微信號:英特爾FPGA,微信公眾號:英特爾FPGA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高性能FPGA計算加速卡

    的高性能FPGA計算加速卡。作為基于服務器的PCI Express數(shù)據(jù)采集、處理、存儲設備,該板卡可以實現(xiàn)2通道萬兆光纖網(wǎng)絡數(shù)據(jù)的高速采集、實時處理、實時記錄和寬帶回放,強大的FPGA處理性能,可以實現(xiàn)
    發(fā)表于 03-04 11:13

    高性能FPGA計算加速卡

    的高性能FPGA計算加速卡。作為基于服務器的PCI Express數(shù)據(jù)采集、處理、存儲設備,該板卡可以實現(xiàn)2通道萬兆光纖網(wǎng)絡數(shù)據(jù)的高速采集、實時處理、實時記錄和寬帶回放,強大的FPGA處理性能,可以實現(xiàn)
    發(fā)表于 03-18 11:16

    高性能FPGA計算加速卡

    的高性能FPGA計算加速卡。作為基于服務器的PCI Express數(shù)據(jù)采集、處理、存儲設備,該板卡可以實現(xiàn)2通道萬兆光纖網(wǎng)絡數(shù)據(jù)的高速采集、實時處理、實時記錄和寬帶回放,強大的FPGA處理性能,可以實現(xiàn)
    發(fā)表于 03-25 11:34

    高性能FPGA計算加速卡

    的高性能FPGA計算加速卡。作為基于服務器的PCI Express數(shù)據(jù)采集、處理、存儲設備,該板卡可以實現(xiàn)2通道萬兆光纖網(wǎng)絡數(shù)據(jù)的高速采集、實時處理、實時記錄和寬帶回放,強大的FPGA處理性能,可以實現(xiàn)
    發(fā)表于 04-01 10:53

    高性能FPGA計算加速卡

    的高性能FPGA計算加速卡。作為基于服務器的PCI Express數(shù)據(jù)采集、處理、存儲設備,該板卡可以實現(xiàn)2通道萬兆光纖網(wǎng)絡數(shù)據(jù)的高速采集、實時處理、實時記錄和寬帶回放,強大的FPGA處理性能,可以實現(xiàn)
    發(fā)表于 04-11 14:45

    高性能FPGA計算加速卡

    的高性能FPGA計算加速卡。作為基于服務器的PCI Express數(shù)據(jù)采集、處理、存儲設備,該板卡可以實現(xiàn)2通道萬兆光纖網(wǎng)絡數(shù)據(jù)的高速采集、實時處理、實時記錄和寬帶回放,強大的FPGA處理性能,可以實現(xiàn)
    發(fā)表于 04-18 14:12

    基于加速卡的FPGA生態(tài)系統(tǒng)布局是怎樣的?

    FPGA加速卡是如何產(chǎn)生的?主要的FPGA加速卡產(chǎn)品有哪些?基于加速卡的FPGA生態(tài)系統(tǒng)布局是怎樣的?
    發(fā)表于 06-17 06:07

    MLU220-M.2邊緣端智能加速卡支持相關資料介紹

    ??梢暂p松實現(xiàn)終端設備和邊緣段設備的AI賦能方案。MLU220-M.2加速卡用于離線模型的部署,離線模型在MLU220上運行, 不依賴AI框架,只需要利用CNRT庫,即可實現(xiàn)高效的AI推理運算。如果需要
    發(fā)表于 08-08 17:37

    LCD轉VGA/AV/S-Video視頻加速卡

    LCD轉VGA/AV/S-Video視頻加速卡:此 LCD 轉VGA 視頻加速卡是一款以FPGA+SDRAM+DAC 為核心的視頻加速卡。帶有LCD 控制器的CPU 通過此視頻加速卡
    發(fā)表于 09-21 08:25 ?73次下載

    LCD轉VGA視頻加速卡

    LCD轉VGA視頻加速卡:此 LCD 轉VGA 視頻加速卡是一款以FPGA+SDRAM+DAC 為核心的視頻加速卡。帶有LCD 控制器的CPU 通過此視頻加速卡,可以驅動帶VGA 接口
    發(fā)表于 09-21 08:28 ?56次下載

    提供超低時加速的Axxia網(wǎng)絡加速

      LSI 公司宣布推出 Axxia網(wǎng)絡加速器,旨在為新一代網(wǎng)絡應用提供超低時加速。該款 PCI Express智能加速卡和配套提供
    發(fā)表于 10-15 09:03 ?870次閱讀

    FPGA加速卡從芯片到系統(tǒng)的發(fā)展歷程

    在2019年MWC大會的第一天,英特爾又推出了一款針對5G應用的FPGA加速卡PAC N3000。這款加速卡可以實現(xiàn)高達100Gbps的網(wǎng)絡流量的加速處理,同時支持9GB DDR4和1
    發(fā)表于 08-12 17:51 ?1243次閱讀

    GPU加速卡對PCB性能的作用是什么?

    由于 AI 服務器需要處理大量的數(shù)據(jù)和信號,因此 GPU 加速卡需要使用 具有高頻高速性能的 CCL,即能夠在高頻率下保持低損耗、、串擾、低噪聲等 特性的 CCL。這需要 CC
    發(fā)表于 09-22 14:50 ?4369次閱讀
    GPU<b class='flag-5'>加速卡</b>對PCB性能的作用是什么?

    AMD 推出為超低時電子交易專屬打造的基于FPGA的加速卡

    ? UL3524 加速卡,這是一款面向超低時電子交易應用設計的新款金融科技( fintech )加速卡。Alveo UL3524 已由領先的交易公
    發(fā)表于 10-07 14:43 ?310次閱讀
    AMD 推出為超低時<b class='flag-5'>延</b>電子交易專屬打造的基于FPGA的<b class='flag-5'>加速卡</b>

    AMD 為超低時電子交易推出 Alveo UL3524 加速卡

    Data、Exegy 和 Hypertec 加入到不斷壯大的面向金融科技市場的超低時解決方案生態(tài)系統(tǒng) - AMD(超威,納斯達克股票代碼:AMD)日前宣布 推出 AMD Alveo UL3524 加速卡
    的頭像 發(fā)表于 10-11 08:10 ?553次閱讀
    AMD 為超低時<b class='flag-5'>延</b>電子交易推出 Alveo UL3524 <b class='flag-5'>加速卡</b>