“我在跑馬拉松的時(shí)候,身心都受到了磨礪。因此我明白了一個(gè)道理,想要把一件事做得更好,必須要持續(xù)不斷地轉(zhuǎn)型。”在近日的賽靈思開(kāi)發(fā)者大會(huì)(XDF)上,賽靈思總裁兼首席執(zhí)行官 Victor Peng 以他35年的長(zhǎng)跑經(jīng)歷來(lái)形容賽靈思的戰(zhàn)略轉(zhuǎn)型。此外,賽靈思還向全球消費(fèi)者推出了兩款重磅轉(zhuǎn)型之作……
超越FPGA轉(zhuǎn)型為平臺(tái)供應(yīng)商
“我23歲第一次跑馬拉松,當(dāng)時(shí)沒(méi)有任何準(zhǔn)備,我堅(jiān)持跑完了全程。整個(gè)過(guò)程非常痛苦,但讓我明白了提前做準(zhǔn)備的重要性。在今后的35年里,我累計(jì)跑了100多場(chǎng)馬拉松,最長(zhǎng)的一場(chǎng)是10年前參加的,賽程為100英里。“大會(huì)一開(kāi)始,Victor 講述了他的馬拉松經(jīng)歷, “我在跑馬拉松的時(shí)候,身心都受到了磨礪。同時(shí)我也明白了,想要把一件事做得更好,必須要持續(xù)不斷地轉(zhuǎn)型。”
Victor表示,當(dāng)今時(shí)代的變化呈幾何級(jí)數(shù)發(fā)生,F(xiàn)PGA也變得更加復(fù)雜和強(qiáng)大。此前,賽靈思的可編程邏輯器件主要應(yīng)用在原型設(shè)計(jì)和互聯(lián)上。而如今,隨著FPGA的復(fù)雜程度越來(lái)越高,賽靈思已經(jīng)超越了FPGA器件,轉(zhuǎn)變?yōu)橐患移脚_(tái)提供商。
打造靈活應(yīng)變、萬(wàn)物智能的世界
數(shù)據(jù)爆炸的發(fā)生,人工智能的興起,摩爾定律的放緩,顛覆了原有的市場(chǎng)和業(yè)務(wù)。系統(tǒng)和基礎(chǔ)設(shè)施在全球迅速擴(kuò)張,對(duì)計(jì)算能力和帶寬也有了更高的要求。同時(shí),也需要更加迅速地變化來(lái)滿足不斷變化的要求和標(biāo)準(zhǔn)。Victor解釋:“就像自然界‘物競(jìng)天擇,適者生存’自然法則一樣,在數(shù)字世界,即使是量產(chǎn)型應(yīng)用,靈活應(yīng)變的系統(tǒng)也是最具彈性和可持續(xù)性的?!?/p>
正如Victor所言,“打造靈活應(yīng)變、萬(wàn)物智能的世界”正是賽靈思的使命,這個(gè)使命還將會(huì)延續(xù)幾十年。
為了更好地完成使命,賽靈思制定了新的戰(zhàn)略,即:數(shù)據(jù)中心優(yōu)先,加速核心市場(chǎng)發(fā)展,驅(qū)動(dòng)靈活應(yīng)變的計(jì)算。Victor比喻:“像是一把椅子的三條腿,每一條腿都相互關(guān)聯(lián),對(duì)策略的完整性至關(guān)重要?!?/p>
基于新使命和新戰(zhàn)略,賽靈思推出了全新的產(chǎn)品類別——自適應(yīng)計(jì)算加速平臺(tái)ACAP。大會(huì)上,Victor重點(diǎn)介紹了賽靈思業(yè)界首款A(yù)CAP平臺(tái)Versal和AI加速器卡Alveo兩款新品。
ACAP:賽靈思轉(zhuǎn)型后的全新類別
Victor揭示,當(dāng)前的設(shè)計(jì)周期已經(jīng)超過(guò)了硅片發(fā)展周期。即使采用先進(jìn)的架構(gòu),保證迅速流程化,也要花費(fèi)18-24個(gè)月,而市場(chǎng)的變化往往在一夕之間。賽靈思的平臺(tái)要求既能加速機(jī)器學(xué)習(xí),又能加速非機(jī)器學(xué)習(xí)部分,并可動(dòng)態(tài)、迅速地完成加速,幫助用戶縮短集成人工智能到應(yīng)用中的時(shí)間,提升上市速度。
為了更好地滿足用戶需求,賽靈思推出了全新的產(chǎn)品類別——ACAP(Adaptive Compute Acceleration Platform)。
ACAP是可擴(kuò)展、一體化程度非常高的計(jì)算平臺(tái),其硬、軟件都可編程。A指靈活應(yīng)變。ACAP支持采用任何架構(gòu)來(lái)優(yōu)化網(wǎng)絡(luò)、算法和應(yīng)用,具備低時(shí)延,高通量的優(yōu)勢(shì);CA指計(jì)算加速。ACAP是多核計(jì)算平臺(tái),其內(nèi)部有不同的計(jì)算引擎,可擴(kuò)展性非常強(qiáng),用戶可對(duì)它進(jìn)行定制化的配置;P指平臺(tái)。數(shù)據(jù)流動(dòng)、計(jì)算工作等都可在ACAP上來(lái)實(shí)現(xiàn),并有更好的安全性和能耗。
在軟件層面,ACAP是非常一體化的開(kāi)發(fā)平臺(tái),內(nèi)部含有編譯器等,具有高通量、可擴(kuò)展、低延遲的性能,未來(lái)將能應(yīng)用到任何場(chǎng)景中。
·Versal
VERSAL是行業(yè)首款A(yù)CAP自適應(yīng)計(jì)算加速平臺(tái)。據(jù)賽靈思產(chǎn)品與技術(shù)市場(chǎng)營(yíng)銷高級(jí)總監(jiān)Kirk Saban介紹,VERSAL能夠?qū)崿F(xiàn)異構(gòu)加速,可用于各種類型的應(yīng)用,其設(shè)計(jì)面向所有開(kāi)發(fā)者。Kirk表示,賽靈思有一個(gè)全面的工具流,幫助用戶充分利用Versal架構(gòu)在熟悉的環(huán)境中進(jìn)行開(kāi)發(fā)。
Kirk認(rèn)為,Versal的異構(gòu)處理能力,由其多個(gè)不同類型的處理引擎帶來(lái),使得Versal可應(yīng)對(duì)不同的工作負(fù)載。Versal的引擎包括標(biāo)量處理引擎、靈活應(yīng)變的硬件引擎、智能引擎、高級(jí)協(xié)議引擎等。
標(biāo)量處理引擎,有雙ARM Cortex-A72應(yīng)用處理器,能效高且支持廣泛的應(yīng)用。還有雙ARM Cortex-R5實(shí)時(shí)處理器,可滿足安全性非常強(qiáng)的應(yīng)用需。另外,賽靈思還引入了革新性的引擎——平臺(tái)管理控制器,可對(duì)整個(gè)器件進(jìn)行控制,可滿足自上而下的設(shè)計(jì),實(shí)現(xiàn)軟件的可編程。
靈活應(yīng)變的硬件引擎,適用于更高計(jì)算密度的再構(gòu)建基礎(chǔ)硬件架構(gòu),它支持定制存儲(chǔ)器層級(jí),用戶可看到不同層次的應(yīng)用和外部應(yīng)用,比如高級(jí)機(jī)器學(xué)習(xí)和AI推斷部署和實(shí)施,可提供動(dòng)態(tài)重新配置功能,比之前各大產(chǎn)品快8倍。
智能引擎,其軟件可編程,硬件靈活應(yīng)變。比如DSP引擎,在Versal架構(gòu)可實(shí)現(xiàn)高精度浮點(diǎn)和低時(shí)延,面向定制化數(shù)據(jù)路徑的粒度控制。比如AI引擎,具備高吞吐量,低時(shí)延和高功效的特性,專為AI推斷和高級(jí)信號(hào)處理工作負(fù)載而優(yōu)化。使用緊密耦合存儲(chǔ)器的向量處理器陣列,可直接訪問(wèn)自適應(yīng)硬件,實(shí)現(xiàn)定制存儲(chǔ)器層級(jí),其軟件可編程??捎迷跓o(wú)線的計(jì)算,雷達(dá)型的應(yīng)用等。
值得注意的是,賽靈思AI引擎并沒(méi)有采用深鑒科技的技術(shù)。賽靈思軟件與AI解決方案產(chǎn)品市場(chǎng)營(yíng)銷與產(chǎn)品規(guī)劃副總裁Ramine Roane先生在媒體群訪中解釋,深鑒科技的AI引擎應(yīng)用范圍比較窄,更適用于某些神經(jīng)網(wǎng)絡(luò)DNA,而賽靈思希望AI引擎可用于包括AI、DSP還有5G在內(nèi)的更廣泛的領(lǐng)域。
Versal系列共六個(gè)產(chǎn)品
Versal產(chǎn)品組合將采用臺(tái)積電7nm FinFET制程工藝。目前共規(guī)劃六個(gè)系列:AI核心系列,AI Edge系列,AI RF系列,基礎(chǔ)系列,旗艦系列以及HBM系列。
其中,AI核心系列和基礎(chǔ)系列已經(jīng)通過(guò)早期使試用計(jì)劃與多家關(guān)鍵客戶合作,將于明年下半年上市。基礎(chǔ)系列是通用性非常強(qiáng)的產(chǎn)品,可針對(duì)包括傳統(tǒng)互聯(lián)應(yīng)用、加速應(yīng)用在內(nèi)的各個(gè)市場(chǎng)。AI系列是應(yīng)用于對(duì)性能要求非常高的領(lǐng)域,比如機(jī)器學(xué)習(xí)的推斷。
AI Edge系列主要針對(duì)自動(dòng)駕駛、機(jī)器人的應(yīng)用,或者對(duì)獨(dú)立運(yùn)營(yíng)要求以及安全性比較高的應(yīng)用,預(yù)計(jì)量產(chǎn)的時(shí)間為2020年。Versal旗艦版量產(chǎn)時(shí)間為2020年,HBM系列可用在高端的數(shù)據(jù)中心和測(cè)試產(chǎn)品中,其量產(chǎn)時(shí)間在2021年之后。RF系列可支持5G架構(gòu)和應(yīng)用,主要用在一些高性能的應(yīng)用當(dāng)中,包括天線的系統(tǒng)等,將于2020年量產(chǎn)。
·Alveo AI加速器卡
除了Versal之外,Alveo也是賽靈思主要介紹的重磅產(chǎn)品。
賽靈思軟件和IP產(chǎn)品部執(zhí)行副總裁Salil Raje先生在演講中強(qiáng)調(diào)了AI加速在人工智能訓(xùn)練和推斷階段的特點(diǎn)。他表示,當(dāng)前在推斷階段面臨創(chuàng)新的速度,低時(shí)延的性能,更低的功耗,整體的應(yīng)用加速等方面的挑戰(zhàn)。
另外,Ramine 也明確表示,當(dāng)前的賽靈思更專注于推斷部分的市場(chǎng)。推斷市場(chǎng)仍然處于上升期,推斷在加速應(yīng)用這方面處于快速增長(zhǎng)階段,現(xiàn)在正處于從CPU向加速卡轉(zhuǎn)換的階段,推斷的市場(chǎng)未來(lái)將比訓(xùn)練市場(chǎng)規(guī)模更大。
此背景下,賽靈思Alveo誕生了。Alveo將用來(lái)大幅度提升云端和本地?cái)?shù)據(jù)中心中業(yè)界標(biāo)準(zhǔn)服務(wù)器的性能。利用 Alveo,客戶在運(yùn)行實(shí)時(shí)機(jī)器學(xué)習(xí)推斷以及視頻處理、基因組學(xué)、數(shù)據(jù)分析等關(guān)鍵的數(shù)據(jù)中心應(yīng)用時(shí),有望以較低時(shí)延實(shí)現(xiàn)突破性的性能提升。
據(jù)了解,Alveo基于16nm 工藝。目前,Alveo? U200 和 Alveo U250已經(jīng)開(kāi)始接受量產(chǎn)訂單,起價(jià)為8995 美元。
就機(jī)器學(xué)習(xí)而言,Alveo U250實(shí)時(shí)推斷吞吐量比高端 CPU高出20 倍,相對(duì)于高端 GPU等固定功能的加速器,能讓 2 毫秒以下的低時(shí)延應(yīng)用性能提升 4 倍以上。此外,Alveo 加速器卡相對(duì)于 GPU 能將時(shí)延減少 3 倍,在運(yùn)行實(shí)時(shí)推斷應(yīng)用時(shí)提供顯著的性能優(yōu)勢(shì)。數(shù)據(jù)庫(kù)搜索等一些應(yīng)用可從根本上得到加速,性能比 CPU 高90 倍以上。
與合作伙伴發(fā)布的其他新品
此外,賽靈思還與其芯片合作伙伴進(jìn)行了合作,并制定了新的標(biāo)準(zhǔn)和方案。比如:賽靈思與華為聯(lián)合發(fā)布FX系列加速卡,具備高帶寬、低時(shí)延功能,可讓FPGA、CPU、GPU交互使用;賽靈思與浪潮聯(lián)合發(fā)布了全球首款集成HBM2的FPGA AI加速卡F37X,該加速卡可在不到75W典型應(yīng)用功耗提供28.1TOPS的INT8計(jì)算性能和460GB/s的超高數(shù)據(jù)帶寬,適用于機(jī)器學(xué)習(xí)推理、視頻轉(zhuǎn)碼、圖像識(shí)別、語(yǔ)音識(shí)別等應(yīng)用場(chǎng)景的AI計(jì)算加速。
評(píng)論
查看更多