數(shù)據(jù)洪流下,AI、5G等新技術(shù)催生的創(chuàng)新應(yīng)用帶來(lái)更加多元化的計(jì)算需求,這就要求多樣化的計(jì)算架構(gòu)。為此,英特爾提出了“xPU”策略,也就是英特爾不再局限于CPU(向量計(jì)算),而是向GPU(矢量計(jì)算)、AI(矩陣計(jì)算)和FPGA(空間計(jì)算)進(jìn)行延展。
基于此,我們看到英特爾構(gòu)建了一個(gè)包含CPU、GPU、AI加速器、FPGA,以及如神經(jīng)擬態(tài)計(jì)算等面向未來(lái)的計(jì)算架構(gòu)。在這樣的計(jì)算架構(gòu)支撐下,我們正在邁入超異構(gòu)計(jì)算時(shí)代。
在超異構(gòu)計(jì)算時(shí)代,英特爾確立了制程和封裝、架構(gòu)、內(nèi)存和存儲(chǔ)、互連、安全、軟件六大技術(shù)支柱,全方位推動(dòng)計(jì)算創(chuàng)新發(fā)展。在這其中,英特爾軟件是推動(dòng)未來(lái)計(jì)算創(chuàng)新的隱形力量。
軟件加速硬件指數(shù)級(jí)創(chuàng)新
毋庸置疑,英特爾在硬件層面的創(chuàng)新是有目共睹的。但是進(jìn)入到超異構(gòu)計(jì)算時(shí)代,計(jì)算力指數(shù)級(jí)上升的實(shí)現(xiàn)一定是基于硬件與軟件的結(jié)合。所以英特爾借助“軟件先行”的戰(zhàn)略,推進(jìn)硬件和軟件的共同創(chuàng)新,來(lái)引領(lǐng)異構(gòu)計(jì)算的整合和創(chuàng)新,實(shí)現(xiàn)計(jì)算力指數(shù)級(jí)增長(zhǎng),滿足未來(lái)多元化的計(jì)算需求。
在以數(shù)據(jù)為中心的戰(zhàn)略指引下,英特爾不光在硬件層面進(jìn)行創(chuàng)新,還在軟件層面進(jìn)行投入。因?yàn)檎麄€(gè)計(jì)算架構(gòu)不是原來(lái)的單一CPU架構(gòu),需要針對(duì)不同的架構(gòu)和負(fù)載進(jìn)行整合,軟件在中間起了一個(gè)最關(guān)鍵的橋梁作用。
其實(shí),英特爾在軟件領(lǐng)域的投入是巨大。英特爾在全球大概十萬(wàn)到十一萬(wàn)人,軟件工程師占到15%左右(15000名左右)。而在中國(guó),英特爾亞太研發(fā)中心正式員工超過(guò)2000人,是涵蓋英特爾各個(gè)產(chǎn)品部在中國(guó)最大的、最完整的綜合性研發(fā)機(jī)構(gòu),擁有世界一流的工程研發(fā)能力。
英特爾通過(guò)軟件實(shí)現(xiàn)軟硬協(xié)同、生態(tài)共贏:提供簡(jiǎn)便可擴(kuò)展的工具,來(lái)加速應(yīng)用開發(fā)部署;堅(jiān)持客戶至上,針對(duì)不同類型的工作負(fù)載進(jìn)行優(yōu)化;秉承開放理念,推動(dòng)開源、開放生態(tài)系統(tǒng)協(xié)作;產(chǎn)學(xué)研對(duì)接,培育面向未來(lái)的創(chuàng)新人才。
在軟件生態(tài)構(gòu)件中,開發(fā)者是重要一環(huán)。英特爾已經(jīng)深入開發(fā)者生態(tài)領(lǐng)域超過(guò)20年,并有10000項(xiàng)與客戶緊密合作的軟件部署,是Linux Kernel最大的貢獻(xiàn)者,每年修改的代碼超過(guò)50萬(wàn)行,為100多個(gè)操作系統(tǒng)進(jìn)行過(guò)優(yōu)化,并且擁有超過(guò)兩千萬(wàn)活躍開發(fā)者的生態(tài),而這些只是英特爾龐大的軟件實(shí)力的一部分。英特爾跨基礎(chǔ)架構(gòu)、網(wǎng)絡(luò)、操作系統(tǒng)的開發(fā)經(jīng)驗(yàn),開發(fā)工具和SDK以及其所參與并影響的標(biāo)準(zhǔn)制定組織的數(shù)量在業(yè)界是無(wú)與倫比的。
基于這樣深厚的積淀,英特爾希望通過(guò)“統(tǒng)一架構(gòu)編程”,圍繞架構(gòu)創(chuàng)新進(jìn)行擴(kuò)展,并且讓所做的一切都是簡(jiǎn)便和可擴(kuò)展的。英特爾軟件所做的事情使所有的硬件的每一個(gè)晶體管都能夠能力充分發(fā)揮起來(lái),使得開發(fā)者能夠非常容易地把軟硬件充分用起來(lái)。
oneAPI打造統(tǒng)一架構(gòu)編程
跨架構(gòu)(CPU、GPU、FPGA及其他加速器)開發(fā)能力對(duì)于處理數(shù)據(jù)密集型工作負(fù)載極為重要,因?yàn)檫@種工作負(fù)載需要多種架構(gòu),這也將成為未來(lái)的常態(tài)。不過(guò)多架構(gòu)編程面臨諸多挑戰(zhàn)比如專用工作負(fù)載日益增多、尚無(wú)通用編程語(yǔ)言或 API、不一致的跨平臺(tái)工具支持、每個(gè)平臺(tái)需要單獨(dú)的軟件投資、需采用不同的以數(shù)據(jù)為中心的硬件等。
在今天,每一個(gè)硬件平臺(tái)往往需要開發(fā)者維護(hù)獨(dú)立的代碼庫(kù),這些代碼庫(kù)需要使用不同的語(yǔ)言、庫(kù)和軟件工具進(jìn)行編程。這是一項(xiàng)極其復(fù)雜和耗費(fèi)時(shí)間的工作,會(huì)大大降低開發(fā)速度、抑制創(chuàng)新。
為了解決這樣的業(yè)界難題,英特爾發(fā)布了一項(xiàng)全新軟件行業(yè)計(jì)劃oneAPI。oneAPI為異構(gòu)計(jì)算提供了一個(gè)統(tǒng)一和簡(jiǎn)化的應(yīng)用程序開發(fā)編程模型,這種統(tǒng)一性為開發(fā)者提供了一個(gè)統(tǒng)一的開發(fā)體驗(yàn),因?yàn)槠涿鎸?duì)不同的異構(gòu)硬件,他們不需要學(xué)習(xí)不同的編程方法。
具體來(lái)說(shuō),oneAPI基于標(biāo)準(zhǔn)的跨架構(gòu)語(yǔ)言Data Parallel C++和SYCL功能強(qiáng)大的API,旨在加速特定領(lǐng)域的主要功能底層硬件接口,可為供應(yīng)商提供硬件抽象層,支持針對(duì)不同的架構(gòu)和供應(yīng)商重復(fù)使用代碼。也就是說(shuō)oneAPI支持直接編程和API編程,并提供統(tǒng)一的語(yǔ)言和庫(kù),可以在包括CPU、GPU、FPGA和AI加速器等不同硬件架構(gòu)上提供完整的本地代碼性能。oneAPI的簡(jiǎn)單易用和高性能讓開發(fā)者不再需要維護(hù)不同的代碼庫(kù)、多種編程語(yǔ)言以及不同的工具和工作流程。
英特爾對(duì)于未來(lái)計(jì)算的展望和承諾是:SVMS架構(gòu)(S是Scalar標(biāo)量,V是Vector向量,M是Matrix矩陣,S是Space空間),也就是我們前面提到的超異構(gòu)計(jì)算。而在SVNS架構(gòu)之上,英特爾構(gòu)建oneAPI,對(duì)這些硬件進(jìn)行了抽象。開發(fā)者針對(duì)的是這個(gè)抽象來(lái)寫程序,而不是具體的硬件。在oneAPI是框架和中間件框架提供了更高一層的抽象和語(yǔ)義,開發(fā)者可以在上面快速開發(fā),高效部署。
我們可以將oneAPI理解成英特爾的中間件層,上面有各種不同類型的行業(yè)應(yīng)用,如果你要調(diào)英特爾底層的硬件,就統(tǒng)一用oneAPI進(jìn)行研發(fā)。比如面向視覺計(jì)算的OpenVINO就是構(gòu)建在oneAPI之上,支持CPU、FPGA、Movidius、GPU等,編寫一次以后可以通過(guò)異構(gòu)的接口支撐跑在其他的硬件平臺(tái)之上。
oneAPI以開發(fā)者為中心,是為多架構(gòu)并存的世界重新定義的一種新編程方式,讓開發(fā)者可以自由選擇架構(gòu),無(wú)需在性能上作出妥協(xié),也大大降低了使用不同的代碼庫(kù)、編程語(yǔ)言、編程工具和工作流程所帶來(lái)的復(fù)雜性。oneAPI產(chǎn)品為開發(fā)者提供了全套的開發(fā)工具,包括編譯器、編程庫(kù)、分析器等,并把這些工具封裝為特定領(lǐng)域的工具包。
oneAPI保留了現(xiàn)有軟件投資,包括支持現(xiàn)有語(yǔ)言,同時(shí)為開發(fā)人員創(chuàng)造更多豐富的應(yīng)用程序提供了靈活性,幫助他們?cè)诒A衄F(xiàn)有軟件投資的基礎(chǔ)上,搭建一座無(wú)縫連接的橋梁,從而為未來(lái)的多架構(gòu)世界創(chuàng)造更多豐富的應(yīng)用程序。比如oneAPI支持高級(jí)移植、分析和調(diào)試工具,包括英特爾Vtune分析器、英特爾Advisor等,其中英特爾DPC++兼容性工具支持CUDA代碼遷移。
除此以外,oneAPI包括了一項(xiàng)基于開放規(guī)范的行業(yè)計(jì)劃,該規(guī)范包括一種編程語(yǔ)言、強(qiáng)大的API函數(shù)庫(kù)以及底層硬件接口。比如Data Parallel C++可提供跨平臺(tái)數(shù)據(jù)并行性支持,而SYCL是全行業(yè)開展的一項(xiàng)標(biāo)準(zhǔn)化工作,旨在定義面向C++的跨平臺(tái)數(shù)據(jù)并行性支持。這就意味著各個(gè)不同加速器提供商可以在oneAPI框架里提供對(duì)它自己硬件的支持,其實(shí)已經(jīng)有第三方通過(guò)oneAPI對(duì)于NVIDIA的CUDA進(jìn)行上層的封裝,這樣對(duì)于開發(fā)人員來(lái)講,他也可以oneAPI支持NVIDIA的GPU,其想象空間巨大。
開發(fā)人員從現(xiàn)在開始就可以在英特爾DevCloud for oneAPI上對(duì)基于多種英特爾架構(gòu)(包括英特爾至強(qiáng)可擴(kuò)展處理器、帶集成顯卡的英特爾酷睿處理器、英特爾FPGA如英特爾Arria、Stratix等)的代碼和應(yīng)用進(jìn)行測(cè)試。它是一個(gè)開發(fā)系統(tǒng),支持使用英特爾的oneAPI測(cè)試版軟件在所有英特爾CPU、GPU和FPGA上開發(fā)、測(cè)試和運(yùn)行工作負(fù)載。用戶無(wú)需下載,無(wú)需購(gòu)買硬件,無(wú)需安裝,無(wú)需設(shè)置和配置,即可使用英特爾oneAPI工具套件,了解 Data Parallel C++,評(píng)估工作負(fù)載,構(gòu)建異構(gòu)應(yīng)用,設(shè)計(jì)項(xiàng)目原型。
目前oneAPI還是Beta測(cè)試版,預(yù)計(jì)2020年Q4發(fā)布正式版。畢竟oneAPI是一個(gè)全新的開發(fā)編程模型,足夠長(zhǎng)的測(cè)試期可以收集更多開發(fā)人員的反饋,完善產(chǎn)品。只有更多的開發(fā)者使用oneAPI,其價(jià)值才會(huì)凸顯出來(lái)。
oneAPI的發(fā)布源自英特爾數(shù)百萬(wàn)小時(shí)軟件工程開發(fā)的努力,并且標(biāo)志著一個(gè)行業(yè)內(nèi)的變革,從今天受限、封閉的編程方法演變到一個(gè)開放的、基于標(biāo)準(zhǔn)的模式,助力開發(fā)人員實(shí)現(xiàn)跨架構(gòu)的參與和創(chuàng)新,為全球開發(fā)人員提供一座從現(xiàn)有代碼和技能過(guò)渡到即將來(lái)臨的xPU時(shí)代的橋梁。
oneAPI是英特爾借助軟件力量充分釋放硬件性能這一長(zhǎng)期探索之旅的第一步,也是重要一步。目前英特爾正在與高校、合作伙伴等通過(guò)將oneAPI引入學(xué)校課程、線下Workshop等讓更多開發(fā)者認(rèn)識(shí)和使用oneAPI,同時(shí)通過(guò)開發(fā)人員指南、培訓(xùn)、英特爾工具支持論壇、ISV和應(yīng)用支持等加速oneAPI的落地。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論