5月23日,在有著103年歷史的舊金山藝術(shù)宮中, 英特爾的新晉科技大會——人工智能開發(fā)者大會(簡稱“AIDC”)如期而至。這一次,英特爾聚焦于拓寬人工智能生態(tài)。
在羅馬式建筑和科技感的AI場景間之間,英特爾的AI掌舵者Naveen Rao侃侃而談英特爾的人工智能軟硬件組合,而最重磅的信息莫過于Nervana神經(jīng)網(wǎng)絡芯片的發(fā)布預告,按照規(guī)劃,英特爾最新的AI芯片Nervana NNP L-1000,將在2019年正式推向市場,這也是英特爾第一個商用神經(jīng)網(wǎng)絡處理器產(chǎn)品。
兩年前,Naveen Rao還是深度學習初創(chuàng)公司Nervana Systems的首席執(zhí)行官兼聯(lián)合創(chuàng)始人。在公司被英特爾收購后,Nervana成為了英特爾人工智能的核心戰(zhàn)艦,Nervana NNP系列也應運而生,Naveen Rao則被任命為人工智能產(chǎn)品事業(yè)部的總負責人。
英特爾人工智能產(chǎn)品事業(yè)部副總裁、Nervana團隊成員Carey Kloss在接受21世紀經(jīng)濟報道記者專訪時談道:“我們創(chuàng)業(yè)初期就開始研發(fā)Lake Crest(Nervana NNP系列初代芯片代號)。當時我們整個團隊大概45人,正在構(gòu)建一個最大的Die(硅芯片),我們開發(fā)了Neon(深度學習軟件),還構(gòu)建了云棧,這些都是小團隊所完成的。但是這也是挑戰(zhàn)所在,小團隊成長會有陣痛,我們花了很長時間才把第一批產(chǎn)品拿出來,Nervana在2014年成立,直到去年芯片才真正問世。”
圖片來自網(wǎng)絡
不過,加入英特爾后,Nervana可以使用英特爾的各類資源,“當然,調(diào)用資源并不是一件容易的事情,但是英特爾在產(chǎn)品的市場化方面擁有豐富的經(jīng)驗。同時,英特爾有迄今為止我見過的最佳的后硅培養(yǎng)(post-silicon bring-up)和架構(gòu)分析。”Carey Kloss告訴21世紀經(jīng)濟報道記者,“出品芯片方面,我們有數(shù)百個系統(tǒng)同時運行,Nervana的員工和6個月前剛加入的成員也都為了新品夜以繼日地協(xié)同工作。”在他看來,Nervana現(xiàn)在處于合理的節(jié)奏中,已經(jīng)具備了明年取得成功的所有要素。
除了Nervana,英特爾收購的人工智能旗艦企業(yè)還包括專注視覺處理的Movidius、FPGA(現(xiàn)場可編程門陣列)巨頭Altera、智能駕駛相關(guān)的Mobileye等。事實上,從2011年開始,英特爾就開始不斷地投資人工智能相關(guān)的公司,其中也包括了中國的寒武紀、地平線。
與此同時,英特爾的競爭對手也在日益壯大。英偉達的GPU在人工智能領(lǐng)域高歌猛進; 谷歌 前不久發(fā)布了第三代AI芯片TPU,該芯片針對谷歌的深度學習架構(gòu)TensorFlow進行了優(yōu)化,并且谷歌對開發(fā)者提供了TPU等底層服務;去年, 百度 聯(lián)合ARM、紫光展銳和漢楓電子發(fā)布DuerOS智慧芯片,主要提供語音交互解決方案; Facebook 和 阿里巴巴 也紛紛進軍芯片領(lǐng)域,其中,阿里巴巴達摩院正在研發(fā)名為Ali-NPU的神經(jīng)網(wǎng)絡芯片,主要用于圖像、視頻識別以及云計算等場景。
在這場人工智能芯片的“遭遇戰(zhàn)”中,英特爾又將如何應對?
三大派系爭霸
從整體來看,目前全球人工智能的格局尚未明朗,屬于各自做技術(shù)探索的局部戰(zhàn),尚未進入群雄逐鹿的總體戰(zhàn)。人工智能是一個籠統(tǒng)的概念,具體的應用場景差異頗大,各家公司側(cè)重點有所不同,若根據(jù)技術(shù)和業(yè)務流派進行分類,可以將全球公司分為三個派系。
其一是系統(tǒng)應用派,最典型的代表是谷歌和Facebook。他們不僅開發(fā)人工智能的系統(tǒng)級框架,比如谷歌出名的人工智能框架Tensorflow、Facebook的Pytorch,而且還大規(guī)模地投入應用。例如,谷歌斥重金研發(fā)自動駕駛,推出翻譯等2C業(yè)務。而Facebook也將人工智能技術(shù)廣泛應用在社交網(wǎng)絡中的圖像處理,自然語言處理等諸多領(lǐng)域。
第二類是芯片派,目前主要是提供算力支持,最大的玩家就是英特爾和英偉達。英偉達的GPU抓住了計算設備需求的關(guān)鍵時機,在圖形渲染、人工智能和區(qū)塊鏈領(lǐng)域的計算表現(xiàn)十分突出,在這些業(yè)務方面也給英特爾帶來壓力。同時英偉達似乎和英特爾的“Intel Inside”不同,它更希望成為真正的算力平臺,并且成功推出了自己的CUDA平臺。
就在5月30日,英偉達發(fā)布了全球首個融合人工智能和高性能計算的計算平臺——HGX-2,這也是目前最大的GPU——DGX-2背后的計算平臺。
作為傳統(tǒng)算力領(lǐng)域的老大英特爾自然不甘示弱,50年的企業(yè)頗有老驥伏櫪的意味,近年來在人工智能領(lǐng)域頻頻發(fā)起重磅并購:2015年167億美元收購“現(xiàn)場可編程門陣列巨頭”(Field Programmable Gate Array,F(xiàn)PGA)Altera,為未來算力的發(fā)展趨勢奠定基礎(chǔ),F(xiàn)PGA在云計算、物聯(lián)網(wǎng)、邊緣計算等方面有很大的潛力;2016年英特爾收購Nervana,計劃用這家公司在深度學習方面的能力來對抗GPU;同年還收購了視覺處理芯片初創(chuàng)公司 Movidius;2017年英特爾以153億美元收購以色列協(xié)助駕駛公司Mobileye,旨在進軍自動駕駛領(lǐng)域。
在系統(tǒng)應用派和芯片派之外,第三類是技術(shù)應用派,剩下的大部分公司都屬于這一類型。雖然不同的公司都聲稱自己在深度學習、人工智能領(lǐng)域有著深厚甚至獨特的技術(shù)積累,但實際上大多是基于系統(tǒng)應用派和芯片派的技術(shù)平臺。只不過技術(shù)應用派更多的面向C端用戶,包括自動駕駛、圖像識別、企業(yè)級應用等??陀^上說,技術(shù)應用派屬于“君子善假于物也”。
從目前的競爭格局上來看,系統(tǒng)應用派已經(jīng)逐漸占據(jù)了整體優(yōu)勢,在人工智能領(lǐng)域具備了最核心的競爭力。在傳統(tǒng)的電腦和手機時代,系統(tǒng)和芯片更多是合作關(guān)系,芯片甚至更加占據(jù)主導地位。具體來看,比如在電腦市場上,英特爾在算力領(lǐng)域完全制霸,橫跨PC和 蘋果 的MAC機。而系統(tǒng)方面,Windows和iOS各有千秋,無法代替對方,但他們共同的英特爾卻無法代替。到了手機時代,雖然算力的主角從英特爾變?yōu)榱?高通 ,但是芯片依然處于核心的地位,其重要性和操作系統(tǒng)平分秋色。
而最近1-2年,形勢變化很快,蘋果放出要自己研發(fā)和生產(chǎn)MAC芯片的口風,英特爾股價一度聞風下跌。在人工智能領(lǐng)域,這樣的趨勢更加明顯,由于計算場景的需求差異化極大,谷歌根據(jù)自己的需要研發(fā)成熟的芯片變得必要,技術(shù)上也更可行。英特爾如果要為不同的場景定制芯片,意味著英特爾將全面轉(zhuǎn)入2B領(lǐng)域,和之前的2B2C模式相比,純2B的業(yè)務顯然會更像乙方,業(yè)務線的復雜度會急劇增長。而歷史上來看,一家公司從2C轉(zhuǎn)向2B總體來看往往都是因為失去了在行業(yè)中的核心統(tǒng)治地位而不得不退而求次。
押寶Nervana NNP
那么,在激烈競爭中,英特爾又如何進一步加碼芯片事業(yè)?
Naveen Rao加入了英特爾后,成為英特爾副總裁、AI事業(yè)部(AIPG)負責人,主導推出英特爾神經(jīng)網(wǎng)絡處理器(Nervana NNP)系列芯片。這次在AIDC大會上提出為開發(fā)者提供軟件工具、硬件、生態(tài)。在業(yè)內(nèi)看來,以英特爾的技術(shù)實力,軟件工具和硬件并不成問題,但是生態(tài)卻有待商榷。在PC時代,生態(tài)的核心是芯片,因此圍繞芯片構(gòu)建生態(tài)就可以令英特爾固若金湯,但是在人工智能時代,人工智能系統(tǒng)才是生態(tài)的核心,提供算力的芯片是生態(tài)的一部分,CPU可以提供算力,GPU也可以提供,英特爾可以生產(chǎn),英偉達也可以生產(chǎn),甚至谷歌、蘋果自己也可以生產(chǎn)。
目前在數(shù)據(jù)科學和深度學習計算領(lǐng)域,英特爾的芯片布局主要有Xeon(至強)芯片系列、Movidius的視覺芯片VPU、Nervana NNP系列、以及FPGA(現(xiàn)場可編程門陣列)。這幾條產(chǎn)品線分別對應幾個不同的細分應用場景。
Nervana NNP系列則是神經(jīng)網(wǎng)絡處理器,在深度學習的訓練和推斷階段中,Nervana NNP主要針對訓練階段的計算,按照英特爾的計劃,到2020年要將深度學習訓練(Deep Learning,簡稱“DL”)的效果提高100倍。這款神經(jīng)網(wǎng)絡處理器由英特爾和Facebook一起合作設計,可以預測該芯片很大程度上應該會對Facebook的機器學習框架Pytorch有很好的支持,畢竟Facebook的Pytorch的野心肯定是要和谷歌的Tensorflow一決高下。不過最新款芯片2019年才會正式推出商用,屆時深度學習的格局變化如何無法預料。
Naveen Rao在其博客中寫道:“我們正在開發(fā)第一個商用神經(jīng)網(wǎng)絡處理器產(chǎn)品英特爾Nervana NNP-L1000(代號Spring Crest),計劃在2019年發(fā)布。與第一代Lake Crest產(chǎn)品相比,我們預計英特爾Nervana NNP-L1000將實現(xiàn)3-4倍的訓練性能。英特爾Nervana NNP-L1000還將支持bfloat16,這是業(yè)內(nèi)廣泛采用的針對神經(jīng)網(wǎng)絡的一種數(shù)值型數(shù)據(jù)格式。未來,英特爾將在人工智能產(chǎn)品線上擴大對bfloat16的支持,包括英特爾至強處理器和英特爾FPGA?!?/p>
事實上,Spring Crest在2018年底推出的傳言早已有之,但是目前看來,官方公布的2019年這一時間點略有延遲。對此,Carey Kloss向記者解釋道:“進入更現(xiàn)代化的制程節(jié)點,我們集成了更多的Die(硅芯片),可以獲得更快的處理速度。但是需要一定的時間去制造硅片,也需要時間把硅片變成新的神經(jīng)網(wǎng)絡處理器,這是延遲的原因?!?/p>
對于兩代芯片的區(qū)別,他分析稱:“Lake Crest作為第一代處理器,在GEMM(矩陣運算)和卷積神經(jīng)上都實現(xiàn)了非常好的計算利用率。這不僅僅是指96%吞吐量的利用率,而是在沒有充分定制化的情況下,我們也取得了大多數(shù)情況下實現(xiàn)GEMM高于80%的計算利用率。當我們開發(fā)下一代芯片時,如果我們能夠保持高計算利用率,新的產(chǎn)品在性能上有3到4倍的性能提升?!?/p>
談及競爭,Carey Kloss表示:“我不知道我們競爭對手的路線圖是什么,但我們的反應速度相對較快,所以我認為我們不會在神經(jīng)網(wǎng)絡處理上處于劣勢。比如bfloat16已經(jīng)有一段時間了,它最近變得更受歡迎,不少客戶提出支持bfloat16的要求,我們也逐步轉(zhuǎn)向支持bfloat16。”而對比谷歌的TPU來看,他認為TPU二代類似于Lake Crest,TPU三代類似于Spring Crest。
四面出擊
除了備受關(guān)注的Nervana NNP,英特爾的Xeon芯片主要面向服務器和大型計算設備,比如我國超級計算機天河一號和二號就采用了Intel Xeon 六核處理器。
在視覺芯片方面,英特爾的業(yè)務量增長迅速。Movidius VPU芯片早就面向在汽車、無人機等新興的硬件市場,比如大疆無人機、 特斯拉 ,以及Google Clips攝像頭中都采用了Movidius的視覺芯片。
Movidius的市場負責人Gary Brown告訴21世紀經(jīng)濟報道記者:“在Movidius,我們研發(fā)的芯片被稱作視覺處理單元VPU。VPU是一種兼具計算機視覺和智能攝像頭處理器的芯片。所以我們的芯片所做的處理大概有三類: ISP處理,也就是圖像信號處理,基于攝像頭捕捉技術(shù)的處理,以及計算機視覺和深度學習。”
他舉例道,具體的使用場景包括VR產(chǎn)品和機器人技術(shù)、智能家居、工業(yè)攝像頭、AI攝像頭,還有監(jiān)控和安保。其中,“監(jiān)控和安保是一個巨大的市場,尤其在中國,監(jiān)控和安保攝像頭的市場特別大,有一些大公司在研發(fā)監(jiān)控攝像頭,例如??低?/u>和大華。”
Gary Brown還提到,智能家居領(lǐng)域目前正在迅速發(fā)展,雖然市場很小,但是發(fā)展神速。“有很多公司在研發(fā)智能裝置,如智能家庭安防、個人家庭助手、智能門鈴,以及公寓和家庭的訪問控制。但是在家居領(lǐng)域,要做到低成本、低能耗、電池壽命長,以及非常精準是非常有挑戰(zhàn)性的。因為比如室外的樹蔭在移動,就有可能觸發(fā)了防盜警報,因此非常低的誤報率是非常重要的,要有良好的準確性。”
而公司的挑戰(zhàn)之一就是如何繼續(xù)創(chuàng)造高性能的芯片,“我們有一些策略,比如,用一個前端算法降低功耗,這樣我們就能關(guān)閉大部分芯片,只運作小部分最優(yōu)化的面部檢測功能。當一張臉出現(xiàn)時,其他芯片將被啟動。這樣就能一直保持面部監(jiān)控系統(tǒng)開啟。我們還有很多演算節(jié)能技術(shù),使家用智能攝像頭續(xù)航時間達到大致6個月?!?Gary Brown解釋道。
此外,F(xiàn)PGA這條線則由Altera執(zhí)掌局面。隨著5G浪潮的到來,IoT物聯(lián)網(wǎng)的數(shù)據(jù)分析及計算需求會暴增,物聯(lián)網(wǎng)的接入節(jié)點至少是數(shù)百億級的規(guī)模,比手機規(guī)模要高出1-2個數(shù)量級。物聯(lián)網(wǎng)的典型需求是需要靈活使用算法的變化,這是FPGA的強項,F(xiàn)PGA可以通過自身結(jié)構(gòu)的改變來適應定制化計算場景的需求,這也使得英特爾在未來為更多不同類型的設備提供高效提供芯片變成可能。從167億美元的收購金額就可以看出,英特爾買的顯然不只是眼前的價值。
速攻企業(yè)級場景
英特爾近期的一項調(diào)查顯示,在美國企業(yè)客戶中,50%以上都正在轉(zhuǎn)向采用基于英特爾Xeon處理器的現(xiàn)有的云解決方案來滿足其對人工智能的初步需求。而多位英特爾高管在接受采訪時都向記者表示,沒有一種解決方案適用于所有的人工智能場景,英特爾會根據(jù)客戶需求對技術(shù)和業(yè)務進行搭配。比如,英特爾會將Xeon和FPGA、或者Xeon和Movidius配置在一起,從而實現(xiàn)更高性能的人工智能功能。
對于英特爾而言,這些強化的人工智能功能將被廣泛地應用于企業(yè)級場景。Naveen Rao就表示:“在加速向人工智能驅(qū)動的未來計算過渡之時,我們需要提供全面的企業(yè)級解決方案。這意味著我們的解決方案要提供最廣泛的計算能力,并且能夠支持從毫瓦級到千瓦級的多種架構(gòu)?!?/p>
Carey Kloss進一步向21世紀經(jīng)濟報道記者解釋人工智能芯片的應用場景:“Spring Crest可以說是最高等級的Nervana神經(jīng)元處理器架構(gòu)。因此它的客戶就包括超大規(guī)模計算中心、已經(jīng)擁有相當強大的數(shù)據(jù)科學工作的大型企業(yè)、政府等等。如果你需求的是低延且小模型,Xeon就能幫助到你,它可以把數(shù)據(jù)從云到端打通?!?/p>
具體來看,英特爾也在醫(yī)療、無人駕駛、新零售、物聯(lián)網(wǎng)等場景上做了探索。比如在醫(yī)療方面,據(jù)介紹,英特爾正在與 諾華 (Novartis)合作,使用深度神經(jīng)網(wǎng)絡來加速高內(nèi)涵篩選——這是早期藥品研發(fā)的關(guān)鍵元素。雙方的合作把訓練圖片分析模型的時間從11個小時縮短到了31分鐘——效率提高了20多倍。
在無人商店方面,英特爾為 京東 無人便利店提供“計算大腦”,目前已在多個智能門店( 中石化 易捷便利店、京東之家)以及智能售賣機項目中部署使用。在算法上,京東方面表示,無人商店用到的機器學習算法主要集中在知人、知貨、知場3個方向,由于涉及線上線下數(shù)據(jù)打通,將視頻等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)數(shù)據(jù)等,需要用到現(xiàn)在比較流行的機器視覺領(lǐng)域CNN(卷積神經(jīng)網(wǎng)絡)算法,智慧供應鏈方面用到的傳統(tǒng)機器學習算法,如SVM、統(tǒng)計學的線形回歸,邏輯回歸等。在網(wǎng)絡條件比較好的情況下,多數(shù)視頻數(shù)據(jù)可以使用較大模型在云端完成。在網(wǎng)絡不佳的情況下,通過端計算比如移動端,邊緣計算使用小網(wǎng)絡完成。而使用的硬件包括Intel的邊緣服務器等。
盡管英特爾外遇強敵,轉(zhuǎn)型、擴張的步伐十分堅定。僅從研發(fā)數(shù)值來看,根據(jù)IC Insights的統(tǒng)計數(shù)據(jù),2017年排名前10位的半導體廠商研發(fā)總支出為359億美元,英特爾位列第一。報告顯示,2017年英特爾的研發(fā)支出為131億美元,占集團總支出的36%,約為英特爾2017年銷售額的五分之一。
隨著各家的巨額投入,AI芯片的戰(zhàn)役還將愈演愈烈。(來源:tuicool)
評論
查看更多