科技云報道原創(chuàng)。
英偉達是當(dāng)之無愧的“AI算力王者”,A100、H100系列芯片占據(jù)金字塔頂尖位置,是ChatGPT這樣的大型語言模型背后的動力來源。
但面對英偉達的獨霸天下,科技巨頭們都紛紛下場自研AI芯片。
10月6日,媒體援引知情人士消息稱,微軟計劃在下個月的年度開發(fā)者大會上推出首款為人工智能設(shè)計的芯片,來降低成本并減少對英偉達的依賴。
同一天,據(jù)媒體消息顯示,ChatGPT開發(fā)商OpenAI也正在探索AI芯片的可能性,并已評估潛在的收購目標,以加速自研芯片的研發(fā)。
事實上,不僅是微軟、OpenAI試圖自研AI芯片,AWS、谷歌、Meta等科技巨頭都已下場自研。
在醞釀數(shù)年后,這是否意味著英偉達的獨霸時代即將結(jié)束?
巨頭紛紛自研AI芯片
目前,包括谷歌、AWS、阿里巴巴、百度、華為等國內(nèi)外云服務(wù)大廠都已有自研 AI 芯片用于數(shù)據(jù)中心,微軟和Meta也有相關(guān)計劃。所以對于頭部的AI技術(shù)大廠來說,自研AI芯片已經(jīng)是一大趨勢。
微軟早就自研芯片
作為全球頭部云廠商,微軟Azure需要大量AI處理器。尤其是和OpenAI合作以后,有消息稱微軟至少訂購了數(shù)十萬顆英偉達芯片。
因此,這幾年微軟在芯片研發(fā)上加快了進程,先是建立由前英特爾高管Rani Borkar領(lǐng)導(dǎo)的芯片部門;后又各處招兵買馬,其中就包括前蘋果芯片架構(gòu)師Filippo;此外還和AMD展開了密切合作。
自2019年以來,微軟就開始研發(fā)一款名為"雅典娜"(Athena)的定制AI芯片,用于為大型語言模型提供動力,目前已在測試階段。
Athena的首個目標是為OpenAI提供算力引擎,以替代昂貴的英偉達A100/H100。如果明年大規(guī)模推出,Athena將允許微軟內(nèi)部和OpenAI的團隊同時訓(xùn)練和推理模型。
SemiAnalysis的分析師迪倫·帕特爾(Dylan Patel)表示,開發(fā)類似于雅典娜的芯片可能每年需要花費1億美元左右,ChatGPT每天的運營成本約70萬美元,大部分成本來源于昂貴的服務(wù)器,如果雅典娜芯片與英偉達的產(chǎn)品擁有同等競爭力,每個芯片的成本將可以降低三分之一。
有知情人爆料,微軟在芯片研發(fā)上已砸入了近20億美元。
OpenAI計劃收購
據(jù)媒體消息稱,OpenAI也正在探索制造自研人工智能芯片,并已開始評估潛在的收購目標。
報道稱,至少從去年開始,OpenAI就已討論各種方案,以解決AI芯片短缺問題。
OpenAI已將獲取更多AI芯片列為公司首要任務(wù),討論方案包括自研AI芯片,與包括英偉達在內(nèi)的其他芯片制造商更密切地合作,以及在英偉達之外實現(xiàn)供應(yīng)商多元化。
谷歌最早自研TPU芯片
早在2013年,谷歌就已秘密研發(fā)一款專注于AI機器學(xué)習(xí)算法的芯片,并將其用在內(nèi)部的云計算數(shù)據(jù)中心中,以取代英偉達的GPU。
2016年5月,這款自研芯片公諸于世,即TPU。TPU可以為深度學(xué)習(xí)模型執(zhí)行大規(guī)模矩陣運算,例如用于自然語言處理、計算機視覺和推薦系統(tǒng)的模型,其最初專為谷歌的超級業(yè)務(wù)云計算數(shù)據(jù)中心而生。
2020年,谷歌實際上已在其數(shù)據(jù)中心部署了人工智能芯片TPU v4。
AWS推出訓(xùn)練和推理芯片
從2013年推出首顆Nitro1芯片至今,AWS是最先涉足自研芯片的云廠商,已擁有網(wǎng)絡(luò)芯片、服務(wù)器芯片、人工智能機器學(xué)習(xí)自研芯片3條產(chǎn)品線。
2018年初,科技媒體Information爆料亞馬遜已經(jīng)開始設(shè)計定制AI芯片。
AWS自研AI芯片版圖包括推理芯片Inferentia和訓(xùn)練芯片Trainium。2018年底,AWS推出自研AI推理芯片Inferentia,可以以低成本在云端運行圖像識別、語音識別、自然語言處理、個性化和欺詐檢測等大規(guī)模機器學(xué)習(xí)推理應(yīng)用程序。
2020年底,AWS推出專用于訓(xùn)練機器學(xué)習(xí)模型的Trainium。
2023年初,專為人工智能打造的Inferentia 2發(fā)布。Inf2實例最多可支持1750億個參數(shù),這使其成為大規(guī)模模型推理的有力競爭者。
在AWS、微軟和谷歌這三家中,亞馬遜是唯一一家在服務(wù)器中提供兩種類型芯片(標準計算芯片和用于訓(xùn)練與運行機器學(xué)習(xí)模型的專用芯片)的云提供商,其在2015年收購以色列芯片設(shè)計公司Annapurna Labs為這些努力奠定了基礎(chǔ)。
Meta基于RISC-V開源架構(gòu)自研
直到2022年,Meta Platforms還主要使用CPU和專為加速AI算法而設(shè)計的定制芯片組合來運行其AI工作負載。
后來,Meta取消了于2022年大規(guī)模推出定制芯片的計劃,轉(zhuǎn)而訂購了價值數(shù)十億美元的英偉達GPU。
如今為了扭轉(zhuǎn)局面,Meta已經(jīng)在開發(fā)內(nèi)部芯片,并于5月19日公布了AI訓(xùn)練與推理芯片項目。
據(jù)介紹,MTIA芯片的功耗僅為25瓦,占英偉達等市場領(lǐng)先供應(yīng)商芯片功耗的一小部分,并使用了RISC-V(第五代精簡指令處理器)開源架構(gòu)。
值得注意的是,Meta于5月初收購了英國AI芯片獨角獸Graphcore的AI網(wǎng)絡(luò)技術(shù)團隊,為其自研AI芯片奠定了基礎(chǔ)。
英偉達能否被撼動?
埃森哲公司報告指出,如今技術(shù)行業(yè)的AI滲透度明顯高出其他行業(yè),而未來企業(yè)的成長潛力取決于其能在多大程度上應(yīng)用生成式AI。更關(guān)鍵的是,熟練運用新技術(shù)也將成為國家發(fā)展的關(guān)鍵。
如今,AI技術(shù)在數(shù)據(jù)中心、智能汽車、游戲等的應(yīng)用落地方面取得了豐碩的成果,要實現(xiàn)AI大規(guī)模應(yīng)用,背后必定要有大量AI芯片的算力支持。
數(shù)據(jù)顯示,英偉達的GPU是全球應(yīng)用最為廣泛的 AI 芯片。
英偉達獨立GPU市場份額達80%,在高端GPU市場份額高達90%。2020年,全世界跑AI的云計算與數(shù)據(jù)中心,80.6%都由英偉達GPU驅(qū)動。2021年,英偉達表示,全球前500個超算中,大約七成是由英偉達芯片驅(qū)動的。
顯而易見,英偉達已經(jīng)壟斷了全球算力。
隨著AWS、谷歌、微軟等巨頭加入自研AI芯片的道路,英偉達的壟斷地位是否能被撼動呢?
首先,芯片設(shè)計技術(shù)非常復(fù)雜。
高算力芯片的首要挑戰(zhàn)就是其復(fù)雜度,從芯片設(shè)計角度,高性能計算芯片中的計算單元、存儲訪問以及芯片間的互聯(lián)都是需要仔細考慮。
英偉達之所以引領(lǐng)GPU創(chuàng)新,源于其架構(gòu)底座不斷迭代,從2008年的Tesla架構(gòu)到2020年的Ampere架構(gòu),每一次都是對硬件的升級與改進。代際之間產(chǎn)品性能提升顯著,性能和市場份額均領(lǐng)先全球。
其次,不可一世的CUDA生態(tài)。
比造芯更難的是搭建生態(tài),全球GPU生態(tài)都來自CUDA。
CUDA,是英偉達2006年推出的通用并行計算架構(gòu)生態(tài),使GPU能夠解決復(fù)雜的計算問題。
毋庸置疑,CUDA是迄今為止最發(fā)達、最廣泛的生態(tài)系統(tǒng),也是深度學(xué)習(xí)庫最有力的支持。
雖然有PyTorch支持更多GPU廠商,再加上OpenAI的Triton攪局,但無法撼動CUDA的統(tǒng)治地位。
隨著人工智能領(lǐng)域的蓬勃發(fā)展,GPU和CUDA被從業(yè)者視為標配,使用GPU做加速計算已成為行業(yè)主流。雖然英偉達GPU本身硬件平臺的算力卓越,但其強大的CUDA軟件生態(tài)才是推升GPU計算生態(tài)普及的關(guān)鍵力量。
當(dāng)前CUDA 廣泛功能已與英偉達GPU硬件深度耦合,開發(fā)者早已熟悉其專有的編程語言CUDA,用于制作GPU驅(qū)動的應(yīng)用程序。
如果換到其他廠商的定制芯片,就需要學(xué)習(xí)全新的軟件語言了,如何說服開發(fā)者使用這些AI芯片呢?
最后,芯片的具體生產(chǎn)也是一個挑戰(zhàn)。
如何確保芯片生產(chǎn)的良率,以及如何在高級封裝和先進工藝節(jié)點產(chǎn)能仍然有可能緊張的幾年內(nèi),獲得足夠的產(chǎn)能以量產(chǎn),也是各大巨頭需要解決的問題。
總體而言,想要撼動英偉達的壟斷地位,并不是一朝一夕的事。各大科技巨頭要想在AI算力芯片上突圍,就必須在底座、專利、核心技術(shù)、人才建設(shè)、生態(tài)建設(shè)等各方面下大功夫。
【關(guān)于科技云報道】
專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。
審核編輯 黃宇
-
微軟
+關(guān)注
關(guān)注
4文章
6554瀏覽量
103896 -
英偉達
+關(guān)注
關(guān)注
22文章
3720瀏覽量
90683 -
AI芯片
+關(guān)注
關(guān)注
17文章
1850瀏覽量
34849 -
OpenAI
+關(guān)注
關(guān)注
9文章
1033瀏覽量
6378
發(fā)布評論請先 登錄
相關(guān)推薦
評論