AI芯片大戰(zhàn)已經(jīng)轉(zhuǎn)向新的戰(zhàn)場。
通過提供訓(xùn)練AI模型這一極其復(fù)雜的工作所必需的芯片,英偉達(dá)將自身打造成了一家市值達(dá)2萬億美元的公司。隨著該行業(yè)的快速發(fā)展,更大的機(jī)遇將是銷售讓這些模型在訓(xùn)練后運(yùn)行的芯片,為生成式AI工具迅速擴(kuò)大的公司和個(gè)人使用者提供大量文本和圖像。
眼下,這種轉(zhuǎn)變正在為英偉達(dá)的火爆銷售錦上添花。該公司首席財(cái)務(wù)官Colette Kress上周表示,在去年收入超過470億美元的英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)中,逾40%是用于部署AI系統(tǒng),而非訓(xùn)練AI模型。這一比例是首個(gè)顯示轉(zhuǎn)變正在進(jìn)行的重要跡象。
Kress的評(píng)論緩解了一些人關(guān)于轉(zhuǎn)向部署AI系統(tǒng)的芯片會(huì)威脅到英偉達(dá)地位的擔(dān)憂,這些擔(dān)憂源于與那些讓英偉達(dá)成為AI熱潮領(lǐng)頭羊的芯片相比,AI系統(tǒng)進(jìn)行的所謂 “推理”工作可以用性能較低、成本更低的芯片來完成。
“有一種看法認(rèn)為,英偉達(dá)在推理功能領(lǐng)域的份額將低于訓(xùn)練功能領(lǐng)域,”Melius Research的分析師Ben Reitzes在客戶報(bào)告中說。“事實(shí)情況有助于揭示英偉達(dá)從即將到來的推理爆炸中獲益的能力?!?/p>
英偉達(dá)的許多競爭對(duì)手都認(rèn)為,隨著推理功能芯片變得越來越重要,它們?cè)贏I市場上會(huì)獲得更好的發(fā)展機(jī)會(huì)。
英特爾認(rèn)為,隨著客戶著眼于降低AI模型的運(yùn)營成本,英特爾的芯片將越來越具有吸引力。英特爾擅長制造的芯片類型已經(jīng)廣泛應(yīng)用于推理功能,而英偉達(dá)的尖端且更昂貴的H100 AI芯片在執(zhí)行推理工作方面則并未發(fā)揮至關(guān)重要的作用。
英特爾首席執(zhí)行官帕特·基辛格(Pat Gelsinger)在去年12月的一次采訪中表示:“推理芯片的經(jīng)濟(jì)效益在于,不需要去構(gòu)建4萬美元的H100環(huán)境,因?yàn)槟翘碾?,并且需要搭配新的管理和安全模型以及新的IT基礎(chǔ)設(shè)施?!彼f,“如果我能在標(biāo)準(zhǔn)的(英特爾芯片)上運(yùn)行那些模型,那就簡單好辦了?!?/p>
美國銀行的分析師Vivek Arya說,從英偉達(dá)上周三公布的財(cái)報(bào)來看,透露出的最重要信息可能就是行業(yè)向推理芯片的轉(zhuǎn)變。英偉達(dá)的財(cái)季業(yè)績超出了華爾街的預(yù)期,推動(dòng)該股在上周攀升8.5%,令公司估值達(dá)到約2萬億美元。
Arya說,對(duì)AI模型訓(xùn)練的投資激增后,隨著重點(diǎn)轉(zhuǎn)向從AI模型中創(chuàng)收,芯片推理功能的重要性將上升。與英偉達(dá)主導(dǎo)的AI訓(xùn)練功能相比,推理芯片可能更具競爭力。
推理相關(guān)業(yè)務(wù)的增長速度可能比早先預(yù)期的要快。今年年初,瑞銀分析師估計(jì),90%的芯片需求來自訓(xùn)練,到明年推理將僅占市場的20%。這些分析師在一份報(bào)告中說,英偉達(dá)約40%的數(shù)據(jù)中心收入來自推理,這個(gè)數(shù)字超出了他們的預(yù)期。
英偉達(dá)上周三的財(cái)報(bào)顯示,該公司在AI芯片市場的份額尚未受到真正挑戰(zhàn)。目前英偉達(dá)的AI芯片市場份額超過80%。在可預(yù)見的未來,英偉達(dá)用于訓(xùn)練AI系統(tǒng)的芯片預(yù)計(jì)仍將保持較高需求。
在訓(xùn)練AI系統(tǒng)的過程中,公司通過其模型運(yùn)行海量數(shù)據(jù),教它們預(yù)測語言,從而生成類似于人類的表達(dá)。這項(xiàng)工作對(duì)算力要求很高,而英偉達(dá)的GPU非常適合這項(xiàng)工作。
除了英特爾和Advanced Micro Devices等英偉達(dá)的老牌競爭對(duì)手外,一些AI芯片初創(chuàng)公司也可能會(huì)隨著推理功能日漸重要而嶄露頭角。
初創(chuàng)公司SambaNova將AI芯片和軟件結(jié)合在一起,可以進(jìn)行推理和訓(xùn)練?!拔覀兛吹轿覀兊耐评碛美诒ㄊ皆鲩L,”該公司首席執(zhí)行官SambaNova表示,“人們開始意識(shí)到,80%以上的成本將用于推理,我需要尋找替代解決方案?!?/p>
由前谷歌AI芯片工程師Jonathan Ross創(chuàng)立的初創(chuàng)公司Groq近幾個(gè)月來的吸引力激增,此前該公司主頁上的一個(gè)演示展示了其推理芯片如何快速地從一個(gè)大語言模型中生成響應(yīng)。Ross說,該公司現(xiàn)有計(jì)劃是今年部署4.2萬塊自家芯片,明年將部署100萬塊,但公司正在考慮將今年的部署數(shù)量增加到22萬塊,明年增加到150萬塊。
Ross說,推動(dòng)該公司考慮改變計(jì)劃的一個(gè)因素是,一些最先進(jìn)的AI系統(tǒng)正在進(jìn)行調(diào)整,以便在不重新訓(xùn)練的情況下做出更好的響應(yīng),這會(huì)將更多的計(jì)算工作推向推理。Ross說,與英偉達(dá)或其他芯片公司的產(chǎn)品相比,Groq的專業(yè)芯片運(yùn)行速度快得多、成本也低得多。
“對(duì)于推理,你能部署什么取決于成本,”Ross表示。“有很多模型可以在谷歌接受有效訓(xùn)練,但其中大約80%都沒有得到部署,原因是投入生產(chǎn)的成本太高?!?/p>
包括Meta、微軟、Alphabet旗下谷歌和亞馬遜公司在內(nèi)的科技巨頭一直在努力開發(fā)內(nèi)部推理芯片,因?yàn)樗鼈円庾R(shí)到即將到來的轉(zhuǎn)變以及能夠以更低成本進(jìn)行推理的好處。
以亞馬遜為例,該公司云計(jì)算部門數(shù)據(jù)和機(jī)器學(xué)習(xí)副總裁Swami Sivasubramanian去年表示,亞馬遜從2018年起就開始研發(fā)推理芯片,推理占其Alexa智能助手運(yùn)算成本的40%。
英偉達(dá)則希望在向推理過渡的過程中保持領(lǐng)先地位。去年,英偉達(dá)即將推出的一款芯片在一次重要的AI推理基準(zhǔn)測試中取得了行業(yè)領(lǐng)先的成績,延續(xù)了該公司多年來在該競爭中的優(yōu)勢地位。
2023年12月,AMD發(fā)布了新的AI芯片,稱其推理性能優(yōu)于英偉達(dá)的芯片,隨后英偉達(dá)在一篇博文中回?fù)袅诉@一說法。英偉達(dá)稱,AMD提到了其芯片有更好的推理性能,但是AMD的測試沒有使用優(yōu)化軟件,而如果在使用優(yōu)化軟件的同等測試條件下,英偉達(dá)芯片的推理速度將會(huì)是AMD的兩倍。
審核編輯:黃飛
評(píng)論
查看更多