目前比較主流的AI深度學(xué)習(xí)框架主要由國(guó)際巨頭領(lǐng)銜,比如谷歌的TensorFlow和Facebook的PyTorch等。2017年中國(guó)的一家初創(chuàng)團(tuán)隊(duì)悄悄成立,他們做的是對(duì)標(biāo)這些主流框架的技術(shù)開(kāi)發(fā)。今年初,這家公司聲名鵲起,并獲得了由高瓴創(chuàng)投領(lǐng)投的5000萬(wàn)元A輪融資。這家公司叫一流科技,他們的深度學(xué)習(xí)框架叫做OneFlow,今年7月31日,OneFlow即將迎來(lái)自己的開(kāi)源一周年紀(jì)念日。
對(duì)框架的超前定位,有力支撐了深度學(xué)習(xí)領(lǐng)域的創(chuàng)業(yè)
一流科技創(chuàng)始人袁進(jìn)輝在創(chuàng)辦公司之前,在微軟研究院工作多年,主要從事機(jī)器學(xué)習(xí)、分布式系統(tǒng)的研發(fā)?!爱?dāng)時(shí)我們認(rèn)為隨著AI數(shù)據(jù)和算力需求的不斷增加,現(xiàn)有的深度學(xué)習(xí)框架在未來(lái)會(huì)遇到瓶頸,幾年前我多次在公開(kāi)演講中提到過(guò)這個(gè)觀點(diǎn),但當(dāng)時(shí)業(yè)界不以為然。”袁進(jìn)輝說(shuō)道。
袁進(jìn)輝分析,從機(jī)器視覺(jué)到人機(jī)對(duì)話,再到認(rèn)知智能,AI不斷突破能力邊界,同時(shí)伴隨著模型參數(shù)的指數(shù)級(jí)提升,AI模型加速膨脹導(dǎo)致訓(xùn)練成本攀升,預(yù)計(jì)2025年最先進(jìn)的AI訓(xùn)練模型成本將達(dá)到1億美元。
而單芯片存在算力天花板,單芯片在物理層面存在性能極限,先進(jìn)制程發(fā)展已難以維持摩爾定律;分布式硬件難以高效協(xié)同運(yùn)轉(zhuǎn),分布式方案芯片間傳輸帶寬低于片上帶寬,多芯片集群難以像“超級(jí)芯片”一樣高效工作。
針對(duì)內(nèi)存墻、用戶(hù)接口不友好和定制化成本高等AI分布式訓(xùn)練痛點(diǎn),OneFlow從底層機(jī)制提出Actor機(jī)制、一致性視角和自動(dòng)并行技術(shù)加以解決。
袁進(jìn)輝表示,隨著大規(guī)模參數(shù)模型爆發(fā),OneFlow需求匹配程度愈發(fā)提高,將超過(guò)TensorFlow和PyTorch逐漸占據(jù)更多的市場(chǎng)空間。
近兩年,一些國(guó)內(nèi)科技巨頭也紛紛推出深度學(xué)習(xí)框架,例如百度飛槳PaddlePaddle、華為的MindSpore等。他們大多擁有自己的生態(tài)圈,能夠?qū)⒂布蛙浖钆涫褂?。相比之下,一流科技的OneFlow屬于獨(dú)立的第三方框架,更具有中立性,可以廣泛地與芯片廠商進(jìn)行適配。
“GPU芯片巨頭英偉達(dá)在美國(guó)的軟件棧團(tuán)隊(duì)對(duì)我們的深度學(xué)習(xí)框架表示了密切關(guān)注,每?jī)蓚€(gè)星期我們會(huì)就框架優(yōu)化與合作問(wèn)題進(jìn)行探討。”袁進(jìn)輝透露。
雖然TensorFlow和PyTorch等深度學(xué)習(xí)框架為也英偉達(dá)的芯片所適配,不過(guò)顯然,英偉達(dá)注意到OneFlow這個(gè)由獨(dú)立的軟件公司研發(fā)的框架的好處和價(jià)值。
開(kāi)源與良好的商業(yè)模式并不沖突
去年OneFlow框架開(kāi)源之后獲得了非常高的關(guān)注。OneFlow的開(kāi)源代碼發(fā)布到了Github,開(kāi)源讓全球開(kāi)發(fā)者能夠直觀接觸、下載、使用OneFlow。開(kāi)源十個(gè)月Star數(shù)量超過(guò)2500,超過(guò)華為Mindspore。
袁進(jìn)輝直言,“在開(kāi)源社區(qū)里面,有很多基礎(chǔ)軟件,勝出的不是大公司,而是初創(chuàng)團(tuán)隊(duì),比如主導(dǎo)Spark的Databricks等。一些互聯(lián)網(wǎng)大公司都在用的軟件,剛開(kāi)始都是小團(tuán)隊(duì)做的。只要技術(shù)上過(guò)硬,就有機(jī)會(huì)。”顯然,一流科技有這個(gè)技術(shù)實(shí)力,在其框架開(kāi)源之后,獲得了谷歌、Facebook、華為、百度等同行的關(guān)注,也受到了資本的青睞。
但是,一個(gè)問(wèn)題是,開(kāi)源與公司的商業(yè)模式是否沖突呢?公司又如何建立自己的商業(yè)價(jià)值?
袁進(jìn)輝分析,開(kāi)源的商業(yè)模式主要有兩種,一種是雖然一些有技術(shù)能力的互聯(lián)網(wǎng)公司或開(kāi)發(fā)者自行下載開(kāi)源軟件,進(jìn)行項(xiàng)目開(kāi)發(fā),但是對(duì)于沒(méi)有開(kāi)發(fā)能力的用戶(hù),他們需要付費(fèi)購(gòu)買(mǎi)開(kāi)源軟件的商業(yè)版來(lái)使用。
另一種是云上托管。如今很多企業(yè)將數(shù)據(jù)計(jì)算在云上進(jìn)行,在用某個(gè)軟件處理大數(shù)據(jù)、AI計(jì)算的任務(wù)時(shí)他可以把開(kāi)源工具下載下來(lái)在云上部署,這種方式下公司必須自己雇用工程師對(duì)這一流程進(jìn)行調(diào)優(yōu),需要承擔(dān)較高的人力成本。但也可以直接從云上使用開(kāi)源公司部署的軟件,這種做法用戶(hù)需要承擔(dān)的成本較低,也更方便省事。
目前開(kāi)源云托管是最好的商業(yè)模式,在美國(guó)已經(jīng)運(yùn)用相對(duì)成熟。相信在中國(guó)也將有越來(lái)越多的用戶(hù)接受這一模式。
OneFlow用起來(lái)不僅是快,下一步打通易用性
OneFlow選擇自上向下占領(lǐng)市場(chǎng),占據(jù)技術(shù)制高點(diǎn),從高效性向易用性和完備性延伸。以高效性作為突破口,切入市場(chǎng)打破競(jìng)爭(zhēng)格局。
目前,用OneFlow訓(xùn)練比其他框架快的口碑已經(jīng)在業(yè)內(nèi)傳開(kāi)。一個(gè)數(shù)據(jù)是,OneFlowv0.2.0實(shí)現(xiàn)了多達(dá)17個(gè)性能優(yōu)化,使得CNN和BERT的自動(dòng)混合精度(AMP)訓(xùn)練速度大幅提升,不僅遠(yuǎn)超其他各個(gè)主要框架的官方實(shí)現(xiàn),同時(shí)也超過(guò)了NVIDIA深度優(yōu)化過(guò)的版本,成為在主流旗艦顯卡(V100 16G)上訓(xùn)練ResNet50-v1.5和BERT-base模型最快的框架。OneFlow ResNet50-v1.5 AMP單卡比NVIDIA深度優(yōu)化過(guò)的PyTorch快80%,比TensorFlow2.3快35%。
袁進(jìn)輝表示,我們即將發(fā)布新的版本,將重點(diǎn)提升軟件的易用性體驗(yàn),首先在單卡代碼上保證和PyTorch的體驗(yàn)一致,而同時(shí)在多卡場(chǎng)景下推出了全新的接口設(shè)計(jì),將給用戶(hù)帶來(lái)革命性的開(kāi)發(fā)體驗(yàn)。相信這個(gè)版本的發(fā)布將極大地帶動(dòng)開(kāi)發(fā)者群體,擴(kuò)大OneFlow的使用數(shù)量和應(yīng)用范圍。
在鋪設(shè)高效性和易用性之后,OneFlow還將打造完備性,從而形成自上而下、三位一體的布局。袁進(jìn)輝有信心,在不久的將來(lái)和TensorFlow、PyTorch是三分天下的市場(chǎng)格局。
AI軟件生態(tài),OneFlow需當(dāng)此重任
在移動(dòng)端,開(kāi)源的安卓系統(tǒng)形成強(qiáng)大的生態(tài)而成功。深度學(xué)習(xí)框架就像AI的操作系統(tǒng)一樣,它是模型算法和硬件資源之間的接口,是AI系統(tǒng)資源的管理者,實(shí)現(xiàn)對(duì)底層硬件資源的調(diào)度,讓開(kāi)發(fā)者無(wú)需關(guān)心實(shí)現(xiàn)細(xì)節(jié)。
袁進(jìn)輝認(rèn)為,生態(tài)建設(shè)就是0和1的問(wèn)題,OneFlow必然建設(shè)強(qiáng)大的生態(tài)才能實(shí)現(xiàn)更多的可能,取得最終的成功。
目前,OneFlow的硬核創(chuàng)新在核心AI開(kāi)發(fā)圈樹(shù)立了口碑,得到全球框架專(zhuān)家的高度認(rèn)可,國(guó)內(nèi)外深度學(xué)習(xí)框架產(chǎn)品已在積極跟進(jìn)OneFlow所開(kāi)創(chuàng)的設(shè)計(jì)理念。一流科技已與北京智源人工智能研究院、粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院、之江實(shí)驗(yàn)室、中關(guān)村智用人工智能研究院等頂尖AI科研院所開(kāi)展深度合作。同時(shí),聯(lián)合芯片、云廠商等上下游企業(yè)加強(qiáng)配合,已與寒武紀(jì)、燧原科技等推進(jìn)超大模型訓(xùn)練方案。下一步將推動(dòng)與更多芯片廠商和廣大開(kāi)發(fā)者的合作,打造AI平臺(tái)的繁榮生態(tài)。
開(kāi)源生態(tài)已經(jīng)得到國(guó)家層面的重視,“開(kāi)源”寫(xiě)進(jìn)了今年的十四五規(guī)劃,而開(kāi)源將是中國(guó)占領(lǐng)科技高地的機(jī)會(huì)。例如硬件方面現(xiàn)在大力發(fā)展的RISC-V開(kāi)源指令集架構(gòu),軟件方面OneFlow做為中國(guó)的深度學(xué)習(xí)框架,也將借助開(kāi)源的力量進(jìn)一步壯大其AI生態(tài)。
基于深度學(xué)習(xí)的軟件2.0時(shí)代將打開(kāi)30萬(wàn)億美元的市場(chǎng),袁進(jìn)輝表示,中國(guó)擁有大量的基礎(chǔ)軟件人才,積累了豐富的AI應(yīng)用場(chǎng)景,OneFlow有機(jī)會(huì)在這個(gè)AI時(shí)代乘風(fēng)而行。
本文為電子發(fā)燒友網(wǎng)原創(chuàng)文章,作者黃晶晶,微信號(hào)kittyhjj,轉(zhuǎn)載請(qǐng)注明以上來(lái)源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
-
AI
+關(guān)注
關(guān)注
87文章
29885瀏覽量
268173 -
pytorch
+關(guān)注
關(guān)注
2文章
802瀏覽量
13121 -
OneFlow
+關(guān)注
關(guān)注
0文章
9瀏覽量
8786
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論