燧原科技于7月7日在上海發(fā)布第二代人工智能訓(xùn)練產(chǎn)品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓(xùn)練加速卡和“云燧T21”訓(xùn)練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內(nèi)首家發(fā)布第二代人工智能訓(xùn)練產(chǎn)品組合的公司。
這是繼2019年12年發(fā)布第一代訓(xùn)練芯片,邃思1.0及云燧T10/T11,2020年12月發(fā)布第一代推理產(chǎn)品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強(qiáng)化學(xué)習(xí)使能游戲AI,改變數(shù)字娛樂的方式;強(qiáng)大的視覺能力,保駕護(hù)航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
隨著第二代產(chǎn)品的發(fā)布,將加速這些場景的商業(yè)化落地。
云燧智算集群
隨著自然語言處理、強(qiáng)化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、多模態(tài)和認(rèn)知模型等的發(fā)展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應(yīng)用上,綠色一體化的超級智算集群是關(guān)鍵趨勢。
燧原發(fā)布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓(xùn)練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓(xùn)練卡以及80%的線性度。
這是為智能計(jì)算和新基建算力而推出的集群化產(chǎn)品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計(jì)算芯片,邃思DTU2.0性能強(qiáng)悍
邃思DTU2.0是中國最大的計(jì)算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構(gòu)成先進(jìn)封裝。封裝尺寸為57.5mm*57.5mm。
?
DTU2.0的計(jì)算能力,單精度FP32達(dá)40FLOPS,支持單精度張量TF32,達(dá)160T FLOPS。TF32格式被認(rèn)為是在數(shù)據(jù)中心最先進(jìn)的數(shù)據(jù)模式。
此外,DTU2.0植入完全可編程的數(shù)據(jù)流,軟件指令驅(qū)動(dòng)的傳輸和數(shù)據(jù)計(jì)算,標(biāo)量、向量和張量的高效數(shù)據(jù)處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內(nèi)存,帶寬達(dá)1.8TB/s,是中國第一個(gè)支持世界最先進(jìn)存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。
6個(gè)LARE卡間互聯(lián)端口,每一個(gè)端口雙向50GB/s,總集群互聯(lián)帶寬300GB/s。
云燧T21\T20訓(xùn)練產(chǎn)品,分別為OAM標(biāo)準(zhǔn)模組和全高全長PCIE板卡。
以Benchmark數(shù)據(jù)來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標(biāo)檢測、圖像分割、推薦等均有明顯優(yōu)勢。
馭算Topsrider2.0架構(gòu)
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計(jì)算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計(jì),充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運(yùn)行提供解決方案。開放升級的編程模型和可擴(kuò)展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
云端訓(xùn)練計(jì)算產(chǎn)品路線圖
訓(xùn)練產(chǎn)品方面,燧原計(jì)劃第三代T30/T31產(chǎn)品將于2023年發(fā)布,每瓦的能效將提升14倍。同時(shí)升級到Matrix3.0。
推理計(jì)算方面,2021年下半年將發(fā)布i20推理芯片,以及2023年將發(fā)布i30。其每瓦能效將分別提升4倍和16倍。
另外,在Topsrider2.x的基礎(chǔ)上,還將進(jìn)一步升級至Topsrider3.x,致力于泛AI生態(tài)。
生態(tài)建設(shè)
AI生態(tài)也是跨行業(yè)的、復(fù)雜的生態(tài)競爭。燧原推出的異構(gòu)計(jì)算生態(tài)燎原計(jì)劃,將聚集生態(tài)的三大特征:原始創(chuàng)新、標(biāo)準(zhǔn)化和生態(tài)共建。
燎原計(jì)劃將建立繁榮開放的開發(fā)者生態(tài),健康互利的產(chǎn)業(yè)生態(tài),持續(xù)創(chuàng)新的科研生態(tài)。打造以人工智能為起點(diǎn)構(gòu)建通用異構(gòu)計(jì)算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。將涵蓋深度學(xué)習(xí)計(jì)算,通用異構(gòu)計(jì)算以及視覺計(jì)算。
趙立東表示,未來行業(yè)的發(fā)展趨勢表明,以芯片為核心的算力,是工業(yè)4.0兵家必爭之地。工業(yè)4.0時(shí)代,人工智能是關(guān)鍵動(dòng)力。摩爾定律放緩,異構(gòu)計(jì)算加速,基于小芯片、封裝技術(shù),人工智能落地將改變互聯(lián)網(wǎng)重塑傳統(tǒng)行業(yè)。算力需示爆炸,算力成為人工智能技術(shù)發(fā)展的基礎(chǔ)。燧原科技要建立世界水平的本土化研發(fā)和工程化團(tuán)隊(duì),開發(fā)國產(chǎn)自主創(chuàng)新的核心技術(shù),布局云端AI+高端芯片雙賽道。我們?yōu)閿?shù)據(jù)中心打造最優(yōu)的云端AI產(chǎn)品,形成訓(xùn)練推理完整的閉環(huán)解決方案。
本文由電子發(fā)燒友原創(chuàng),作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
這是繼2019年12年發(fā)布第一代訓(xùn)練芯片,邃思1.0及云燧T10/T11,2020年12月發(fā)布第一代推理產(chǎn)品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強(qiáng)化學(xué)習(xí)使能游戲AI,改變數(shù)字娛樂的方式;強(qiáng)大的視覺能力,保駕護(hù)航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
隨著第二代產(chǎn)品的發(fā)布,將加速這些場景的商業(yè)化落地。
云燧智算集群
隨著自然語言處理、強(qiáng)化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、多模態(tài)和認(rèn)知模型等的發(fā)展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應(yīng)用上,綠色一體化的超級智算集群是關(guān)鍵趨勢。
燧原發(fā)布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓(xùn)練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓(xùn)練卡以及80%的線性度。
這是為智能計(jì)算和新基建算力而推出的集群化產(chǎn)品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計(jì)算芯片,邃思DTU2.0性能強(qiáng)悍
邃思DTU2.0是中國最大的計(jì)算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構(gòu)成先進(jìn)封裝。封裝尺寸為57.5mm*57.5mm。
?
燧原科技第二代通用人工智能訓(xùn)練芯片“邃思2.0”
DTU2.0的計(jì)算能力,單精度FP32達(dá)40FLOPS,支持單精度張量TF32,達(dá)160T FLOPS。TF32格式被認(rèn)為是在數(shù)據(jù)中心最先進(jìn)的數(shù)據(jù)模式。
此外,DTU2.0植入完全可編程的數(shù)據(jù)流,軟件指令驅(qū)動(dòng)的傳輸和數(shù)據(jù)計(jì)算,標(biāo)量、向量和張量的高效數(shù)據(jù)處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內(nèi)存,帶寬達(dá)1.8TB/s,是中國第一個(gè)支持世界最先進(jìn)存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。
6個(gè)LARE卡間互聯(lián)端口,每一個(gè)端口雙向50GB/s,總集群互聯(lián)帶寬300GB/s。
云燧T21\T20訓(xùn)練產(chǎn)品,分別為OAM標(biāo)準(zhǔn)模組和全高全長PCIE板卡。
以Benchmark數(shù)據(jù)來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標(biāo)檢測、圖像分割、推薦等均有明顯優(yōu)勢。
馭算Topsrider2.0架構(gòu)
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計(jì)算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計(jì),充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運(yùn)行提供解決方案。開放升級的編程模型和可擴(kuò)展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
云端訓(xùn)練計(jì)算產(chǎn)品路線圖
訓(xùn)練產(chǎn)品方面,燧原計(jì)劃第三代T30/T31產(chǎn)品將于2023年發(fā)布,每瓦的能效將提升14倍。同時(shí)升級到Matrix3.0。
推理計(jì)算方面,2021年下半年將發(fā)布i20推理芯片,以及2023年將發(fā)布i30。其每瓦能效將分別提升4倍和16倍。
另外,在Topsrider2.x的基礎(chǔ)上,還將進(jìn)一步升級至Topsrider3.x,致力于泛AI生態(tài)。
生態(tài)建設(shè)
AI生態(tài)也是跨行業(yè)的、復(fù)雜的生態(tài)競爭。燧原推出的異構(gòu)計(jì)算生態(tài)燎原計(jì)劃,將聚集生態(tài)的三大特征:原始創(chuàng)新、標(biāo)準(zhǔn)化和生態(tài)共建。
燎原計(jì)劃將建立繁榮開放的開發(fā)者生態(tài),健康互利的產(chǎn)業(yè)生態(tài),持續(xù)創(chuàng)新的科研生態(tài)。打造以人工智能為起點(diǎn)構(gòu)建通用異構(gòu)計(jì)算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。將涵蓋深度學(xué)習(xí)計(jì)算,通用異構(gòu)計(jì)算以及視覺計(jì)算。
趙立東表示,未來行業(yè)的發(fā)展趨勢表明,以芯片為核心的算力,是工業(yè)4.0兵家必爭之地。工業(yè)4.0時(shí)代,人工智能是關(guān)鍵動(dòng)力。摩爾定律放緩,異構(gòu)計(jì)算加速,基于小芯片、封裝技術(shù),人工智能落地將改變互聯(lián)網(wǎng)重塑傳統(tǒng)行業(yè)。算力需示爆炸,算力成為人工智能技術(shù)發(fā)展的基礎(chǔ)。燧原科技要建立世界水平的本土化研發(fā)和工程化團(tuán)隊(duì),開發(fā)國產(chǎn)自主創(chuàng)新的核心技術(shù),布局云端AI+高端芯片雙賽道。我們?yōu)閿?shù)據(jù)中心打造最優(yōu)的云端AI產(chǎn)品,形成訓(xùn)練推理完整的閉環(huán)解決方案。
本文由電子發(fā)燒友原創(chuàng),作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
AI
+關(guān)注
關(guān)注
87文章
28877瀏覽量
266237 -
燧原科技
+關(guān)注
關(guān)注
0文章
115瀏覽量
8234
發(fā)布評論請先 登錄
相關(guān)推薦
清華光芯片取得新突破,邁向AI光訓(xùn)練
電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,清華大學(xué)發(fā)布官方消息稱,清華大學(xué)電子工程系方璐教授課題組、自動(dòng)化系戴瓊海院士課題組另辟蹊徑,首創(chuàng)了全前向智能光計(jì)算訓(xùn)練架構(gòu),研制了“太極-II”光訓(xùn)練
燧原科技啟動(dòng)IPO輔導(dǎo),加速AI算力底座布局
近日,中國證監(jiān)會正式披露了上海燧原科技股份有限公司(簡稱:燧原科技)的IPO輔導(dǎo)備案報(bào)告,標(biāo)志著這家AI芯片領(lǐng)域的獨(dú)角獸企業(yè)正式踏上了上市征
AI芯片的混合精度計(jì)算與靈活可擴(kuò)展
、NPU、DSP等。 ? 而無論是哪種架構(gòu),如何判斷其性能優(yōu)劣都至關(guān)重要,而這就涉及到AI芯片的各項(xiàng)性能指標(biāo),如算力、能效、時(shí)延等。其中AI芯片的算力精度是衡量其處理數(shù)據(jù)能力的重要指標(biāo)
中國Wi-Fi7 FEM F4誕生
。在2024年年初,三伍微推出了Wi-Fi7 FEM,性能不輸國際廠商。腳步不能停留,Wi-Fi8已經(jīng)在路上。有未來的路,是幸福的路。
至此,中國Wi-Fi7 FEM的F4正式誕生,可以量產(chǎn)供應(yīng)
發(fā)表于 07-31 11:14
蘋果承認(rèn)使用谷歌芯片來訓(xùn)練AI
蘋果公司最近在一篇技術(shù)論文中披露,其先進(jìn)的人工智能系統(tǒng)Apple Intelligence背后的兩個(gè)關(guān)鍵AI模型,是在谷歌設(shè)計(jì)的云端芯片上完成預(yù)訓(xùn)練的。這一消息標(biāo)志著在尖端AI
AI初出企業(yè)Cerebras已申請IPO!稱發(fā)布的AI芯片比GPU更適合大模型訓(xùn)練
美國加州,專注于研發(fā)比GPU更適用于訓(xùn)練AI模型的晶圓級芯片,為復(fù)雜的AI應(yīng)用構(gòu)建計(jì)算機(jī)系統(tǒng),并與阿布扎比科技集團(tuán)G42等機(jī)構(gòu)合作構(gòu)建超級
risc-v多核芯片在AI方面的應(yīng)用
得RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片的性能和效率,降低成本,使AI邊緣計(jì)算晶片更具
發(fā)表于 04-28 09:20
聯(lián)想向燧弘華創(chuàng)交付首臺搭載國產(chǎn)AI算力芯片的問天WA5480 G3服務(wù)器
3月19日,在聯(lián)想集團(tuán)(全球)最大的智能計(jì)算設(shè)備研發(fā)和制造基地——聯(lián)寶科技,聯(lián)想集團(tuán)向燧弘華創(chuàng)交付聯(lián)想首臺可搭載國產(chǎn)AI算力芯片的聯(lián)想問天W
華為海思、燧原、海光、云天勵(lì)飛等齊力打破封鎖,誰主AI芯片江山?
近期,美國對英偉達(dá)出口進(jìn)行了限制,導(dǎo)致英偉達(dá)無法向中國大陸銷售AI芯片,這一局勢催生了中國本土IC設(shè)計(jì)企業(yè)的崛起,包括華為旗下的海思科技、騰訊旗下的
騰訊:已儲備足夠英偉達(dá)芯片,將尋求國內(nèi)AI訓(xùn)練芯片供應(yīng)
騰訊總裁劉熾平表示,美國上個(gè)月決定禁止更多人工智能芯片向中國出口,這將迫使該公司更有效地使用現(xiàn)有芯片并尋求國產(chǎn)人工智能芯片。“我們必須找到更有效地使用我們的人工智能
英偉達(dá)確認(rèn)為中國推三款改良AI芯片 性能暴降80%
據(jù)報(bào)道,nvidia的3種ai芯片不是“改良版”,而是“縮水版”,分別是hgx h20、l20 pcle和l2 pcle。用于ai模型訓(xùn)練的hgx h20雖然帶寬和
國內(nèi)外AI芯片、算力、大模型綜合對比(2023)
國內(nèi)AI芯片廠商格局:一梯隊(duì),有成熟產(chǎn)品、批量出貨的企業(yè),包括寒武紀(jì)、華為海思、百度昆侖芯、燧原科技等;二梯隊(duì),以AI
評論