0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

燧原科技全新一代“邃思”云端AI推理芯片幫助客戶進(jìn)行云端系統(tǒng)部署

燧原科技Enflame ? 來源:燧原科技Enflame ? 作者:燧原科技Enflame ? 2021-12-09 15:16 ? 次閱讀

2021年12月,燧原科技重磅發(fā)布第二代云端人工智能推理加速卡“云燧i20”——這是時(shí)隔僅五個(gè)月,繼今年7月發(fā)布云端人工智能訓(xùn)練加速卡“云燧T20”之后,燧原科技又推出的全新一代針對(duì)云端推理場(chǎng)景的AI加速產(chǎn)品

第二代人工智能推理加速卡“云燧i20”

作為全新一代云端AI推理加速產(chǎn)品,云燧i20擁有迄今為止業(yè)內(nèi)最大的AI加速卡存儲(chǔ)帶寬,高達(dá)819 GB/s,遠(yuǎn)超行業(yè)同類產(chǎn)品水平;同時(shí)全面支持從FP32、TF32、FP16、BF16到INT8的計(jì)算精度。單精度FP32峰值算力達(dá)到32 TFLOPS,單精度張量TF32峰值算力達(dá)到128 TFLOPS,整型INT8峰值算力達(dá)到256 TOPS。對(duì)比第一代推理產(chǎn)品,云燧i20將浮點(diǎn)算力提升到1.8倍,整型算力提升到3.6倍。

升級(jí)后的“馭算TopsRider”軟件棧,在性能、開發(fā)效率和模型覆蓋面上得到大幅提升。通過引入通用高層圖優(yōu)化和大規(guī)模算子融合技術(shù),充分釋放了大容量片內(nèi)存儲(chǔ)和高帶寬存儲(chǔ)的利用率,將模型平均性能提升3.5倍,硬件算力利用率平均提升2倍;通過升級(jí)的編程模型以及算子自動(dòng)分片、自動(dòng)生成技術(shù),自定義算子開發(fā)效率翻倍,模型遷移成本大大降低;此外,馭算增強(qiáng)了對(duì)動(dòng)態(tài)性的支持,使云燧i20在檢測(cè)、語音識(shí)別、語義理解等場(chǎng)景更具競(jìng)爭(zhēng)力。

在經(jīng)濟(jì)效益和部署靈活性層面,基于虛擬化和多實(shí)例加速技術(shù),云燧i20能夠?qū)崿F(xiàn)單卡多用戶,同時(shí)支持6個(gè)業(yè)務(wù)互不干擾、安全隔離運(yùn)行。讓更多云端推理應(yīng)用同時(shí)享受專有的算力加速,為客戶業(yè)務(wù)架構(gòu)帶來輕耦合、靈活可靠的實(shí)現(xiàn)方式,顯著提升資源利用率與投入產(chǎn)出比。

燧原科技CEO趙立東和COO張亞林發(fā)布第二代云端AI推理產(chǎn)品

“云燧i20的發(fā)布標(biāo)志著燧原科技在云端AI算力加速領(lǐng)域,從訓(xùn)練到推理的完整產(chǎn)品線已全面迭代到第二代,能夠以更有競(jìng)爭(zhēng)力的產(chǎn)品,為互聯(lián)網(wǎng)、智慧城市、智慧政務(wù),以及金融、交通、能源等傳統(tǒng)行業(yè)客戶提供更優(yōu)的AI計(jì)算方案?!膘菰萍糃EO趙立東表示,“當(dāng)前,我國芯片產(chǎn)業(yè)正處于激烈的成長(zhǎng)與蛻變時(shí)代,燧原科技以‘做大芯片,拼硬科技’為時(shí)代使命,基于原始創(chuàng)新的軟硬件架構(gòu),正在不斷加速技術(shù)創(chuàng)新與產(chǎn)品迭代。性能趕超業(yè)內(nèi)旗艦GPU的云燧i20正是我們的關(guān)鍵成果之一?!?/p>

超大帶寬推理加速卡

兼具高吞吐、低延時(shí)特性

目前以語音識(shí)別、圖片識(shí)別、視頻內(nèi)容分析為主的感知類應(yīng)用,內(nèi)容推薦和欺詐交易攔截等決策類應(yīng)用在云端大部分都是以實(shí)時(shí)在線的方式提供服務(wù);同時(shí)神經(jīng)網(wǎng)絡(luò)參數(shù)越來越多,數(shù)據(jù)帶寬需求也越來越高,兼顧高帶寬和低延遲變得至關(guān)重要。云燧i20創(chuàng)新性地采用了高帶寬HBM2E存儲(chǔ),實(shí)現(xiàn)了高達(dá)819GB/s的超大帶寬,為各類云端推理業(yè)務(wù)提供高吞吐、低延時(shí)的性能,保障其準(zhǔn)確、平穩(wěn)、高效的運(yùn)行。

自主創(chuàng)新芯片架構(gòu)

以更高性價(jià)比提供極致化性能

新一代“邃思”AI推理芯片采用第二代高性能計(jì)算核心和數(shù)據(jù)引擎,由12nm工藝打造,通過架構(gòu)升級(jí),大大提高了單位面積的晶體管效率,從而實(shí)現(xiàn)了與目前業(yè)內(nèi)7nm GPU相匹敵的計(jì)算能力。不僅如此,基于12nm成熟工藝帶來的成本優(yōu)勢(shì),使得云燧i20在相同性能表現(xiàn)下更具性價(jià)比優(yōu)勢(shì)。并且供應(yīng)鏈體系更加穩(wěn)定成熟,客戶的業(yè)務(wù)需求可以得到及時(shí)滿足。

全新一代“邃思”云端AI推理芯片

燧原科技COO張亞林指出:“云燧i20全面提升了算力,在兼顧全精度算力的同時(shí)大幅度提高了整型運(yùn)算,大力加強(qiáng)了模型覆蓋率和泛化支持的能力,在多項(xiàng)基準(zhǔn)測(cè)試中,其模型性能、能效比均處于國內(nèi)領(lǐng)先水平,可以滿足云端推理業(yè)務(wù)高度多樣化的需求。燧原科技目前已經(jīng)擁有第二代的訓(xùn)練和推理產(chǎn)品,針對(duì)客戶的業(yè)務(wù)場(chǎng)景提供原始創(chuàng)新的、具有高性能及性價(jià)比的‘訓(xùn)練+推理’完整解決方案,并支持國產(chǎn)服務(wù)器和操作系統(tǒng),可以幫助客戶進(jìn)行云端系統(tǒng)部署,全面且持續(xù)為客戶創(chuàng)造價(jià)值?!?/p>

產(chǎn)學(xué)研協(xié)同

引領(lǐng)原始創(chuàng)新國產(chǎn)AI算力落地

自第一代云端AI推理加速卡“云燧i10”發(fā)布后,燧原科技在構(gòu)建原始創(chuàng)新的通用算力和自主生態(tài)上付出了卓絕的努力。以其國產(chǎn)AI算力產(chǎn)品為核心,以商業(yè)生態(tài)和科研生態(tài)為支撐,實(shí)現(xiàn)燧原科技的云端AI推理產(chǎn)品在互聯(lián)網(wǎng)、金融、政務(wù)等多家客戶的商業(yè)落地,并獲得認(rèn)可。

之江實(shí)驗(yàn)室發(fā)展合作部副部長(zhǎng)吳麗娟表示:“之江實(shí)驗(yàn)室今年3月與燧原科技成立聯(lián)合研究中心,圍繞人工智能應(yīng)用場(chǎng)景,共同開發(fā)具有標(biāo)桿性的技術(shù)解決方案,構(gòu)建開源開放的創(chuàng)新生態(tài)系統(tǒng)。目前,燧原科技的第一代人工智能訓(xùn)練產(chǎn)品‘云燧T11’正在之江實(shí)驗(yàn)室搭建千卡高性能計(jì)算的液冷集群,打造符合國家碳中和政策導(dǎo)向的低碳綠色數(shù)據(jù)中心。未來,我們還會(huì)在智能計(jì)算的更多領(lǐng)域合作研發(fā)?!?/p>

上海銀行自貿(mào)區(qū)陳行長(zhǎng)表示:“燧原科技的第一代人工智能推理產(chǎn)品云燧i10具有科技獨(dú)創(chuàng)性和技術(shù)領(lǐng)先優(yōu)勢(shì)。上海銀行和燧原科技已經(jīng)簽署了深度戰(zhàn)略合作協(xié)議,在智慧金融領(lǐng)域開展了戰(zhàn)略合作,通過場(chǎng)景化、智能化、融合化的創(chuàng)新產(chǎn)品,將金融科技融入銀行服務(wù)的全流程,用便捷流暢的客戶體驗(yàn)、優(yōu)質(zhì)高效的服務(wù)品質(zhì),實(shí)現(xiàn)傳統(tǒng)銀行服務(wù)方式的突破式變革。燧原科技將助力上海銀行向?qū)崿F(xiàn)數(shù)字化、智能化轉(zhuǎn)型邁出堅(jiān)實(shí)的一步?!?/p>

浪潮信息副總裁劉軍表示:“燧原科技是國產(chǎn)人工智能計(jì)算芯片的領(lǐng)軍企業(yè),浪潮信息與燧原科技通過元腦生態(tài)聯(lián)合創(chuàng)新,在AI整機(jī)系統(tǒng)、AI算力優(yōu)化、場(chǎng)景方案落地等多方面深入合作。此次云燧i20的發(fā)布,標(biāo)志著燧原從訓(xùn)練到推理全面進(jìn)入2.0時(shí)代,這也是國產(chǎn)AI算力發(fā)展的里程碑。我們期待和燧原一起緊密合作,共同推進(jìn)中國人工智能產(chǎn)業(yè)的快速發(fā)展。”

原文標(biāo)題:燧原科技發(fā)布業(yè)內(nèi)帶寬最大的云端AI推理卡“云燧i20”

文章出處:【微信公眾號(hào):燧原科技Enflame】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    450

    文章

    49636

    瀏覽量

    417191
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266237
  • 燧原科技
    +關(guān)注

    關(guān)注

    0

    文章

    115

    瀏覽量

    8234

原文標(biāo)題:燧原科技發(fā)布業(yè)內(nèi)帶寬最大的云端AI推理卡“云燧i20”

文章出處:【微信號(hào):gh_1222367b8780,微信公眾號(hào):燧原科技Enflame】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    蘋果揭示AI新動(dòng)向:Apple Intelligence模型在谷歌云端芯片上預(yù)訓(xùn)練

    蘋果公司在最新的技術(shù)論文中披露了項(xiàng)重要信息,其全新的人工智能系統(tǒng)Apple Intelligence所依賴的模型并非傳統(tǒng)上大型科技公司首選的NVIDIA GPU,而是選擇了在谷歌設(shè)計(jì)的云端
    的頭像 發(fā)表于 07-30 15:00 ?384次閱讀

    云天勵(lì)飛推出全新云端推理加速卡X6000,夯實(shí)智算運(yùn)營底座

    作為國內(nèi)領(lǐng)先的人工智能企業(yè),云天勵(lì)飛不僅持續(xù)開展芯片、大模型等關(guān)鍵核心技術(shù)的自主研發(fā)工作,也直持續(xù)推進(jìn)大模型等創(chuàng)新技術(shù)的應(yīng)用落地,在推理算力領(lǐng)域進(jìn)行了完備的
    的頭像 發(fā)表于 07-24 15:07 ?181次閱讀
    云天勵(lì)飛推出<b class='flag-5'>全新</b><b class='flag-5'>云端</b><b class='flag-5'>推理</b>加速卡X6000,夯實(shí)智算運(yùn)營底座

    韓國兩大芯片公司尋求合并,以開發(fā)新一代AI芯片

    在人工智能芯片設(shè)計(jì)領(lǐng)域,韓國兩大初創(chuàng)公司Rebellions Inc.和Sapeon Korea Inc.近日宣布計(jì)劃合并,共同開發(fā)新一代AI芯片,以在激烈的國際競(jìng)爭(zhēng)中搶占先機(jī)。
    的頭像 發(fā)表于 06-18 16:10 ?494次閱讀

    工業(yè)富聯(lián)預(yù)估今年AI云端項(xiàng)目營收占比40%

    在本周舉辦的第季度線上業(yè)績(jī)發(fā)布會(huì)上,鄭弘孟對(duì)工業(yè)富聯(lián)今年的AI應(yīng)用表現(xiàn)做出預(yù)期,他預(yù)測(cè),作為云端服務(wù)商的資本性支出增長(zhǎng)勢(shì)頭將有助于帶動(dòng)AI服務(wù)器需求,因此
    的頭像 發(fā)表于 05-16 09:18 ?220次閱讀

    蘋果將通過自研芯片云端推出AI功能

    近日,科技界傳來則令人振奮的消息。據(jù)可靠報(bào)道,蘋果公司即將在云端推出強(qiáng)大的人工智能(AI)功能,而這切將依托于自研的高端芯片
    的頭像 發(fā)表于 05-11 10:59 ?455次閱讀

    有了云端,智能家居還有必要部署本地AI嗎?

    模式下,用戶的終端設(shè)備并不需要強(qiáng)大的本地AI處理能力,而是將數(shù)據(jù)上傳至云端服務(wù)器,在那里由大型AI模型進(jìn)行復(fù)雜的計(jì)算處理,并將結(jié)果返回給用戶。 ? 但隨著人們需求提升,尤其是對(duì)設(shè)備的響
    的頭像 發(fā)表于 05-10 00:19 ?2423次閱讀

    開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

    Network Runtime 神經(jīng)網(wǎng)絡(luò)運(yùn)行時(shí),作為中間橋梁連通上層AI推理框架和底層加速芯片,實(shí)現(xiàn)AI模型的跨芯片
    發(fā)表于 04-11 16:14

    谷歌發(fā)布Axion新款數(shù)據(jù)中心AI芯片,性能超越x86及云端

    谷歌預(yù)計(jì)將通過Google Cloud提供Axion AI芯片客戶。谷歌強(qiáng)調(diào)這款基于ARM的CPU產(chǎn)品具有優(yōu)越的性能表現(xiàn),甚至超越了傳統(tǒng)的x86芯片
    的頭像 發(fā)表于 04-10 16:32 ?724次閱讀

    HarmonyOS:使用MindSpore Lite引擎進(jìn)行模型推理

    場(chǎng)景介紹 MindSpore Lite 是AI 引擎,它提供了面向不同硬件設(shè)備 AI 模型推理的功能,目前已經(jīng)在圖像分類、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。 本文介紹
    發(fā)表于 12-14 11:41

    云天勵(lì)飛發(fā)布新一代邊緣AI芯片,采用Chiplet技術(shù),可運(yùn)行百億級(jí)大模型

    工藝,內(nèi)含國產(chǎn)RISC-V核,支持大模型推理部署。 ? 云天勵(lì)飛新一代自研AI SoC DeepEdge10 ? 大模型在邊緣運(yùn)行對(duì)AI
    的頭像 發(fā)表于 11-23 01:08 ?2372次閱讀
    云天勵(lì)飛發(fā)布<b class='flag-5'>新一代</b>邊緣<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,采用Chiplet技術(shù),可運(yùn)行百億級(jí)大模型

    云天勵(lì)飛重磅發(fā)布新一代AI芯片DeepEdge10

    11月15日,在高交會(huì)開幕式上,云天勵(lì)飛重磅發(fā)布新一代AI芯片DeepEdge10。 云天勵(lì)飛董事長(zhǎng)兼CEO陳寧博士在高交會(huì)開幕式上介紹DeepEdge10芯片DeepEdge10是國
    的頭像 發(fā)表于 11-16 09:16 ?1180次閱讀

    高通全新一代的Arm PC芯片驍龍X Elite發(fā)布

    高通則帶來了公司全新一代的Arm PC芯片驍龍X Elite。在高通看來,這個(gè)AI賦能的強(qiáng)大平臺(tái)將為PC帶來變革。值得提的是,Snapdragon X Elite 中的 Oryon
    發(fā)表于 10-26 12:37 ?943次閱讀
    高通<b class='flag-5'>全新一代</b>的Arm PC<b class='flag-5'>芯片</b>驍龍X Elite發(fā)布

    【KV260視覺入門套件試用體驗(yàn)】Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型

    推斷開發(fā)平臺(tái),它可以幫助開發(fā)者在賽靈的 FPGA 和自適應(yīng) SoC 上實(shí)現(xiàn)高效的 AI 應(yīng)用部署。它是個(gè)強(qiáng)大而靈活的
    發(fā)表于 10-14 15:34

    原科技與篆芯半導(dǎo)體達(dá)成戰(zhàn)略合作,共同打造新一代算網(wǎng)融合平臺(tái)

    2023年10月11日,原科技與篆芯半導(dǎo)體達(dá)成戰(zhàn)略合作,雙方將依托自身優(yōu)勢(shì),聯(lián)合開發(fā)新一代AI算網(wǎng)融合平臺(tái),為各行各業(yè)提供普惠、高效的算力解決方案。 隨著通用人工智能時(shí)代的到來,AI
    的頭像 發(fā)表于 10-11 16:15 ?423次閱讀
    <b class='flag-5'>燧</b>原科技與篆芯半導(dǎo)體達(dá)成戰(zhàn)略合作,共同打造<b class='flag-5'>新一代</b>算網(wǎng)融合平臺(tái)

    HarmonyOS/OpenHarmony原生應(yīng)用開發(fā)-華為Serverless云端服務(wù)支持說明(

    Serverless又叫無服務(wù)器計(jì)算,是種按需提供云端服務(wù)的架構(gòu)和服務(wù)模型。應(yīng)用運(yùn)行所需的服務(wù)器和環(huán)境可以皆由云端平臺(tái)提供,開發(fā)者只需關(guān)注應(yīng)用的業(yè)務(wù)邏輯,而無需關(guān)心基礎(chǔ)設(shè)施(例如:服務(wù)器、操作
    發(fā)表于 10-08 10:22