0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

鯤云發(fā)布超高效CAISA2.0架構(gòu) 為AI提供更高算力支撐

漁翁先生 ? 來源:鯤云科技 ? 作者:鯤云科技 ? 2019-04-10 10:27 ? 次閱讀

2019年4月9日,第二屆全球人工智能應(yīng)用創(chuàng)新峰會在深圳五洲賓館舉行,這場由深圳市科學(xué)技術(shù)協(xié)會、福田區(qū)科技創(chuàng)新局主辦,鯤云科技、鯤云人工智能應(yīng)用創(chuàng)新研究院和源創(chuàng)力創(chuàng)新中心承辦的AI開年盛會上,鯤云科技發(fā)布全球第一款基于數(shù)據(jù)流技術(shù)打造的通用人工智能底層架構(gòu)-定制數(shù)據(jù)流CAISA架構(gòu)和端到端自動編譯工具鏈RainBuilder,實現(xiàn)了國內(nèi)完全自主產(chǎn)權(quán)的AI芯片架構(gòu),有效計算效率大幅領(lǐng)先國際水平,為人工智能算法的快速應(yīng)用落地提供高性能算力支撐,推動我國人工智能芯片領(lǐng)域的技術(shù)革新和發(fā)展。深圳市人大常委會副主任、深圳市科協(xié)主席蔣宇揚,深圳市福田區(qū)委常委、副區(qū)長黃偉,深圳市源創(chuàng)力離岸創(chuàng)新中心總裁周路明,深圳市科協(xié)秘書長、辦公室主任林肇武,深圳市福田區(qū)科技創(chuàng)新局、發(fā)展和改革局和工業(yè)信息化局等單位負(fù)責(zé)同志出席峰會。

打破摩爾定律局限,鯤云發(fā)布全球首款通用底層AI架構(gòu)-定制數(shù)據(jù)流CAISA架構(gòu)

牛昕宇博士

作為本次峰會的重頭戲,鯤云科技創(chuàng)始人&CEO牛昕宇博士在會上發(fā)布了定制數(shù)據(jù)流CAISA2.0架構(gòu)。依托創(chuàng)始團(tuán)隊在數(shù)據(jù)流架構(gòu)領(lǐng)域近三十年的積累,鯤云的CAISA架構(gòu)拋棄了傳統(tǒng)基于指令集的架構(gòu)方式,是全球第一款基于數(shù)據(jù)流技術(shù)打造的通用人工智能底層架構(gòu),可發(fā)揮90%以上的芯片峰值計算性能,大幅領(lǐng)先國際主流AI芯片。同時,鯤云還在會上發(fā)布了針對數(shù)據(jù)流架構(gòu)定制開發(fā)的RainBuilder編譯工具鏈,CAISA2.0架構(gòu)可支持Tensorflow,Caffe等開源框架下開發(fā)的主流深度學(xué)習(xí)算法的無縫遷移,無需用戶進(jìn)行面向CAISA架構(gòu)的編程?;贏rria10 SX160、SX660、GX1150,Straix10 GX2800系列的FPGA加速卡已完成開發(fā)并應(yīng)用于產(chǎn)品落地中。

(定制數(shù)據(jù)流CAISA2.0架構(gòu))

隨著人工智能技術(shù)的深入發(fā)展,對人工智能芯片的算力提出了更高的要求,算力成為了決定算法落地的重中之重。尤其是在云計算、自動駕駛、安防工業(yè)等領(lǐng)域,算力的提升更是能夠直接帶來更多的用戶量、更多的前端設(shè)備智能升級和更安全的自動駕駛汽車。正如圖靈獎得主John Hennessey和 David Patterson在圖靈獎頒獎典禮所言,未來十年,隨著摩爾定律逐步飽和,人工智能芯片的峰值算力將逐步趨近飽和,而架構(gòu)效率將成為芯片性能的決定因素,未來十年將是計算架構(gòu)的“黃金十年”。鯤云科技自主研發(fā)的CAISA2.0架構(gòu)以及RainBuilder編譯工具鏈,沒有采用主流計算機(jī)架構(gòu)下大規(guī)模并行指令集設(shè)計的思路,通過完全不同的數(shù)據(jù)流架構(gòu)突破底層架構(gòu)的效率瓶頸,最大化發(fā)揮底層硬件的效率,在同等峰值芯片性能情況下可以為人工智能應(yīng)用提供更高的算力支撐。

打造最好用的AI芯片編譯工具,CAISA架構(gòu)的端到端自動編譯工具鏈RainBuilder面世,讓人工智能更簡單

要實現(xiàn)更快的AI應(yīng)用落地,滿足不同算法開發(fā)的需求,需要一個可以兼容各類算法框架和方便快捷實現(xiàn)算法到硬件寫入的編譯工具。為了降低使用門檻,鯤云發(fā)布了端到端自動編譯工具鏈RainBuilder,它是一款針對深度學(xué)習(xí)算法優(yōu)化加速的開發(fā)工具鏈。依托于CAISA架構(gòu)的高性能特性,RainBuilder提供從算法模型到芯片級算法部署的一整套開發(fā)套件。該套件主要由Compiler和Runtime兩部分組成,其中Compiler包含了一系列命令行接口,支持主流AI開發(fā)框架模型的解析和優(yōu)化,并將模型轉(zhuǎn)化為適用于CAISA架構(gòu)的中間表達(dá)和數(shù)據(jù)。Runtime以Compiler生成的中間表達(dá)和數(shù)據(jù)為輸入,為用戶提供了豐富易用的開發(fā)接口以完成對底層AI芯片硬件的高效應(yīng)用。

(RainBuilder端到端自動編譯工具鏈)

RainBuilder使用過程非常簡單便捷,用戶無需對于底層硬件有深入的了解,即可快速開發(fā)適用于AI專用芯片的算法方案。從訓(xùn)練好的模型文件,只需兩步,即可實現(xiàn)整個神經(jīng)網(wǎng)絡(luò)的推演。首先,調(diào)用Compiler的命令行接口完成模型的離線準(zhǔn)備,對于一個模型,該步驟只需進(jìn)行一次。Compiler提供了一套端到端的優(yōu)化流程,包括模型解析、冗余節(jié)點裁剪、節(jié)點融合、模型量化壓縮等。之后用戶只需編寫針對特定算法的前后處理函數(shù),Runtime會自動完成算法模型對于CAISA架構(gòu)的高效調(diào)用。Runtime中包含了大量針對CAISA架構(gòu)的深層優(yōu)化,如硬件資源調(diào)配、運行時資源調(diào)度、軟硬件并行、異常處理等。另外,RainBuilder通過支持用戶自定義算子實現(xiàn)了對于不同算法的高拓展性。用戶只需根據(jù)提供的接口即可完成自定義模塊的實現(xiàn),RainBuilder會自動將自定義算子整合進(jìn)計算圖中,并針對其特點完成相應(yīng)的計算優(yōu)化。

提供下一代人工智能計算平臺,鯤云公布基于CAISA架構(gòu)的系列AI產(chǎn)品,鯤云高性能AI芯片切入工業(yè)市場

會上,鯤云還公布了基于CAISA架構(gòu)的一系列產(chǎn)品,包括針對前端和邊緣計算的“雨人”AI芯片加速卡3代和應(yīng)用于NVR和服務(wù)器的“星空”AI加速卡2代,目前已經(jīng)在電力、安防、工業(yè)等領(lǐng)域?qū)崿F(xiàn)了規(guī)模落地。同合作伙伴聯(lián)合開發(fā)的搭載雨人加速卡的AI攝像頭、智能無人機(jī)、智能ops系統(tǒng)盒子,搭載星空加速卡的兩款A(yù)I服務(wù)器也同時披露。

(雨人加速卡3代)

“雨人”加速卡可嵌入前端IoTs設(shè)備,提供深度學(xué)習(xí)目標(biāo)定位、去重一體化前端方案,支持1080p高清實時視頻對于60x60像素特定目標(biāo)全檢測,具有50幀/秒的處理能力。

(星空加速卡2代)

“星空”加速卡嵌入小型主機(jī)和服務(wù)器設(shè)備,即插即用,可同時支持16路1080p視頻中對最小60×60像素的特定目標(biāo)全檢測及視頻結(jié)構(gòu)化分析,實現(xiàn)1080P高清實時視頻200-800幀/秒的檢測性能,延時低至5毫秒,功耗為35w,實測性能達(dá)理論峰值的90%。充分體現(xiàn)了自主研發(fā)的定制數(shù)據(jù)流CAISA架構(gòu)芯片高性能、低功耗、低延時的特性,最大化資源能效比??蔀榘卜佬袠I(yè)中交通、商場和住宅等場景數(shù)字安全監(jiān)控及行人、車輛、路況等提供深度學(xué)習(xí)目標(biāo)定位、去重、識別、屬性分析一體化的邊緣后端人工智能加速方案。

鯤云高校計劃發(fā)布,聯(lián)合高校開展人工智能教學(xué)科研合作

為滿足高校日益增長的在人工智能領(lǐng)域教學(xué)培訓(xùn)、科研平臺方面的需求,鯤云科技結(jié)合自身在人工智能芯片、開發(fā)平臺和垂直領(lǐng)域解決方案等方向的研發(fā)和技術(shù)優(yōu)勢,以及與市場端廣泛的互動關(guān)系,由鯤云人工智能應(yīng)用創(chuàng)新研究院發(fā)起,鯤云正式發(fā)布鯤云高校計劃CUP (Corerain University Program),與全球高校在人工智能課程、科研合作和國際交流等領(lǐng)域?qū)崿F(xiàn)深度合作。

在課程方面,鯤云提供基于CAISA架構(gòu)FPGA加速卡的人工智能課程及實驗內(nèi)容,支持高校相關(guān)課程升級;在科研方面,鯤云支持高?;贑AISA架構(gòu)運行最新人工智能算法,以及圍繞CAISA架構(gòu)拓展硬件平臺;在國際合作領(lǐng)域,鯤云提供人工智能峰會、人工智能硬件加速暑期峰會等國際交流平臺,全方位支持與高校在AI領(lǐng)域的合作,加速最新AI技術(shù)的產(chǎn)學(xué)研合作。

2019年2月24日,鯤云高校計劃啟動,聯(lián)手英特爾開展的基于Intel? FPGA的人工智能芯片應(yīng)用設(shè)計培訓(xùn)的交流活動完美落幕,來自清華大學(xué)、武漢大學(xué)、華中科技大學(xué)、山東大學(xué)、天津大學(xué)、重慶大學(xué)、電子科技大學(xué)等近30所高校的40余位老師參加。除與Intel合作進(jìn)行人工智能課程培訓(xùn)外,鯤云人工智能應(yīng)用創(chuàng)新研究院已同帝國理工學(xué)院、哈爾濱工業(yè)大學(xué)、天津大學(xué)等成立聯(lián)合實驗室,在定制計算、AI芯片安全、工業(yè)智能等領(lǐng)域開展前沿研究合作。

高端會晤,國際AI領(lǐng)域權(quán)威分享人工智能前沿技術(shù)突破

作為年度重量級AI峰會,此次活動匯聚了政府領(lǐng)導(dǎo)、全球人工智能領(lǐng)域頂尖學(xué)術(shù)大師、世界頂級科技企業(yè)、互聯(lián)網(wǎng)巨頭,產(chǎn)業(yè)界、投資界行業(yè)領(lǐng)袖,共同探討人工智能實戰(zhàn)落地和產(chǎn)學(xué)研發(fā)展方向。整個峰會由政府致辭、主題演講和產(chǎn)業(yè)論壇三個環(huán)節(jié)組成。會上,幾位人工智能領(lǐng)域的國際權(quán)威,包括獲得“IT諾貝爾獎”的Viktor K. Prasanna教授,IEEE終身會士Sun Yuan Kung(貢三元)教授,國際學(xué)術(shù)界公認(rèn)的世界上極少數(shù)同時在數(shù)據(jù)庫理論與系統(tǒng)兩個領(lǐng)域做出突破性貢獻(xiàn)的Wenfei Fan(樊文飛)院士,定制計算國際權(quán)威Wayne Luk 陸永青院士,清華大學(xué)魏少軍教授,以及高性能計算領(lǐng)域的Cristina Silvano教授等院士嘉賓就計算加速技術(shù)在人工智能領(lǐng)域的落地應(yīng)用、AI方法的研究演進(jìn)、面向人工智能應(yīng)用的定制計算加速技術(shù)以及高能效高性能并行集群計算,軟件定義芯片等內(nèi)容做主題報告。

除了諸位院士、會士嘉賓的專業(yè)分享以外,Intel PSG戰(zhàn)略市場總監(jiān)的Tony Kau、浪潮人工智能與產(chǎn)品總經(jīng)理劉軍,也分享了英特爾和浪潮在人工智能的落地應(yīng)用以及創(chuàng)新技術(shù)等方面的技術(shù)革新和新進(jìn)展,也分享了同鯤云在AI加速應(yīng)用和高校推廣等方面的深入合作。

此外,峰會還邀請到星瀚資本楊歌、雷鋒網(wǎng)麥廣煒、天津大學(xué)電子信息學(xué)院副院長劉強(qiáng)、JWIPC副總經(jīng)理劉迪科、CCE-YOCSEF深圳主席盧昱明等專家學(xué)者與鯤云科技CTO蔡權(quán)雄博士就人工智能芯片產(chǎn)業(yè)與生態(tài)落地等話題進(jìn)行了探討。

2019年人工智能應(yīng)用創(chuàng)新峰會順利結(jié)束,干貨滿滿,在未來計算架構(gòu)的黃金十年,鯤云科技是否能夠憑借自己多年積累的數(shù)據(jù)流架構(gòu)厚積薄發(fā),在AI芯片性能上實現(xiàn)突破?我們拭目以待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46071

    瀏覽量

    235164
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1828

    瀏覽量

    34672
  • 鯤云科技
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    3778
收藏 人收藏

    評論

    相關(guān)推薦

    瑞芯微RK3588與3588S如何選型硬件區(qū)別

    。內(nèi)置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。支持INT4/INT8/INT16/FP16混合運算能力,6TOPs的NPU,賦能各類AI場景。在接口方面則更注重
    發(fā)表于 09-11 11:31

    iTOP-3562開發(fā)板/核心板采用RK3562,集成四核A53+Mali G52架構(gòu)

    A53+Mali G52架構(gòu),主頻2GHZ,內(nèi)置1TOPSNPU,RK809動態(tài)調(diào)頻。支持OpenGLES1.1/2.0/3.2、0penCL2
    發(fā)表于 09-05 11:30

    【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    力量關(guān)注芯片的發(fā)展,希望我們的國家能夠更獨立自主地設(shè)計制造高性能芯片。 內(nèi)容簡介: 本書介紹了超級計算機(jī)
    發(fā)表于 09-02 10:09

    【書籍評測活動NO.41】大模型時代的基礎(chǔ)架構(gòu):大模型中心建設(shè)指南

    書籍介紹 大模型是近年來引人注目的熱點之一。大模型蓬勃發(fā)展的基礎(chǔ),是針對其需求設(shè)計的及基礎(chǔ)架構(gòu)。本書針對如何為大模型構(gòu)建基礎(chǔ)架構(gòu)進(jìn)行深入講解,并基于TOGAF方法論,剖析業(yè)界知名案
    發(fā)表于 08-16 18:33

    ElfBoard技術(shù)貼|如何將libwebsockets庫編譯為x86架構(gòu)

    高效。通過在主機(jī)環(huán)境中編譯運用x86架構(gòu)下的libwebsockets庫,可以充分利用主機(jī)卓越的計算性能與豐富的調(diào)試資源,顯著提升開發(fā)及調(diào)試工作的效率與便捷性。
    的頭像 發(fā)表于 07-10 09:38 ?1012次閱讀
    ElfBoard技術(shù)貼|如何將libwebsockets庫編譯為x86<b class='flag-5'>架構(gòu)</b>

    助力全國一體化網(wǎng)建設(shè),神州泰以構(gòu)建新質(zhì)生產(chǎn)

    助推新質(zhì)生產(chǎn)發(fā)展的道路。“成為領(lǐng)先的創(chuàng)新智基礎(chǔ)設(shè)施提供商”一直是神州泰的愿景,在本次活動上,神州
    的頭像 發(fā)表于 06-24 16:57 ?479次閱讀
    助力全國一體化<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)建設(shè),神州<b class='flag-5'>鯤</b>泰以<b class='flag-5'>算</b><b class='flag-5'>力</b>構(gòu)建新質(zhì)生產(chǎn)<b class='flag-5'>力</b>

    I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構(gòu)

    Ubuntu環(huán)境下編譯X86架構(gòu)的OpenCV,這快速迭代產(chǎn)品、優(yōu)化算法提供了堅實的支撐。希望本篇指南能成為各位小伙伴在嵌入式技術(shù)探索之旅上的得力助手。如果您在實踐過程中遇到任何問題
    發(fā)表于 06-07 09:32

    泰新聞|神州泰創(chuàng)新智之旅北京站開幕,發(fā)布全新智架構(gòu)和液冷整機(jī)柜產(chǎn)品應(yīng)對 “多云、異構(gòu)、綠色

    5月17日,神州泰智中國行北京站盛大召開。在本次活動上,神州泰針對用戶對大模型訓(xùn)練、大需求的痛點,重磅
    的頭像 發(fā)表于 05-22 10:56 ?293次閱讀
    <b class='flag-5'>鯤</b>泰新聞|神州<b class='flag-5'>鯤</b>泰創(chuàng)新智<b class='flag-5'>算</b>之旅北京站開幕,<b class='flag-5'>發(fā)布</b>全新智<b class='flag-5'>算</b><b class='flag-5'>架構(gòu)</b>和液冷整機(jī)柜產(chǎn)品應(yīng)對 “多云、異構(gòu)、綠色

    打造新型智中心,神州泰中標(biāo)中移動智中心采購

    ”)該項目標(biāo)包1的中標(biāo)候選人之一,投標(biāo)報價19,116,746,188.47元(不含稅),中標(biāo)份額10.53%。 AIGC時代,各企業(yè)的AI業(yè)務(wù)快速發(fā)展,引爆AI基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 05-17 15:54 ?247次閱讀
    打造新型智<b class='flag-5'>算</b>中心,神州<b class='flag-5'>鯤</b>泰中標(biāo)中移動智<b class='flag-5'>算</b>中心采購

    神州泰推出全新智架構(gòu)及硅光+液冷整機(jī)柜,破解多云異構(gòu)綠色智難題

    、神州數(shù)碼信創(chuàng)控股董事長韓智敏重磅發(fā)布新一代神州泰綠色異構(gòu)智中心全液冷整機(jī)柜新品,在異構(gòu)智的時代,通過軟硬件協(xié)同創(chuàng)新,客戶
    的頭像 發(fā)表于 05-15 16:37 ?286次閱讀

    深度踐行“IaaS on DPU”理念,中科馭數(shù)正式發(fā)布“馭”高性能異構(gòu)解決方案!

    ?高性能異構(gòu)解決方案,企業(yè)提供更快部署、更強(qiáng)性能和更高吞吐的
    的頭像 發(fā)表于 05-14 17:04 ?365次閱讀
    深度踐行“IaaS on DPU”理念,中科馭數(shù)正式<b class='flag-5'>發(fā)布</b>“馭<b class='flag-5'>云</b>”高性能<b class='flag-5'>云</b>異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>解決方案!

    AMD推出銳龍8000嵌入式處理器,AI高達(dá)39 T

    此款CPU選用4納米制程、AMD基于“Zen 4”架構(gòu)的CPU核心以及使用RDNA 3架構(gòu)GPU和XDNA架構(gòu)NPU,實現(xiàn)高達(dá)39TOPS的AI
    的頭像 發(fā)表于 04-03 10:39 ?655次閱讀

    Debian宣布停止i386架構(gòu)支持

    近日,在英國劍橋市舉行的小規(guī)模DebConf活動中,Debian GNU/Linux的發(fā)布團(tuán)隊召開春季會議,探討了未來發(fā)展方向,其中包括停止對i386架構(gòu)的支持。
    的頭像 發(fā)表于 12-19 10:16 ?649次閱讀

    淺談AI而生的存-體芯片

    大模型爆火之后,存一體獲得了更多的關(guān)注與機(jī)會,其原因之一是因為存一體芯片的裸相比傳統(tǒng)架構(gòu)AI
    發(fā)表于 12-06 15:00 ?305次閱讀
    淺談<b class='flag-5'>為</b><b class='flag-5'>AI</b>大<b class='flag-5'>算</b><b class='flag-5'>力</b>而生的存<b class='flag-5'>算</b>-體芯片

    AI調(diào)度平臺,大模型時代計算的新生意

    這兩款AI產(chǎn)品與服務(wù)針對的是中心的短期建設(shè)與中長期運營的需求。青云科技總裁林源表示,今天中國
    的頭像 發(fā)表于 09-28 16:57 ?1845次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度平臺,大模型時代<b class='flag-5'>云</b>計算的新生意