0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度自研AI芯片昆侖解讀 與國(guó)產(chǎn)處理器飛騰良好適配

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-04-03 08:56 ? 次閱讀

4月2日下午,百度智能芯片總經(jīng)理歐陽劍在一場(chǎng)公開課中首次對(duì)昆侖芯片進(jìn)行了詳細(xì)分享,并公開了昆侖K200與英特爾T4 GPU的多項(xiàng)對(duì)比數(shù)據(jù),其中最有優(yōu)勢(shì)的一項(xiàng)數(shù)據(jù)是Gemm-Int8 的Benchmark是T4性能的3倍。歐陽劍還通過視頻展示了昆侖芯片的殺手锏,與國(guó)產(chǎn)處理器飛騰的良好適配。

2018年的百度AI開發(fā)者大會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏宣布推出自研AI芯片昆侖。百度研發(fā)AI芯片的積累得益于其用FPGA做AI加速的積累,也得益于其在軟件定義加速器和XPU架構(gòu)的多年積累。

百度最早在2010年開始用FPGA做AI架構(gòu)的研發(fā),2011年開展小規(guī)模部署上線,2017年部署超過了10000片F(xiàn)PGA,2018年發(fā)布自主研發(fā)AI芯片,2019年下半年流片成功,2020年開始量產(chǎn)。

昆侖芯片的定位是通用AI芯片,目標(biāo)是提供高性能、低成本、高靈活性的AI芯片。歐陽劍在分享中說:“相比GPU,昆侖芯片的通用性和可編程性都做的不錯(cuò),并且我們還在努力把編程性做的更好?!?/p>

昆侖發(fā)布之后,其相關(guān)消息陸續(xù)公布。架構(gòu)方面,昆侖有2個(gè)計(jì)算單元,512GB/S的內(nèi)存帶寬,16MB SRAM/unit。歐陽劍介紹,16MB的SRAM對(duì)AI推理很有幫助,XPU架構(gòu)上的XPU-SDNN是為Tensor等而設(shè)計(jì),XPU-Cluster則能夠滿足通用處理的需求。

昆侖第一代芯片并沒有采用NVLink,而是通過PCIE 4.0接口進(jìn)行互聯(lián)。在三星14nm的制造工藝和2.5D封裝的支持下,昆侖芯片峰值性能可以達(dá)到260TOPS,功耗為150W。

在靈活性和易用性方面,昆侖面向開發(fā)者提供類似英偉達(dá)CUDA的軟件棧,可以通過C/C++語言進(jìn)行編程,降低開發(fā)者的開發(fā)難度。

目前,基于第一代昆侖芯片,百度推出了兩款A(yù)I加速卡,K100和K200,前者算力和功耗都是后者的兩倍。

在今天的分享中,歐陽劍給出了一系列K200對(duì)比英偉達(dá)T4的數(shù)據(jù),其中在Gemm-Int8數(shù)據(jù)類型,4K X 4K的矩陣下,昆侖K200的Benchmark分出超過2000,是英偉達(dá)T4的3倍多。

在語音常用的Bert/Ernie測(cè)試模型下,昆侖也有明顯性能優(yōu)勢(shì)。

在線上性能數(shù)據(jù)的表現(xiàn)上,昆侖的表現(xiàn)相比英偉達(dá)T4更加穩(wěn)定,且延遲也有優(yōu)勢(shì)。

在圖像分割YOLOV3算法中,昆侖雖然有優(yōu)勢(shì),但優(yōu)勢(shì)已經(jīng)不那么明顯。不過歐陽劍表示百度仍然在通過持續(xù)的優(yōu)化提高昆侖的性能。

他同時(shí)表示,昆侖已經(jīng)在百度內(nèi)部規(guī)模應(yīng)用。至于對(duì)外提供AI算力,去年12月13日百度通過定向邀請(qǐng)的方式通過百度云提供昆侖的算力。在與歐陽劍的直播互動(dòng)中,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))了解到通過百度云提供昆侖AI算力目前仍然是定向邀請(qǐng)的方式,且主要是私有部署的方式。百度會(huì)通過定向邀請(qǐng)的客戶的反饋消息,再通過百度云大規(guī)模向外提供昆侖的算力,但他沒有給出具體的時(shí)間線。

除了通過百度云提供昆侖的算力,歐陽劍也展示了昆侖加速卡在工業(yè)智能設(shè)備中的應(yīng)用。歐陽劍演示的是用CPU和昆侖加速卡去進(jìn)行產(chǎn)品缺陷檢測(cè),昆侖可以大幅提升速度,但并沒有給出具體的對(duì)比數(shù)據(jù)。

另外一個(gè)展示則是昆侖的殺手锏,那就是和國(guó)產(chǎn)處理器平臺(tái)飛騰的適配。在2019飛騰生態(tài)伙伴大會(huì)上,歐陽劍就透露昆侖AI芯片正在適配國(guó)產(chǎn)飛騰服務(wù)器,做性能調(diào)優(yōu)工作。在今天的線上分享中,歐陽劍展示了采用昆侖加速卡帶來的圖像分割速度的顯著加速。

飛騰CPU處理器采用的是Armv8指令級(jí),主要用在數(shù)據(jù)中心云計(jì)算中心,作為國(guó)產(chǎn)芯的代表,昆侖選擇與飛騰進(jìn)行很好地適配顯然是看中了國(guó)產(chǎn)自研芯片的大市場(chǎng)。

通過飛騰CPU+昆侖AI加速器的方式,雙方可以更好的實(shí)現(xiàn)國(guó)產(chǎn)芯片在服務(wù)器市場(chǎng)的國(guó)產(chǎn)化,也可以視為昆侖AI芯片和加速卡未來增長(zhǎng)的一個(gè)重要?jiǎng)恿蜌⑹诛怠?/p>

責(zé)任編輯:wv

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19118

    瀏覽量

    228869
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2247

    瀏覽量

    90203
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1851

    瀏覽量

    34861
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    百度將發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計(jì)劃在即將舉行的百度世界大會(huì)上推出一款全新的AI智能眼鏡。這款眼鏡將內(nèi)置先進(jìn)的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗(yàn)。
    的頭像 發(fā)表于 11-11 14:50 ?220次閱讀

    百度AI計(jì)算平臺(tái)4.0震撼發(fā)布

    在2024年百度云智大會(huì)的璀璨舞臺(tái)上,百度智能云重磅推出了AI異構(gòu)計(jì)算平臺(tái)的全新力作——4.0版本。此次升級(jí),標(biāo)志著百度
    的頭像 發(fā)表于 09-26 14:46 ?366次閱讀

    國(guó)產(chǎn)DSP,指令集內(nèi)核C2000,F(xiàn)28335、F280049、F28377

    國(guó)產(chǎn)DSP,指令集內(nèi)核架構(gòu),工具鏈,完美替代TI的 C2000系列產(chǎn)品,F(xiàn)280049、F28335、F28377 性能、主頻、外設(shè)
    發(fā)表于 09-26 13:56

    2024百度移動(dòng)生態(tài)萬象大會(huì):百度新搜索11%內(nèi)容已AI生成

    2024百度移動(dòng)生態(tài)萬象大會(huì):百度新搜索11%內(nèi)容已AI生成 今天2024百度移動(dòng)生態(tài)萬象大會(huì)在江蘇蘇州舉辦,特別是AI搜索與
    發(fā)表于 05-30 18:58 ?387次閱讀

    日產(chǎn)汽車將搭載百度AI解決方案

    日產(chǎn)汽車與百度達(dá)成戰(zhàn)略合作,雙方正式簽署諒解備忘錄,共同探索智能技術(shù)在汽車領(lǐng)域的應(yīng)用。根據(jù)協(xié)議,日產(chǎn)將在中國(guó)市場(chǎng)的車型上搭載百度AI解決方案,進(jìn)一步提升車輛智能化水平。
    的頭像 發(fā)表于 05-06 14:14 ?415次閱讀

    百度搜索重磅推出AI圖片助手

    近日,百度搜索全新上線了一款名為“百度AI圖片助手”的智能工具,該工具賦予了用戶一鍵處理圖片的強(qiáng)大能力。無論是搜索中的圖片還是用戶自主上傳的圖片,均可輕松實(shí)現(xiàn)涂抹消除、去水印以及畫質(zhì)修
    的頭像 發(fā)表于 05-06 10:20 ?1269次閱讀

    百度將為蘋果新品提供AI功能

    據(jù)知情人士透露,百度已確定將為蘋果即將發(fā)布的iPhone16、Mac系統(tǒng)和iOS18提供AI功能。此前,蘋果曾與阿里等其他國(guó)內(nèi)大模型公司進(jìn)行過洽談,但最終選擇了百度作為合作伙伴。
    的頭像 發(fā)表于 03-26 09:15 ?489次閱讀

    【有獎(jiǎng)】 百度智能云目推出首款多模態(tài) AI 模組,應(yīng)用場(chǎng)景有獎(jiǎng)?wù)骷?/a>

    他來了,他來了 大模型時(shí)代悄然到來 百度首款大模型落地的硬件產(chǎn)品 目多模態(tài)AI模組LUCA系列正式亮相 目LUCA深度集成百度語音
    的頭像 發(fā)表于 02-26 15:19 ?497次閱讀

    百度搜索推出AI拜年新能力 AI春節(jié)儀式感拉滿

    春節(jié)AI拜年新體驗(yàn),百度搜索春節(jié)期間推出AI拜年大禮包!
    的頭像 發(fā)表于 02-05 10:38 ?2.2w次閱讀

    飛騰2000 4核處理器國(guó)產(chǎn)主板介紹# 飛騰主板# 國(guó)產(chǎn)主板# 飛騰處理器

    處理器服務(wù)
    jf_67464575
    發(fā)布于 :2024年02月03日 10:15:41

    飛騰派4G版免費(fèi)試用】飛騰派4G版開發(fā)板套裝測(cè)試及環(huán)境搭建

    先簡(jiǎn)單介紹一下這款飛騰派4G版開發(fā)板套裝; 飛騰派是由中電港螢火工場(chǎng)研發(fā)的一款面向行業(yè)工程師、學(xué)生和愛好者的開源硬件。主板處理器采用飛騰嵌入式四核
    發(fā)表于 01-22 00:47

    飛騰派4G版免費(fèi)試用】飛騰派開發(fā)板運(yùn)行Ubuntu系統(tǒng)

    工程師、學(xué)生和愛好者的開源硬件。主板處理器采用飛騰嵌入式四核處理器,兼容ARM V8架構(gòu),包含2個(gè)FTC664核和2個(gè)FTC310核,其中FTC664核主頻可達(dá)1.8GHz,F(xiàn)TC310核主頻可達(dá)
    發(fā)表于 01-08 22:40

    飛騰派4G版免費(fèi)試用】大家來了解飛騰派4G版開發(fā)板

    、OpenHarmony、SylixOS、RT-Thread等國(guó)產(chǎn)操作系統(tǒng)。 飛騰派4G版開發(fā)板是由中電港螢火工場(chǎng)研發(fā)的一款面向行業(yè)工程師、學(xué)生和愛好者的開源硬件。主板處理器采用飛騰
    發(fā)表于 01-02 22:43

    飛騰派4G版免費(fèi)試用】1.開箱與鏡像燒錄

    的高能效異構(gòu)多核處理器技術(shù),具有模塊化、易上手、全開源、低成本的特點(diǎn),大大降低了國(guó)產(chǎn)處理器的開發(fā)使用門檻,解決了國(guó)產(chǎn)處理器難以普及推廣的問題
    發(fā)表于 12-08 12:47

    飛騰派開發(fā)板資料免費(fèi)下載!??!

    飛騰派開發(fā)板是螢火工場(chǎng)研發(fā)的一款面向行業(yè)工程師、學(xué)生和愛好者的開源硬件。 主板處理器采用飛騰定制四核處理器,該處理器兼容 ARM V8 指令
    發(fā)表于 12-05 15:03