0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度平地起“雷”,突然爆出的QPS數(shù)據(jù)意味著什么?

腦極體 ? 來(lái)源:腦極體 ? 作者:腦極體 ? 2023-04-24 09:16 ? 次閱讀

魯迅先生1923年在北師大發(fā)表了著名的演講《娜拉走后怎樣》,其中的提問(wèn)與思考方式振聾發(fā)聵,直到今天也依舊有效。面對(duì)很多產(chǎn)業(yè)現(xiàn)象、技術(shù)趨勢(shì),我們也不妨多問(wèn)幾個(gè)“之后怎樣”。

比如說(shuō),自ChatGPT爆火之后,中國(guó)各個(gè)互聯(lián)網(wǎng)、科技公司競(jìng)相推出了自己的大語(yǔ)言模型及相關(guān)應(yīng)用。其實(shí),關(guān)于中國(guó)能否有ChatGPT我們從未擔(dān)心過(guò),而問(wèn)題的關(guān)鍵在于“之后怎樣”。

層出不窮的大語(yǔ)言模型,讓人眼花繚亂。但如此多的大模型,差異化和競(jìng)爭(zhēng)力從何而來(lái)?能否順利、低成本實(shí)現(xiàn)產(chǎn)業(yè)落地?能否有效支持模型的快速迭代?

發(fā)布大模型并不是終點(diǎn),而是一場(chǎng)新長(zhǎng)跑的起點(diǎn)。如果不能有效回答這些問(wèn)題,那么大模型也最終會(huì)像其他技術(shù)風(fēng)口一樣,倏忽而來(lái),倏忽而去。

wKgaomRFKEaAAgTRAAHnJ5bHvJE167.jpg

慢慢地,“大模型之后怎樣”這個(gè)問(wèn)題,也開(kāi)始有了答案。4月23日,我們看到一份百度文心一言內(nèi)部流出的會(huì)議紀(jì)要。其中顯示,從3月開(kāi)始,文心一言啟動(dòng)邀測(cè)后的一個(gè)多月內(nèi),其模型已經(jīng)迭代了4次,最近一次帶來(lái)的推理效果提升了達(dá)到123%。

到底是什么支持文心一言完成了這種超越常規(guī)的迭代速度?

這個(gè)“秘密”或許正是中國(guó)大模型走向未來(lái)所需要的動(dòng)力,也是“大模型之后怎樣”的某種答案。

內(nèi)部會(huì)議紀(jì)要,透露出文心一言的奔跑速度

根據(jù)內(nèi)部紀(jì)要內(nèi)容顯示,文心一言在開(kāi)啟邀測(cè)后用戶數(shù)與同時(shí)在線人數(shù)都極速增長(zhǎng),面臨這種情況,文心一言需要及時(shí)獲得更快的響應(yīng)速度。我們知道,機(jī)器學(xué)習(xí)類模型的應(yīng)用邏輯包含數(shù)據(jù)準(zhǔn)備—模型訓(xùn)練—模型推理幾個(gè)步驟。文心一言面臨的響應(yīng)挑戰(zhàn),就是需要及時(shí)強(qiáng)化模型的推理能力。

wKgZomRFKEeAYVpUAAEMHTVFrJ4910.jpg

為了實(shí)現(xiàn)這個(gè)目標(biāo),百度對(duì)文心一言進(jìn)行了模型層與框架層的聯(lián)合優(yōu)化,從而在一個(gè)月內(nèi)迭代了4次,實(shí)現(xiàn)了模型推理能力的極大提升。

是什么讓文心一言獲得了這樣的奔跑速度?這就要提到百度飛槳“提前”做好的準(zhǔn)備。作為深度學(xué)習(xí)開(kāi)發(fā)平臺(tái),飛槳可以支持AI模型從訓(xùn)練到推理的全流程落地。其中,飛槳模型推理服務(wù)就可以有效支持大模型升級(jí),這一服務(wù)在4月19日剛剛再次迭代,已迭代至3.5版本,它的特點(diǎn)是在業(yè)內(nèi)首創(chuàng)了支持動(dòng)態(tài)插入的分布式推理引擎,從而可以更有效完成龐大數(shù)據(jù)規(guī)模的AI模型進(jìn)行推理部署。

至此我們可以從這份內(nèi)部紀(jì)要中知道,文心一言能夠快速持續(xù)迭代,并且低成本落地應(yīng)用的關(guān)鍵,就藏在這里——飛槳與文心一言聯(lián)合優(yōu)化。

wKgaomRFKEiAIQspAAFfWi1jZBY802.jpg

從結(jié)果上看,聯(lián)合優(yōu)化帶來(lái)的價(jià)值非常顯著。飛槳幫助文心一言實(shí)現(xiàn)了模型推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。其中,模型推理效率提升10倍,意味著推理成本降低為原來(lái)1/10,或者可以為10倍數(shù)量的用戶提供服務(wù);模型推理性能提升50%,意味著飛槳可以幫助文心一言工藝更精密,模型的學(xué)習(xí)效果與魯棒性更強(qiáng);模型算力利用率提升1倍,是由于飛槳向下兼容到芯片,實(shí)現(xiàn)全棧聯(lián)合優(yōu)化,從而可以極大降低文心一言的算力開(kāi)銷。

從這幾個(gè)方向可以看出,飛槳為文心一言帶來(lái)的價(jià)值,是持續(xù)性且多方面的,其中最重要的是,飛槳讓文心一言可以持續(xù)性、低成本向前奔跑,不斷進(jìn)化。

這也恰好解釋了這個(gè)問(wèn)題:大模型,路在何方?

飛槳,讓大模型節(jié)奏飛起的AI引擎

在ChatGPT全球化爆火,各家廠商、投資人,都在不遺余力地?cái)D上大模型賽道。這種情況當(dāng)然可以理解,但也必須看到,這條賽道不僅門(mén)檻高、入局難,在入局之后構(gòu)建持續(xù)競(jìng)爭(zhēng)力同樣很難。

大模型意味著龐大的算力開(kāi)支、數(shù)據(jù)開(kāi)支,以及更為恐怖的模型迭代成本。入局大模型之后,必須根據(jù)用戶反饋快速迭代,高效率升級(jí),否則一不小心就會(huì)掉隊(duì),在第一輪風(fēng)口過(guò)去后陷入行業(yè)洗牌,緊跟行業(yè)趨勢(shì),不斷推動(dòng)模型升級(jí),又會(huì)面臨巨大的工作量與模型推理成本。

這個(gè)兩難選擇并不遙遠(yuǎn),很快就會(huì)成為困擾大量新玩家的頭疼問(wèn)題。

而多年部署AI基礎(chǔ)設(shè)施與基礎(chǔ)技術(shù)的百度,其優(yōu)勢(shì)就在這時(shí)顯示了出來(lái)。飛槳與文心一言的聯(lián)合優(yōu)化,讓文心一言在訓(xùn)練和推理過(guò)程中效率大幅提升,實(shí)現(xiàn)了真正的人家起跑,我已經(jīng)幾輪加速,節(jié)奏快到飛起。

大模型與AI開(kāi)發(fā)平臺(tái),是相輔相成、互為表里的關(guān)系。比如有分析人士解讀認(rèn)為,“大模型就仿佛汽車的發(fā)動(dòng)機(jī),光賬面上的動(dòng)力強(qiáng),參數(shù)大是沒(méi)有用的,要壓榨出發(fā)動(dòng)機(jī)瞬時(shí)最大爆發(fā)力(QPS)以及最優(yōu)的性能表現(xiàn)。深度學(xué)習(xí)框架就像是生產(chǎn)發(fā)動(dòng)機(jī)和變速箱的,可以讓發(fā)動(dòng)機(jī)整體部件組合更精密、動(dòng)力更強(qiáng)。自研產(chǎn)品彼此適配度更高,協(xié)同會(huì)更高效,這可能是效率提升的最根本原因?!币劳酗L(fēng)口入局大模型,終歸會(huì)有一種空中樓閣的隱憂,至少難以將全面的技術(shù)棧掌握在自己手中,實(shí)現(xiàn)更高效、可控的模型升級(jí)。

由此可見(jiàn),大模型走向成功,除了算力、數(shù)據(jù)的基礎(chǔ)之外,深度學(xué)習(xí)框架同樣扮演著關(guān)鍵角色。面對(duì)紛繁而出的大模型,百度文心系列大模型的差異化優(yōu)勢(shì),也就在百度十年搭建的飛槳平臺(tái)中展露了出來(lái)。

而當(dāng)我們把大模型與飛槳的聯(lián)動(dòng)關(guān)系,放到科技自立自強(qiáng)的戰(zhàn)略高度來(lái)審視。又會(huì)發(fā)現(xiàn)一些別樣的答案:飛槳既是百度的AI護(hù)城河,也是中國(guó)大模型的動(dòng)力引擎。

中國(guó)AI,勝負(fù)系于工程化

最近,我們能看到很多大語(yǔ)言模型的發(fā)布會(huì),差不多每一家都會(huì)說(shuō),我們目前確實(shí)不如ChatGPT,以后繼續(xù)努力。

那么問(wèn)題來(lái)了,怎么努力?

事實(shí)上,努力不是說(shuō)說(shuō)就行了,而是要找到方式和方法。ChatGPT代表的算法優(yōu)勢(shì)、人才優(yōu)勢(shì)、算力優(yōu)勢(shì)都是短期很難抹平的,至少看不到可以快速超車的戰(zhàn)略空間。中國(guó)AI想要走通大模型這條路,就只能揚(yáng)長(zhǎng)避短,而中國(guó)AI的優(yōu)勢(shì)在哪呢?從百度流出的內(nèi)部會(huì)議紀(jì)要中其實(shí)已經(jīng)告訴了我們答案:工程化。

通過(guò)飛槳長(zhǎng)期堅(jiān)持的AI工程化路徑的掌握與打磨,我們可以看到百度發(fā)展大模型的獨(dú)特優(yōu)勢(shì),同時(shí)也可以看到中國(guó)AI整體性的戰(zhàn)略機(jī)遇。

首先,對(duì)于百度內(nèi)部來(lái)說(shuō),通過(guò)飛槳牢牢把控工程化能力,可以提升文心一言的迭代速度,降低算力、人工、數(shù)據(jù)等開(kāi)銷,從而讓文心一言能夠在同等成本下服務(wù)的用戶更多,適配產(chǎn)品的效率更高。這就像同樣從一處名叫“大模型”的深海油井取得原油,飛槳就像一艘輪船,船速更快,運(yùn)量還大,而其他人在用帆船運(yùn)輸。效率意味著成本,成本意味著商業(yè)化可能性,這就是飛槳的價(jià)值,也是AI工程化能力的魅力。

從百度向外看,飛槳帶來(lái)的工程化能力,意味著文心系列大模型的推理成本更低,繼而導(dǎo)致其在各行業(yè)、各場(chǎng)景中的落地成本更低。這對(duì)于文心大模型融入行業(yè),通過(guò)產(chǎn)業(yè)智能化產(chǎn)生價(jià)值是個(gè)重大利好。大模型走向千行百業(yè),是今天每家公司都在喊的口號(hào),但這個(gè)過(guò)程中,一定不能把模型落地成本全部轉(zhuǎn)嫁給行業(yè)用戶。消解這一成本的關(guān)鍵,也在于飛槳代表的工程化路徑。

wKgaomRFKEmAQy1MAAEv39zd6SM408.jpg

最后,當(dāng)大模型已經(jīng)上升為國(guó)家戰(zhàn)略,我們必須看到AI框架在科技自立自強(qiáng)進(jìn)程中扮演的角色。如果事關(guān)國(guó)計(jì)民生,每天與無(wú)數(shù)國(guó)人進(jìn)行問(wèn)答的大模型,建立在其他國(guó)家的框架上,那么其危險(xiǎn)系數(shù)可想而知。當(dāng)大模型愈發(fā)重要,關(guān)注并持續(xù)解決深度學(xué)習(xí)框架卡脖子的隱憂就更加重要。

而從另一個(gè)角度看,AI框架與AI開(kāi)發(fā)平臺(tái)代表的AI工程化能力,是中國(guó)AI技術(shù)最亮眼、最特殊的部分。這一部分下接芯片,上達(dá)應(yīng)用,通向千行百業(yè)的AI開(kāi)發(fā)需求,恰好是AI技術(shù)中的戰(zhàn)略要沖所在。中國(guó)AI能否揚(yáng)長(zhǎng)避短,實(shí)現(xiàn)超車,極大概率就系于工程化能力的建設(shè)與發(fā)揮,系于AI框架與產(chǎn)業(yè)智能化的連接中。

中國(guó)大模型,就是行業(yè)大模型,就是強(qiáng)工程化、強(qiáng)落地性的大模型,只有走通這條路,中國(guó)AI才有未來(lái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2234

    瀏覽量

    89839
  • QPS
    QPS
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    8777
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120592
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6928
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    123

    瀏覽量

    1148
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2136

    瀏覽量

    1979
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    請(qǐng)問(wèn)固定增益芯片是否意味著不能通過(guò)改變外圍參數(shù)來(lái)改變?cè)鲆妫?/a>

    固定增益芯片是否意味著我不能通過(guò)改變外圍參數(shù)來(lái)改變?cè)鲆妫?
    發(fā)表于 09-11 07:13

    百度文心一言APP升級(jí)為文小言

    百度宣布其文心一言APP正式升級(jí)為文小言,標(biāo)志百度在智能搜索領(lǐng)域邁出了重要一步。文小言作為百度旗下的“新搜索”智能助手,不僅集成了富媒體搜索、多模態(tài)輸入等前沿技術(shù),還創(chuàng)新性地推出了文
    的頭像 發(fā)表于 09-04 16:06 ?185次閱讀

    百度健康推出五款大模型應(yīng)用產(chǎn)品

    百度集團(tuán)資深副總裁、百度大健康事業(yè)群組總裁何明科發(fā)表主題演講時(shí)表示,醫(yī)療行業(yè)中存在“看得上病”“看得病”“看得好病”難以同時(shí)實(shí)現(xiàn)的“不可能三角”,AI是平衡這個(gè)“不可能三角”的關(guān)鍵點(diǎn)。
    的頭像 發(fā)表于 07-23 09:36 ?286次閱讀

    百度申請(qǐng)文小言商標(biāo)

    近日,百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司在知識(shí)產(chǎn)權(quán)領(lǐng)域有了新動(dòng)作。據(jù)天眼查知識(shí)產(chǎn)權(quán)信息顯示,百度已申請(qǐng)多枚“文小言”商標(biāo),這些商標(biāo)將涵蓋廣告銷售、網(wǎng)站服務(wù)、健身器材、機(jī)械設(shè)備等多個(gè)領(lǐng)域。
    的頭像 發(fā)表于 06-19 09:20 ?369次閱讀

    百度搜索AI生成內(nèi)容占比達(dá)11%

    在2024年舉辦的百度移動(dòng)生態(tài)萬(wàn)象大會(huì)上,百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組總經(jīng)理何俊杰分享了一系列令人矚目的數(shù)據(jù)。他透露,百度新搜索
    的頭像 發(fā)表于 05-31 09:24 ?553次閱讀

    2024百度移動(dòng)生態(tài)萬(wàn)象大會(huì):百度新搜索11%內(nèi)容已AI生成

    萬(wàn)象大會(huì)上百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰公布了一項(xiàng)統(tǒng)計(jì)數(shù)據(jù)百度新搜索已有11%的搜索內(nèi)容是由AI生成的。同時(shí),他透露,
    發(fā)表于 05-30 18:58 ?337次閱讀

    百度與特斯拉探討Robotaxi合作新機(jī)遇

    在特斯拉宣布計(jì)劃使用百度地圖提供的高精度地圖之后,百度與特斯拉之間的合作再度引起關(guān)注。百度自動(dòng)駕駛技術(shù)部總經(jīng)理徐寶強(qiáng)近日透露,百度正積極考慮與特斯拉在Robotaxi(共享出租車)項(xiàng)目
    的頭像 發(fā)表于 05-24 10:20 ?340次閱讀

    百度文心大模型擴(kuò)展合作領(lǐng)域

    百度創(chuàng)始人兼CEO李彥宏在2024年第一季度財(cái)報(bào)電話會(huì)上宣布,文心大模型API在繼與中國(guó)三星、榮耀成功合作后,本季度再度實(shí)現(xiàn)重要突破。小米、OPPO、vivo等主流手機(jī)廠商已全面接入文心大模型API,此舉標(biāo)志百度在智能設(shè)備領(lǐng)域
    的頭像 發(fā)表于 05-17 11:17 ?428次閱讀

    百度智能云攜手烏鎮(zhèn)共建AI數(shù)據(jù)產(chǎn)業(yè)基地

    近日,百度智能云與桐鄉(xiāng)市烏鎮(zhèn)大數(shù)據(jù)高新技術(shù)產(chǎn)業(yè)園區(qū)簽署合作協(xié)議,雙方將發(fā)揮各自優(yōu)勢(shì),以人工智能標(biāo)注產(chǎn)業(yè)為基礎(chǔ),共建百度智能云(烏鎮(zhèn))AI數(shù)據(jù)產(chǎn)業(yè)基地。
    的頭像 發(fā)表于 04-01 16:12 ?482次閱讀

    百度將為國(guó)行iPhone16提供AI功能

    百度將為國(guó)行iPhone16提供AI功能 蘋(píng)果iPhone 16預(yù)計(jì)將在2024年9月份發(fā)布,現(xiàn)在關(guān)于iPhone16的消息已經(jīng)開(kāi)始被陸續(xù)爆出,今日爆出百度公司將為蘋(píng)果國(guó)行iPhone
    的頭像 發(fā)表于 03-25 16:23 ?809次閱讀

    漳州市長(zhǎng)魏東到訪百度,與百度智能云共商漳州新質(zhì)生產(chǎn)力發(fā)展

    發(fā)展,就百度智能云(漳州)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地、生態(tài)合作項(xiàng)目,百度智能云與漳州在文旅、交通、水務(wù)、元宇宙、數(shù)字人等領(lǐng)域合作場(chǎng)景進(jìn)行深入交流。
    的頭像 發(fā)表于 03-25 11:27 ?625次閱讀

    AD5420沒(méi)有CS引腳是否意味著不能和其他SPI接口的芯片共用SPI總線呢?

    請(qǐng)問(wèn)一下,AD5420沒(méi)有CS引腳是否意味著不能和其他SPI接口的芯片共用SPI總線呢?如果必須共用SPI總線有沒(méi)有什么解決方案呢? 我的電路中將AD7715和AD5420同時(shí)連接到MCU的SPI
    發(fā)表于 12-15 07:25

    百度阿波羅智行(西南)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地揭牌

    11月8日,百度阿波羅智行(西南)人工智能基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地(以下簡(jiǎn)稱“百度自貢數(shù)據(jù)基地”)在自貢市數(shù)據(jù)標(biāo)注產(chǎn)業(yè)基地現(xiàn)場(chǎng)工作推進(jìn)會(huì)上揭牌, 標(biāo)
    的頭像 發(fā)表于 11-13 18:00 ?838次閱讀
    <b class='flag-5'>百度</b>阿波羅智行(西南)人工智能基礎(chǔ)<b class='flag-5'>數(shù)據(jù)</b>產(chǎn)業(yè)基地揭牌

    百度世界大會(huì)2023:大模型“重構(gòu)”智能汽車,百度Apollo發(fā)布多個(gè)高階智駕解決方案

    10月17日,百度世界大會(huì)2023在北京舉辦。會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏表示,繼大語(yǔ)言模型重構(gòu)人類的信息世界之后,大模型還將走向多模態(tài),進(jìn)一步重構(gòu)人類的物理世界,自動(dòng)駕駛就是大模型
    的頭像 發(fā)表于 10-21 10:17 ?1544次閱讀
    <b class='flag-5'>百度</b>世界大會(huì)2023:大模型“重構(gòu)”智能汽車,<b class='flag-5'>百度</b>Apollo發(fā)布多個(gè)高階智駕解決方案

    百度世界2023看點(diǎn) 文心大模型4.0正式發(fā)布 百度文庫(kù)變身生產(chǎn)力工具

    百度世界2023看點(diǎn) 文心大模型4.0正式發(fā)布 百度文庫(kù)變身生產(chǎn)力工具 百度世界大會(huì)2023于10月17日,以“生成未來(lái)(PROMPT THE WORLD)”為主題在北京首鋼園舉辦。在在百度
    的頭像 發(fā)表于 10-17 18:49 ?1021次閱讀
    <b class='flag-5'>百度</b>世界2023看點(diǎn) 文心大模型4.0正式發(fā)布 <b class='flag-5'>百度</b>文庫(kù)變身生產(chǎn)力工具