0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4 Turbo多模態(tài),應(yīng)用生態(tài)加速

智能計算芯世界 ? 來源:智能計算芯世界 ? 2024-01-04 16:50 ? 次閱讀

本文來自“GPT-4精華專題:多模態(tài)能力提升,應(yīng)用生態(tài)加速(2023)”,2023年11月7日,OpenAI通過開發(fā)者大會推出新產(chǎn)品:

1)GPT4-Turbo:該模型通過增加上下文窗口以支持更長的工作流,同時具備視覺和語音等多模態(tài)能力,輸入和輸出的tokens價格大幅下降,從而幫助開發(fā)者以更低的價格獲取更高的模型性能。

2)GPTs:用戶只需輸入指令并提供外設(shè)的知識庫即可創(chuàng)建專屬GPT,應(yīng)用開發(fā)門檻大幅降低,未來在收益計劃的助力下,AI應(yīng)用有望迎來大爆發(fā),形成全新的AI Agent生態(tài)。

3)Assistant API:開發(fā)者可以通過函數(shù)調(diào)用、知識檢索、代碼解釋器簡化應(yīng)用開發(fā)流程、實現(xiàn)效率提升。

《400+份重磅ChatGPT專業(yè)報告》

1)算力端:OpenAI一系列新產(chǎn)品的推出成功打開新流量入口,更多的用戶和開發(fā)者希望參與其中,巨大的流量對算力底座提出更高的要求;疊加圖片等多模態(tài)生成所要求的tokens計算量遠高于文本模態(tài)(根據(jù)OpenAI官網(wǎng)信息推算,在GPT-4-Turbo的Vision pricing calculator高保真度模式下,1張圖片所產(chǎn)生的tokens數(shù)大約是1個單詞的570或830倍),算力供給亟需擴容。

2)存力端:在算力提效到達一定瓶頸的情況下,AI芯片未來將逐步通過堆疊HBM的方式來提升性能,擴大單位算力的存儲能力,HBM等存力需求將迎來暴增。

3)應(yīng)用端:類比移動互聯(lián)網(wǎng)時代,AI時代的應(yīng)用市場有望如同移動互聯(lián)網(wǎng)時代具備無限潛力,GPTs數(shù)量將呈現(xiàn)非線性高速增長;此外,OpenAI的GPTs通過提供API,使得開發(fā)者只需喂給大模型更多的垂類數(shù)據(jù)即可打造垂類AI應(yīng)用,同時使?jié)M足更多長尾需求成為可能。

4)數(shù)據(jù)端:從OpenAI GPTs的Knowledge功能來看,專業(yè)知識與大模型通用能力的結(jié)合將成為未來的重中之重,私域數(shù)據(jù)庫和專業(yè)數(shù)據(jù)庫方向?qū)粩喈a(chǎn)生新熱點、新需求,因此,如何在合規(guī)前提下留存垂類數(shù)據(jù)并構(gòu)建體系化數(shù)據(jù)庫、以及保證知識產(chǎn)權(quán)的確權(quán)或成為未來的重要議題。

31bb52aa-a1f2-11ee-8b88-92fbcf53809c.png

31d17544-a1f2-11ee-8b88-92fbcf53809c.png

為打造視覺大模型,建立高效視覺預(yù)訓(xùn)練體系以提升圖像理解能力至關(guān)重要,這影響到從圖像整體(如分類、圖文檢索、標注)到部分區(qū)域(如物體識別、短語定位)及到像素細節(jié)(如語義、實例、全景分割)的各項任務(wù)。

通用視覺預(yù)訓(xùn)練方法主要可歸納為三大類。1)標簽監(jiān)督:此方法在每張圖片都配有對應(yīng)標簽的數(shù)據(jù)集上進行訓(xùn)練,如圖像分類中,一張狗的照片會對應(yīng)“狗”的標簽,模型的核心任務(wù)是準確預(yù)測此標簽。2)語言-圖像監(jiān)督:利用完整的文本描述來引導(dǎo)模型學(xué)習(xí),使模型能夠深入挖掘圖像內(nèi)容與文本語義間的關(guān)聯(lián)。3)僅圖像自監(jiān)督:利用圖像本身固有的結(jié)構(gòu)和信息來學(xué)習(xí)有意義的表示,而不依賴于顯式的人工注釋標簽。

31edf7aa-a1f2-11ee-8b88-92fbcf53809c.png

320051fc-a1f2-11ee-8b88-92fbcf53809c.png

1)更長的上下文(Context Length):GPT-4-turbo支持的上下文窗口(128k)相較于GPT-4-8k提升16倍,相較于GPT-4-32k提升4倍,即GPT-4-turbo可在單個prompt中處理超過300頁的文本,且GPT-4-turbo模型在較長的上下文中更加準確。我們認為GPT-4-turbo更長且更準確的上下文處理能力將支持更長的工作流,在B端有能力承擔(dān)更多的工作負載,提升用戶體驗。

2)更豐富的世界知識(Better Knowledge):外部文檔和數(shù)據(jù)庫的截止更新日期從21年9月更新至23年4月,意味著OpenAI的大模型在半年內(nèi)已學(xué)習(xí)互聯(lián)網(wǎng)一年半的知識,學(xué)習(xí)速度極快。

什么是GPTs:GPTs是指“針對特定目的定制的ChatGPT”,用戶可以通過自定義行為創(chuàng)建一個定制版的ChatGPT,定制版的ChatGPT具備帶有任何功能的可能性(在保證隱私和安全的情況下)。

不論是開發(fā)者還是不會寫代碼的普通人,都可以擁有自定義版本的GPT。

更加個性化、私人化、場景化,每個人都可以擁有自己的AI Agent。GPTs通過結(jié)合①說明/Instruction+②擴展的知識/Expand knowledge+③操作/Actions,能夠在很多情況下更好地工作,并且為用戶提供更好地控制,用以幫助用戶輕松完成各種任務(wù)、或者獲得更多樂趣。

321e19a8-a1f2-11ee-8b88-92fbcf53809c.png

3244d5d4-a1f2-11ee-8b88-92fbcf53809c.png

32719ed4-a1f2-11ee-8b88-92fbcf53809c.png

32898b7a-a1f2-11ee-8b88-92fbcf53809c.png

32b0663c-a1f2-11ee-8b88-92fbcf53809c.png

針對開發(fā)者在開發(fā)API中的痛點,OpenAI推出Assistant API,致力于為開發(fā)者賦能。根據(jù)此前市場上推出的各種API,我們可以發(fā)現(xiàn)API通過接入各種程序和應(yīng)用,有助于幫助應(yīng)用實現(xiàn)特定功能。

例如,Shopify的Sidekick允許用戶在平臺上進行操作;Discord的Clyde允許discord版主設(shè)置自定義人格;Snap my AI作為定制聊天機器人工具,可以添加至群聊中并提出建議。但以上API的構(gòu)建可能需要開發(fā)者耗費幾個月的時間、并由數(shù)十名工程師搭建,而目前Assistant API的推出將使其變得容易實現(xiàn)。

32c7426c-a1f2-11ee-8b88-92fbcf53809c.png

32daf17c-a1f2-11ee-8b88-92fbcf53809c.png

1)云側(cè)芯片龍頭:英偉達龍頭地位穩(wěn)固,AMD加速發(fā)展。

① 英偉達:2023年11月13日,英偉達推出H200,內(nèi)存方面首次采用HBM3e,容量高達141GB,帶寬實現(xiàn)大幅提升;性能方面著重強化推理能力和HPC性能,可將Llama2模型的推理速度提高近一倍,相較于H100可降低50%的TCO和能耗成本。2023年以來,英偉達AI芯片已發(fā)布多個產(chǎn)品,在云側(cè)算力芯片領(lǐng)域龍頭優(yōu)勢明顯。

② AMD:2023年6月,AMD正式發(fā)布MI300系列,MI300將CPU、GPU和內(nèi)存封裝為一體,大幅縮短DDR內(nèi)存行程和CPU-GPU PCIe行程,提高性能和效率;MI300采用Chiplet設(shè)計,擁有13個基于3D堆疊的小芯片(5nm: 3個CPU,6個GPU;4個6nm芯片),包括24個Zen4 CPU內(nèi)核,同時融合CDNA 3和8個HBM3顯存堆棧,集成5nm和6nm IP,總共包含128GB HBM3顯存和1460億個晶體管。對比MI250加速卡,MI300可帶來8倍AI性能和5倍每瓦性能的提升(FP8),使ChatGPT和DALL-E等超大AI模型的訓(xùn)練時間可以從幾個月縮短到幾周。

32ec8c84-a1f2-11ee-8b88-92fbcf53809c.png

2)端側(cè)芯片格局:對于AI PC端側(cè)適用芯片,英特爾進展保持領(lǐng)先,高通有望實現(xiàn)從0到1。

① 英特爾:PC主芯片包括CPU和GPU。GPU方面,根據(jù)Statista數(shù)據(jù),英特爾在22Q4全球PC GPU市場中占據(jù)71%的市場份額;CPU方面,根據(jù)Counterpoint Research數(shù)據(jù),英特爾在2022年全球Notebook CPU/SoC市場中占據(jù)69.6%的市場份額,當前英特爾在PC主芯片市場中處于主導(dǎo)地位。23H2,英特爾推出Meteor Lake處理器,助力PC效能提升,專為AI任務(wù)設(shè)計,在AI PC主芯片市場中具備先發(fā)優(yōu)勢。

② 高通:2023年10月,高通于驍龍峰會上推出驍龍X Elite芯片,可支持130億參數(shù)大模型,為Windows-on-Arm筆記本設(shè)計,預(yù)計在2024年中期發(fā)布。算力方面,AI PC對PC芯片的算力要求更高,高通在端側(cè)AI推理能力優(yōu)于英特爾。與此同時,生態(tài)方面,2022年至今Windows開始支持高通,已發(fā)布多輪支持Arm架構(gòu)芯片的操作系統(tǒng)。未來,高通在以驍龍X Elite為代表的AI PC芯片的助力下,將在PC領(lǐng)域?qū)崿F(xiàn)重要突破,逐步搶占市場份額。

3300827a-a1f2-11ee-8b88-92fbcf53809c.png

3)大廠自研趨勢:科技巨頭加速自研,優(yōu)先服務(wù)于自身云服務(wù)業(yè)務(wù)及AI條線。微軟于23年11月16日Ignite技術(shù)大會上發(fā)布兩款自研芯片——Azure Maia 100和Azure Cobalt 100,分別用于大語言模型的訓(xùn)練推理和通用云服務(wù)的支持。近年來,各大科技廠商紛紛自研芯片,一是為了降低自身對第三方芯片和外部供應(yīng)鏈的依賴;二是自研芯片可幫助各大廠商克服一定的通用芯片局限,通過CPU+GPU+DPU+定制芯片等結(jié)合方案,提升全系統(tǒng)整合效率、實現(xiàn)業(yè)務(wù)賦能;三是提高計算能效、減少長期硬件成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1828

    瀏覽量

    34665
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    836

    瀏覽量

    14572
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    988

    瀏覽量

    6252

原文標題:GPT-4 Turbo多模態(tài),應(yīng)用生態(tài)加速

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    國內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和模態(tài)GPT4o API調(diào)用開發(fā)教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的強大工具,可用于自然語言處理和模態(tài)任務(wù)。在國內(nèi)直聯(lián)使用這些服務(wù)需要一些配置和技巧。本文將詳細介紹GPT-4o模型以及
    的頭像 發(fā)表于 06-08 00:33 ?3444次閱讀
    國內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>GPT4</b>o API調(diào)用開發(fā)教程!

    開發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價格詳情指南

    ?目前,OpenAI新模型GPT-4o和GPT-4 Turbo的價格如下: GPT-4o 對比 GPT-4
    的頭像 發(fā)表于 05-29 16:00 ?7710次閱讀
    開發(fā)者如何調(diào)用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南

    OpenAI全新GPT-4o能力炸場!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為
    的頭像 發(fā)表于 05-15 00:15 ?7681次閱讀

    阿里云正式發(fā)布通義千問2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發(fā)布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型之巔。
    的頭像 發(fā)表于 05-13 11:16 ?814次閱讀

    訊飛星火大模型V3.5春季升級,領(lǐng)域知識問答超越GPT-4 Turbo?

    劉慶峰指出,現(xiàn)如今,星火大模型在通用長文本處理能力方面已相當成熟,覆蓋長文檔信息抽取、知識問答、歸納總結(jié)、文本生成等諸多領(lǐng)域,整體表現(xiàn)已達GPT-4 Turbo今年4月最新版的97%水準;
    的頭像 發(fā)表于 04-26 14:26 ?667次閱讀

    商湯科技發(fā)布5.0模態(tài)大模型,綜合能力全面對標GPT-4 Turbo

    商湯科技發(fā)布5.0模態(tài)大模型,綜合能力全面對標GPT-4 Turbo 4月23日,商湯科技董事長兼CEO徐立在2024商湯技術(shù)交流日上發(fā)布
    的頭像 發(fā)表于 04-24 16:49 ?969次閱讀

    OpenAI推出Vision模型版GPT-4 Turbo,融合文本與圖像理解

    據(jù)悉,此模型沿用GPT-4 Turbo系列特有的12.8萬token窗口規(guī)模及截至2023年12月的知識庫架構(gòu),其創(chuàng)新亮點則是強大的視覺理解功能。
    的頭像 發(fā)表于 04-10 10:49 ?288次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無疑將使得
    的頭像 發(fā)表于 03-13 13:42 ?572次閱讀

    OpenAI推出ChatGPT新功能:朗讀,支持37種語言,兼容GPT-4GPT-3

    據(jù)悉,“朗讀”功能支持37種語言,且能夠自主識別文本類型并對應(yīng)相應(yīng)的發(fā)音。值得關(guān)注的是,該功能對GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“模態(tài)
    的頭像 發(fā)表于 03-05 15:48 ?705次閱讀

    ChatGPT plus有什么功能?OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能

    OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能分析解答 在最近的OpenAI DevDay上,該組織發(fā)布了一項備受期待的公告:推出GPT-4 Turbo,這是對其突破
    的頭像 發(fā)表于 12-13 09:19 ?935次閱讀
    ChatGPT plus有什么功能?OpenAI 發(fā)布 <b class='flag-5'>GPT-4</b> <b class='flag-5'>Turbo</b> 目前我們所知道的功能

    新火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini,原生模態(tài)碾壓GPT-4

    谷歌背水一戰(zhàn),發(fā)布Gemini,狙擊GPT-4
    的頭像 發(fā)表于 12-08 09:09 ?1009次閱讀
    新火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini,原生<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>碾壓<b class='flag-5'>GPT-4</b>?

    OpenAI發(fā)布的GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAI的GPT-4 Turbo以前所未有的功能和價格改變?nèi)斯ぶ悄艿奈磥?在人工智能領(lǐng)域的一次里程碑式活動中,OpenAI開發(fā)者大會上發(fā)布了GPT-4 Turbo,這是突破性人工智
    的頭像 發(fā)表于 12-05 17:57 ?2211次閱讀
    OpenAI發(fā)布的<b class='flag-5'>GPT-4</b> <b class='flag-5'>Turbo</b>版本ChatGPT plus有什么功能?

    微軟Copilot(Bing Chat)將升級至GPT-4 Turbo

    微軟Copilot(Bing Chat)將升級至GPT-4 Turbo 微軟廣告和網(wǎng)絡(luò)服務(wù)負責(zé)人Mikhail Parakhin在X平臺透露,Copilot(Bing Chat)目前還在解決一些問題
    的頭像 發(fā)表于 11-28 18:37 ?1070次閱讀

    ChatGPT重磅更新 OpenAI發(fā)布GPT-4 Turbo模型價格大降2/3

    ChatGPT重磅更新 OpenAI發(fā)布GPT-4 Turbo模型價格大降2/3 目前OpenAI算是全球大模型的引領(lǐng)者,一舉一動都牽動著大家的關(guān)注,現(xiàn)在ChatGPT迎來重磅更新。 OpenAI
    的頭像 發(fā)表于 11-07 18:20 ?2555次閱讀
    ChatGPT重磅更新 OpenAI發(fā)布<b class='flag-5'>GPT-4</b> <b class='flag-5'>Turbo</b>模型價格大降2/3

    高性能計算與模態(tài)處理的探索之旅:英偉達GH200性能優(yōu)化與GPT-4V的算力加速未來

    隨著人工智能技術(shù)的不斷發(fā)展,模態(tài)大模型成為越來越重要的發(fā)展趨勢。GPT-4V(GPT-4 近日開放的視覺模態(tài))大型
    的頭像 發(fā)表于 10-19 10:45 ?1214次閱讀
    高性能計算與<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>處理的探索之旅:英偉達GH200性能優(yōu)化與<b class='flag-5'>GPT-4</b>V的算力<b class='flag-5'>加速</b>未來