0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)令人驚艷的ChatGPT項(xiàng)目,開源了!

CodeSheep ? 來源:CodeSheep ? 2023-03-31 11:00 ? 次閱讀

最近在GitHub上發(fā)現(xiàn)了一個(gè)爆火的開源項(xiàng)目,star數(shù)一頓暴增。

好家伙,湊近一看,居然還是由微軟開源,并且和最近炙手可熱的ChatGPT息息相關(guān)。

項(xiàng)目的名字叫做:Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

fe346fe4-cf69-11ed-bfe3-dac502259ad0.png

https://github.com/microsoft/visual-chatgpt

這個(gè)項(xiàng)目最早是3月上旬微軟開源的,項(xiàng)目宣布開源后僅用了短短一周,就斬獲了2w+ star。

fe3c0cd6-cf69-11ed-bfe3-dac502259ad0.png

截止到目前,距離當(dāng)初項(xiàng)目開源僅僅過去了3周多,倉庫star數(shù)則來到了27k+,亦可謂是火箭式上漲。

眾所周知,ChatGPT自2022年11月推出以來,持續(xù)走紅。

fe62158e-cf69-11ed-bfe3-dac502259ad0.jpg

ChatGPT具備強(qiáng)大的會(huì)話能力,可以理解文字、聊天、寫小說、解答問題、編寫代碼... 但是目前還并不能直接處理或生成圖像。

而Visual ChatGPT這個(gè)項(xiàng)目則可以把ChatGPT和一系列視覺基礎(chǔ)模型(VFM,Visual Foundation Model)給聯(lián)系起來,以便實(shí)現(xiàn)在ChatGPT聊天的過程中來發(fā)送和接收?qǐng)D像,也使得ChatGPT能夠處理更為復(fù)雜的視覺任務(wù)。

fe73407a-cf69-11ed-bfe3-dac502259ad0.gif

講白了,就是通過Visual ChatGPT,可以把一系列視覺基礎(chǔ)模型給接入ChatGPT,使得ChatGPT能勝任更為復(fù)雜的視覺處理任務(wù)。

fe90c992-cf69-11ed-bfe3-dac502259ad0.jpg

Visual ChatGPT的整體技術(shù)架構(gòu)圖如上所示,我們可以清楚地看到ChatGPT和視覺基礎(chǔ)模型(VFM,Visual Foundation Model)分別位于其中的位置。

一方面,ChatGPT(或LLM)作為一個(gè)通用接口,繼續(xù)發(fā)揮它本身的優(yōu)勢(shì),提供對(duì)不同話題的智能理解。

另一方面,基礎(chǔ)視覺模型VFM則通過提供特定領(lǐng)域的深入知識(shí)來充當(dāng)領(lǐng)域?qū)<?,它們通過交互管理模塊(Prompt Manger)進(jìn)行連接和適配。

這樣聊可能比較抽象,我們可以拿官方給的一個(gè)例子來進(jìn)行說明:

feb5352a-cf69-11ed-bfe3-dac502259ad0.png

1、首先是用戶:輸入一張黃色的向日葵圖片,并且要求ChatGPT根據(jù)該圖像預(yù)測(cè)深度來生成一朵紅花,然后再一步一步將其做成卡通畫。

2、接著是交互管理模塊(Prompt Manger)發(fā)揮作用,在它的協(xié)調(diào)和控制下,VFM模塊開始發(fā)揮作用:

首先需要運(yùn)用深度估計(jì)模型來預(yù)測(cè)并生成圖像的深度信息;

然后需要運(yùn)用深度圖像模型來生成對(duì)應(yīng)空間深度的紅花圖像;

最后運(yùn)用Stable Diffusion的風(fēng)格遷移模型來完成圖像風(fēng)格的變換。

3、最后Visual ChatGPT系統(tǒng)再將最終結(jié)果返回給用戶,完成本次對(duì)話。

說到這里,有興趣的小伙伴可以可以看看微軟給出的一篇有關(guān)Visual ChatGPT的論文:https://arxiv.org/pdf/2303.04671.pdf

fed2f54c-cf69-11ed-bfe3-dac502259ad0.png

https://arxiv.org/pdf/2303.04671.pdf

里面關(guān)于這部分的流程解釋得非常詳細(xì),而且還給出了多輪對(duì)話的案例、以及實(shí)驗(yàn)結(jié)果,有興趣的小伙伴可以看看。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3126

    瀏覽量

    42070
  • 視覺
    +關(guān)注

    關(guān)注

    1

    文章

    144

    瀏覽量

    23774
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1517

    瀏覽量

    6930

原文標(biāo)題:一個(gè)令人驚艷的ChatGPT項(xiàng)目,開源了!

文章出處:【微信號(hào):CodeSheep,微信公眾號(hào):CodeSheep】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    用launch pad燒錄chatgpt_demo項(xiàng)目會(huì)有api key報(bào)錯(cuò)的原因?

    我用launch pad燒錄chatgpt_demo項(xiàng)目問題會(huì)有api key報(bào)錯(cuò);請(qǐng)問用launch pad要如何設(shè)置api key和調(diào)試?還是只能通過idf?
    發(fā)表于 06-27 07:59

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當(dāng)?shù)貢r(shí)間5月13日OpenAI推出ChatGPT-4o,代表人工智能向前邁出的大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會(huì)的演示中,OpenAI展示該模型的高級(jí)
    發(fā)表于 05-27 15:43

    未來的智慧園區(qū),充滿令人驚艷的場(chǎng)景

    未來的智慧園區(qū),充滿了令人驚艷的場(chǎng)景。它將實(shí)現(xiàn)從能源管理到環(huán)境監(jiān)測(cè)的多重使命,用科技的力量為人類打造宜居、綠色的工作生活空間。 首先,智慧園區(qū)的能源管理將進(jìn)入全新階段。通過智能化的能源管理系統(tǒng),實(shí)時(shí)
    的頭像 發(fā)表于 05-08 15:33 ?190次閱讀

    3月全志芯片開源項(xiàng)目分享合集

    基本的Linux派和語音擴(kuò)展模板組成,非常簡(jiǎn)單。語音擴(kuò)展模塊提供個(gè)基本的麥克風(fēng)輸入和個(gè)功放,同時(shí)提供鋰電池充放電系統(tǒng),達(dá)到便攜的目的,
    發(fā)表于 04-01 11:21

    在FPGA設(shè)計(jì)中是否可以應(yīng)用ChatGPT生成想要的程序呢

    當(dāng)下AI人工智能崛起,很多開發(fā)領(lǐng)域都可看到ChatGPT的身影,F(xiàn)PGA設(shè)計(jì)中,是否也可以用ChatGPT輔助設(shè)計(jì)呢?
    發(fā)表于 03-28 23:41

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))6.FPGA連接ChatGPT 4

    嗨,親愛的工程師、學(xué)生和愛好者們,我來啦!歡迎來到神秘的星嵌世界!如果你是位FPGA工程師或者對(duì)嵌入式異構(gòu)技術(shù)感興趣,那么你來到的地方絕對(duì)沒錯(cuò)!今天,我們將起探索個(gè)
    發(fā)表于 02-14 21:58

    開源FPGA項(xiàng)目有哪些

    請(qǐng)問開源FPGA項(xiàng)目有哪些?
    發(fā)表于 12-26 12:09

    開源項(xiàng)目維護(hù)者分論壇圓滿舉辦

    開源維護(hù)者——個(gè)被嚴(yán)重誤解的群體,在個(gè)開源項(xiàng)目
    的頭像 發(fā)表于 12-22 18:20 ?453次閱讀
    <b class='flag-5'>開源</b><b class='flag-5'>項(xiàng)目</b>維護(hù)者分論壇圓滿舉辦

    開放原子開源基金會(huì)與 9 個(gè)開源項(xiàng)目舉行捐贈(zèng)簽約儀式

    軟件、OpenTenBase、MetaToC、crowdos、NXROS、Dorothy SSR、onps 開源網(wǎng)絡(luò)協(xié)議共 9 個(gè)開源項(xiàng)目捐贈(zèng)方代表共同簽約。
    的頭像 發(fā)表于 12-21 17:30 ?703次閱讀
    開放原子<b class='flag-5'>開源</b>基金會(huì)與 9 <b class='flag-5'>個(gè)</b><b class='flag-5'>開源</b><b class='flag-5'>項(xiàng)目</b>舉行捐贈(zèng)簽約儀式

    開放原子開源基金會(huì)與9個(gè)開源項(xiàng)目舉行捐贈(zèng)簽約儀式

    軟件、OpenTenBase、MetaToC、crowdos、NXROS、Dorothy SSR、onps開源網(wǎng)絡(luò)協(xié)議共9個(gè)開源項(xiàng)目捐贈(zèng)方代表共同簽約。
    的頭像 發(fā)表于 12-17 15:55 ?665次閱讀

    ChatGPT原理 ChatGPT模型訓(xùn)練 chatgpt注冊(cè)流程相關(guān)簡(jiǎn)介

    ChatGPT注冊(cè)沒有外國手機(jī)號(hào)驗(yàn)證怎么辦? ChatGPT作為近期火爆網(wǎng)絡(luò)的AI項(xiàng)目,受到了前所未有的關(guān)注。我們可以與AI機(jī)器人實(shí)時(shí)聊天,獲得問題的答案。但受ChatGPT服務(wù)器及相
    的頭像 發(fā)表于 12-06 16:28 ?716次閱讀
    <b class='flag-5'>ChatGPT</b>原理 <b class='flag-5'>ChatGPT</b>模型訓(xùn)練 <b class='flag-5'>chatgpt</b>注冊(cè)流程相關(guān)簡(jiǎn)介

    開放原子開源基金會(huì)與Eclipse基金會(huì)正式簽署協(xié)議,創(chuàng)造個(gè)

    Milinkovich基于OpenHarmony的開源項(xiàng)目Oniro正式簽署合作協(xié)議。 簽約照片 本次簽約開放原子開源基金會(huì)創(chuàng)造個(gè)
    的頭像 發(fā)表于 11-21 20:15 ?510次閱讀
    開放原子<b class='flag-5'>開源</b>基金會(huì)與Eclipse基金會(huì)正式簽署協(xié)議,創(chuàng)造<b class='flag-5'>了</b>兩<b class='flag-5'>個(gè)</b>第<b class='flag-5'>一</b>

    不到1分鐘開發(fā)個(gè)GPT應(yīng)用!各路大神瘋狂整活,網(wǎng)友:ChatGPT就是新iPhone

    這個(gè)說法并不準(zhǔn)確。盡管ChatGPT等語言模型已經(jīng)在定程度上改變了我們獲取信息、學(xué)習(xí)知識(shí)的方式,但它們并不能替代人類進(jìn)行創(chuàng)造性思考和創(chuàng)造性活動(dòng)。 雖然些人可能會(huì)利用ChatGPT
    發(fā)表于 11-19 12:06

    如何使用Rust創(chuàng)建個(gè)基于ChatGPT的RAG助手

    經(jīng)常會(huì)出現(xiàn)些幻覺,“本正經(jīng)”地為我們提供些錯(cuò)誤答案,沒有辦法為我們提供專業(yè)的意見或指導(dǎo)。那我們?nèi)绾巫?ChatGPT 具備某個(gè)專業(yè)領(lǐng)域的知識(shí),提升回答的正確率,從而讓
    的頭像 發(fā)表于 10-24 17:34 ?898次閱讀
    如何使用Rust創(chuàng)建<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>基于<b class='flag-5'>ChatGPT</b>的RAG助手

    ChatGPT是怎么實(shí)現(xiàn)的

    情況,并探討它能夠如此出色地產(chǎn)生有意義文本的原因。 首先需要解釋的是,ChatGPT的基本目標(biāo)是嘗試產(chǎn)生個(gè)“合理的延續(xù)”,無論它當(dāng)前所擁有的文本是什么。這里的“合理”是指“在瀏覽數(shù)
    的頭像 發(fā)表于 10-16 11:31 ?783次閱讀
    <b class='flag-5'>ChatGPT</b>是怎么實(shí)現(xiàn)的