欧美性大战久久久久久,国产在线拍偷自揄拍精品

本文將為大家介紹CVPR 2023年最佳論文兩篇中的Visual Programming: Compositional visual reasoning without training （視覺編程：無需訓練的組合式視覺推理），代碼已開源。

Title:

VisualProgramming:Compositionalvisualreasoningwithouttraining

Paper:

https://openaccess.thecvf.com/content/CVPR2023/html/Gupta_Visual_Programming_Compositional_Visual_Reasoning_Without_Training_CVPR_2023_paper.html

Code:

https://github.com/allenai/visprog

/導讀/

VISPROG是一種神經符號方法，可利用自然語言指令解決復雜的組合式視覺任務。VISPROG避免了任何特定于任務的訓練需求。相反，它利用大型語言模型的上下文學習能力生成類似Python的可組合程序，這些程序將被執(zhí)行以獲得解決方案和全面可解釋的推理結果。生成的程序的每一行可以調用多個現(xiàn)成的計算機視覺模型、圖像處理子程序或Python函數(shù)以生成中間輸出，后續(xù)程序部分可以使用這些中間輸出。在四項不同的任務中展示了VISPROG的靈活性：組合式視覺問答、基于圖像對的零樣本推理、實際知識對象標注和語言引導圖像編輯。類似VISPROG這樣的神經符號方法是擴展人工智能系統(tǒng)范圍、為人們提供執(zhí)行復雜任務的有效途徑。

VISPROG是一種可組合和可解釋的神經符號系統(tǒng)，用于進行組合式視覺推理。給定自然語言指令和高層次程序的幾個示例，VISPROG利用GPT-3的上下文學習功能針對任何新指令生成程序，并在輸入的圖像上執(zhí)行程序以獲取預測結果。VISPROG還將中間輸出總結為可以解釋的視覺說明。

/模塊/

VisProg目前支持20個模塊，可實現(xiàn)圖像理解、圖像操作（包括生成）、知識檢索和算術和邏輯操作等能力。在這里顯示的紅色模塊是使用經過訓練的最先進神經模型實現(xiàn)的，而藍色模塊是使用多種Python庫（如PIL、OpenCV和AugLy）實現(xiàn)的非神經Python函數(shù)。

在VISPROG中，每個模塊都被實現(xiàn)為一個Python類，見下述代碼，其具有以下方法：

（i）解析行以提取輸入參數(shù)的名稱和值以及輸出變量的名稱；

（ii）執(zhí)行必要的計算，可能涉及訓練過的神經模型，并更新程序狀態(tài)以獲得輸出變量的名稱和值；

（iii）使用HTML方式以可視方式總結該步驟的計算（用于創(chuàng)建visual rationales）。

要向VISPROG添加新模塊，只需要實現(xiàn)并注冊一個模塊類，程序的執(zhí)行使用該模塊將由VISPROG解釋器自動處理。

/VISPROG中的程序生成/

VisProg通過向LLM GPT-3提供指令及其相關的示例指令和對應程序，來生成程序。與以前的方法如神經模塊網(wǎng)絡（Neural Module Network）不同，VisProg利用大規(guī)模語言模型的上下文學習能力來生成程序，而不是使用預先定義的模塊。這使生成的程序更加靈活且能夠處理更多的組合式視覺任務。

/可解釋性/

VisProg不僅生成高度可解釋的程序，還通過將每個步驟的輸入和輸出的摘要拼接在一起生成visual rationales，以幫助理解和調試程序執(zhí)行期間的信息流。下面是兩個visual rationales的示例。

使用自然語言進行圖像編輯

關于圖像對的推理（自然語言視覺推理）

/結果可視化/

在組合式視覺問答、基于零樣本的圖像對推理（僅使用單張圖像VQA模型）、實際知識對象標記和語言引導的圖像編輯等復雜視覺任務上展示了VisProg。下圖展示了VisProg在對象標記和圖像編輯任務上的能力。

更多關于所有任務的定性結果以及相應的視覺說明，包括由于程序生成中的邏輯錯誤或模塊預測錯誤而導致的失敗案例，請根據(jù)下面鏈接下載查閱：

https://openaccess.thecvf.com/content/CVPR2023/supplemental/Gupta_Visual_Programming_Compositional_CVPR_2023_supplemental.zip

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

模塊

模塊

+關注

關注
7

文章
2655

瀏覽量
47292
人工智能

人工智能

+關注

關注
1789

文章
46652

瀏覽量
237069
python

python

+關注

關注
55

文章
4767

瀏覽量
84375

原文標題：CVPR 2023 最佳論文！VISPROG：以神經符號方式將人工智能推向更廣泛、更復雜的任務領域

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

人工智能是什么?

的階段。阻礙前行的因素很多，要攻克的技術難點也很多，但這些問題在人工智能領域的專家來看，技術的積累都只是時間問題，對人工智能技術做更進一步剖析的話，其實就是“算法”+“海量數(shù)據(jù)”。更通

發(fā)表于 09-16 15:40

未來的人工智能技術趨勢是什么？

隨著Google、Microsoft和Facebook等巨頭的大力投入，深度學習正在超越機器學習，人工智能來勢兇猛。那么，如今人工智能最熱門的技術趨勢是什么？黑匣認為，復雜神經網(wǎng)絡、L

發(fā)表于 12-23 14:21

人工智能事實上是一種生物進化歷程的壓縮

，執(zhí)行化合生命體無法執(zhí)行的或復雜或規(guī)模龐大的任務等等。值得一提的是，機器翻譯是人工智能的重要分支和最先應用領域。不過就已有的機譯成就來看，機譯系統(tǒng)的譯文質量離終極目標仍相差甚遠；而機譯

發(fā)表于 03-08 10:56

百度總裁：百度在人工智能領域已有重大突破

　　隨著阿法狗大戰(zhàn)李世石，人工智能引發(fā)越來越多的關注。百度總裁張亞勤28日表示，百度長期堅持技術創(chuàng)新，2015年研發(fā)投入超過100億元，目前在人工智能領域已有重大突破?！　垇喦谠谔旖蛳募具_沃斯論壇

發(fā)表于 07-01 15:22

人工智能已經進入醫(yī)療領域

的方式保存起來，當需要的時候在一定的授權下能夠很快的調回使用，同時增加一些輔助診斷管理功能。如今，隨著人工智能技術的逐步興起，為放射科醫(yī)生提高工作效率提供了更多可能。通過人工智能算法，機器可以自動讀取

發(fā)表于 05-24 15:07

人工智能到底用 GPU？還是用 FPGA？

`我思故我在亮出你的觀點自從類神經網(wǎng)絡算法可以用強大的運算能力加以模擬之后，強人工智能才開始出現(xiàn)。即便如此，以目前 CPU 的運算能力來講，模擬類神經網(wǎng)絡算法的代價非常之大，于是有人

發(fā)表于 08-23 15:42

人工智能和機器學習的前世今生

可以交替使用的概念，這或多或少地加重了與這些概念相關聯(lián)的已經存在的混淆程度。讓我們領會這些概念，直截了當?shù)乩斫馑鼈兊膬群椭g的細微差別。人工智能是一個比機器學習更廣泛的概念。它是關于將人類的認知

發(fā)表于 08-27 10:16

全語音人工智能AI耳機，或將引爆智能耳機市場

，阿里巴巴集團董事局主席馬云將人工智能重新定義為：未來的一種生活方式。人工智能正在改變一切，在未來將會顛覆所有的商業(yè)應用，影響每一個人的生活。那么，當

發(fā)表于 11-02 11:55

人工智能：超越炒作

。對于人工智能用例在當前物聯(lián)網(wǎng)環(huán)境中變?yōu)楝F(xiàn)實，必須滿足三個條件：非常大的真實數(shù)據(jù)集具有重要處理能力的硬件架構和環(huán)境開發(fā)新的強大算法和人工神經網(wǎng)絡（ANN）以充分利用上述內容很明顯，后兩

發(fā)表于 05-29 10:46

人工智能后續(xù)以什么形式發(fā)展？

從2014年開始，人工智能逐漸成為科技領域最熱門的概念，被科技界，企業(yè)界和媒體廣泛關注。作為一個學術領域，人工智能是在1956年夏季，

發(fā)表于 08-12 07:53

人工智能的應用領域有哪些？

` 本帖最后由 cdhqyj 于 2020-10-23 11:09 編輯 人工智能的應用領域有哪些？人工智能的定義可以分為兩部分，即“人工”和“

發(fā)表于 10-23 11:07

中國人工智能的現(xiàn)狀與未來

中國人工智能的現(xiàn)狀與未來，人工智能是目前最火熱的技術領域，也是一門極富挑戰(zhàn)性的科學，從事這項工作的人必須懂得計算機知識，數(shù)學、心理學，甚至哲學。人工智能是包括十分

發(fā)表于 07-27 06:40

什么是人工智能、機器學習、深度學習和自然語言處理？

，機器人現(xiàn)在可以與具有多任務處理能力的人類工作者一起工作。計算機視覺、傳感器網(wǎng)絡和人工智能廣泛應用于數(shù)控機床和裝配線，以減少誤差，實現(xiàn)自動修正和提高生產率。交通: 基于應用程序的出租車

發(fā)表于 03-22 11:19

《移動終端人工智能技術與應用開發(fā)》人工智能的發(fā)展與AI技術的進步

人工智能打發(fā)展是算法優(yōu)先于實際應用。近幾年隨著人工智能的不斷普及，許多深度學習算法涌現(xiàn)，從最初的卷積神經網(wǎng)絡（CNN）到機器學習算法的時代。由于應用環(huán)境的差別衍生出不同的學習算法：線性回歸，分類與回歸樹

發(fā)表于 02-17 11:00

神經符號人工智能如何書寫未來

符號人工智能和神經網(wǎng)絡還是完完全全的兩個世界，相互對立。人工智能領域的大佬們常常各執(zhí)一詞，在支持一種方法的同時，必將否定另一種方法。

發(fā)表于 01-07 13:38 ?2191次閱讀

搜索歷史

VISPROG：以神經符號方式將人工智能推向更廣泛、更復雜的任務領域

評論