国偷自产一区二区免费,99爱国产精品免费精品在线

近日，在第二屆視覺對話競賽Visual Dialogue Challenge中，阿里AI擊敗了微軟、首爾大學(xué)等十支參賽隊伍，獲得冠軍。

(阿里AI在視覺對話競賽中得冠)

據(jù)了解，視覺對話競賽由美國佐治亞理工大學(xué)、Facebook人工智能實驗室(FAIR)等機構(gòu)聯(lián)合全球視覺技術(shù)領(lǐng)域頂級學(xué)術(shù)會議CVPR發(fā)起，是目前視覺對話領(lǐng)域最權(quán)威的競賽之一。

該競賽要求參賽的AI在看完近萬張圖片后，回答出人類對于任一圖片任一內(nèi)容的提問。競賽結(jié)果顯示，阿里AI以74.57%的準(zhǔn)確率獲得冠軍，將上一屆比賽的紀(jì)錄提高了16.82%。在相同的數(shù)據(jù)集中，人類的準(zhǔn)確率僅為64.27%。

傳統(tǒng)的視覺AI主要針對目標(biāo)的檢測和識別，例如識別出圖片是否是一只貓，但對復(fù)雜場景中目標(biāo)之間的邏輯關(guān)系理解、推理能力較弱，無法回答“這只貓旁邊的男生穿了什么顏色的衣服”等復(fù)雜問題，也難以將圖片信息轉(zhuǎn)化為人類理解的語言輸出。

阿里AI的突破在于提出了“遞歸探索對話模型”，綜合集成了圖像識別、關(guān)系推理與自然語言理解三大能力，它通過高效利用標(biāo)注信息學(xué)習(xí)出模仿人類認(rèn)知復(fù)雜場景的思維方式，能夠有效識別圖片里的實體以及它們之間的關(guān)系，推理出圖片所描述的事件內(nèi)容，并通過對上下文進行有效建模，理解人類提出的問題及真實意圖，給出自然準(zhǔn)確的回復(fù)。

視覺對話是近年來快速崛起的AI研究方向，目的在于教會機器用自然語言與人類討論視覺內(nèi)容。如果說視覺識別技術(shù)，讓機器具備了視覺能力;那么視覺對話技術(shù)，則使得機器擁有了對真實視覺世界的理解與推斷能力，意味著AI的認(rèn)知能力將邁上新的臺階。

據(jù)了解，這項技術(shù)未來將被應(yīng)用在人機交互諸多場景：地震后在廢墟中尋找幸存者的救援機器人，能夠更加及時、高效地綜合指揮指令和場景信息作出行動;視障人士可以通過提問阿里AI，理解網(wǎng)絡(luò)照片中的內(nèi)容，了解自身所處的周圍環(huán)境;無人駕駛車輛對影響因子的意圖理解會更為準(zhǔn)確，乘客的乘坐體驗更好。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
29807

瀏覽量
268107
阿里巴巴

阿里巴巴

+關(guān)注

關(guān)注
7

文章
1607

瀏覽量
47059

原文標(biāo)題：不忘初心奮勇當(dāng)先——光華科技連續(xù)9年成為中國電子電路專用化學(xué)品民族企業(yè)No.1

文章出處：【微信號：ruziniubbs，微信公眾號：PCB行業(yè)工程師技術(shù)交流】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

AI對話魔法 Prompt Engineering 探索指南

Engineering 就是設(shè)計和優(yōu)化與AI對話的“提示詞”或“指令”，讓AI能準(zhǔn)確理解并提供有用的回應(yīng)。 Prompt Engineering 主要包括以下幾個方面： 1.明確目標(biāo)：希望A

發(fā)表于 11-07 10:11 ?467次閱讀

莫拉維克悖論與多模態(tài)AI:邁向機器人認(rèn)知的新時代

莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級推理與基本感知運動技能上的巨大差異。對于AI而言，復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運動技能更容易實現(xiàn)。這一悖論凸顯了當(dāng)前AI與人類認(rèn)知能力之間的鴻溝。

發(fā)表于 10-26 15:00 ?439次閱讀

AI大模型在圖像識別中的優(yōu)勢

AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢，這些優(yōu)勢主要源于其強大的計算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像

發(fā)表于 10-23 15:01 ?313次閱讀

AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

人們對AI for Science的關(guān)注推向了高潮。 2. 跨學(xué)科融合與科學(xué)研究新范式 AI與生命科學(xué)的結(jié)合，不僅推動了生命科學(xué)本身的進步，還促進了多個學(xué)科之間的交叉融合。這種跨學(xué)科的合作模式，打破

發(fā)表于 10-14 09:21

人工智能ai4s試讀申請

目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊，ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題，本書對ai4s基本原理和原則，方法進行描訴，有利于總結(jié)經(jīng)驗，擬

發(fā)表于 09-09 15:36

基于迅為RK3588開發(fā)板的AI圖像識別方案

源源不斷的動力。 ■ 無與倫比的視覺盛宴最高支持8K編碼+8K解碼，能夠同時處理多路視頻流，確保每一幀畫面都流暢如絲，細(xì)膩入微。 ■ 智馭未來的AI力量RK3588內(nèi)置了6Tops（即每秒處理6萬億次

發(fā)表于 08-13 11:26

基于瑞薩RZ/V2H AI微處理器的解決方案：高性能視覺AI系統(tǒng)

復(fù)雜的實時物體識別及推理，同時功耗可與傳統(tǒng)的嵌入式MPU相媲美，無需冷卻風(fēng)扇。這里介紹基于RZ/V2H的解決方案：高性能視覺AI系統(tǒng)。

發(fā)表于 07-02 18:36 ?428次閱讀

聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集（硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集）

自定義大模型應(yīng)用并接入到開發(fā)套件上實現(xiàn)語音交互，由淺入深地展示如何開發(fā)自己的大模型助手。離線AI能力示例SDK清單序號AI 能力 1語音

發(fā)表于 06-18 17:33

梯云物聯(lián)|AI提高物聯(lián)網(wǎng)感知能力：讓電梯更智能、安全！

在當(dāng)今日新月異的科技浪潮中，人工智能（AI）與物聯(lián)網(wǎng)（IoT）的深度融合正在為各行各業(yè)帶來革命性的變化。特別是在電梯行業(yè)中，AI技術(shù)的引入不僅極大地提升了物聯(lián)網(wǎng)的感知能力，更讓電梯變得更加智能和安全。

發(fā)表于 06-03 11:49 ?467次閱讀

【AIBOX快速入門】2步玩轉(zhuǎn)AI對話

隨著目前AI的高速發(fā)展，大批量AI硬件應(yīng)運而生，但使用門檻普遍較高。為了解決這類問題，F(xiàn)irefly開源團隊推出了基于Web的AI對話應(yīng)用：FireflyChat，讓

發(fā)表于 05-30 08:02 ?493次閱讀

開發(fā)者手機 AI - 目標(biāo)識別 demo

功能簡介該應(yīng)用是在Openharmony 4.0系統(tǒng)上開發(fā)的一個目標(biāo)識別的AI應(yīng)用，旨在從上到下打通Openharmony AI子系統(tǒng)，展示Openharmony系統(tǒng)的

發(fā)表于 04-11 16:14

搭載星火認(rèn)知大模型的AI鼠標(biāo)：一鍵呼出AI助手，辦公更高效

搭載星火認(rèn)知大模型的AI鼠標(biāo)：一鍵呼出AI助手，辦公更高效在這個AI時代，如果你想在激烈競爭的職場中不被淘汰，訊飛AI鼠標(biāo)AM30就是你的

發(fā)表于 03-25 11:52 ?445次閱讀

計算機視覺：AI如何識別與理解圖像

計算機視覺是人工智能領(lǐng)域的一個重要分支，它致力于讓機器能夠像人類一樣理解和解釋圖像。隨著深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的發(fā)展，人們對于如何讓AI識別和理解圖像產(chǎn)生了濃厚的興趣。本文將探討計算機視覺

發(fā)表于 01-12 08:27 ?1316次閱讀

新紫光集團全面賦能，紫光同創(chuàng)邁上發(fā)展新臺階

，經(jīng)營業(yè)績、市場開拓及客戶服務(wù)也都邁上新臺階！近年來，得益于新一代信息通信、工業(yè)互聯(lián)網(wǎng)、新能源產(chǎn)業(yè)的發(fā)展熱潮，擁有“萬能芯片”之稱的FPGA芯片，因設(shè)計靈活、兼容性強、適用性廣與并行運算等優(yōu)勢，在多個領(lǐng)域展現(xiàn)出蓬勃

發(fā)表于 12-25 18:48 ?363次閱讀

AI視覺識別有哪些工業(yè)應(yīng)用

AI視覺識別涵蓋多種應(yīng)用，如人臉識別、目標(biāo)檢測和識別、圖像分割、行為識別、視頻分析等。本篇就簡單

發(fā)表于 11-27 18:05 ?1144次閱讀