精品人妻系列无码区久久,国产精品伦理久久久久,日本AⅤ精品一区二区三区久久

在IBM最新的論文中，研究人員提出了一種能自主制作多樣化、創(chuàng)造性和符合人類語境的圖片文字說明的模型。實(shí)驗(yàn)證明，圖片的文字說明取得了“良好”的性能，未來可以為強(qiáng)大的新計(jì)算機(jī)視覺系統(tǒng)奠定了基礎(chǔ)。

無論是報(bào)社、雜志社還是新媒體，編輯們最不愿意干得事情就是為圖片搭配文字說明。事實(shí)上這項(xiàng)工作必要且重要但實(shí)際操作上又非?？菰?。

不過，一個(gè)振奮人心的消息是，AI可能很快就能處理大部分工作。6月18日在加州長(zhǎng)灘舉行的2019年計(jì)算機(jī)視覺和模式識(shí)別會(huì)議(CVPR)上，Pierre L. Dognin, Igor Melnyk, Youssef Mroueh, Jarret Ross, Tom Sercu發(fā)表了一篇論文《改進(jìn)圖像說明的對(duì)抗性語義對(duì)齊》，提出了一種能夠自主制作多樣化、創(chuàng)造性和符合人類語境的圖片文字說明的模型。

在論文中，他們將圖像說明作為一種有條件的GAN（生成式對(duì)抗網(wǎng)絡(luò)）訓(xùn)練進(jìn)行研究，提出了一種上下文感知的LSTM字幕器和共同注意鑒別器，它們加強(qiáng)了圖像和字幕之間的語義對(duì)齊。

研究人員根據(jù)經(jīng)驗(yàn)著重研究了SCST和ST兩種訓(xùn)練方法的可行性。他們發(fā)現(xiàn)即使沒有直接訪問鑒別器梯度，SCST也比ST顯示出更穩(wěn)定的梯度行為和更好的結(jié)果。進(jìn)而還解決了對(duì)這些模型進(jìn)行自動(dòng)評(píng)估的開放性問題，引入了一個(gè)新的語義評(píng)分，并證明了它與人類判斷的強(qiáng)相關(guān)性。

作為評(píng)估范例，一個(gè)重要的標(biāo)準(zhǔn)是生成器能夠概括出平常不會(huì)一起出現(xiàn)的對(duì)象之間的組合關(guān)系。為此研究人員引入了一個(gè)小標(biāo)題能脫離上下文（OOC）測(cè)試集。OOC與常規(guī)語義評(píng)分相結(jié)合，為圖片搭配說明文字得體系提出了新基準(zhǔn)。當(dāng)面向OOC和MS-COCO進(jìn)行測(cè)試時(shí)，可以發(fā)現(xiàn)基于SCST的訓(xùn)練在語義評(píng)分和人類評(píng)估方面都有很強(qiáng)的表現(xiàn)，有望成為高效離散GAN訓(xùn)練的一種有價(jià)值的新方法。

目前，構(gòu)建系統(tǒng)需要解決自動(dòng)說明文字系統(tǒng)的一個(gè)主要缺點(diǎn)：順序語言生成導(dǎo)致語法正確—但同質(zhì)、非自然和語義不相關(guān)的結(jié)構(gòu)。

研究者的方法是通過一個(gè)注意力文字說明模型來解決這個(gè)問題，模型使用它正在觀察的照片中的場(chǎng)景片段來造句。在每一個(gè)生成步驟中，團(tuán)隊(duì)的AI都可以選擇關(guān)注最后一步的視覺或文本提示。

為了確保生成的文字說明聽起來不太機(jī)械化，研究團(tuán)隊(duì)在訓(xùn)練時(shí)使用了生成對(duì)抗網(wǎng)絡(luò)(GANs)——由生成樣本的生成器和試圖區(qū)分生成樣本和現(xiàn)實(shí)世界樣本的鑒別器組成的兩部分神經(jīng)網(wǎng)絡(luò)。共同注意鑒別器通過一個(gè)在像素級(jí)匹配場(chǎng)景和生成單詞的模型對(duì)新句子的“自然度”進(jìn)行評(píng)分，使文字說明者能夠通過圖像和句子成對(duì)來進(jìn)行合成。

文字說明系統(tǒng)中的另一個(gè)常見問題是，如何避免訓(xùn)練數(shù)據(jù)集的偏差，即經(jīng)常遭受過度擬合(特定數(shù)據(jù)集過于接近的分析)就需要構(gòu)建診斷工具，否則并不適合推廣到學(xué)習(xí)對(duì)象(“床和臥室”)出現(xiàn)在看不見的環(huán)境(“床和森林”)中的場(chǎng)景。為此，研究人員提出了一種標(biāo)題圖像的測(cè)試語料庫，其設(shè)計(jì)方式使得不良模型性能表明過度擬合。

在實(shí)驗(yàn)中，Amazon's Mechanical Turk評(píng)估人員負(fù)責(zé)識(shí)別AI模型生成的文字說明，并判斷每句話對(duì)相應(yīng)圖像的描述程度，給出幾個(gè)真實(shí)的和合成的樣本，研究人員表示，他們的文字說明總體上取得了“良好”的性能。他們相信他們的工作為強(qiáng)大的新計(jì)算機(jī)視覺系統(tǒng)奠定了基礎(chǔ)，并打算在未來的工作中繼續(xù)探索這些系統(tǒng)。另外，銜接語言和視覺語義的鴻溝表明需要將常識(shí)和推理融入場(chǎng)景理解中。

未來，圖像文字說明的自動(dòng)生成和場(chǎng)景理解的進(jìn)步，使AI系統(tǒng)可以作為視覺障礙者的助理改善他們的日常生活。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

IBM

IBM

+關(guān)注

關(guān)注
3

文章
1730

瀏覽量
74487
AI

AI

+關(guān)注

關(guān)注
87

文章
29011

瀏覽量
266399

原文標(biāo)題：IBM發(fā)布最新AI模型，幫視障者“看”到更多

文章出處：【微信號(hào)：Aiobservation，微信公眾號(hào)：人工智能觀察】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

IBM Granite系列模型被Forrester評(píng)為“強(qiáng)勁表現(xiàn)者”

近日，IBM 憑借其旗艦 Granite 系列模型，在 2024年第二季度的《Forrester Wave：語言 AI 基礎(chǔ)模型》報(bào)告中，被評(píng)為“強(qiáng)勁表現(xiàn)

發(fā)表于 08-16 11:34 ?335次閱讀

智行者——視聽障礙者出行輔助AI小車設(shè)計(jì)

摘要據(jù)統(tǒng)計(jì)，我國(guó)視障人數(shù)達(dá)1731萬人，聽力殘疾患者2780萬人。視聽障礙者對(duì)出行和交流需求迫切，但現(xiàn)有設(shè)施和輔具局限性大，使他們面臨出行難題。因此，我們開發(fā)了一款安全、精準(zhǔn)、語音與手部交互的導(dǎo)航避

發(fā)表于 07-19 08:11 ?297次閱讀

智行者——視聽障礙<b class='flag-5'>者</b>出行輔助<b class='flag-5'>AI</b>小車設(shè)計(jì)

騰云馭智出海時(shí) 看IBM如何用1%的數(shù)據(jù)讓你與眾不同

——IBM混合云與AI為中國(guó)企業(yè)出海提供有力支持之系列報(bào)道（三）北京2024年6月24日?/美通社/ -- IBM日前在北京舉行媒體會(huì)，從IBM的戰(zhàn)略、定位、實(shí)踐，

發(fā)表于 06-24 17:34 ?346次閱讀

騰云馭智出海時(shí) <b class='flag-5'>看</b><b class='flag-5'>IBM</b>如何用1%的數(shù)據(jù)讓你與眾不同

2024 TUYA全球開發(fā)者大會(huì)盛大啟幕，Cube AI大模型重磅首發(fā)！

2024TUYA全球開發(fā)者大會(huì)上，重磅推出AI大模型、AI開發(fā)工具、AI小程序開發(fā)基座等重量級(jí)產(chǎn)品，讓A

發(fā)表于 05-31 08:15 ?267次閱讀

2024 TUYA全球開發(fā)者大會(huì)盛大啟幕，Cube AI大模型重磅首發(fā)！

2024 TUYA全球開發(fā)者大會(huì)上，重磅推出AI大模型、AI開發(fā)工具、AI小程序開發(fā)基座等重量級(jí)產(chǎn)品，讓

發(fā)表于 05-30 09:13 ?191次閱讀

IBM開源AI模型，推動(dòng)AI企業(yè)化應(yīng)用

IBM近日宣布，將把一系列先進(jìn)的人工智能模型以開源軟件的形式發(fā)布，此舉標(biāo)志著人工智能技術(shù)在企業(yè)應(yīng)用上的新篇章。公司表示，隨著watsonx平臺(tái)推出滿一年，該平臺(tái)將迎來重大更新，新增的數(shù)據(jù)和自動(dòng)化功能將使企業(yè)能夠更輕松地集成和部署

發(fā)表于 05-22 09:25 ?396次閱讀

紅帽發(fā)布RHEL AI開發(fā)者預(yù)覽版，集成IBM Granite模型，簡(jiǎn)化AI開發(fā)流程

RHEL AI依托InstructLab開源項(xiàng)目，結(jié)合IBM Research的開源授權(quán)Granite大型語言模型與InstructLab模型對(duì)齊工具，采用LAB（Large-scal

發(fā)表于 05-08 15:01 ?396次閱讀

開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

功能簡(jiǎn)介該應(yīng)用是在Openharmony 4.0系統(tǒng)上開發(fā)的一個(gè)目標(biāo)識(shí)別的AI應(yīng)用，旨在從上到下打通Openharmony AI子系統(tǒng)，展示Openharmony系統(tǒng)的AI能力，并為開發(fā)者

發(fā)表于 04-11 16:14

使用CUBEAI部署tflite模型到STM32F0中，模型創(chuàng)建失敗怎么解決？

看到CUBE_AI已經(jīng)支持到STM32F0系列芯片，就想拿來入門嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直無法創(chuàng)建成功。

發(fā)表于 03-15 08:10

IBM在watsonx上提供開源的Mistral AI模型

IBM 提供 Mixtral-8x7B 的優(yōu)化版本，該版本可將延遲時(shí)間最多縮短 75% IBM、第三方和開源模型的目錄不斷增加，為客戶提供更多選擇和靈活性是 watsonx 人工智能

發(fā)表于 03-12 19:10 ?1253次閱讀

獵戶星空發(fā)布強(qiáng)大AI大模型

近日，獵戶星空在2024·傅盛的開年AI大課暨獵戶星空企業(yè)應(yīng)用大模型發(fā)布會(huì)上，正式發(fā)布了其最新研發(fā)的大模型。這個(gè)大

發(fā)表于 01-22 14:31 ?576次閱讀

AI大模型怎么解決芯片過剩?

AI大模型

電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2024年01月02日 15:42:05

AI大模型可以設(shè)計(jì)電路嗎?

AI大模型

電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2024年01月02日 15:09:29

IBM 發(fā)布新一代 IBM Storage Scale System 6000，加速釋放數(shù)據(jù)和 AI 的潛力

面向非結(jié)構(gòu)化數(shù)據(jù)的全新云規(guī)模、高性能存儲(chǔ)設(shè)備，支持最嚴(yán)苛的 AI 和容量密集型工作負(fù)載近日，IBM (紐交所股票代碼：IBM)? 推出了全新的 IBM Storage Scale S

發(fā)表于 11-14 19:45 ?500次閱讀

【重磅】首批 IBM watsonx 專有 “花崗巖”Granite 模型全球開始上市，化解企業(yè)采用生成式 AI 的“數(shù)據(jù)焦慮”

? ? ? ? ? ? ? 身體力行發(fā)布 Granite 模型訓(xùn)練數(shù)據(jù)集的詳細(xì)信息，兌現(xiàn) IBM 對(duì)透明和負(fù)責(zé)任 AI 的承諾 IBM (

發(fā)表于 10-20 01:15 ?521次閱讀