0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

微軟開發(fā)了一種新的AI圖像字幕算法

姚小熊27 ? 來源:cnBeta.COM ? 作者:cnBeta.COM ? 2020-10-15 14:09 ? 次閱讀

微軟開發(fā)了一種新的圖像字幕算法,在某些有限的測試中,其準確率超過了人類。該人工智能系統(tǒng)已被用于更新該公司為視障人士提供的助理應用程序 “Seeing AI”,并將很快被納入Word、Outlook和PowerPoint等其他微軟產(chǎn)品中。在那里,它將被用于為圖像創(chuàng)建alt文本等任務,這一功能對于提高無障礙性尤為重要。

這些應用包括微軟自己的Seeing AI,該公司于2017年首次發(fā)布。Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。它可以識別家庭物品,閱讀和掃描文本,描述場景,甚至識別朋友。它還可以用來描述其他應用中的圖像,包括電子郵件客戶端、社交媒體應用和WhatsApp等消息應用。

微軟沒有披露Seeing AI的用戶數(shù)量,但Azure AI的企業(yè)副總裁Eric Boyd告訴The Verge,該軟件是 “為盲人或低視力人士提供的領先應用之一”。Seeing AI已經(jīng)連續(xù)三年被盲人和低視力iOS用戶社區(qū)AppleVis評選為最佳應用或最佳輔助應用。

微軟新的圖像字幕算法將顯著提高Seeing AI的性能,因為它不僅能識別物體,還能更精確地描述它們之間的關系。因此,該算法可以在看一張圖片時,不僅能說出圖片中包含哪些物品和物體(如 “一個人、一把椅子、一個手風琴”),還能說出它們之間的互動關系(如 “一個人坐在椅子上,正在拉手風琴”)。微軟表示,該算法是其之前自2015年開始使用的圖像字幕系統(tǒng)的兩倍。

該算法在9月份發(fā)表的一篇預印論文中進行了描述,在一個被稱為 “nocaps ”的圖像字幕基準測試上取得了有史以來最高的分數(shù)。這是一個業(yè)界領先的圖像字幕評分板,不過它有自己的限制條件。nocaps基準測試由超過166,000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15,100張圖片。這些圖片涵蓋了一系列場景,從運動到假日抓拍,再到美食攝影等等。
責任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6554

    瀏覽量

    103897
  • AI
    AI
    +關注

    關注

    87

    文章

    29822

    瀏覽量

    268111
收藏 人收藏

    評論

    相關推薦

    AI圖像識別攝像機

    ?AI圖像識別攝像機是一種集成了先進算法和深度學習模型的智能監(jiān)控設備。這些攝像機不僅能夠捕捉視頻畫面,還能實時分析和處理所拍攝的內(nèi)容,從而實現(xiàn)對特定對象、場景或行
    的頭像 發(fā)表于 11-08 10:38 ?59次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識別攝像機

    愛普生開發(fā)了一種烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%

    愛普生開發(fā)了一種烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%-該振蕩器小巧且節(jié)能,是下代通信基礎設施中參考信號源應用的理想選擇-精工愛普生公司(TSE:6724,“愛普生”)開發(fā)了
    的頭像 發(fā)表于 10-29 11:28 ?116次閱讀
    愛普生<b class='flag-5'>開發(fā)了</b><b class='flag-5'>一種</b>烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%

    BitEnergy AI公司開發(fā)一種AI處理方法

    BitEnergy AI公司,家專注于人工智能(AI)推理技術的企業(yè),其工程師團隊創(chuàng)新性地開發(fā)了一種名為線性復雜度乘法(L-Mul)的
    的頭像 發(fā)表于 10-22 15:15 ?307次閱讀

    圖像識別算法的提升有哪些

    方法。 數(shù)據(jù)增強 數(shù)據(jù)增強是提高圖像識別算法性能的一種有效方法。通過對訓練數(shù)據(jù)進行變換和擴展,可以增加數(shù)據(jù)的多樣性,提高模型的泛化能力。常見的數(shù)據(jù)增強方法包括: 2.1 旋轉(zhuǎn)、縮放、平移和翻轉(zhuǎn) 通過對
    的頭像 發(fā)表于 07-16 11:12 ?554次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法一種利用計算機視覺技術對圖像進行分析和理解的方法,它在許多領域都有廣泛的應用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別
    的頭像 發(fā)表于 07-16 11:09 ?1229次閱讀

    Whatsapp正在開發(fā)一種新的生成人工智能功能

    據(jù)悉,Whatsapp正在開發(fā)一種新的生成人工智能功能,該功能應允許用戶制作自己的個性化頭像,用于任何想象中的場景。WABetaInfo在新的Android版WhatsApp測試版2.24.14.7
    的頭像 發(fā)表于 07-14 17:50 ?925次閱讀

    日本九州大學開發(fā)了名為QDyeFinder的人工智能(AI)工具

    在探索大腦這宇宙中最復雜結(jié)構的征途中,科學家們不斷突破技術的邊界,以更精細、更高效的方式揭示其奧秘。近期,日本九州大學的研究團隊在《自然·通訊》雜志上發(fā)表了項革命性的研究成果,他們開發(fā)了
    的頭像 發(fā)表于 07-03 14:43 ?415次閱讀

    微軟網(wǎng)頁版PPT新增語音識別及字幕生成功能

    據(jù)報道,微軟計劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識別功能。此項功能將能夠監(jiān)控PowerPoint視頻中的聲音,進而自動生成字幕。
    的頭像 發(fā)表于 05-16 14:36 ?354次閱讀

    微軟在天氣預報領域突破,新AI模型精準預測未來30天

    微軟在天氣預報領域取得顯著成果。其Start團隊成功研發(fā)了一種全新AI模型,能夠更精準地預測未來30天的天氣狀況。
    的頭像 發(fā)表于 05-10 11:23 ?769次閱讀

    微軟開發(fā)AI語言模型MAI-1,挑戰(zhàn)行業(yè)巨頭

    據(jù)最新消息,微軟正積極開發(fā)款新型AI語言模型MAI-1,以提升在快速發(fā)展的AI市場中的競爭力。
    的頭像 發(fā)表于 05-08 10:27 ?417次閱讀

    利用AI實現(xiàn)自動圖像標注不是夢

    次次的將圖像添加標簽進行分類,如此機械式的操作是否令你心煩?為不多不少的圖像分類標注工作不得不增加個崗位?你是否因圖像標注需求和數(shù)據(jù)安全
    的頭像 發(fā)表于 01-04 08:29 ?1223次閱讀
    利用<b class='flag-5'>AI</b>實現(xiàn)自動<b class='flag-5'>圖像</b>標注不是夢

    FPGA圖像處理-CLAHE算法介紹()

    在介紹CLAHE算法之前必須要先提下直方圖均衡化,直方圖均衡化算法一種常見的圖像增強算法,可
    的頭像 發(fā)表于 01-02 13:32 ?1648次閱讀
    FPGA<b class='flag-5'>圖像</b>處理-CLAHE<b class='flag-5'>算法</b>介紹(<b class='flag-5'>一</b>)

    韓國研究團隊開發(fā)了一種在石墨烯層上生長柔性GaN LED陣列的方法

    外媒消息,韓國首爾國立大學與成均館大學的研究團隊聯(lián)合開發(fā)了一種在石墨烯層上生長柔性GaN LED陣列的方法,通過該技術研究團隊生長出了LED微型陣列,并稱作微盤陣列(Microdisks arrays)。
    的頭像 發(fā)表于 12-18 10:07 ?871次閱讀

    韓國開發(fā)了一種在石墨烯層上生長柔性GaN LED陣列的方法

    12月11日,外媒消息,韓國首爾國立大學與成均館大學的研究團隊聯(lián)合開發(fā)了一種在石墨烯層上生長柔性GaN LED陣列的方法,通過該技術研究團隊生長出了LED微型陣列
    的頭像 發(fā)表于 12-13 16:06 ?722次閱讀
    韓國<b class='flag-5'>開發(fā)了</b><b class='flag-5'>一種</b>在石墨烯層上生長柔性GaN LED陣列的方法

    一種新的鈣鈦礦-晶硅疊層太陽能電池開發(fā)

    研究人員開發(fā)了一種新的鈣鈦礦-晶硅疊層太陽能電池,該設計使用了一種禁帶寬度為1.67 eV的頂層鈣鈦礦電池和一種基于咔唑的新型自組裝單層(
    的頭像 發(fā)表于 11-16 09:37 ?866次閱讀
    <b class='flag-5'>一種</b>新的鈣鈦礦-晶硅疊層太陽能電池<b class='flag-5'>開發(fā)</b>