0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Seeing AI幫助盲人和弱視用戶“看”世界

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-05-15 10:44 ? 次閱讀

導(dǎo)盲犬可以很好地幫助盲人或視障人士出行,但是如果想辨別出前面路口的標(biāo)識(shí),或者想知道錢包里還有多少錢,導(dǎo)盲犬可就辦不到了。

由微軟AI研究小組開(kāi)發(fā)的應(yīng)用程序Seeing AI為這個(gè)問(wèn)題給出了解決方案。該應(yīng)用程序可為盲人和弱視用戶描述這個(gè)世界,使他們可以使用自己的智能手機(jī)來(lái)識(shí)別一切:包括單個(gè)物體、顏色、鈔票、文檔等。

自去年問(wèn)世以來(lái),這一應(yīng)用程序的下載量已突破15萬(wàn)次,執(zhí)行任務(wù)500萬(wàn)次,其中一些任務(wù)的服務(wù)對(duì)象還是全球知名的盲人。

“Stevie Wonder(美國(guó)知名藝人)每天都會(huì)用,這確實(shí)很令人振奮?!蔽④浉呒?jí)數(shù)據(jù)科學(xué)家Anirudh Koul在3月于圣何塞舉行的GPU技術(shù)大會(huì)上發(fā)表演講時(shí)說(shuō)道。

該應(yīng)用程序的現(xiàn)場(chǎng)演示就已展現(xiàn)出了其強(qiáng)大的功能。和Koul一同上臺(tái)的還有他的一位同事,當(dāng)他在自己的智能手機(jī)上運(yùn)行應(yīng)用程序,并將手機(jī)朝向他的同事時(shí),應(yīng)用程序描述他看到的是“一位31歲、有著黑頭發(fā)、戴著眼鏡且看起來(lái)很開(kāi)心的男士”。

如果這位同事在他的聯(lián)系人列表中,則有更佳的使用效果,因?yàn)镾eeing AI可以與用戶的聯(lián)系人進(jìn)行整合,并能識(shí)別出朋友的名字。

Koul還分享了幾個(gè)令人嘆服的使用案例:一位盲人教師將運(yùn)行該應(yīng)用的手機(jī)面朝教室門口,這樣孩子們就不會(huì)因她是盲人而趁機(jī)偷偷進(jìn)出教室;另一位用戶在颶風(fēng)肆虐的地區(qū)穿行時(shí),利用這款應(yīng)用程序避開(kāi)了倒落的電線和其他障礙物。

Seeing AI的開(kāi)發(fā)始于2014年2月,開(kāi)發(fā)人員曾試圖創(chuàng)建一個(gè)能發(fā)現(xiàn)并識(shí)別周圍物體的卷積神經(jīng)網(wǎng)絡(luò)。但是其延遲時(shí)間達(dá)10秒,這樣的速度不能及時(shí)幫助人們快速作出決策。

第二年,微軟贊助了一場(chǎng)為期一周的黑客馬拉松,活動(dòng)共吸引了13000人參與,并由此引發(fā)了第二次嘗試:在用戶的頭上配備手機(jī)。

在使用智能眼鏡進(jìn)行試驗(yàn)后,Koul的團(tuán)隊(duì)開(kāi)始著手于應(yīng)用程序本身的開(kāi)發(fā)工作。網(wǎng)絡(luò)本地訓(xùn)練過(guò)程在NVIDIA GPU上進(jìn)行,而較為繁重的工作則交給了基于NVIDIA Tesla P100 GPU運(yùn)行的Azure云實(shí)例。通過(guò)逐幀分析確定每一部分訓(xùn)練的發(fā)生位置。

AI調(diào)優(yōu)

應(yīng)用程序需要辨別不同圖像,而圖像屬性具有不確定性,所以開(kāi)發(fā)人員針對(duì)此特性對(duì)模型進(jìn)行了訓(xùn)練。例如,如果訓(xùn)練應(yīng)用程序識(shí)別貨幣,則需要向訓(xùn)練網(wǎng)絡(luò)內(nèi)輸入不清晰和無(wú)背景的貨幣圖片,以及貨幣某一極小部分放大后的圖片,再讓其識(shí)別出圖片的真實(shí)內(nèi)容。

該團(tuán)隊(duì)向志愿者征集,最終得到了各種類型的圖片,其中包括一張貓咪玩紙幣的圖片,以及紙幣被封在冰塊中的照片。通過(guò)這些變量對(duì)模型進(jìn)行訓(xùn)練,最終就能夠計(jì)算出識(shí)別圖片所需的最小參數(shù)。

Koul的團(tuán)隊(duì)對(duì)網(wǎng)絡(luò)進(jìn)行了調(diào)整,使其傾向于得出否定性分類或不分類的結(jié)果,而不是猜測(cè)結(jié)果(這樣可能將5元鈔票識(shí)別成10元),因?yàn)椴聹y(cè)很顯然會(huì)給盲人用戶造成麻煩。

隨著用戶人數(shù)的增多,這款應(yīng)用程序也將變得越好、越準(zhǔn)確。AI將會(huì)成為盲人和視障用戶的福音。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18416

    瀏覽量

    179696
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29817

    瀏覽量

    268111

原文標(biāo)題:重見(jiàn)光明:深度學(xué)習(xí)幫助盲人“看”到世界

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開(kāi)發(fā)者大會(huì)成功舉辦 vivo用科技搭建人與數(shù)字世界的無(wú)障礙橋梁

    盲人協(xié)會(huì)主席李慶忠出席論壇,與資深用戶、合作伙伴們分享vivo信息無(wú)障礙建設(shè)最新成果,共同展望信息無(wú)障礙美好未來(lái)。 vivo副總裁、vvQ AI全球研究院院長(zhǎng)周圍與中國(guó)殘疾人聯(lián)合會(huì)理事,中國(guó)
    發(fā)表于 10-12 14:18 ?105次閱讀
    開(kāi)發(fā)者大會(huì)成功舉辦 vivo用科技搭建人與數(shù)字<b class='flag-5'>世界</b>的無(wú)障礙橋梁

    使用Google Play獲得安全可靠的AI體驗(yàn)

    生成式 AI 的快速發(fā)展為開(kāi)發(fā)者提供了機(jī)會(huì),讓開(kāi)發(fā)者能為世界各地用戶創(chuàng)造全新、引人入勝的沉浸式應(yīng)用體驗(yàn)。在這個(gè)瞬息萬(wàn)變的時(shí)代,我們很高興能繼續(xù)幫助開(kāi)發(fā)者創(chuàng)建創(chuàng)新、優(yōu)質(zhì)的應(yīng)用,同時(shí)保持
    的頭像 發(fā)表于 09-09 15:53 ?371次閱讀

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料。
    發(fā)表于 09-09 15:36

    FMEA:解鎖AI用戶體驗(yàn)新境界,直擊用戶心坎的智能鑰匙

    在復(fù)雜多變的AI系統(tǒng)中,F(xiàn)MEA不僅僅是傳統(tǒng)制造業(yè)中預(yù)防缺陷的工具,它更是一把解鎖AI用戶體驗(yàn)新境界的鑰匙。通過(guò)系統(tǒng)地識(shí)別、評(píng)估AI系統(tǒng)可能面臨的失效模式及其對(duì)
    的頭像 發(fā)表于 09-05 11:02 ?221次閱讀

    昆侖萬(wàn)維天工AI日活用戶超過(guò)100萬(wàn)

    昆侖萬(wàn)維集團(tuán)近日宣布,旗下天工AI的每日活躍用戶(DAU)已突破百萬(wàn)大關(guān),標(biāo)志著其在人工智能領(lǐng)域的強(qiáng)大影響力和用戶基礎(chǔ)。天工AI智能體平臺(tái)匯聚了近百萬(wàn)個(gè)
    的頭像 發(fā)表于 05-28 09:16 ?564次閱讀

    AI正通過(guò)智能家居幫助我們?nèi)朊?/a>

    不少企業(yè)已經(jīng)推出了個(gè)性化的睡眠方案,結(jié)合智能床墊和智能枕頭,通過(guò)智能分析和個(gè)性化設(shè)置,AI能夠根據(jù)用戶的睡眠習(xí)慣和偏好,自動(dòng)調(diào)整睡眠環(huán)境,從而提供更加舒適和健康的睡眠體驗(yàn)。 ? 要想實(shí)現(xiàn)這一技術(shù),與產(chǎn)品中的重要軟硬件是分不開(kāi)的
    的頭像 發(fā)表于 04-12 00:08 ?3218次閱讀
    <b class='flag-5'>AI</b>正通過(guò)智能家居<b class='flag-5'>幫助</b>我們?nèi)朊? />    </a>
</div><div   id=

    AI芯片未來(lái)會(huì)控制這個(gè)世界嗎?

    AI芯片行業(yè)資訊
    芯廣場(chǎng)
    發(fā)布于 :2024年03月27日 18:21:28

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    :在工業(yè)生產(chǎn)過(guò)程中,NanoEdge AI 可以幫助實(shí)現(xiàn)對(duì)生產(chǎn)線的實(shí)時(shí)監(jiān)控和故障預(yù)測(cè),提高生產(chǎn)效率和降低維護(hù)成本。 3.智能交通:通過(guò)將 NanoEdge AI 應(yīng)用于交通信號(hào)燈、無(wú)人駕駛汽車等設(shè)備
    發(fā)表于 03-12 08:09

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬世界。用戶可以在這個(gè)
    的頭像 發(fā)表于 03-04 14:02 ?688次閱讀

    谷歌發(fā)布AI基礎(chǔ)世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過(guò)單張圖像提示,生成一個(gè)可玩的、交互式的虛擬環(huán)境,從而開(kāi)啟了一個(gè)全新的數(shù)字體驗(yàn)時(shí)代。
    的頭像 發(fā)表于 02-28 17:41 ?753次閱讀

    Vitis AI用戶指南

    電子發(fā)燒友網(wǎng)站提供《Vitis AI用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 10:51 ?1次下載
    Vitis <b class='flag-5'>AI</b><b class='flag-5'>用戶</b>指南

    直線馬達(dá)觸覺(jué)模擬器助力盲人感受美好世界

    說(shuō)到盲人,作為弱勢(shì)群體之一,他們無(wú)疑是不幸的,他們無(wú)法看到四季的變幻、無(wú)法看到親人的模樣,日常生活也是困難重重,但好在,隨著社會(huì)的發(fā)展和進(jìn)步,越來(lái)越多的人關(guān)注到他們,對(duì)他們伸出友愛(ài)援助之手,越來(lái)越多的設(shè)施設(shè)備給他們的生活提供便利,如導(dǎo)盲犬、盲道、觸覺(jué)模擬器等等。
    的頭像 發(fā)表于 12-09 09:14 ?733次閱讀

    大模型數(shù)據(jù)集:揭秘AI背后的魔法世界

    一、引言 在人工智能的奇幻世界中,大模型數(shù)據(jù)集如同神秘的魔法書,蘊(yùn)藏著無(wú)盡的智慧與力量。它們?yōu)?b class='flag-5'>AI注入了生命,使其具備了理解和改變世界的能力。今天,就讓我們一起揭開(kāi)大模型數(shù)據(jù)集的神秘面紗,探索其背后
    的頭像 發(fā)表于 12-07 17:33 ?516次閱讀

    人類認(rèn)知如何幫助我們制造更好的AI系統(tǒng)?

    我們重點(diǎn)關(guān)注“一致性”問(wèn)題,即AI系統(tǒng)思考和表征世界的方式與人類相比,有多大的一致性?我們需要做的是進(jìn)行更多的研究,找出AI系統(tǒng)擅長(zhǎng)的事情,并幫助人們了解在哪些情況下可以與這些
    的頭像 發(fā)表于 11-15 16:34 ?375次閱讀

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37