0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用 AI 幫助視障者“聽懂”世界

yrlT_lianggezhi ? 來源:工程師李察 ? 2019-01-26 11:32 ? 次閱讀

自動駕駛、無人機(jī),到監(jiān)控安防,視覺 AI 技術(shù)的突破為人們生活帶來了巨大改變,在許多領(lǐng)域迎來爆發(fā)式發(fā)展,僅在國內(nèi)就涌現(xiàn)商湯、云從、曠視和依圖等四大視覺 AI 獨(dú)角獸。但若真要論能為使用者帶來多大改變,恐怕很少有比得上這一項(xiàng),那就是用視覺 AI 來打造盲人的眼睛。

無障礙人工智能成顯學(xué),各大科技巨頭亦相繼致力投入

AI for Accessibility、無障礙人工智能近來已在國際間成為一項(xiàng)顯學(xué)。如何將發(fā)展迅速的人工智能技術(shù),用來改善全世界約 10 億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。

以視障者來說,近日 Instagram 就新增一項(xiàng)輔助功能,用 AI 自動辨識照片內(nèi)容并以語音告知用戶。臉書 Messenger 也有無障礙機(jī)器人(Accessibility Bot),協(xié)助盲人辨識臉書朋友,甚至是朋友的臉部表情。華為 Mate 20 Pro 也有一個(gè)應(yīng)用程序 Facing Emotions,可以將七種最普遍的情緒轉(zhuǎn)化為相應(yīng)的聲音,可以大幅提升盲人與其他人的實(shí)時(shí)互動交流。

影像視覺 AI 并不是新的概念,其背后技術(shù)主要包含機(jī)器學(xué)習(xí)、深度學(xué)習(xí),再加上 3D 臉部辨識等。尤其是深度學(xué)習(xí)算法運(yùn)用在訓(xùn)練 AI來協(xié)助盲人辨識物體,可以發(fā)揮非常大的用處。

比方說,如果我們想要設(shè)計(jì)一個(gè) AI 協(xié)助盲人分辨不同面額的紙鈔。做法就是將一張 10 元紙鈔,通過各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給 AI 看,讓它學(xué)習(xí)什么是一張 10 元紙鈔。通過大量反覆學(xué)習(xí)后,視障者只要能讓手機(jī)鏡頭看到 10 元紙鈔的一小角,AI 就能將它分辨出來。

“這些小事,會讓你很確實(shí)地感覺到自己的獨(dú)立性。希望隨著人工智能的進(jìn)展,可以讓我們更容易感受環(huán)境,協(xié)助我們完成更多日常事務(wù)”,微軟視覺輔助應(yīng)用程序 Seeing AI 的項(xiàng)目主管、同時(shí)自身也是視障者的 Saqib Shaikh,近日接受專訪時(shí)這樣對 DT 君說。

圖|微軟技術(shù)負(fù)責(zé)人(Tech Lead)Saqib Shaikh (來源:微軟)

Saqib Shaikh 在 7 歲時(shí)失去視力,此前不久,他才剛剛得到人生中的第一臺電腦。

所幸這并不是他與計(jì)算機(jī)科學(xué)之間的句點(diǎn)。

而后他就讀視障學(xué)生小學(xué),一位老師看出了他的潛力,鼓勵(lì)他開始學(xué)習(xí)打字。此后他一路進(jìn)入大學(xué),主修計(jì)算機(jī)科學(xué),以班上頂尖的成績畢業(yè),并取得人工智能碩士學(xué)位。而后,他又加入微軟的人工智能團(tuán)隊(duì),并在大約 3 年前通過微軟內(nèi)部的黑客松競賽,以Seeing AI這個(gè)項(xiàng)目脫穎而出,獲得資源將之打造為實(shí)際產(chǎn)品,現(xiàn)在已可在美國地區(qū)免費(fèi)下載。

Seeing AI 用視覺 AI 幫助視障者“聽懂”世界

Seeing AI 這個(gè)是一款結(jié)合圖像辨識、語音說明及人性化使用介面的應(yīng)用程序,可以用手機(jī)上的攝像頭識別所有圖像,包含通過掃描條形碼來識別產(chǎn)品、辨識身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內(nèi)容,并閱讀出菜單和文件。

同時(shí),這款應(yīng)用程序也可以結(jié)合智能眼鏡,更好地協(xié)助用戶了解所處的周遭環(huán)境。

圖|Seeing AI 是一款結(jié)合圖像辨識、語音說明及人性化使用介面的應(yīng)用程序(來源:微軟)

Saqib Shaikh 指出,近年深度學(xué)習(xí)技術(shù)的成熟,是 Seeing AI 可以真正發(fā)揮用處的主要關(guān)鍵。通過深度學(xué)習(xí)訓(xùn)練,向系統(tǒng)展示大量照片,并教導(dǎo)它們照片中的內(nèi)容,AI 可以真正有效辨識出現(xiàn)實(shí)生活環(huán)境中的各種物體與人物。

但是,要落實(shí)到讓 AI 有效協(xié)助視障者在生活中能真正用上,還必須歸功于近年硬件技術(shù)的發(fā)展,在軟、硬件配合之下,讓視覺 AI 技術(shù)實(shí)用價(jià)值大大提升。尤其是邊緣運(yùn)算風(fēng)潮興起,視覺信息可以在裝置終端就能完成運(yùn)算,才能對使用者提供實(shí)時(shí)反饋,讓盲人能夠即時(shí)對互動對象做出適合的反應(yīng)。

實(shí)時(shí)反饋絕對是關(guān)鍵。Saqib Shaikh 說,想像一個(gè)情境,當(dāng)你在一個(gè)會議上進(jìn)行簡報(bào)。因?yàn)檫@是一個(gè)正式場合,因此所有人,包含旁邊的同事、上級主管,都只是安靜聽你說話,不會任意發(fā)出聲音。所以在你說話的同時(shí),若無法用眼睛去觀察聽眾,你對于他們的反應(yīng)是毫無頭緒的,你甚至不知道應(yīng)不應(yīng)該繼續(xù)說下去,還是暫停下來詢問聽眾的想法。

這時(shí)候,如果有一個(gè) AI 可以幫你辨識聽眾的反應(yīng),實(shí)時(shí)反饋你他們是不是看起來滿意、尤其是還能辨認(rèn)出特定人士,比方說直屬主管的表情和動作如何,這樣一個(gè)人工智能,將能夠大大地讓盲人突破限制,改善他們在日常工作中表現(xiàn)。

非監(jiān)督學(xué)習(xí)是視覺 AI 下一步突破關(guān)鍵

今日我們所談的視覺 AI ,其實(shí)多半仍局限于靜態(tài)圖像、單一圖像,但 Saqib Shaikh 想像中的 Seeing AI 2.0,將可以解讀一系列的圖像、可以掌握使用者的偏好。

“就像當(dāng)我與妻子一起在街上走路時(shí),她會告訴我有什么我沒看過的新東西、有什么有趣的事物。比方說,她會告訴我我們很喜歡的一間咖啡店關(guān)門了?!盨aqib Shaikh 說,“一個(gè)真正的人可以了解什么是你會感興趣、什么是你會覺得重要的事物?!?/p>

而 AI 若要能夠做到這一點(diǎn),就不能只是一次辨識單一圖像,而是還要能綜合理解背后的情境,甚至是接續(xù)出現(xiàn)的新的信息。Saqib Shaikh 分析,這意味著后續(xù) Seeing AI 必須運(yùn)用更多非監(jiān)督學(xué)習(xí)的技術(shù)來訓(xùn)練 AI,進(jìn)一步拓展 AI 對多變場景復(fù)雜信息的處理能力。

其實(shí),Saqib Shaikh 早在求學(xué)期間意識到,為了讓身為盲人的自己表現(xiàn)更好,他必須做很多額外的努力來改變他所處的生活環(huán)境,包括不只是自己看書、而是要雇請其他人為他朗讀教科書的內(nèi)容等,才能讓自己與其他正常人站在更接近一點(diǎn)的比較基準(zhǔn)上。

當(dāng)時(shí)就有個(gè)朋友建議過他,與其只用嘴巴說要改變生活環(huán)境,不如實(shí)際做點(diǎn)什么真正的改變。這讓他早就思考過,從某種角度來講,殘疾者本人其實(shí)就是最好的創(chuàng)新者。因?yàn)?,他們比任何人都了解殘疾者最迫切的需求是什么?愿意做什么嘗試?可以如何改變?

然而,在 Saqib Shaikh 進(jìn)入微軟工作的近乎前 10 年,他并未在工作上試圖突出任何作為一個(gè)盲人的特殊能力。相反的,他讓自己就像一名正常的工程師一樣,絕大多數(shù)時(shí)間都投入內(nèi)部的主流專案,如 Cortana 等。

“我想,起初我是想證明自己可以成為一個(gè)主流的工程師”,Saqib Shaikh 說,而轉(zhuǎn)捩點(diǎn)是出現(xiàn)在他于微軟工作的第10年?!肮ぷ鳚M 10 年后,我覺得我已經(jīng)達(dá)到了目標(biāo),證明了自己的能力,所以我可以開始運(yùn)用自己的專業(yè)去幫助其他人?!?/p>

現(xiàn)在,他終于決定投入自己真正想做的事情,也就是用 AI 來改善殘疾人士的生活環(huán)境。就像他所說的,“我可以選擇用這一種與我自己最相關(guān)的方式,從個(gè)人經(jīng)驗(yàn)來理解許多盲人的問題,并且用自己的專業(yè)來提供協(xié)助?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29822

    瀏覽量

    268111
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46669

    瀏覽量

    237104
  • 無人機(jī)
    +關(guān)注

    關(guān)注

    226

    文章

    10302

    瀏覽量

    179153

原文標(biāo)題:用 AI 幫助視障者“聽懂”世界,專訪微軟傳奇盲人工程師 Saqib Shaikh

文章出處:【微信號:lianggezhizi,微信公眾號:兩個(gè)質(zhì)子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Arm推出GitHub平臺AI工具,簡化開發(fā)AI應(yīng)用開發(fā)部署流程

    軟件提供了無縫的開發(fā)體驗(yàn)。 GitHub Actions、原生 GitHub 運(yùn)行器和基于 Arm 平臺的 AI 框架相結(jié)合,幫助全球 2,000 萬開發(fā)簡化 AI 應(yīng)用開發(fā)
    的頭像 發(fā)表于 10-31 18:51 ?782次閱讀

    2024 TUYA全球開發(fā)大會(蘇州)啟幕,涂鴉攜手開發(fā)共繪AI與能源領(lǐng)域新藍(lán)圖

    2024 TUYA全球開發(fā)大會(蘇州)的圓滿舉辦,見證了涂鴉在AI與能源等領(lǐng)域的先進(jìn)技術(shù)實(shí)力和行業(yè)內(nèi)的強(qiáng)大影響力。未來,涂鴉還將持續(xù)攜手全球合作伙伴,共同探索AI等全新領(lǐng)域,推動技術(shù)創(chuàng)新,攜手共創(chuàng)一個(gè)更加綠色、可持續(xù)的智能
    的頭像 發(fā)表于 09-26 08:29 ?129次閱讀
    2024 TUYA全球開發(fā)<b class='flag-5'>者</b>大會(蘇州)啟幕,涂鴉攜手開發(fā)<b class='flag-5'>者</b>共繪<b class='flag-5'>AI</b>與能源領(lǐng)域新藍(lán)圖

    組團(tuán)“出?!绷料嗟习?,卓智通AI產(chǎn)品閃耀I(xiàn)TS World Congress 2024

    在智能交通世界大會的“Technologies and practice for Vehicle-Road-Cloud integration”主題論壇上,卓智通董事長兼CEO吳柯維受中國公路學(xué)會邀請登臺演講,全程英語向不同
    的頭像 發(fā)表于 09-24 09:47 ?185次閱讀
    組團(tuán)“出?!绷料嗟习?,卓<b class='flag-5'>視</b>智通<b class='flag-5'>AI</b>產(chǎn)品閃耀I(xiàn)TS World Congress 2024

    智行者——視聽障礙出行輔助AI小車設(shè)計(jì)

    摘要據(jù)統(tǒng)計(jì),我國人數(shù)達(dá)1731萬人,聽力殘疾患者2780萬人。視聽障礙對出行和交流需求迫切,但現(xiàn)有設(shè)施和輔具局限性大,使他們面臨出行難題。因此,我們開發(fā)了一款安全、精準(zhǔn)、語音與手部交互的導(dǎo)航避
    的頭像 發(fā)表于 07-19 08:11 ?494次閱讀
    智行者——視聽障礙<b class='flag-5'>者</b>出行輔助<b class='flag-5'>AI</b>小車設(shè)計(jì)

    強(qiáng)強(qiáng)聯(lián)合!深智能攜手Zebra公司成功舉辦“3D機(jī)器視覺+AI融合技術(shù)”研討會

    ?深智能&斑馬技術(shù)7月9號下午,VisionChina行業(yè)盛會期間,深智能與領(lǐng)先數(shù)字解決方案提供商Zebra公司強(qiáng)強(qiáng)聯(lián)合,成功舉辦一場以“AI時(shí)代下3D機(jī)器視覺與AI技術(shù)融合創(chuàng)新
    的頭像 發(fā)表于 07-16 10:40 ?374次閱讀
    強(qiáng)強(qiáng)聯(lián)合!深<b class='flag-5'>視</b>智能攜手Zebra公司成功舉辦“3D機(jī)器視覺+<b class='flag-5'>AI</b>融合技術(shù)”研討會

    AMEYA360:2024年世界人工智能大會-除了Ai更有“愛”

    在上海2024年7月4日揭幕的2024年世界人工智能大會上,全球科技界的精英們不僅展示了最前沿的人工智能技術(shù),更向世界宣告了 AI 的另一面 —— 它的溫暖與“愛”。這場在上海舉辦的科技盛會,以
    的頭像 發(fā)表于 07-08 16:37 ?305次閱讀

    2024 TUYA全球開發(fā)大會盛大啟幕,Cube AI大模型重磅首發(fā)!

    AI浪潮席卷全球的當(dāng)下,把握時(shí)代脈搏,全面擁抱生成式AI已成為共識。面對AI帶來的無限可能,開發(fā)們紛紛投身其中,積極探尋AI技術(shù)的新邊界
    的頭像 發(fā)表于 05-31 08:15 ?309次閱讀
    2024 TUYA全球開發(fā)<b class='flag-5'>者</b>大會盛大啟幕,Cube <b class='flag-5'>AI</b>大模型重磅首發(fā)!

    NVIDIA與微軟擴(kuò)展合作,幫助開發(fā)更快構(gòu)建和部署AI應(yīng)用

    NVIDIA 在 Microsoft Build 開發(fā)大會上展示了與 Microsoft Azure 和 Windows PC 的集成解決方案,簡化了 AI 模型部署并優(yōu)化了路徑規(guī)劃和應(yīng)用性能。
    的頭像 發(fā)表于 05-23 10:14 ?363次閱讀

    開發(fā)手機(jī) AI - 目標(biāo)識別 demo

    功能簡介 該應(yīng)用是在Openharmony 4.0系統(tǒng)上開發(fā)的一個(gè)目標(biāo)識別的AI應(yīng)用,旨在從上到下打通Openharmony AI子系統(tǒng),展示Openharmony系統(tǒng)的AI能力,并為開發(fā)
    發(fā)表于 04-11 16:14

    AI芯片未來會控制這個(gè)世界嗎?

    AI芯片行業(yè)資訊
    芯廣場
    發(fā)布于 :2024年03月27日 18:21:28

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬世界。用戶可以在這個(gè)世界中逐
    的頭像 發(fā)表于 03-04 14:02 ?688次閱讀

    高通AI Hub為開發(fā)開啟卓越終端側(cè)AI性能

    在今年的巴塞羅那世界移動通信大會(MWC)上,高通技術(shù)公司再次引領(lǐng)AI技術(shù)的創(chuàng)新潮流,發(fā)布了其全新的高通AI Hub。這一創(chuàng)新平臺為開發(fā)提供了一個(gè)全面的
    的頭像 發(fā)表于 02-27 11:15 ?763次閱讀

    英飛凌試用Archetype AIAI開發(fā)模型,以加強(qiáng)AI傳感器解決方案創(chuàng)新

    【 2023 年 11 月 13 日 ,德國慕尼黑 訊】 全球功率系統(tǒng)和物聯(lián)網(wǎng)領(lǐng)域的半導(dǎo)體領(lǐng)導(dǎo)英飛凌科技股份公司(FSE代碼:IFX / OTCQX代碼:IFNNY)與物理世界AI先行者
    發(fā)表于 12-05 16:07 ?486次閱讀

    人類認(rèn)知如何幫助我們制造更好的AI系統(tǒng)?

    我們重點(diǎn)關(guān)注“一致性”問題,即AI系統(tǒng)思考和表征世界的方式與人類相比,有多大的一致性?我們需要做的是進(jìn)行更多的研究,找出AI系統(tǒng)擅長的事情,并幫助人們了解在哪些情況下可以與這些
    的頭像 發(fā)表于 11-15 16:34 ?375次閱讀

    #芯片 #AI 世界最強(qiáng)AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月15日 15:54:37