0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI手語(yǔ)識(shí)別技術(shù)存在的挑戰(zhàn)

lPCU_elecfans ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2021-11-17 09:16 ? 次閱讀

據(jù)外媒報(bào)道,日本電氣大學(xué)與軟銀公司聯(lián)合,通過(guò)人工智能AI技術(shù),能將手語(yǔ)直接翻譯成日語(yǔ),這將使聾啞人士的溝通更順暢。

目前該系統(tǒng)只能用于柜臺(tái)設(shè)備上,聾啞人士能在攝像頭前通過(guò)手語(yǔ)溝通,然后系統(tǒng)用圖像識(shí)別技術(shù),分析手指和手臂等身體幾個(gè)部位的骨骼運(yùn)動(dòng),將手勢(shì)翻譯成日文,顯示在工作人員的電腦屏幕上,隨后口頭回復(fù)以文本的形式出現(xiàn)在聽(tīng)障人士面前的屏幕上,使交流更加順暢。

該系統(tǒng)的核心技術(shù)由ABEJA提供,谷歌2018年投資了它,ABEJA的核心產(chǎn)品是使用機(jī)器學(xué)習(xí)幫助公司從他們的數(shù)據(jù)堆中開(kāi)展商業(yè)分析。在這個(gè)項(xiàng)目中,ABEJA通過(guò)讓AI學(xué)習(xí)了5萬(wàn)個(gè)手語(yǔ)視頻,使其捕捉到手語(yǔ)特征和變化,目前該系統(tǒng)能準(zhǔn)確將手勢(shì)翻譯成大約1500個(gè)日語(yǔ)單詞。

早在2015年就有手語(yǔ)識(shí)別研究

人工智能技術(shù)的出現(xiàn)和逐漸成熟,不僅有利于產(chǎn)業(yè)升級(jí),事實(shí)上很早開(kāi)始,就有研究人員嘗試?yán)肁I技術(shù)幫助聾啞人士更加順暢的交流。

2015年9月沙特設(shè)計(jì)師就專門(mén)研發(fā)了一款無(wú)線智能手套,內(nèi)置傳感器,聾啞人戴上交流的時(shí)候,傳感器可以根據(jù)手指的運(yùn)動(dòng)追蹤手勢(shì),再通過(guò)語(yǔ)言軟件轉(zhuǎn)換成聲音和文字,在初期,這款無(wú)線智能手套只會(huì)講法語(yǔ)、英語(yǔ)和阿拉伯語(yǔ),該研究團(tuán)隊(duì)表示,后續(xù)會(huì)支持更多種語(yǔ)言。

在中國(guó)也很早就有相關(guān)的研究,2016年有媒體報(bào)道,東大自動(dòng)化專業(yè)李師寧等同學(xué)研發(fā)出了一種最新型的手語(yǔ)識(shí)別發(fā)聲系統(tǒng),這是一種結(jié)合人體生物及姿態(tài)信息的便攜手語(yǔ)發(fā)聲器,聾啞人可以通過(guò)手語(yǔ)使該機(jī)器發(fā)聲翻譯。

2018年?yáng)|北大學(xué)也研制出一款幫助聽(tīng)障人士溝通交流的智能系統(tǒng),由智能傳感手環(huán)、前端APP及云端服務(wù)組成,智能傳感手環(huán)可以將聽(tīng)障人士的手語(yǔ)動(dòng)作捕捉識(shí)別,并在云端轉(zhuǎn)換為文字及語(yǔ)音呈現(xiàn)在APP端,傳遞給非手語(yǔ)使用者,同時(shí)又可以將非手語(yǔ)使用者的語(yǔ)音在APP端轉(zhuǎn)換為文字加手語(yǔ)動(dòng)圖的“雙語(yǔ)形式”。

百度、騰訊等互聯(lián)網(wǎng)巨頭企業(yè)也進(jìn)行了相關(guān)研究,2019年百度在AI開(kāi)發(fā)者大會(huì)上提出“Everyone can AI”的理想,意思是讓每個(gè)人都能有平等接收AI的能力,百度以百度飛槳開(kāi)源內(nèi)容為基礎(chǔ)建立訓(xùn)練模型,通過(guò)采集手勢(shì)得到數(shù)據(jù),借助手機(jī)轉(zhuǎn)化成文字信息,聽(tīng)障人士可以使用翻譯器,在咖啡館、餐廳如同正常人一樣點(diǎn)餐、交流。

優(yōu)圖AI手語(yǔ)翻譯機(jī)界面

同是在2019年,騰訊優(yōu)圖實(shí)驗(yàn)室也推出了一款基于自研算法的優(yōu)圖AI手語(yǔ)翻譯機(jī),以普通攝像頭作為手語(yǔ)采集裝置,用戶正對(duì)攝像頭完成手語(yǔ)表達(dá),翻譯機(jī)就能通過(guò)后臺(tái)運(yùn)算將手語(yǔ)快速翻譯成文字。據(jù)介紹,優(yōu)圖AI手語(yǔ)翻譯機(jī)數(shù)據(jù)集覆蓋近千句日常表達(dá),包括900個(gè)常用詞匯,同時(shí)還對(duì)數(shù)據(jù)進(jìn)行了分析和歸納,是當(dāng)前最大的中文手語(yǔ)識(shí)別數(shù)據(jù)集。

手語(yǔ)識(shí)別技術(shù)存在很大挑戰(zhàn)

相比于其他AI視覺(jué)識(shí)別技術(shù),手語(yǔ)識(shí)別研發(fā)存在更大困難。在2018年?yáng)|北大學(xué)的研究中,就透露出手語(yǔ)識(shí)別研究存在的現(xiàn)實(shí)問(wèn)題,即每位聽(tīng)障人士的手語(yǔ)規(guī)劃不同,同一個(gè)詞打出的手勢(shì)有差異,因此智能識(shí)別可能就沒(méi)那么準(zhǔn)確。

不過(guò)好在2018年中央頒發(fā)了國(guó)家通用手語(yǔ)標(biāo)準(zhǔn)方案,這很大程度有利于后續(xù)手語(yǔ)轉(zhuǎn)文字或語(yǔ)音方面的研究。即使如此可能還是會(huì)存在細(xì)微差異,百度此前就表示,手語(yǔ)復(fù)雜、多樣、以及地域性差異給研究帶來(lái)不少困難。

百度還談到另外一大困難,即可用于訓(xùn)練模型的數(shù)據(jù)量小,在上述日本的項(xiàng)目中,一位參與開(kāi)發(fā)的軟銀工程師也表示,要建立一個(gè)將符號(hào)準(zhǔn)確翻譯成日文的模型,需要大量的手語(yǔ)數(shù)據(jù)。因此他們通過(guò)網(wǎng)站等方式,呼吁更多人發(fā)送手語(yǔ)圖像數(shù)據(jù)。

小結(jié)

AI技術(shù)在服務(wù)產(chǎn)業(yè)升級(jí)的同時(shí),也可以極大的幫助聾啞人群更好的實(shí)現(xiàn)溝通,這是這個(gè)時(shí)代的福音。據(jù)第二次全國(guó)殘疾人抽樣調(diào)查結(jié)果顯示,我國(guó)有2780萬(wàn)聽(tīng)障人士,如果能夠利用AI技術(shù)實(shí)現(xiàn)將手語(yǔ)實(shí)時(shí)翻譯成文字和語(yǔ)音,這將是一項(xiàng)極其有意義的事。

日本聾人聯(lián)合會(huì)認(rèn)為,要使人工智能成為聾啞人群的有效工具,還需要很長(zhǎng)的時(shí)間來(lái)實(shí)現(xiàn)。不過(guò)很明顯從2015年到現(xiàn)在,手語(yǔ)識(shí)別在逐漸取得進(jìn)步,也有相當(dāng)多的研究人員和企業(yè)投入其中,對(duì)于未來(lái)逐步突破困難取得更大進(jìn)步還是值得期待。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29824

    瀏覽量

    268117
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46671

    瀏覽量

    237123

原文標(biāo)題:騰訊、百度、軟銀都在研究,利用AI技術(shù)將手語(yǔ)轉(zhuǎn)文字有多重要?

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    的深入發(fā)展。 3. 挑戰(zhàn)與機(jī)遇并存 盡管AI在生命科學(xué)領(lǐng)域取得了顯著的成果,但也面臨著諸多挑戰(zhàn)。例如,數(shù)據(jù)隱私、算法偏見(jiàn)、倫理道德等問(wèn)題都需要我們認(rèn)真思考和解決。同時(shí),如何更好地將AI
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    的物理可信度,還為科學(xué)研究提供了新的視角和方法。 5. 挑戰(zhàn)與未來(lái)展望 第二章也提到了AI for Science面臨的挑戰(zhàn)和未來(lái)展望。盡管AI技術(shù)
    發(fā)表于 10-14 09:16

    人工智能的語(yǔ)音識(shí)別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語(yǔ)音識(shí)別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用
    的頭像 發(fā)表于 07-01 11:39 ?973次閱讀

    開(kāi)源項(xiàng)目!設(shè)計(jì)一款智能手語(yǔ)翻譯眼鏡

    手語(yǔ)翻譯的依賴。 這款眼鏡的設(shè)計(jì)既實(shí)用又低調(diào),方便日常佩戴,能夠無(wú)縫融入用戶的日常生活中,讓使用者能夠輕松地與不懂手語(yǔ)的人士溝通。它的亮點(diǎn)在于利用人工智能技術(shù)檢測(cè)手勢(shì)并進(jìn)行實(shí)時(shí)翻譯,不僅打破了交流障礙
    發(fā)表于 05-20 15:59

    **十萬(wàn)級(jí)口語(yǔ)識(shí)別,離線自然說(shuō)技術(shù),讓智能照明更懂你**

    ,使得語(yǔ)音芯片在風(fēng)噪和人聲疊加的情況下,仍能保持較高的識(shí)別率,可滿足用戶對(duì)風(fēng)扇燈語(yǔ)音識(shí)別性能的要求。 可應(yīng)用照明品類(lèi) 離線自然說(shuō): 離線自然說(shuō)是啟英泰倫研發(fā)的一種能在端側(cè)AI語(yǔ)音芯片上實(shí)現(xiàn)的輕量級(jí)
    發(fā)表于 04-29 17:09

    開(kāi)發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

    功能簡(jiǎn)介 該應(yīng)用是在Openharmony 4.0系統(tǒng)上開(kāi)發(fā)的一個(gè)目標(biāo)識(shí)別AI應(yīng)用,旨在從上到下打通Openharmony AI子系統(tǒng),展示Openharmony系統(tǒng)的AI能力,并為
    發(fā)表于 04-11 16:14

    情感語(yǔ)音識(shí)別挑戰(zhàn)與未來(lái)趨勢(shì)

    一、引言 情感語(yǔ)音識(shí)別是一種通過(guò)分析和理解人類(lèi)語(yǔ)音中的情感信息來(lái)實(shí)現(xiàn)智能交互的技術(shù)。盡管近年來(lái)取得了顯著的進(jìn)步,但情感語(yǔ)音識(shí)別仍然面臨著諸多挑戰(zhàn)。本文將探討情感語(yǔ)音
    的頭像 發(fā)表于 11-30 11:24 ?486次閱讀

    情感語(yǔ)音識(shí)別的應(yīng)用與挑戰(zhàn)

    一、引言 情感語(yǔ)音識(shí)別是一種通過(guò)分析人類(lèi)語(yǔ)音中的情感信息實(shí)現(xiàn)智能化和個(gè)性化人機(jī)交互的技術(shù)。本文將探討情感語(yǔ)音識(shí)別的應(yīng)用領(lǐng)域、優(yōu)勢(shì)以及所面臨的挑戰(zhàn)。 二、情感語(yǔ)音
    的頭像 發(fā)表于 11-30 10:40 ?602次閱讀

    情感語(yǔ)音識(shí)別技術(shù)發(fā)展與挑戰(zhàn)

    一、引言 情感語(yǔ)音識(shí)別是人工智能領(lǐng)域的重要研究方向,它通過(guò)分析人類(lèi)語(yǔ)音中的情感信息,實(shí)現(xiàn)人機(jī)之間的情感交互。本文將探討情感語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程和面臨的挑戰(zhàn)。 二、情感語(yǔ)音
    的頭像 發(fā)表于 11-28 18:26 ?602次閱讀

    AI視覺(jué)識(shí)別有哪些工業(yè)應(yīng)用

    AI視覺(jué)識(shí)別涵蓋多種應(yīng)用,如人臉識(shí)別、目標(biāo)檢測(cè)和識(shí)別、圖像分割、行為識(shí)別、視頻分析等。本篇就簡(jiǎn)單介紹一下
    的頭像 發(fā)表于 11-27 18:05 ?1144次閱讀
    <b class='flag-5'>AI</b>視覺(jué)<b class='flag-5'>識(shí)別</b>有哪些工業(yè)應(yīng)用

    情感語(yǔ)音識(shí)別挑戰(zhàn)與未來(lái)發(fā)展方向

    一、引言 情感語(yǔ)音識(shí)別是人工智能領(lǐng)域中的一項(xiàng)重要技術(shù),它通過(guò)分析人類(lèi)語(yǔ)音中的情感信息,實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)交互。然而,在實(shí)際應(yīng)用中,情感語(yǔ)音識(shí)別技術(shù)面臨著許多
    的頭像 發(fā)表于 11-23 14:37 ?437次閱讀

    情感語(yǔ)音識(shí)別:現(xiàn)狀、挑戰(zhàn)與解決方案

    一、引言 情感語(yǔ)音識(shí)別是人工智能領(lǐng)域的前沿研究課題,它通過(guò)分析人類(lèi)語(yǔ)音中的情感信息,實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)交互。然而,在實(shí)際應(yīng)用中,情感語(yǔ)音識(shí)別技術(shù)面臨著許多挑戰(zhàn)。本文將探討情感
    的頭像 發(fā)表于 11-23 11:30 ?774次閱讀

    情感語(yǔ)音識(shí)別:現(xiàn)狀、挑戰(zhàn)與未來(lái)趨勢(shì)

    一、引言 情感語(yǔ)音識(shí)別是近年來(lái)人工智能領(lǐng)域的研究熱點(diǎn),它通過(guò)分析人類(lèi)語(yǔ)音中的情感信息,實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)交互。然而,在實(shí)際應(yīng)用中,情感語(yǔ)音識(shí)別技術(shù)仍面臨著許多挑戰(zhàn)。本文將探討
    的頭像 發(fā)表于 11-22 11:31 ?764次閱讀

    情感語(yǔ)音識(shí)別技術(shù)挑戰(zhàn)與未來(lái)發(fā)展

    情感語(yǔ)音識(shí)別技術(shù)作為人工智能領(lǐng)域的重要分支,已經(jīng)取得了顯著的進(jìn)展。然而,在實(shí)際應(yīng)用中,情感語(yǔ)音識(shí)別技術(shù)仍面臨許多挑戰(zhàn)。本文將探討情感語(yǔ)音
    的頭像 發(fā)表于 11-16 16:48 ?428次閱讀

    情感語(yǔ)音識(shí)別技術(shù)挑戰(zhàn)與解決方案

    一、引言 情感語(yǔ)音識(shí)別技術(shù)是一種通過(guò)分析人類(lèi)語(yǔ)音中的情感信息來(lái)理解和識(shí)別人的情感狀態(tài)的技術(shù)。然而,在實(shí)際應(yīng)用中,情感語(yǔ)音識(shí)別
    的頭像 發(fā)表于 11-12 17:31 ?469次閱讀