0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊、百度、軟銀都在研究,利用AI技術(shù)將手語轉(zhuǎn)文字有多重要?

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2021-11-15 09:54 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)據(jù)外媒報道,日本電氣大學(xué)與軟銀公司聯(lián)合,通過人工智能AI技術(shù),能將手語直接翻譯成日語,這將使聾啞人士的溝通更順暢。

目前該系統(tǒng)只能用于柜臺設(shè)備上,聾啞人士能在攝像頭前通過手語溝通,然后系統(tǒng)用圖像識別技術(shù),分析手指和手臂等身體幾個部位的骨骼運動,將手勢翻譯成日文,顯示在工作人員的電腦屏幕上,隨后口頭回復(fù)以文本的形式出現(xiàn)在聽障人士面前的屏幕上,使交流更加順暢。

該系統(tǒng)的核心技術(shù)由ABEJA提供,谷歌2018年投資了它,ABEJA的核心產(chǎn)品是使用機器學(xué)習幫助公司從他們的數(shù)據(jù)堆中開展商業(yè)分析。在這個項目中,ABEJA通過讓AI學(xué)習了5萬個手語視頻,使其捕捉到手語特征和變化,目前該系統(tǒng)能準確將手勢翻譯成大約1500個日語單詞。

早在2015年就有手語識別研究

人工智能技術(shù)的出現(xiàn)和逐漸成熟,不僅有利于產(chǎn)業(yè)升級,事實上很早開始,就有研究人員嘗試利用AI技術(shù)幫助聾啞人士更加順暢的交流。

2015年9月沙特設(shè)計師就專門研發(fā)了一款無線智能手套,內(nèi)置傳感器,聾啞人戴上交流的時候,傳感器可以根據(jù)手指的運動追蹤手勢,再通過語言軟件轉(zhuǎn)換成聲音和文字,在初期,這款無線智能手套只會講法語、英語和阿拉伯語,該研究團隊表示,后續(xù)會支持更多種語言。

在中國也很早就有相關(guān)的研究,2016年有媒體報道,東大自動化專業(yè)李師寧等同學(xué)研發(fā)出了一種最新型的手語識別發(fā)聲系統(tǒng),這是一種結(jié)合人體生物及姿態(tài)信息的便攜手語發(fā)聲器,聾啞人可以通過手語使該機器發(fā)聲翻譯。

2018年東北大學(xué)也研制出一款幫助聽障人士溝通交流的智能系統(tǒng),由智能傳感手環(huán)、前端APP及云端服務(wù)組成,智能傳感手環(huán)可以將聽障人士的手語動作捕捉識別,并在云端轉(zhuǎn)換為文字及語音呈現(xiàn)在APP端,傳遞給非手語使用者,同時又可以將非手語使用者的語音在APP端轉(zhuǎn)換為文字加手語動圖的“雙語形式”。

百度、騰訊等互聯(lián)網(wǎng)巨頭企業(yè)也進行了相關(guān)研究,2019年百度在AI開發(fā)者大會上提出“Everyone can AI”的理想,意思是讓每個人都能有平等接收AI的能力,百度以百度飛槳開源內(nèi)容為基礎(chǔ)建立訓(xùn)練模型,通過采集手勢得到數(shù)據(jù),借助手機轉(zhuǎn)化成文字信息,聽障人士可以使用翻譯器,在咖啡館、餐廳如同正常人一樣點餐、交流。

優(yōu)圖AI手語翻譯機界面

同是在2019年,騰訊優(yōu)圖實驗室也推出了一款基于自研算法的優(yōu)圖AI手語翻譯機,以普通攝像頭作為手語采集裝置,用戶正對攝像頭完成手語表達,翻譯機就能通過后臺運算將手語快速翻譯成文字。據(jù)介紹,優(yōu)圖AI手語翻譯機數(shù)據(jù)集覆蓋近千句日常表達,包括900個常用詞匯,同時還對數(shù)據(jù)進行了分析和歸納,是當前最大的中文手語識別數(shù)據(jù)集。

手語識別技術(shù)存在很大挑戰(zhàn)

相比于其他AI視覺識別技術(shù),手語識別研發(fā)存在更大困難。在2018年東北大學(xué)的研究中,就透露出手語識別研究存在的現(xiàn)實問題,即每位聽障人士的手語規(guī)劃不同,同一個詞打出的手勢有差異,因此智能識別可能就沒那么準確。

不過好在2018年中央頒發(fā)了國家通用手語標準方案,這很大程度有利于后續(xù)手語轉(zhuǎn)文字或語音方面的研究。即使如此可能還是會存在細微差異,百度此前就表示,手語復(fù)雜、多樣、以及地域性差異給研究帶來不少困難。

百度還談到另外一大困難,即可用于訓(xùn)練模型的數(shù)據(jù)量小,在上述日本的項目中,一位參與開發(fā)的軟銀工程師也表示,要建立一個將符號準確翻譯成日文的模型,需要大量的手語數(shù)據(jù)。因此他們通過網(wǎng)站等方式,呼吁更多人發(fā)送手語圖像數(shù)據(jù)。

小結(jié)

AI技術(shù)在服務(wù)產(chǎn)業(yè)升級的同時,也可以極大的幫助聾啞人群更好的實現(xiàn)溝通,這是這個時代的福音。據(jù)第二次全國殘疾人抽樣調(diào)查結(jié)果顯示,我國有2780萬聽障人士,如果能夠利用AI技術(shù)實現(xiàn)將手語實時翻譯成文字和語音,這將是一項極其有意義的事。

日本聾人聯(lián)合會認為,要使人工智能成為聾啞人群的有效工具,還需要很長的時間來實現(xiàn)。不過很明顯從2015年到現(xiàn)在,手語識別在逐漸取得進步,也有相當多的研究人員和企業(yè)投入其中,對于未來逐步突破困難取得更大進步還是值得期待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266240
收藏 人收藏

    評論

    相關(guān)推薦

    百度發(fā)布文心大模型4.0 Turbo與飛槳框架3.0,引領(lǐng)AI技術(shù)新篇章

    在科技飛速發(fā)展的今天,人工智能(AI技術(shù)已成為推動社會進步的重要力量。6月28日,百度公司再次站在了AI
    的頭像 發(fā)表于 06-29 16:03 ?502次閱讀

    百度申請文小言商標

    近日,百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司在知識產(chǎn)權(quán)領(lǐng)域了新動作。據(jù)天眼查知識產(chǎn)權(quán)信息顯示,百度已申請多枚“文小言”商標,這些商標涵蓋廣告銷
    的頭像 發(fā)表于 06-19 09:20 ?370次閱讀

    2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成

    2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成 今天2024百度移動生態(tài)萬象大會在江蘇蘇州舉辦,特別是AI搜索與
    發(fā)表于 05-30 18:58 ?337次閱讀

    集團“AI革命”開始啟動

    日本集團會長孫正義已啟動“AI革命”,計劃利用AI半導(dǎo)體技術(shù)引領(lǐng)行業(yè)變革。該集團
    的頭像 發(fā)表于 05-14 10:59 ?369次閱讀

    日產(chǎn)汽車搭載百度AI解決方案

    日產(chǎn)汽車與百度達成戰(zhàn)略合作,雙方正式簽署諒解備忘錄,共同探索智能技術(shù)在汽車領(lǐng)域的應(yīng)用。根據(jù)協(xié)議,日產(chǎn)將在中國市場的車型上搭載百度AI解決方案,進一步提升車輛智能化水平。
    的頭像 發(fā)表于 05-06 14:14 ?354次閱讀

    百度智能云攜手烏鎮(zhèn)共建AI數(shù)據(jù)產(chǎn)業(yè)基地

    近日,百度智能云與桐鄉(xiāng)市烏鎮(zhèn)大數(shù)據(jù)高新技術(shù)產(chǎn)業(yè)園區(qū)簽署合作協(xié)議,雙方發(fā)揮各自優(yōu)勢,以人工智能標注產(chǎn)業(yè)為基礎(chǔ),共建百度智能云(烏鎮(zhèn))AI數(shù)據(jù)
    的頭像 發(fā)表于 04-01 16:12 ?484次閱讀

    蘋果iPhone采用百度AI技術(shù)

    近期,科創(chuàng)板日報亦轉(zhuǎn)載此類消息,聲稱收到可靠線報,今年秋季即將推出的iPhone16、Mac系統(tǒng)乃至iOS 18版本都將搭載百度提供的AI插件。
    的頭像 發(fā)表于 03-25 13:47 ?317次閱讀

    百度搜索推出AI拜年新能力

    隨著人工智能技術(shù)的迅猛發(fā)展,百度搜索始終站在技術(shù)前沿,致力于為用戶提供更加智能化、便捷的服務(wù)。百度搜索重磅推出了AI拜年新能力,在春節(jié)期間,
    的頭像 發(fā)表于 02-05 10:54 ?5944次閱讀

    三星Galaxy AI集成百度文心大模型

    近日,中國三星與百度智能云宣布正式結(jié)成AI生態(tài)戰(zhàn)略合作伙伴,共同推動AI技術(shù)在智能手機等設(shè)備上的應(yīng)用。作為這一合作的一部分,三星Galaxy AI
    的頭像 發(fā)表于 01-29 17:03 ?1037次閱讀

    三星電子與百度智能云達成合作

    近日,三星電子與百度智能云宣布了一項重要的合作,百度的文心大模型集成至三星全新的AI手機Galaxy S24系列中。
    的頭像 發(fā)表于 01-26 17:14 ?1042次閱讀

    APUS入駐百度靈境矩陣,普惠AI大模型插件能力

    10月17日,APUS出席百度世界大會2023。會上,百度公布了靈境矩陣業(yè)務(wù)進展,APUS作為靈境矩陣首批合作伙伴正與百度攜手拓展大模型能力邊界、構(gòu)建大模型應(yīng)用生態(tài)。 百度認為,大模型
    的頭像 發(fā)表于 10-23 10:46 ?647次閱讀
    APUS入駐<b class='flag-5'>百度</b>靈境矩陣,普惠<b class='flag-5'>AI</b>大模型插件能力

    百度世界2023看點 文心大模型4.0正式發(fā)布 百度文庫變身生產(chǎn)力工具

    2023上,基于大模型重構(gòu)的百度文庫升級發(fā)布,李彥宏表示百度文庫變身生產(chǎn)力工具,在理解資料、撰寫文章、PPT智能生成的方面都在升級。 另外還有一個特別
    的頭像 發(fā)表于 10-17 18:49 ?1021次閱讀
    <b class='flag-5'>百度</b>世界2023看點 文心大模型4.0正式發(fā)布 <b class='flag-5'>百度</b>文庫變身生產(chǎn)力工具

    百度發(fā)布全新AI互動式搜索 簡單搜索AI升級

    搜索APP。百度旗下簡單搜索17日大升級,簡單搜索,首個AI互動式搜索引擎,能聽會看,聰明懂你。全新的百度搜索為用戶帶來全新的搜索體驗。回答更靈活、結(jié)論更清晰、更懂邏輯。 在簡單搜索不管用戶輸入的問題
    的頭像 發(fā)表于 10-17 12:34 ?1192次閱讀

    Whisper語音轉(zhuǎn)文字教程

    地生成字幕,從而縮短制作時間,節(jié)省人工成本,并提高制作效率。 2.法律文書:在法律領(lǐng)域,語音轉(zhuǎn)文字可以幫助律師和律所聽證會、辯論和其他法律活動的錄音轉(zhuǎn)化為文字文檔。這些文檔可以用于研究
    的頭像 發(fā)表于 10-16 11:26 ?808次閱讀
    Whisper語音<b class='flag-5'>轉(zhuǎn)文字</b>教程

    大模型如何全面重構(gòu)搜索、辦公和營銷?2023百度世界李彥宏解密

    百度世界2023將于10月17日在北京首鋼園舉辦,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏進行長達一小時的主題演講,「手把手教你做AI原生應(yīng)用」,并發(fā)布大模型重構(gòu)后的
    的頭像 發(fā)表于 10-11 18:44 ?685次閱讀
    大模型如何全面重構(gòu)搜索、辦公和營銷?2023<b class='flag-5'>百度</b>世界李彥宏<b class='flag-5'>將</b>解密