0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Eros Now利用Google Cloud實(shí)現(xiàn)AI驅(qū)動(dòng)的字幕功能

倩倩 ? 來源:慧譯講視頻,風(fēng)尚網(wǎng),互 ? 作者:慧譯講視頻,風(fēng)尚 ? 2021-03-15 13:44 ? 次閱讀

Google 用三個(gè)項(xiàng)目:Live Transcribe、Live Caption、Live Relay,來幫助聽障人群融入正常社會(huì),實(shí)現(xiàn)無障礙溝通。

1 Live Transcribe(實(shí)時(shí)轉(zhuǎn)錄):打開應(yīng)用軟件后,手機(jī)設(shè)備可以實(shí)時(shí)監(jiān)聽周圍環(huán)境中的語音,并實(shí)時(shí)顯示出對(duì)應(yīng)的文字。

2 Live Caption(實(shí)時(shí)字幕):使用自動(dòng)語音識(shí)別,為視頻添加字幕。適用于播放音頻的任何媒體,包括視頻,音頻等消息,尤其是無字幕的直播,甚至和家人視頻聊天,都可以實(shí)時(shí)添加字幕。

3 Live Relay(實(shí)時(shí)語音)基于Live Transcribe的實(shí)時(shí)的文字轉(zhuǎn)語音的產(chǎn)品,以便聾啞人在打電話需求場景下,能打字轉(zhuǎn)換成語音播放達(dá)到溝通目的。

Eros Now周二表示,它已與Google Cloud合作,使用后者的AI技術(shù),以自動(dòng)字幕的形式流式傳輸其全部電影和原著。

AI驅(qū)動(dòng)的字幕功能將首先以阿拉伯語提供。該公司表示,語言支持將迎合喜歡印度電影和其他消費(fèi)印度娛樂內(nèi)容市場的“大量阿拉伯觀眾”。

Eros Now還詳細(xì)說明了其如何在其流媒體平臺(tái)上使用尖端技術(shù)。

“通過使用AI框架和大量預(yù)先存在的數(shù)據(jù),Eros Now的內(nèi)部數(shù)據(jù)科學(xué)團(tuán)隊(duì)模擬,培訓(xùn)和開發(fā)了一種先進(jìn)的模型,該模型的性能相當(dāng)于人類,并且能夠生成所需的字幕電影和原著中使用的語言”,該公司在一份新聞稿中說。

該公司表示,該部署將有助于推動(dòng)更高的消費(fèi)者參與度,并為“文本到語音”自動(dòng)化打開新的機(jī)會(huì)窗口。該公司指出,該模型可用于不同類型和語言。

“應(yīng)對(duì)性別非中立語言以及各種使用不同語言的標(biāo)點(diǎn)符號(hào)只是最大的挑戰(zhàn)中的幾個(gè)。自動(dòng)化過程花了六個(gè)月的時(shí)間才能使數(shù)據(jù)科學(xué)家完善?!痹摴狙a(bǔ)充說。

Eros Now由Eros STX Global Corporation擁有。OTT平臺(tái)擁有使用印地語和當(dāng)?shù)卣Z言發(fā)行的12,000多部電影的權(quán)利。截至2020年9月,該平臺(tái)擁有超過2.11億注冊(cè)用戶和3,620萬付費(fèi)用戶。

過去,愛神(Eros)也嘗試了其他新時(shí)代的技術(shù)。去年,它與美國視頻游戲和軟件公司Epic Games合作,將“虛幻引擎”技術(shù)引入了印度電影。以Fortnite之類的游戲而聞名的Epic Games表示,它將提供實(shí)時(shí)渲染,更好的VFX和虛擬制作等技術(shù)。

在2019年,Eros Now與Microsoft合作,利用Azure云平臺(tái)托管和流傳輸其數(shù)字視頻產(chǎn)品。

利用Google Assistant 中由AI驅(qū)動(dòng)的新功能非常方便

在Google助手首次為家庭采用解釋器模式大約一年后,該功能終于在移動(dòng)設(shè)備上發(fā)布。這是根據(jù)最近的報(bào)道援引Google自己的話說的,該模式即將到來。

為清楚起見,解釋器模式是一種實(shí)時(shí)翻譯器,可以進(jìn)行對(duì)話。因此,使用后,用戶將能夠閱讀和聽到某人對(duì)他們說的另一種語言的翻譯。他們還可以進(jìn)行交談或點(diǎn)擊智能回復(fù)并鍵入回復(fù)。

Google助理會(huì)以相應(yīng)的語言大聲朗讀所有內(nèi)容。用戶不必為外國的發(fā)音和語法上的細(xì)微差別而苦惱。目前,一長串可用的語言總共有44種。明顯的內(nèi)容包括德語,法語和類似的通用語言。但是Google也包含了一些在世界許多地方都不太常用的東西。

例如,用于移動(dòng)設(shè)備的新解釋器模式可以幫助用戶說泰語或其他常用但使用較少的語言。

利用Google Assistant 中由AI驅(qū)動(dòng)的新功能非常方便。實(shí)際上,通常只需在“ Okay”或“ Hey Google”之后加上幾個(gè)字即可使事情向前發(fā)展。關(guān)鍵短語也很簡單。因此,整個(gè)過程和小程序的使用應(yīng)非常直觀,而不是要求口頭體操來完成。

例如,用戶可以說“嘿Google,幫我說西班牙語”。正如所暗示的那樣,該短語將在西班牙語的解釋器模式下啟動(dòng)?!昂冒?,谷歌,當(dāng)我的泰語翻譯者”同樣可以很好地工作。

從那里開始,Google的解釋器模式將按預(yù)期工作。口語單詞會(huì)在屏幕上翻譯并大聲說出來。智能答復(fù)似乎可以從中選擇,當(dāng)然,還會(huì)顯示一個(gè)鍵盤圖標(biāo)來鍵入響應(yīng)。語音響應(yīng)也會(huì)被捕獲,并以其他語言大聲朗讀。

Google似乎并未提供太多有關(guān)哪些移動(dòng)設(shè)備將能夠使用由Assistant AI支持的新解釋器模式的確切信息。但是,它確實(shí)說它正在同時(shí)出現(xiàn)在iOSAndroid上。該模式將通過更新到達(dá)??梢詮腁pp Store或Google Play商店中找到專門用于Google Assistant應(yīng)用程序的內(nèi)容。

這意味著,盡管它現(xiàn)在正在推出,但要花一些時(shí)間才能敲打那里的所有設(shè)備。部署通常需要幾個(gè)星期才能完成。

(慧譯講視頻,風(fēng)尚網(wǎng),互聯(lián)網(wǎng)分析沙龍網(wǎng)綜合整理 )

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1755

    瀏覽量

    57386
  • 流媒體
    +關(guān)注

    關(guān)注

    1

    文章

    192

    瀏覽量

    16645
  • 解釋器
    +關(guān)注

    關(guān)注

    0

    文章

    103

    瀏覽量

    6489
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    聯(lián)想與Meta合作推出AI Now個(gè)人AI智能體

    聯(lián)想集團(tuán)近日在美國西雅圖舉辦了年度Tech World大會(huì),會(huì)上聯(lián)想CEO楊元慶與Meta創(chuàng)始人兼CEO馬克?扎克伯格共同宣布了一項(xiàng)重要合作。雙方基于Meta的Llama大模型,推出了面向PC的個(gè)人AI智能體——AI Now。
    的頭像 發(fā)表于 10-17 16:58 ?479次閱讀

    Google Cloud AI助力衛(wèi)安智能推出機(jī)器人解決方案

    Google Cloud 基于神經(jīng)網(wǎng)絡(luò)的語音識(shí)別技術(shù)讓衛(wèi)安智能得以滿足小語種地區(qū)用戶對(duì)機(jī)器人交互的需求,為其節(jié)省約60%與第三方溝通協(xié)作的人力成本,并運(yùn)用高性能的計(jì)算資源將產(chǎn)品的開發(fā)周期縮短了一半。
    的頭像 發(fā)表于 10-16 11:11 ?433次閱讀

    Commvault Cloud平臺(tái)提供Cloud Rewind功能

    混合云企業(yè)網(wǎng)絡(luò)彈性和數(shù)據(jù)保護(hù)解決方案領(lǐng)先提供商Commvault(納斯達(dá)克代碼:CVLT)宣布在Commvault Cloud平臺(tái)上提供Cloud Rewind功能。這項(xiàng)獨(dú)特的產(chǎn)品集成了通過收購
    的頭像 發(fā)表于 10-15 09:21 ?308次閱讀

    NetApp與Google Cloud深化合作,強(qiáng)化分布式云存儲(chǔ)

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)導(dǎo)者NetApp?宣布,其與Google Cloud的戰(zhàn)略合作再升級(jí)。此次合作中,NetApp將統(tǒng)一數(shù)據(jù)存儲(chǔ)和智能服務(wù)融入Google Distributed Cloud
    的頭像 發(fā)表于 10-11 17:21 ?423次閱讀

    谷歌Vertex AI助力企業(yè)生成式AI應(yīng)用

    過去的一段時(shí)間,我們看到了許多 Google Cloud 客戶對(duì)生成式 AI 和 agent 的精彩應(yīng)用,令我們拍案叫絕。為了讓企業(yè)能夠更快推出功能強(qiáng)大的
    的頭像 發(fā)表于 09-09 15:59 ?439次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    Google Cloud 一如既往地踐行打造開放、靈活的 AI 生態(tài)系統(tǒng)的承諾,幫助您構(gòu)建最能滿足您需求的解決方案。
    的頭像 發(fā)表于 08-02 15:42 ?345次閱讀

    谷歌將優(yōu)化安卓系統(tǒng)的實(shí)時(shí)字幕功能,用戶可更改字幕行數(shù)

    Live Captions作為安卓系統(tǒng)的輔助工具,能自動(dòng)識(shí)別并實(shí)時(shí)將音頻轉(zhuǎn)化為字幕。此功能對(duì)聽力受損或環(huán)境嘈雜時(shí)難以理解內(nèi)容的人群十分有用。
    的頭像 發(fā)表于 05-30 14:28 ?573次閱讀

    微軟網(wǎng)頁版PPT新增語音識(shí)別及字幕生成功能

    據(jù)報(bào)道,微軟計(jì)劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識(shí)別功能。此項(xiàng)功能將能夠監(jiān)控PowerPoint視頻中的聲音,進(jìn)而自動(dòng)生成字幕
    的頭像 發(fā)表于 05-16 14:36 ?358次閱讀

    Flutter首次亮相Google Cloud Next大會(huì)

    Flutter 團(tuán)隊(duì)在近期首次參加了 Google Cloud Next 大會(huì),這意味著 Flutter 在開發(fā)社區(qū)中的影響力正在日益增長。
    的頭像 發(fā)表于 05-09 10:15 ?441次閱讀

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺(tái)已成為云服務(wù)提供商優(yōu)化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google Axion 處理器,面向通用計(jì)算和人工智能
    的頭像 發(fā)表于 04-16 14:30 ?587次閱讀

    Cognizant與Google Cloud深化合作,提升軟件交付效率

    近日,知名IT服務(wù)提供商Cognizant與Google Cloud宣布將進(jìn)一步擴(kuò)大合作伙伴關(guān)系,共同致力于增強(qiáng)軟件交付生命周期,并顯著提升開發(fā)人員的工作效率。
    的頭像 發(fā)表于 03-26 10:01 ?317次閱讀

    Imagen 2 現(xiàn)已在 Vertex AI 上全面推出

    Google Cloud 圖像生成功能帶來的重大升級(jí)——這是我們最先進(jìn)的文生圖技術(shù),現(xiàn)在已向許可名單 (即獲準(zhǔn)訪問) 上的 Vertex AI 客戶全面開放。 Vertex
    的頭像 發(fā)表于 12-22 10:10 ?369次閱讀
    Imagen 2 現(xiàn)已在 Vertex <b class='flag-5'>AI</b> 上全面推出

    Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作負(fù)載

    以下文章來源于谷歌云服務(wù),作者 Google Cloud Amin Vahdat ML、系統(tǒng)與 Cloud AI 副總裁/總經(jīng)理 Mark Lohmeyer 計(jì)算與 ML 基礎(chǔ)設(shè)施副總
    的頭像 發(fā)表于 12-13 16:05 ?533次閱讀
    <b class='flag-5'>Google</b> <b class='flag-5'>Cloud</b> 推出 TPU v5p 和 <b class='flag-5'>AI</b> Hypercomputer: 支持下一代 <b class='flag-5'>AI</b> 工作負(fù)載

    Google Cloud 線上課堂 | Google Cloud 遷移最佳實(shí)踐

    以下文章來源于谷歌云服務(wù),作者 Google Cloud 立即預(yù)約 長按識(shí)別/掃描 右方二維碼 預(yù)約觀看直播 各行各業(yè)的組織都積極將業(yè)務(wù)遷移到云端,但同時(shí)發(fā)現(xiàn),無論單個(gè)本地應(yīng)用,還是跨多個(gè)
    的頭像 發(fā)表于 11-28 17:45 ?461次閱讀

    通過我們的 10 步計(jì)劃啟動(dòng)您的生成式 AI 之旅

    以下文章來源于谷歌云服務(wù),作者 Google Cloud 生成式 AI 是史上最重大的技術(shù)變革之一 這項(xiàng)技術(shù)可能會(huì)對(duì)個(gè)人和企業(yè)的效率產(chǎn)生重大影響,影響之大堪比互聯(lián)網(wǎng)或移動(dòng)設(shè)備的問世。事實(shí)上,在考慮
    的頭像 發(fā)表于 11-15 17:50 ?460次閱讀
    通過我們的 10 步計(jì)劃啟動(dòng)您的生成式 <b class='flag-5'>AI</b> 之旅