0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌I/O在音視頻領(lǐng)域中有哪些技術(shù)值得被關(guān)注?

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2021-05-26 10:58 ? 次閱讀

時(shí)隔兩年Google I/O大會再次與大家見面。雖然去年的大會因新冠疫情被迫取消,但技術(shù)的迭代發(fā)展卻未被打斷,反而因疫情的影響促使了技術(shù)的創(chuàng)新變得愈加以人們的需求為首要考量,從而變得更具人性化也更具智能化。

“在重要的時(shí)刻提供幫助”——是此次谷歌 I/O 2021大會的主題。從充滿人情味的主題開場,并圍繞AI視頻聊天、地圖、醫(yī)療診斷、數(shù)據(jù)安全等方面發(fā)布了一系列最新的技術(shù)進(jìn)展。而在音視頻領(lǐng)域中最值得關(guān)注的是:全息視頻聊天技術(shù)——Project Starline,谷歌AI芯片最新版本——TPU v4,以及基于AI模型的皮膚病問診應(yīng)用程序。

Project Starline 3D視頻聊天新體驗(yàn)

Project Starline 3D視頻聊天互動 演示

該項(xiàng)技術(shù)可以說是本次大會的絕對黑科技了,使一些無法進(jìn)行線下見面的人們(如:疫情影響)能夠在同一空間中進(jìn)行實(shí)時(shí)的3D互動聊天。據(jù)悉,Project Starline利用全息影像技術(shù)打破人們身處不同空間的隔閡,并與傳統(tǒng)的視頻聊天的區(qū)別在于,讓你想見到的人就“坐”在你對面,感覺像是真的在你身邊一樣。

而為了實(shí)現(xiàn)這一技術(shù),在硬件部分谷歌采用了65英寸的光場顯示器,并配備了定制高分辨率傳感器和數(shù)十個(gè)景深掃描傳感器,從多個(gè)角度捕捉用戶的外貌和動作,然后進(jìn)行融合,并在聯(lián)合驅(qū)動下生成流暢細(xì)致的實(shí)時(shí)3D模型。由于其所產(chǎn)生的數(shù)據(jù)每秒高達(dá)數(shù)千兆字節(jié),因此,對于在現(xiàn)有網(wǎng)絡(luò)上發(fā)送如此之大的圖像,谷歌研發(fā)了新的壓縮和流算法,可將數(shù)據(jù)減少100倍以上。

而在軟件部分則是通過在計(jì)算機(jī)視覺機(jī)器學(xué)習(xí)、空間音頻和數(shù)據(jù)壓縮技術(shù)等方面數(shù)年之久的開發(fā),通過硬件與軟件的整合才得以實(shí)現(xiàn)今天的Project Starline。除此之外,突破性的光場系統(tǒng)也是支持這一技術(shù)的亮點(diǎn),讓人們可以免去佩戴眼鏡、耳機(jī)就能體驗(yàn)到逼真的體積和深度感。

目前Project Starline僅在谷歌的幾個(gè)辦公室中被應(yīng)用,由于它依賴于定制的硬件和高度專業(yè)化的設(shè)備,還未在市場中進(jìn)行推廣。

新定制AI芯片TPU v4:性能提升10倍

在谷歌 I/O大會中還推出了谷歌最新定制的AI芯片——TPU v4。這類定制芯片對其所要處理的AI任務(wù)有著數(shù)量級的性能優(yōu)勢,如圖像識別、語音助手、視頻、視覺計(jì)算處理等。而TPU v4的動力來源于v4芯片,其速度是v3(上一個(gè)TPU版本)的兩倍以上。TPU v4:一個(gè)Pods里面有4069個(gè)v4芯片,可以提供每秒 10^18 次浮點(diǎn)運(yùn)算;并提供一個(gè)exaflop以上的容量,相當(dāng)于一千萬臺筆記本電腦的計(jì)算能力之和,性能比上一代提升了10倍。Sundar Pichai表示:“這是我們部署過的最快的系統(tǒng),對我們來說是一個(gè)歷史性的里程碑”。而全球超算TOP 500排行榜第一名的日本富岳的最高性能也只有它的一半。

TPU v4芯片托盤

谷歌TPU之所以能夠做到效率提高是在于:它可將看似相互獨(dú)立的數(shù)百塊芯片轉(zhuǎn)為密切互聯(lián)的單個(gè)系統(tǒng)來使用。Sundar Pichai談到:“每塊芯片的互連帶寬是其他網(wǎng)絡(luò)技術(shù)的10倍”。并透露會在年底對開發(fā)者開放使用。

另外,TPU v4在提高效率的同時(shí),其數(shù)據(jù)中心也將以90%(或接近)的無碳能源運(yùn)行。

AI“問診”:針對皮膚病的診斷新功能

本次谷歌 I/O大會的另一個(gè)亮點(diǎn)便是AI“問診”。這是一個(gè)由AI驅(qū)動的皮膚病學(xué)輔助工具的預(yù)覽,能夠幫助人們了解自身皮膚、頭發(fā)和指甲等有關(guān)的問題。并使用很多與CT掃描相同的技術(shù)來檢測一些眼部疾病或肺癌。可通過手機(jī)的攝像頭來識別皮膚病,如手臂上的皮疹。

其具體工作原理是基于Web應(yīng)用程序,通過上傳拍攝的圖片,利用AI模型來分析圖片中所出現(xiàn)的癥狀信息,從而為用戶提供與之匹配的條件列表。對于條件列表中的每個(gè)匹配條件,都源自于皮膚科醫(yī)生審核過的信息和常見問題的答案,以及來自網(wǎng)絡(luò)中的類似匹配圖像。

然而,值得注意的是該應(yīng)用程序所得出的匹配結(jié)果并不能作為診斷依據(jù),也不能替代醫(yī)學(xué)建議,因?yàn)樵S多情況還是需要在醫(yī)院中進(jìn)行專業(yè)的檢查。因此,該應(yīng)用的意義在于希望用戶在此訪問到權(quán)威信息,為下一步做出更為明智的決定。

該款應(yīng)用工具已經(jīng)過3年的機(jī)器學(xué)習(xí)研究和產(chǎn)品開發(fā),并發(fā)表了多篇同行評審的論文,以驗(yàn)證其AI模型。除此之外,谷歌的深度學(xué)習(xí)方法對皮膚病的評估還曾發(fā)表于《自然醫(yī)學(xué)》雜志中,并表明其AI系統(tǒng)可以達(dá)到與美國董事會認(rèn)證的皮膚科醫(yī)生相同的準(zhǔn)確性。目前,為該款應(yīng)用程序所提供的AI模型已成功通過了臨床認(rèn)證,其應(yīng)用程序在歐盟也獲得了CE標(biāo)記為I類醫(yī)療設(shè)備。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    453

    文章

    50249

    瀏覽量

    421111
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29852

    瀏覽量

    268151
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1694

    瀏覽量

    45905
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8356

    瀏覽量

    132324
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    138

    瀏覽量

    20684

原文標(biāo)題:谷歌 I/O 2021 在音視頻領(lǐng)域中有哪些技術(shù)值得被關(guān)注?

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    盤點(diǎn)那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發(fā)展至今日常使用中已經(jīng)漸漸少了。但是工業(yè)領(lǐng)域音視頻連接,依然能看到其身影。這些看似消失的接口,它們現(xiàn)在發(fā)
    的頭像 發(fā)表于 09-09 14:34 ?423次閱讀

    常見音視頻接口的靜電浪涌防護(hù)和濾波方案

    音視頻接口現(xiàn)代多媒體設(shè)備中扮演著至關(guān)重要的角色,它們確保了音視頻信號不同設(shè)備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應(yīng)用場景需求
    的頭像 發(fā)表于 06-25 11:28 ?582次閱讀

    音視頻IP化浪潮全面來襲,分布式系統(tǒng)開創(chuàng)音視頻行業(yè)新時(shí)代!

    傳統(tǒng)音視頻頻系統(tǒng)中,廠商們各自采用不同的通訊方式和控制協(xié)議,這使得不同的產(chǎn)品之間就像一座座的信息孤島,要連接起來就需要復(fù)雜的轉(zhuǎn)換設(shè)備和系統(tǒng)再開發(fā)。隨著音視頻項(xiàng)目的規(guī)模不斷擴(kuò)大,各類音頻設(shè)備產(chǎn)品
    的頭像 發(fā)表于 05-30 16:55 ?614次閱讀

    音視頻產(chǎn)品EMC整改案例解析

    音視頻產(chǎn)品EMCRE整改案例解析
    的頭像 發(fā)表于 05-20 16:49 ?353次閱讀
    <b class='flag-5'>音視頻</b>產(chǎn)品EMC整改案例解析

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

    音視頻所載有的信息通過傳輸?shù)臅r(shí)候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術(shù),將文本數(shù)據(jù)表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據(jù)字符出現(xiàn)
    發(fā)表于 04-28 21:04

    音視頻SoC與AI技術(shù)融合,帶來更智能的音視頻處理解決方案

    ,如WiFi路由器和物聯(lián)網(wǎng)設(shè)備。安防、智能音頻等領(lǐng)域,對SoC芯片的算力要求相比智能手機(jī)、服務(wù)器等略低。 ? 人工智能技術(shù)音視頻SoC 的融合???????????????????
    的頭像 發(fā)表于 04-26 01:20 ?4143次閱讀

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音頻采集與預(yù)處理

    閑暇之余,繼續(xù)學(xué)習(xí)【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】這本書。 書中對于音頻采集的介紹非常詳細(xì)和全面,包括原理、方法、技術(shù)細(xì)節(jié)以及實(shí)踐應(yīng)用等方面的內(nèi)容。 音頻采集是實(shí)時(shí)音視頻通信中的關(guān)鍵步驟之一
    發(fā)表于 04-25 10:41

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】新書一瞥

    本人從事音視頻領(lǐng)域的開發(fā),經(jīng)常接觸實(shí)時(shí)音視頻處理相關(guān)的技術(shù),看到這本書非常有興趣閱讀,這本書全面介紹實(shí)時(shí)音視頻(RTC)
    發(fā)表于 04-22 09:09

    音視頻解碼生成:打造極致觀影體驗(yàn)的關(guān)鍵技術(shù)

    現(xiàn)代多媒體時(shí)代,音視頻解碼生成技術(shù)已成為提供極致觀影體驗(yàn)的核心要素。它不僅能夠確保音視頻數(shù)據(jù)的高效傳輸,還能保證播放的流暢性和畫質(zhì)清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生
    的頭像 發(fā)表于 02-25 14:43 ?425次閱讀

    音視頻解碼生成多媒體制作中的應(yīng)用

    音視頻解碼生成是多媒體制作中不可或缺的一部分,它扮演著將編碼的音視頻數(shù)據(jù)轉(zhuǎn)化為可播放、可編輯的內(nèi)容的關(guān)鍵角色。多媒體制作的全過程中,音視頻解碼生成
    的頭像 發(fā)表于 02-21 14:39 ?344次閱讀

    音視頻解碼生成與流媒體傳輸?shù)慕Y(jié)合

    音視頻解碼生成與流媒體傳輸是現(xiàn)代數(shù)字媒體技術(shù)中兩個(gè)不可或缺的部分,它們的結(jié)合為用戶提供了高質(zhì)量、實(shí)時(shí)性的多媒體體驗(yàn)。 1. 解碼生成與流媒體傳輸?shù)年P(guān)系 解碼生成是流媒體傳輸?shù)那疤帷?b class='flag-5'>在流媒體服務(wù)中
    的頭像 發(fā)表于 02-21 14:36 ?355次閱讀

    音視頻

    音視頻技術(shù)都喜歡深究內(nèi)部最核心的原理和機(jī)制,尤其是ffmpeg這個(gè)編解碼庫,可以說是音視頻領(lǐng)域事實(shí)上的標(biāo)準(zhǔn)。語音智能算法,語言語義分析和理解,流媒體服務(wù)器等高端
    發(fā)表于 11-23 08:51

    看華為高品質(zhì)萬兆園區(qū)網(wǎng)絡(luò)如何對音視頻業(yè)務(wù)“望聞問切”

    延遲等問題。而當(dāng)新的協(xié)作方式拉胯的體驗(yàn)拖了后腿,新技術(shù)便很難發(fā)揮其真正的業(yè)務(wù)價(jià)值。 大量園區(qū)網(wǎng)音視頻業(yè)務(wù)中的表現(xiàn)欠佳并非單純源的帶寬不足,而是缺乏行之有效的管理和規(guī)劃。由此延展,強(qiáng)
    的頭像 發(fā)表于 11-21 20:45 ?658次閱讀
    看華為高品質(zhì)萬兆園區(qū)網(wǎng)絡(luò)如何對<b class='flag-5'>音視頻</b>業(yè)務(wù)“望聞問切”

    關(guān)于手機(jī)端音視頻技術(shù)的思考與經(jīng)驗(yàn)

    提起手機(jī)音視頻,大家的第一印象可能是上面列舉的抖音、快手、愛奇藝和小米視頻等在線視頻平臺,其中我們的小米視頻是一個(gè)聚合平臺,用戶可以通過它觀看各大流媒體平臺的
    發(fā)表于 11-17 09:43 ?821次閱讀
    關(guān)于手機(jī)端<b class='flag-5'>音視頻</b><b class='flag-5'>技術(shù)</b>的思考與經(jīng)驗(yàn)

    科通技術(shù)攜手AMD 解碼專業(yè)音視頻及工業(yè)醫(yī)療圖像新趨勢

    11月14日,《科通&AMD專業(yè)音視頻、工業(yè)醫(yī)療圖像新趨勢》研討會在上海舉辦。繼上月深圳站反響熱烈后,科通技術(shù)再次攜AMD專家以及戰(zhàn)略合作伙伴在上海站深入探討了AMD自適應(yīng)與嵌入式器件工業(yè)和醫(yī)療
    的頭像 發(fā)表于 11-16 14:08 ?389次閱讀