0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

空間音頻技術(shù)的現(xiàn)狀和特性

貿(mào)澤電子 ? 來源:貿(mào)澤電子 ? 2024-06-26 16:46 ? 次閱讀

音頻偏好始終被視為一項個人體驗。一個人認(rèn)為好的東西對另外一個人可能并非如此。但隨著Apple iOS 16對Personalized Spatial Audio的支持,許多渠道上眾說紛紜,誤傳誤報層出不窮。本文將淺談一下空間音頻技術(shù)的現(xiàn)狀和特性。

人們對再現(xiàn)更佳音質(zhì)的追求似乎永無止境。從Victrola的手搖留聲機(jī)到新的環(huán)繞立體聲技術(shù),收聽者們一直在尋求用技術(shù)來改善傳遞到他們耳朵的聲音。隨著空間音頻技術(shù)的新應(yīng)用,這種對改善音頻和收聽體驗的追求迎來了新的轉(zhuǎn)機(jī),因為這項技術(shù)承諾提供比以往更身臨其境的聽覺體驗。

Apple Spatial Audio并不是唯一的空間音頻技術(shù);Sony和Denon等公司在這項技術(shù)上也處于前排地位,并提供商業(yè)化產(chǎn)品。不過,本文僅討論空間音頻技術(shù)一般概念以及Apple的Personalized Spatial Audio。

音頻偏好始終被視為一項個人體驗。一個人認(rèn)為好的東西對另外一個人可能并非如此。但隨著Apple iOS 16對Personalized Spatial Audio的支持,許多渠道上眾說紛紜,誤傳誤報層出不窮。本文將淺談一下空間音頻技術(shù)的現(xiàn)狀和特性。

01

頭部結(jié)構(gòu)剖析

個性化音頻要考慮身體機(jī)能運轉(zhuǎn)背后的生理和物理因素;每個人都是獨二無二的。耳朵離頭部的距離、在頭部的位置以及耳朵本身的形狀和角度都會影響我們的聽覺體驗。對于Personalized Spatial Audio,Apple使用運行iOS 16系統(tǒng)的iPhone中的3D TrueDepth相機(jī)功能來三維掃描用戶的頭部。

iPhone進(jìn)行三次掃描:頭部左側(cè)、頭部右側(cè)和正面臉部(不是一些人所說的內(nèi)耳道)。生成專屬于個人的配置文件并存儲起來,以備播放引擎使用。人們擔(dān)心這些配置數(shù)據(jù)文件會被獲取并用于先進(jìn)的面部識別系統(tǒng)。Apple表示,這些文件在設(shè)備上是安全且加密的,不會用于監(jiān)控和先進(jìn)的面部識別應(yīng)用。

TrueDepth掃描參數(shù)創(chuàng)建一個聲學(xué)模型,音頻渲染引擎使用該模型來優(yōu)化用戶耳朵接收的實時音頻流。

但是等等,好像還不止于此。

對于人類而言,當(dāng)播放的聲音進(jìn)入內(nèi)耳時,內(nèi)耳會產(chǎn)生共鳴,并用自己的聲音做出回應(yīng)。這些聲音來自耳朵里的耳蝸,可被檢測和測量。這些交感聲音被稱為耳聲發(fā)射(OAE),在聽眾更敏感的頻率上,聲音明顯更大。許多耳機(jī)制造商在耳塞內(nèi)安裝了靈敏的麥克風(fēng)來檢測耳聲發(fā)射。頻率掃描讓Spatial Audio系統(tǒng)可以剖析用戶每只耳朵的聽力頻率響應(yīng)圖。

該系統(tǒng)利用每只耳朵的頻率特征來量身調(diào)整音頻,通過補償用戶不太敏感的頻率來使用全頻譜。由此產(chǎn)生的動態(tài)調(diào)整均衡器利用耳塞發(fā)射器的特定角度來優(yōu)化不同頻率下的音頻和頻譜功率,呈現(xiàn)完整的音頻流頻率。

02

聲球

空間音頻感覺有點像環(huán)繞頭部的聲音泡泡。音軌呈現(xiàn)出一種新的特色,不是僅僅出現(xiàn)在左邊、右邊、前方中間和后方中間,因為它們是來自定向揚聲器的環(huán)繞聲。相反,聲音發(fā)射源好像是環(huán)繞在頭部,當(dāng)您把頭靠近這些聲源的“音頻線”(類似于視線)時,聲音會變得更響、更亮。為了實現(xiàn)這一點,音軌必須是包含所有聲球聲源及其相對水平和距離數(shù)據(jù)的編碼音軌。

03

空間音頻的使用

空間音頻處理可用于戲劇音頻、電影音頻、游戲音頻以及健康和健身應(yīng)用??梢哉f,目前非常流行的應(yīng)用是游戲—尤其是虛擬現(xiàn)實(VR)游戲。

VR頭顯采用先進(jìn)且高效的頭部跟蹤,以確保音頻和視頻同步。如果沒有快速準(zhǔn)確的頭部跟蹤,VR會讓人很快感到惡心想吐;例如,當(dāng)您轉(zhuǎn)頭時,若場景沒有實時跟蹤,大腦就會遇到問題。

因此,VR頭顯會錨定空間音頻引擎,所以當(dāng)頭部轉(zhuǎn)動時,來自該方向的主要聲音來源就會發(fā)出超大的聲音。其他聲音也會隨著頭部的位置和轉(zhuǎn)動速度而改變位置。

但家庭影院空間音頻系統(tǒng)無法執(zhí)行這類錨定。例如,如果您坐在沙發(fā)上看電影,只要觀看中央屏幕,空間音頻就可能會提供一個合理的近似環(huán)繞聲。但是當(dāng)您轉(zhuǎn)頭時,系統(tǒng)就很難讓側(cè)邊的聲音更加突出。機(jī)器視覺攝像頭和人工智能可能會幫助系統(tǒng)識別您的轉(zhuǎn)頭,但這項技術(shù)目前還不成熟。

一些聽戴式設(shè)備中使用的加速度計和陀螺儀可以執(zhí)行頭部跟蹤,但這并不是完美解決方案。因此,這種相對頭部跟蹤技術(shù)遠(yuǎn)不如絕對頭部跟蹤技術(shù)那樣又快又準(zhǔn)。

不論哪種情況,其中包括游戲,都需要快速的響應(yīng)時間和低延遲,這樣當(dāng)聽眾移動頭部時,其音頻線就做出正前方出現(xiàn)較高音頻源而兩側(cè)出現(xiàn)靜音或較低音頻源的響應(yīng)。

家庭和劇院使用的可能解決方案就是讓每個人都戴上沉浸式VR頭顯(圖1)。這個方案只有在音頻引擎能夠同時為每個人提供量身定制的音頻流時才可行。但這是一個更加昂貴的解決方案,而且大大削弱了看電影的社交體驗。

04

其他問題、顧慮、技術(shù)和用途

盡管空間音頻是一種純粹的數(shù)字技術(shù),但使用耳塞時也會遇到問題。音頻發(fā)射器較小會限制低音響應(yīng)。這就是低音功放為何要使用更顯眼的揚聲器、低音炮和大型重低音喇叭的原因。

低音依賴于大量的空氣運動,因而較小的發(fā)射器不如較大的聲波發(fā)射器。相控陣已經(jīng)展示了讓較小發(fā)射器保持適當(dāng)間距來增強頻譜中低頻的功率,從而再現(xiàn)低音的能力,但用耳塞很難實現(xiàn)這一點。

較大的耳機(jī)通常使用能提供更好低音響應(yīng)的較大音頻發(fā)射器。但耳機(jī)需要不同的音頻處理來再現(xiàn)頻譜,尤其是環(huán)繞聲效果。耳機(jī)使用360度頭部相關(guān)傳輸函數(shù)(HRTF)濾波器。這些濾波器調(diào)節(jié)聲音的播放方式,所以耳朵反彈使它看起來在不同的位置和水平上感知到聲音。

無論如何,360度音頻技術(shù)在游戲、劇院、健康與保健之外都有許多潛在的應(yīng)用和用途。白色噪音和粉色噪音機(jī)器已經(jīng)在幫助人們?nèi)胨⒎潘珊蜏p壓。未來的應(yīng)用可能在空間音頻中增加生物識別傳感器,以記錄哪些頻率和模式有助于個人放松、降低血壓和入睡。跟蹤阿爾法腦電波可以關(guān)閉這個反饋回路,從而增強放松狀態(tài)。

這項技術(shù)還可以作為一種聽力輔助設(shè)備來幫助失聰或有聽覺障礙的人,盡管目前這還是一項沒有得到證實的用途。音樂家可以使用空間音頻來獲得理想的入耳混音效果。舞臺音量和場地混音總是不同。音響師可以調(diào)節(jié)場地混音,但空間音頻可以幫助表演者在舞臺上聽得更清楚。

目前,人們對空間音頻的評價褒貶不一;有些人喜歡,有些人不喜歡。這是一項每個人都必須自己嘗試后才能做出決定的技術(shù)。畢竟,許多用戶對眾多環(huán)繞聲系統(tǒng)昂貴的價格和復(fù)雜的設(shè)置并不滿意,更何況背景音有時會壓過對話音。

05

空間音頻的使用

空間音頻技術(shù)通過分析人體結(jié)構(gòu)和生理特性,利用獨特的音頻配置文件,并結(jié)合先進(jìn)的音頻渲染技術(shù),提供更加個性化和身臨其境的聆聽體驗。這項技術(shù)的應(yīng)用范圍涵蓋游戲、劇院、健康、健身等領(lǐng)域,其未來的影響可能會徹底改變我們體驗音頻的方式。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 立體聲
    +關(guān)注

    關(guān)注

    1

    文章

    182

    瀏覽量

    35647
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4320

    瀏覽量

    119991
  • 音頻技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    138

    瀏覽量

    24623
  • 頻譜
    +關(guān)注

    關(guān)注

    7

    文章

    874

    瀏覽量

    45550

原文標(biāo)題:音頻技術(shù)的卷王模式

文章出處:【微信號:貿(mào)澤電子,微信公眾號:貿(mào)澤電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    音頻信號的無損壓縮編碼是什么

    音頻信號的無損壓縮編碼是一種在不損失音頻質(zhì)量的前提下,減少音頻文件大小的技術(shù)。這種技術(shù)對于存儲和傳輸音頻
    的頭像 發(fā)表于 09-25 14:10 ?257次閱讀

    CS4344數(shù)模轉(zhuǎn)換芯片

    CS4344數(shù)模轉(zhuǎn)換芯片,作為音頻處理領(lǐng)域的佼佼者,以其卓越的性能和廣泛的應(yīng)用領(lǐng)域,在音頻設(shè)備中扮演著至關(guān)重要的角色。本文將從CS4344的技術(shù)特性、工作原理、應(yīng)用場景以及市場
    的頭像 發(fā)表于 09-23 09:44 ?706次閱讀

    模擬音頻信號是由什么組成的

    地還原聲音的原始特性。模擬音頻信號通常以電壓或電流的形式存在,其幅度和頻率的變化與聲音波形的變化相對應(yīng)。 模擬音頻信號的特性 模擬音頻信號具
    的頭像 發(fā)表于 08-25 15:47 ?465次閱讀

    XMOS 多路音頻解碼器:音頻技術(shù)的未來

    XMOS 多路音頻解碼器代表了音頻技術(shù)的前沿,它通過強大的數(shù)字信號處理能力、靈活的多通道支持和高解析度音頻處理,為用戶帶來了無與倫比的音質(zhì)體驗。無論是在家庭影院、高端音響系統(tǒng)、游戲設(shè)備
    的頭像 發(fā)表于 08-16 22:25 ?968次閱讀
    XMOS 多路<b class='flag-5'>音頻</b>解碼器:<b class='flag-5'>音頻</b><b class='flag-5'>技術(shù)</b>的未來

    高質(zhì)量激光光束光學(xué)系統(tǒng)中的空間濾波

    不規(guī)則性。這一過程確保了更均勻的強度分布,減少了發(fā)散,增強了相干性,從而提高了光束質(zhì)量。空間濾波在各種應(yīng)用中是必不可少的,包括激光加工、全息技術(shù)、顯微鏡和通信領(lǐng)域,其中對光束特性的精確控制對于最佳性能
    發(fā)表于 08-14 11:54

    數(shù)字音頻技術(shù)的應(yīng)用與發(fā)展

    數(shù)字音頻技術(shù)是現(xiàn)代信息技術(shù)的重要組成部分,它在音樂制作、廣播、電影、電視、互聯(lián)網(wǎng)等多個領(lǐng)域都有著廣泛的應(yīng)用。 一、數(shù)字音頻技術(shù)的基本原理 數(shù)
    的頭像 發(fā)表于 07-13 10:14 ?1515次閱讀

    數(shù)字音頻技術(shù)技術(shù)特點

    數(shù)字音頻技術(shù)是一種將聲音信號轉(zhuǎn)換為數(shù)字信號的技術(shù),它具有許多技術(shù)特點: 高保真度:數(shù)字音頻技術(shù)
    的頭像 發(fā)表于 07-13 10:10 ?790次閱讀

    空間光通信技術(shù)的概述

    1.1空間光通信的基本原理空間光通信是一種新型的光通信方式。空間光通信技術(shù)在20世紀(jì)80年代就開始用于軍方,隨著摻餌光纖放大器、波分復(fù)用、自適應(yīng)光學(xué)等
    的頭像 發(fā)表于 06-06 08:37 ?1208次閱讀
    <b class='flag-5'>空間</b>光通信<b class='flag-5'>技術(shù)</b>的概述

    聆聽未來:藍(lán)牙Auracast? 廣播音頻技術(shù)

    在數(shù)字化和移動化日益發(fā)展的今天,音頻內(nèi)容的消費和共享已成為日常生活的一部分。Auracast廣播音頻,作為最新的藍(lán)牙技術(shù)創(chuàng)新,它允許音頻源向周圍的多個藍(lán)牙設(shè)備廣播
    的頭像 發(fā)表于 03-22 08:19 ?941次閱讀
    聆聽未來:藍(lán)牙Auracast? 廣播<b class='flag-5'>音頻</b><b class='flag-5'>技術(shù)</b>

    蘋果公司任命音頻業(yè)務(wù)新主管,應(yīng)對AirPods銷量增長

    蘋果的音頻團(tuán)隊有著大約三百人的龐大規(guī)模,是AirPods、音箱等產(chǎn)品的核心研發(fā)力量。他們致力于研究聲學(xué)和麥克風(fēng)技術(shù),同時也擅長打造諸如空間音頻這樣的軟件
    的頭像 發(fā)表于 02-21 16:55 ?900次閱讀

    音頻轉(zhuǎn)接器解決方案LDR6020E

    Type-C音頻轉(zhuǎn)接器作為一種新型的音頻設(shè)備連接方式,具有廣闊的市場前景和發(fā)展空間。隨著技術(shù)的不斷進(jìn)步和消費者需求的不斷升級,我們期待著更多創(chuàng)新型、高品質(zhì)的Type-C
    的頭像 發(fā)表于 01-31 09:20 ?626次閱讀

    數(shù)字視音頻技術(shù)的基本概念

    技術(shù)的應(yīng)用范圍廣泛,涵蓋了廣播電視、影視制作、多媒體通信、遠(yuǎn)程教育等多個領(lǐng)域。本文將詳細(xì)介紹數(shù)字視音頻技術(shù)的基本概念、技術(shù)原理和應(yīng)用現(xiàn)狀等方
    的頭像 發(fā)表于 12-14 15:00 ?1447次閱讀

    WT2605C-A001音頻藍(lán)牙語音芯片:小巧體積,高品質(zhì)音頻播放的創(chuàng)新

    在現(xiàn)今的科技繁榮時代,音頻技術(shù)作為人類感知世界的重要方式,已經(jīng)變得越來越重要。唯創(chuàng)知音WT2605C-A001音頻藍(lán)牙語音芯片,以其卓越的特性和創(chuàng)新性,正在為
    的頭像 發(fā)表于 11-24 10:26 ?467次閱讀

    情感語音識別技術(shù)現(xiàn)狀與未來

    一、引言 情感語音識別技術(shù)是近年來人工智能領(lǐng)域的研究熱點之一,它通過分析人類語音中的情感信息,為智能客服、心理健康監(jiān)測、娛樂產(chǎn)業(yè)等多個領(lǐng)域提供了重要的支持。本文將探討情感語音識別技術(shù)現(xiàn)狀和未來
    的頭像 發(fā)表于 11-15 16:36 ?618次閱讀

    光束偏轉(zhuǎn)技術(shù)研究現(xiàn)狀及趨勢分析

    本文系統(tǒng)總結(jié)了機(jī)械式和非機(jī)械式六類光束偏轉(zhuǎn)技術(shù)的國內(nèi)外研究進(jìn)展,根據(jù)不同技術(shù)的偏轉(zhuǎn)特性,從關(guān)鍵指標(biāo)方面比較分析了各類光束偏轉(zhuǎn)技術(shù)的特點,并從空間
    的頭像 發(fā)表于 11-14 09:40 ?941次閱讀
    光束偏轉(zhuǎn)<b class='flag-5'>技術(shù)</b>研究<b class='flag-5'>現(xiàn)狀</b>及趨勢分析