0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

讓音樂更柔和 MIT用AI過濾音源

jmiy_worldofai ? 來源:未知 ? 作者:胡薇 ? 2018-07-11 17:05 ? 次閱讀

一般利用均衡器可以將音樂中的低音部分調出來,但是麻省理工學院的計算機科學和人工智能實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)的研究人員發(fā)現(xiàn)了更好的解決方案。他們所研發(fā)的新系統(tǒng) PixelPlayer,能夠利用人工智能來區(qū)分和過濾聲音,讓音樂聽起來更洪亮或更柔和。

將指定視頻錄入經過充分訓練的 PixelPlayer,系統(tǒng)隨機能夠過濾伴奏,同時識別音源,接著計算圖像中每個像素的音量,然后通過“空間定位”確定產生相似音波的片段。

今年9月,德國慕尼黑即將舉行歐洲計算機視覺會議(European Conference on Computer Vision),會議中要發(fā)表的一篇新論文則詳細論述了“像素的聲音(The Sound of Pixels)”。麻省理工學院計算機科學和人工智能實驗室的博士生,同時也是這篇論文的合著者 Zhao Hang 同學表示,“最好的情況就是,我們能識別出哪種樂器發(fā)出怎樣的聲音?!?/p>

PixelPlayer 的核心是一種基于樂器組合多模態(tài)訓練的神經網(wǎng)絡,數(shù)據(jù)集采用了 Youtube 上 714 條未經修剪且未經標記的視頻。其中,總時長為 60 小時的 500 條視頻用于訓練,剩余的則用于驗證和測試。在訓練過程中,研究人員分別根據(jù)原聲吉他、大提琴、單簧管、長笛和其他樂器向系統(tǒng)饋入了算法。

這只是 PixelPlayer 多重機器學習框架的一個部分。經過訓練后的視頻分析算法將從剪輯幀中提取出視覺特征,這就是系統(tǒng)的第二個神經網(wǎng)絡,即音頻分析網(wǎng)絡。音頻分析網(wǎng)絡將聲音拆分為片段,并從中提取特征。最后,音頻合成網(wǎng)絡將把上述兩個網(wǎng)絡輸出的特定像素和聲波關聯(lián)起來。

PixelPlayer 進行完全自監(jiān)督的學習,人們無需對數(shù)據(jù)注釋,而且系統(tǒng)目前已經能識別 20 種樂器。Zhao Hang 說,較大的數(shù)據(jù)集增強了系統(tǒng)的識別量,但識別樂器子類的能力卻不佳。系統(tǒng)也可以識別音樂元素,例如小提琴的諧波頻率。

研究人員認為 PixelPlayer 可以進行聲音剪輯,或者幫助機器人理解動物、車輛和其他物體所制造的環(huán)境聲音。他們寫到,“我們希望我們的工作能夠開辟新的研究途徑,從視覺和聽覺信號角度實現(xiàn)聲源分離”。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網(wǎng)絡

    關注

    42

    文章

    4717

    瀏覽量

    100018
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266254
  • MIT
    MIT
    +關注

    關注

    3

    文章

    253

    瀏覽量

    23312

原文標題:MIT實現(xiàn)用AI過濾音源 讓音樂更悅耳

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    昆侖萬維發(fā)布全球首個AI流媒體音樂平臺Melodio

    昆侖萬維在科技創(chuàng)新領域再次邁出重要一步,正式推出了全球首個AI流媒體音樂平臺——Melodio,以及配套的AI音樂商用創(chuàng)作平臺Mureka。這兩款創(chuàng)新產品的問世,標志著
    的頭像 發(fā)表于 08-14 17:44 ?669次閱讀

    請問蜂鳴器播放音樂的時候如何同時播放兩段音樂?

    PWM 控制的音樂播放,可以按照樂譜播放音符 但現(xiàn)在有個需求,是在播放背景音樂的時候同時疊加一個前景音樂進去? 各位有什么好的思路嗎?
    發(fā)表于 06-14 08:23

    音樂大模型掀起AI音樂創(chuàng)作熱潮,AI“一語成歌”成為可能

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著大模型技術的發(fā)展,AI音樂生成悄然而生。音樂生成是一個結合了人工智能技術和音樂創(chuàng)作的領域,它涵蓋了從基本的音頻信號模擬到復雜的
    的頭像 發(fā)表于 05-30 01:01 ?3770次閱讀

    谷歌推新AI音樂工具,發(fā)布第六代TPU芯片

    谷歌近日宣布與YouTube合作,推出全新音樂工具Music AI Sandbox。這款AI音樂創(chuàng)作工具將與傳統(tǒng)AI
    的頭像 發(fā)表于 05-16 09:44 ?299次閱讀

    全球AI音樂會,第一次聽見中國聲音

    全球AI音樂盛宴中,中國首個音樂AIGC SOTA 的獨特旋律
    的頭像 發(fā)表于 04-19 11:01 ?312次閱讀
    全球<b class='flag-5'>AI</b><b class='flag-5'>音樂</b>會,第一次聽見中國聲音

    一鍵消原音智能AI芯片PTN1118芯片簡介

    PTN1118植入帕特納微AI(SVS),實現(xiàn)將任意音源中人聲部分消除,并在極大程度上保留伴奏,配合PTN 卡拉OK系列芯片,使傳統(tǒng)音頻設備富娛樂性。 支持模擬與數(shù)字輸入輸出,數(shù)字接口支持從模式 人聲消除深淺度可調(比如,保留
    發(fā)表于 04-12 17:40

    BGP路由過濾、引入與缺省路由的配置實踐

    第一個 AS-Path進行路由過濾 利用 AS-Path 進行路由過濾 R3只接收來自AS 100的 做正則表達式
    發(fā)表于 04-08 10:47 ?788次閱讀
    BGP路由<b class='flag-5'>過濾</b>、引入與缺省路由的配置實踐

    音頻功放原理:音樂重現(xiàn)原貌

    在音響設備的世界里,音頻功放器是一個至關重要的組成部分。它負責將輸入的模擬信號轉換為足夠的電流,驅動揚聲器的振動,從而讓我們能夠欣賞到豐富多彩的音樂。那么,音頻功放器是如何實現(xiàn)這一功能的呢?一、音頻
    的頭像 發(fā)表于 03-28 15:57 ?538次閱讀
    音頻功放原理:<b class='flag-5'>讓</b><b class='flag-5'>音樂</b>重現(xiàn)原貌

    智慧路燈桿AI監(jiān)測應用,高速出行安全

    針對更好監(jiān)測和管理高速公路上的交通狀況,可以基于智慧路燈桿打造AI交通監(jiān)測應用,通過智能感知高速路段的路況、車況、環(huán)境狀況,實現(xiàn)實時風險感知、風險預警和協(xié)同處置,高速出行安全。
    的頭像 發(fā)表于 03-11 17:20 ?360次閱讀
    智慧路燈桿<b class='flag-5'>AI</b>監(jiān)測應用,<b class='flag-5'>讓</b>高速出行<b class='flag-5'>更</b>安全

    FPGA末日計算器PC1500煥發(fā)數(shù)碼新春

    FPGA如何PC1500古董計算器實現(xiàn)vgm音樂格式播放以及國產全能語音芯片和國產全能音源芯片控制和編程。
    發(fā)表于 12-01 13:46

    精密信號鏈設計容易

    電子發(fā)燒友網(wǎng)站提供《精密信號鏈設計容易.pdf》資料免費下載
    發(fā)表于 11-23 15:54 ?0次下載
    <b class='flag-5'>讓</b>精密信號鏈設計<b class='flag-5'>更</b>容易

    各種智能能源應用智能

    電子發(fā)燒友網(wǎng)站提供《各種智能能源應用智能.pdf》資料免費下載
    發(fā)表于 11-17 10:29 ?0次下載
    <b class='flag-5'>讓</b>各種智能能源應用<b class='flag-5'>更</b>智能

    AI技術助力網(wǎng)絡革新,企業(yè)智能

    代表了網(wǎng)絡通信的未來。它是一種專門為滿足企業(yè)需求而設計的網(wǎng)絡連接,利用AI技術來提供智能、更高效的網(wǎng)絡服務。這些服務包括自動化網(wǎng)絡優(yōu)化、實時數(shù)據(jù)分析用戶體驗的顯著改進。 二、AI
    的頭像 發(fā)表于 10-27 17:56 ?455次閱讀
    <b class='flag-5'>AI</b>技術助力網(wǎng)絡革新,<b class='flag-5'>讓</b>企業(yè)<b class='flag-5'>更</b>智能

    3 數(shù)字麥陣列六向音源定位追蹤 AR1105

    音源
    深圳德宇科技有限公司
    發(fā)布于 :2023年10月20日 15:05:50

    高通和騰訊音樂合作,首創(chuàng)QQ音樂“驍龍臻品音質”

    今日,高通技術公司和騰訊音樂娛樂集團(TME)宣布展開合作并推出業(yè)界首創(chuàng)的“驍龍臻品音質”,利用驍龍移動平臺強大的AI計算性能,在終端側高效運行QQ音樂臻品音質AI模型算法,為用戶帶來
    的頭像 發(fā)表于 09-27 10:10 ?873次閱讀
    高通和騰訊<b class='flag-5'>音樂</b>合作,首創(chuàng)QQ<b class='flag-5'>音樂</b>“驍龍臻品音質”