0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于神經(jīng)網(wǎng)絡的計算模型,將大腦中的腦電數(shù)據(jù)轉化為語言

nlfO_thejiangme ? 來源:lq ? 2019-01-16 09:27 ? 次閱讀

對于有語言障礙的人來說,內(nèi)心的表達只能通過紙筆或者是手語來與人溝通交流,但他們想說的話卻會在腦海里時時回蕩,如果能將這些腦中的信號轉換為語音發(fā)出,將會給他們帶來巨大的幫助。隨著科技的迅猛發(fā)展,新技術有可能會造福于這些失語人群。最近,有三個研究小組進行了相關研究,他們使用基于神經(jīng)網(wǎng)絡的計算模型,將大腦中的腦電數(shù)據(jù)轉化為語言,并通過計算機合成出語音,重建了可被聽眾理解的單詞和句子。

傳統(tǒng)語音轉換

雖然目前已有基于默讀時的肌肉信號來進行語音合成技術的初步研究,但這種方式更多是幫助人們在不方便說話的時候與計算機或者其他人交流。

對于語音障礙人士特別是先天障礙,這種方式無法通過通常的肌肉信號來捕捉并合成出對應的語音。如有有朝一日,新技術可以僅僅基于人們的思維過程而重建出人們腦中想表達的語言,將會造福更多的人。在中風或疾病之后失去說話能力的人可以使用眼動跟蹤、聯(lián)想輸入和語音合成播放三個步驟達到重新表達的目的。 霍金的個人助理設備就是觀測無法通過收縮他臉頰上的某塊肌肉,來觸發(fā)安裝在眼鏡上的開關,從而輸入文字向世界傳達他的觀點和見解,但是他每分鐘僅可以輸入5-15個單詞,無法像正常人一樣流暢的表達自己的觀點,思維受制于設備的速度。試想,如果霍金可以像馬斯克或者老黃一樣流暢的發(fā)表自己的演講,不用花大量的時間用于輸出單詞,那么他很可能會為世界帶來更多的巨大的貢獻。

如果未來可以通過腦機接口來重構他們的語言系統(tǒng),那將會為霍金一樣的使用者帶來巨大的幫助,他們不僅可以表達想說的話,還可以控制說話的音調(diào),表達的速度也會大幅提升,使得殘障人士實時對話和有效的表達成為可能。

已有的突破

前途是光明的,道路是曲折的。最先遇到的問題在于數(shù)據(jù)采集和數(shù)據(jù)量的限制。在不同個體之間,腦電信號轉化為語音的過程存在一定的差異性,因此必須對每個人(的個性化數(shù)據(jù))進行“訓練”。

而且眾所周知:使用的數(shù)據(jù)越精確,模型的運行效果就越好,但是精準的模型需要開顱手術后才能獲得,這樣嚴苛的條件大大限制了數(shù)據(jù)的獲取,研究人員只能在極少數(shù)的情況下進行。一種情況是在移除腦腫瘤的手術期間,另一種情況是在癲癇患者腦內(nèi)植入電極,來診斷癲癇發(fā)作的起因。但是,每次留給研究者們的數(shù)據(jù)收集最多只有二三十分鐘。數(shù)據(jù)量非常有限。

研究人員目前正在致力于尋找出可替代的有效的數(shù)據(jù)獲取方式。其中一部分研究人員利用聽覺區(qū)域的植入電極來獲取大腦的信號,并試圖找出在不同時間點的神經(jīng)元模型推斷出對應的語音。神經(jīng)網(wǎng)絡的計算模型過將信息傳遞到計算“節(jié)點”層來處理復雜模式。網(wǎng)絡通過調(diào)整節(jié)點之間的連接來學習。

在實驗中研究人員使用了兩種回歸模型一種用于生產(chǎn)聽覺頻譜,一種用于生成聲音信息的向量編碼。網(wǎng)絡的監(jiān)督信號和輸入信息分別是一個人產(chǎn)生或聽到的語音記錄和同時期的大腦活動數(shù)據(jù)中。一個團隊使用了來自五名癲癇患者的數(shù)據(jù)。他們的網(wǎng)絡分析了當病人聽到了故事和從0到9的數(shù)字的錄音時聽覺皮層(在語音和聽力過程中都很活躍)的活動狀況,然后利用計算機,以采集到的神經(jīng)數(shù)據(jù)為依據(jù),重建口述的數(shù)字。合成后的語音,準確率達到了75%。

另外一支由德國不來梅大學的神經(jīng)科學家和荷蘭馬斯特里赫特大學的學者組成的團隊,他們使用來源于六名接受腦瘤手術患者的數(shù)據(jù)。首先,患者被要求重復屏幕上出現(xiàn)的詞語,同時通過麥克風來捕捉音頻信息。同時研究者們還需捕捉從大腦的語音規(guī)劃區(qū)域和運動區(qū)域獲取的信號,這些信號向聲道發(fā)送命令,并使得人們能清楚說出單詞。

最后,利用神經(jīng)網(wǎng)絡模型將腦電信號映射到音頻記錄,然后從數(shù)據(jù)中重建單詞。研究結果表明:大約40%的計算機生成的單詞是可以理解的。研究人員主要使用了下圖所示的densenet模型來實現(xiàn)電信號的音頻信號的重建:

此外自于加州大學舊金山分校的團隊通過從語言和運動區(qū)域捕獲的大腦活動來重建整個句子,他們所使用的數(shù)據(jù)采集于三名癲癇的患者大聲朗讀的過程中。為了驗證重建句子的有效性,邀請了166名受試者進行了在線測試。實驗結果表明,對于某些句子,達到了超過80%的識別準確率。

研究人員還進一步改進了模型:他們使用該模型來基于默念采集到的信息來重建句子。該研究使得人們基于腦中思維過程而重建出腦中想表達的內(nèi)容的目標又更進一步。

未來展望

未來,我們期望的是患者不用說話,僅僅通過腦中的思維過程來進行語音合成。當一個人默念和感知到某種語言時,大腦的反應與真正說出和聽到聲音時的信號不同。如果沒有外部聲音來匹配大腦活動,計算機甚至可能很難理清內(nèi)部語音的開始和結束位置。解碼”想象中的語言” 需要利用腦機接口向用戶提供反饋——他們能夠實時聽到計算機的語音解釋,給出計算機反饋,以獲得他們想要的結果。通過對用戶和神經(jīng)網(wǎng)絡的充分訓練,未來的某一天,大腦和計算機也許能找到更好的配合方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:所思即所講,腦波語音合成技術助力語言障礙人士表達心聲

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    神經(jīng)網(wǎng)絡模型用于解決什么樣的問題 神經(jīng)網(wǎng)絡模型有哪些

    下一個單詞或者下一句話的概率,從而建立起一個能夠捕捉序列數(shù)據(jù)語言模式的模型,從而用于自然語言生成、機器翻譯、文本分類等任務。 序列標注任務:神經(jīng)網(wǎng)
    的頭像 發(fā)表于 08-03 16:37 ?6035次閱讀

    神經(jīng)網(wǎng)絡教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡的構成  第2章人工神經(jīng)網(wǎng)絡基本模型  2.
    發(fā)表于 03-20 11:32

    【PYNQ-Z2試用體驗】神經(jīng)網(wǎng)絡基礎知識

    學習和認知科學領域,是一種模仿生物神經(jīng)網(wǎng)絡(動物的中樞神經(jīng)系統(tǒng),特別是大腦)的結構和功能的數(shù)學模型計算
    發(fā)表于 03-03 22:10

    如何構建神經(jīng)網(wǎng)絡?

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預測的計算系統(tǒng)。如何構建神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡包括:輸
    發(fā)表于 07-12 08:02

    神經(jīng)形態(tài)芯片越來越多地模擬大腦可塑性

    。盡管科學家們對大腦神經(jīng)線路如何執(zhí)行高級功能有了更多的了解,但是在固態(tài)設備(SSD)上對大腦進行逆向工程仍然遙不可及。神經(jīng)網(wǎng)絡的關鍵元素。神經(jīng)
    發(fā)表于 04-16 15:01

    卷積神經(jīng)網(wǎng)絡模型發(fā)展及應用

    。神經(jīng)網(wǎng)絡的思想起源于1943年McCulloch 和 Pitts 提出的神經(jīng)元模型[19],簡稱 MCP 神經(jīng)元模 型。它是利用計算機來模擬人的
    發(fā)表于 08-02 10:39

    什么是神經(jīng)網(wǎng)絡?為什么說神經(jīng)網(wǎng)絡很重要?神經(jīng)網(wǎng)絡如何工作?

    神經(jīng)網(wǎng)絡是一個具有相連節(jié)點層的計算模型,其分層結構與大腦中神經(jīng)元網(wǎng)絡結構相似。神經(jīng)網(wǎng)絡可通過
    的頭像 發(fā)表于 07-26 18:28 ?3740次閱讀
    什么是<b class='flag-5'>神經(jīng)網(wǎng)絡</b>?為什么說<b class='flag-5'>神經(jīng)網(wǎng)絡</b>很重要?<b class='flag-5'>神經(jīng)網(wǎng)絡</b>如何工作?

    卷積神經(jīng)網(wǎng)絡模型原理 卷積神經(jīng)網(wǎng)絡模型結構

    數(shù)據(jù)的不同方面,從而獲得預測和最終的表??現(xiàn)。本文提供有關卷積神經(jīng)網(wǎng)絡模型的工作原理和結構的詳細信息,包括其在圖像、語音和自然語言處理等不
    的頭像 發(fā)表于 08-21 16:41 ?893次閱讀

    常見的卷積神經(jīng)網(wǎng)絡模型 典型的卷積神經(jīng)網(wǎng)絡模型

    常見的卷積神經(jīng)網(wǎng)絡模型 典型的卷積神經(jīng)網(wǎng)絡模型 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)是深度學習
    的頭像 發(fā)表于 08-21 17:11 ?2657次閱讀

    cnn卷積神經(jīng)網(wǎng)絡模型 卷積神經(jīng)網(wǎng)絡預測模型 生成卷積神經(jīng)網(wǎng)絡模型

    cnn卷積神經(jīng)網(wǎng)絡模型 卷積神經(jīng)網(wǎng)絡預測模型 生成卷積神經(jīng)網(wǎng)絡模型? 卷積
    的頭像 發(fā)表于 08-21 17:11 ?1054次閱讀

    卷積神經(jīng)網(wǎng)絡模型搭建

    卷積神經(jīng)網(wǎng)絡模型搭建 卷積神經(jīng)網(wǎng)絡模型是一種深度學習算法。它已經(jīng)成為了計算機視覺和自然語言處理等
    的頭像 發(fā)表于 08-21 17:11 ?838次閱讀

    神經(jīng)網(wǎng)絡模型的工作原理和作用

    神經(jīng)網(wǎng)絡模型是一種計算模型,基于人類神經(jīng)系統(tǒng)的處理和學習機制,模仿大腦神經(jīng)元的工作方式,對輸入
    發(fā)表于 08-28 18:21 ?1503次閱讀

    構建神經(jīng)網(wǎng)絡模型的常用方法 神經(jīng)網(wǎng)絡模型的常用算法介紹

    神經(jīng)網(wǎng)絡模型是一種通過模擬生物神經(jīng)元間相互作用的方式實現(xiàn)信息處理和學習的計算機模型。它能夠對輸入數(shù)據(jù)進行分類、回歸、預測和聚類等任務,已經(jīng)廣
    發(fā)表于 08-28 18:25 ?945次閱讀

    人工神經(jīng)網(wǎng)絡模型的分類有哪些

    人工神經(jīng)網(wǎng)絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經(jīng)元網(wǎng)絡計算模型,它在許多領域,如圖像識別、語音識別、自然
    的頭像 發(fā)表于 07-05 09:13 ?447次閱讀

    基于神經(jīng)網(wǎng)絡語言模型有哪些

    文本或預測文本中的下一個詞。隨著深度學習技術的飛速發(fā)展,涌現(xiàn)出了多種不同類型的神經(jīng)網(wǎng)絡語言模型。以下詳細介紹幾種主流的基于神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 07-10 11:15 ?250次閱讀