0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能伴侶虛擬機器人小冰的技術(shù)解讀

電子工程師 ? 2018-06-17 22:25 ? 次閱讀

三百六十行,行行出狀元。在眾多行業(yè)中有這么一個行業(yè)迎來了一位“新人”——微軟小冰。

作為一款人工智能伴侶虛擬機器人的小冰,去了歌唱界。不僅發(fā)表個人單曲,還參與作詞作曲,經(jīng)歷了五次迭代的微軟小冰,現(xiàn)在已經(jīng)成為一個會作曲會唱歌的全能型藝人。

▌作曲寫詩寫詞樣樣精通

2017 年,微軟出版了一本由小冰原創(chuàng)的詩集《陽光失了玻璃窗》,這是第一部 100% 由人工智能創(chuàng)造的詩集。在寫詩之后,小冰還創(chuàng)作不同類型的文體,填詞,唱歌,發(fā)表個人單曲等。

據(jù)介紹,小冰創(chuàng)作的基本原理有兩大塊,一塊是他需要學(xué)習(xí)前人的作品,包括上千位詩人的詩集、上千萬行歌詞等等。第一步,訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的模型;第二步,有了一定的模型之后,需要給她一個觸發(fā)源,工程師們稱為創(chuàng)作沖動。

創(chuàng)作沖動有不同的方式,給出一張圖片或文字,基于圖片里的元素或文字內(nèi)容的理解去創(chuàng)作,例如知乎上的海量回答,學(xué)習(xí)知乎預(yù)料大數(shù)據(jù)作為觸發(fā)源,基于一個訓(xùn)練好的模型,生成對應(yīng)的歌詞。

值得注意的是,在小冰發(fā)布的單曲中,還聽到有模擬真人呼吸的聲音,據(jù)微軟(亞洲)互聯(lián)網(wǎng)工程院微軟小冰首席語音科學(xué)家欒劍表示,主要是因為考慮到大眾的習(xí)慣,沒有換氣可能會讓人聽著感覺很累,因為有些時候發(fā)燒友會跟著哼唱,沒有呼吸換氣的地方,會覺得不太舒服。

在技術(shù)上實現(xiàn)呼吸換氣主要分為兩個模塊,第一個模塊,首先要預(yù)測什么地方會有呼吸的聲音,第二個模塊,怎么樣把呼吸的聲音生成出來。

關(guān)于第一個,人類有兩種呼吸,一個是這個歌到了一個休止符,在語意的地方需要一個停頓;還有一種,這首歌可能節(jié)奏很快,中間沒有任何的停頓,這時候人類的歌手必須要在某個地方換一下氣,不然的話,人類的肺活量支撐不了。

關(guān)于換氣的聲音,其實換氣的聲音有點類似于人類的聲音,它就是一種沒有聲帶振蕩的聲音,我們可以把他作一種中文語言系統(tǒng)以外的一種新的發(fā)言的因素去建模。

▌最早實現(xiàn)全雙工對話

在 2016 年的 9 月份,微軟小冰就開始真正的給人類打電話,到目前為止,打了超過 60 萬通電話。在通話過程中會增加“嗯”、“啊”這樣的語氣詞,給人的感覺更像真人,并且做到了全雙工對話,可以互相打斷,真正做到雙方互動的聊天。

另外,小冰運用的領(lǐng)域是一個很開放的領(lǐng)域。她實際上跟用戶在溝通的過程中話題,內(nèi)容,都是可以雙方提出來的。不僅是小冰拋出一個話題,就限定在這個話題里聊,而是隨時可以根據(jù)對方拋出的新話題去聊。

據(jù)欒劍介紹,小冰這種開放領(lǐng)域的聊天難度上會更大一些。首先上下文大篇幅的語義理解在業(yè)界和學(xué)術(shù)界都是一個很難的課題,比如在寫詩的時候,有時候的用詞比較古怪,或者語句之間不太通順,但實際上可能存在有一種潛在的邏輯。

也遇到了一個技術(shù)的瓶頸,語意理解像是一個黑盒子,這個黑盒子,會收入一些內(nèi)容也會反饋一些內(nèi)容,反饋的內(nèi)容給人的感覺好像是理解了,但實際上他是不是真正理解了,是沒有辦法判斷的。

人也是這樣,在實際對話過程中,更多的是先給個輸入,然后給個輸出,再根據(jù)這個輸出來判斷他是不是真正理解了,但實際上這里面是有一定的套路存在的,你去判斷他是不是理解,可能是很困難的,因為里面并沒有一個那么直觀的東西存在。

AI 的三個層次:運算智能、感知智能、認(rèn)知智能

第一層,運算智能,像算盤一樣;

第二層,感知智能,能夠感知到一個物品是什么;現(xiàn)在大多數(shù)的 AI,包括語音、圖象等還是停留感知智能層次上;

第三層,認(rèn)知智能;像人一樣,知道是什么,還知道為什么這樣,還可以推理,這個層次較難。

說到底,AI 的創(chuàng)造力和人類的創(chuàng)造力之間有什么差別呢?

微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能創(chuàng)造事業(yè)部副總經(jīng)理袁晶表示,人的左腦更加偏向于計算;人的右腦是偏向創(chuàng)造力,發(fā)散思維,現(xiàn)在希望用計算的方式,讓 AI 用左腦的方式去模擬右腦的行為。

換句話講,這種創(chuàng)造在人里面只有頂尖的藝術(shù)家才能干,但是放到 AI 上,就相當(dāng)于可以簡化這個學(xué)習(xí)和訓(xùn)練的過程了。

相當(dāng)于說,讓她去擬合人類創(chuàng)作者的創(chuàng)作過程,并且能以這樣的能力去幫助普通人去做一些創(chuàng)造,因為每個人都想去做一些創(chuàng)作的行為,只不過說限于自己的能力,AI 能夠做到相當(dāng)于他的助手,幫助普通人,享受創(chuàng)作的樂趣。比如她可以和你一起為你新出生的孩子、或你的戀人寫首情詩,也可能為你爸爸的生日創(chuàng)作一首歌曲等。

▌未來小冰將嘗試更多內(nèi)容領(lǐng)域的創(chuàng)作

袁晶表示,未來會漸漸讓小冰去嘗試往內(nèi)容生成的領(lǐng)域做一些探索,可能半年一年,很多別的公司或者機構(gòu),也會跟隨這個趨勢去做類似這樣的事情。

在袁晶看來,人工智能在內(nèi)容領(lǐng)域有一些新的能力或者突破可能將會是未來的一個方向,所以也會往這個方向不斷的去做一些嘗試,包括聲音、文字、圖像等三個方面,AI 未來會充當(dāng)協(xié)助角色,幫助人類的創(chuàng)作者,去更好更快更高效的創(chuàng)作內(nèi)容。

首先 AI 創(chuàng)造的成本是很低的,要比人類的創(chuàng)造成本低很多。比如讀故事,當(dāng)我們找配音員去讀這個故事,他可能要付出一定的成本,但是如果聲音的模型訓(xùn)練好了之后可以大批量的生成,成百上千個小時的大量的用戶,所以他的成本會攤薄到很低。

小冰的聲音技術(shù)里面增加了一些韻律和風(fēng)格的變換,使得她可以去模仿人類創(chuàng)作者,在各種場景下面做各種不同的演藝。而機器人可以非常真實的模擬人聲,讓很多人有各種各樣的顧慮。

欒劍表示,小冰聲音的生成和使用的過程都是嚴(yán)格受控的,將來提供服務(wù)的時候,模型本身,以及合成的引擎本身,另外,小冰之前給人類打電話已經(jīng)打了60萬個,小冰都會先申明身份,明確告訴用戶我們是微軟小冰。微軟設(shè)有專門的人工智能的委員會,防止人類利用人工智能技術(shù)去做傷害他人和社會的事情。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    27839

    瀏覽量

    204596
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235018

原文標(biāo)題:微軟小冰作詞又作曲,網(wǎng)友:要出道的節(jié)奏嗎?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    ,以及大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對AI for Science的技術(shù)支撐進行解讀。 第3章介紹
    發(fā)表于 09-09 13:54

    海默機器人攜產(chǎn)品精彩亮相人工智能產(chǎn)業(yè)創(chuàng)投融資對接專場活動

    人工智能領(lǐng)域不斷取得突破的今天,海默機器人以其創(chuàng)新的產(chǎn)品和前沿技術(shù),成為行業(yè)內(nèi)的一顆耀眼新星。近日,海默機器人攜其產(chǎn)品精彩亮相了一場人工智能
    的頭像 發(fā)表于 08-02 08:13 ?379次閱讀
    海默<b class='flag-5'>機器人</b>攜產(chǎn)品精彩亮相<b class='flag-5'>人工智能</b>產(chǎn)業(yè)創(chuàng)投融資對接專場活動

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計,提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計算的加速,還可以針對特定應(yīng)用場景進行定制化計算,為人工智能技術(shù)的發(fā)展提供有力支持。
    發(fā)表于 07-29 17:05

    機器視覺和人工智能的關(guān)系與應(yīng)用

    釋視覺信息的技術(shù)。它涉及到圖像的獲取、處理、分析和解釋,以實現(xiàn)對物體、場景和事件的識別、定位、測量和分類。機器視覺系統(tǒng)通常由圖像采集設(shè)備、圖像處理軟件和執(zhí)行器組成,可以應(yīng)用于各種自動化和智能化的場景。
    的頭像 發(fā)表于 07-16 10:27 ?430次閱讀

    什么是虛擬機?虛擬機真的那么好用嗎?

    在日新月異的科技世界中,虛擬技術(shù)如同一座橋梁,連接著現(xiàn)實與數(shù)字的鴻溝,為我們打開了全新的計算維度。虛擬機,這一概念,自其誕生以來,就以其獨特的魅力和強大的功能,深深地影響了軟件開發(fā)、系統(tǒng)測試和云
    的頭像 發(fā)表于 07-06 08:05 ?463次閱讀
    什么是<b class='flag-5'>虛擬機</b>?<b class='flag-5'>虛擬機</b>真的那么好用嗎?

    人工智能機器人的區(qū)別

    在當(dāng)今科技飛速發(fā)展的時代,人工智能(AI)和機器人已成為社會關(guān)注的熱點話題。盡管兩者在多個領(lǐng)域有著廣泛的應(yīng)用和交集,但它們本質(zhì)上是兩個不同的概念。本文將從定義、技術(shù)方向、功能、應(yīng)用范圍、研究重點及未來發(fā)展等方面,詳細(xì)探討
    的頭像 發(fā)表于 07-04 17:41 ?785次閱讀

    國產(chǎn)Cortex-A55人工智能教學(xué)實驗箱_基于Python機械臂跳舞實驗案例分享

    一、實驗?zāi)康?本實驗通過TL3568-PlusTEB教學(xué)實驗箱修改機械臂不同舵機的角度,增加延遲時間,從而做到機械臂跳舞的效果。 二、實驗原理 ROS(機器人操作系統(tǒng)) ROS(機器人操作系統(tǒng)
    發(fā)表于 06-28 14:37

    AI人工智能機器人產(chǎn)業(yè)--政府真正應(yīng)承擔(dān)的責(zé)任與角色

    AI人工智能機器人自人機大戰(zhàn)至今已得到了前所未有的突破與發(fā)展。世界上主要國家都把人工智能機器人產(chǎn)業(yè)作為首要目標(biāo)進行戰(zhàn)略規(guī)劃布局推進。有些國家甚至采取抱團打壓我國
    的頭像 發(fā)表于 06-01 08:14 ?219次閱讀
    AI<b class='flag-5'>人工智能</b><b class='flag-5'>機器人</b>產(chǎn)業(yè)--政府真正應(yīng)承擔(dān)的責(zé)任與角色

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實現(xiàn)手寫數(shù)字識別案例_V2-20240506.pdf 人工智能 語音對話機器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    其利天下技術(shù)·搭載無刷電機的掃地機器人的前景如何?

    隨著人工智能和物聯(lián)網(wǎng)技術(shù)的不斷進步,掃地機器人智能化程度也在不斷提高?,F(xiàn)代掃地機器人已經(jīng)可以通過智能
    發(fā)表于 05-05 15:03

    機器學(xué)習(xí)怎么進入人工智能

    人工智能已成為一個熱門領(lǐng)域,涉及到多個行業(yè)和領(lǐng)域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關(guān)鍵是使用機器學(xué)習(xí)算法,這是一類基于樣本數(shù)據(jù)和模型訓(xùn)練來進行預(yù)測和判斷的
    的頭像 發(fā)表于 04-04 08:41 ?148次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實現(xiàn)手寫數(shù)字識別案例.pdf 人工智能 語音對話機器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音對話機器人
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    聯(lián)網(wǎng)ARM開發(fā) NB-IoT開發(fā)及實戰(zhàn) 七:python工程師,人工智能工程師 python語法基礎(chǔ) python核心編程 基于OpenCV的機器視覺開發(fā) 嵌入式人工智能滲入生活的方方面面,廣泛應(yīng)用
    發(fā)表于 02-26 10:17

    人工智能大模型在工業(yè)機器人方面的規(guī)劃

    工業(yè)機器人應(yīng)用較多的企業(yè)已具備良好的數(shù)字化基礎(chǔ),結(jié)合實際需求,對人工智能大模型在工業(yè)機器人領(lǐng)域的應(yīng)用進行整體設(shè)計規(guī)劃。
    發(fā)表于 01-05 17:27 ?545次閱讀

    利用Arduino讓機器人學(xué)會識別標(biāo)識并作出行為

    教你用Arduino讓機器人學(xué)會識別標(biāo)識并作出行為。你的人工智能小車從此有了眼睛!材料單:跟蹤機器人底盤視覺傳感器Arduino Uno電動機驅(qū)動板18650 Li-離子電池
    發(fā)表于 09-27 07:36