0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

第六代微軟小冰發(fā)布,對(duì)話引擎、全雙工語音和實(shí)時(shí)視覺相融合

Qp2m_ggservicer ? 來源:未知 ? 作者:工程師郭婷 ? 2018-07-31 15:08 ? 次閱讀

第六代微軟小冰正式發(fā)布,相比與以往的低調(diào),此次微軟小冰六代的發(fā)布會(huì)現(xiàn)場(chǎng)格外盛大。

小冰是微軟亞洲研究院在2014年5月在中國推出的人工智能聊天機(jī)器人,也是知名的虛擬形象之一,如今已進(jìn)化到第六代。此外,小冰還改頭換面,徹底拋棄了以前的形象,并且由 2D 變成了 3D(如下圖所示)。

第六代小冰核心對(duì)話引擎與交互感官的升級(jí)

小冰項(xiàng)目負(fù)責(zé)人李笛介紹,微軟的目標(biāo)就是讓小冰成為一個(gè)高情商的機(jī)器人:從有趣、到有情緒、到能探測(cè)、到能占據(jù)主動(dòng)。微軟最新推出了全新的共感模型,它融合了共感模型的對(duì)話引擎、全雙工語音和實(shí)時(shí)視覺三個(gè)類別的全新感官。

共感模型是一種基于生成模型的對(duì)話引擎。微軟在去年的第五代小冰發(fā)布會(huì)上,首次正式完成生成模型的產(chǎn)品化,該模型的特點(diǎn),通俗地說,就是小冰可以自創(chuàng)她的回應(yīng),而不需要從已有的對(duì)話語料庫中檢索而得。在生成模型的基礎(chǔ)上,共感模型能夠進(jìn)一步提高小冰對(duì)于對(duì)話內(nèi)容、領(lǐng)域和節(jié)奏的控制力,也即小冰可以通過自創(chuàng)回應(yīng),來牽引對(duì)話向她所希望的方向進(jìn)行。微軟宣布已經(jīng)完成共感模型的測(cè)試,今日起,共感模型將在微軟小冰所覆蓋的五個(gè)國家正式上線。

在去年八月份舉行的第五代小冰發(fā)布會(huì)上,微軟宣布已完成全雙工語音(Full Duplex Voice)交互感官的產(chǎn)品化,并在打電話和智能音箱設(shè)備兩個(gè)場(chǎng)景中落地。

微軟在今年發(fā)布會(huì)上宣布開始公開測(cè)試的這個(gè)新感官,是融合了共感模型的對(duì)話引擎、全雙工語音和實(shí)時(shí)視覺三個(gè)類別的全新感官。微軟在發(fā)布會(huì)現(xiàn)場(chǎng)放置了用于體驗(yàn)的測(cè)試設(shè)備。在該測(cè)試設(shè)備中,小冰可以通過視覺、語音的實(shí)時(shí)連續(xù)交互,指揮用戶完成面容檢測(cè),并可在上述過程中進(jìn)行開放域的對(duì)話。微軟預(yù)計(jì)該感官將于一年內(nèi)完成全部產(chǎn)品化工作。

第六代小冰在人工智能創(chuàng)造(AI Creation)方面的技術(shù)和產(chǎn)業(yè)化進(jìn)展

微軟認(rèn)為,利用人工智能技術(shù),學(xué)習(xí)人類并進(jìn)行與人類質(zhì)量水平相當(dāng)?shù)膬?nèi)容創(chuàng)造,是重要的、但目前尚未被行業(yè)注意到的未來趨勢(shì)。目前,微軟小冰已通過人工智能技術(shù),實(shí)現(xiàn)了詩歌和金融等領(lǐng)域的文本內(nèi)容生成、歌曲及有聲讀物等領(lǐng)域的有聲內(nèi)容生成,以及電視電臺(tái)節(jié)目和可交互式電臺(tái)等串流內(nèi)容領(lǐng)域的生成工作,并分別完成了不同程度的落地。

2018年6月,微軟(亞洲)互聯(lián)網(wǎng)工程院成立人工智能創(chuàng)造事業(yè)部,旨在進(jìn)一步推動(dòng)微軟小冰在人工智能創(chuàng)造這一內(nèi)容領(lǐng)域的生產(chǎn)線搭建及產(chǎn)業(yè)化落地等工作。

微軟還發(fā)布了新的第四版人工智能歌曲DNN模型,從而展示了微軟在這一領(lǐng)域領(lǐng)先于世界的技術(shù)優(yōu)勢(shì)。與前三個(gè)版本的技術(shù)相比,第四版能夠進(jìn)一步快速合成與人類歌手質(zhì)量相當(dāng)?shù)母枨?,并能夠使人工智能小冰自由吸收多?shù)人類歌手的演唱技巧,融會(huì)貫通,在演唱過程中達(dá)成更加成熟的演繹。此外,該技術(shù)還能夠完整吸收并復(fù)制特定人類歌手的全部演唱特質(zhì)(嗓音、韻律等),使小冰能完全代替原人類歌手完成新作品的創(chuàng)作。目前,微軟在這一領(lǐng)域的技術(shù)研究和產(chǎn)品化,均居于全球領(lǐng)導(dǎo)地位。

微軟宣布與多個(gè)領(lǐng)先的大眾文化公司合作,已經(jīng)完成部分人類歌手的人工智能化工作。在發(fā)布會(huì)上,微軟演示了最新版本的小冰在唱歌上取得的成績(jī)。

第六代小冰的Dual AI戰(zhàn)略

小冰產(chǎn)品負(fù)責(zé)人彭爽解釋道:“在這樣一個(gè)半開放生態(tài)環(huán)境上,一方面我們會(huì)直接負(fù)責(zé)產(chǎn)品體驗(yàn),也就是說我們會(huì)直接把控最具體的、直接和用戶接觸的產(chǎn)品細(xì)節(jié),另一方面我們又不封閉在一個(gè)自有平臺(tái)上,而是走出去接觸,甚至直接融入到第三方平臺(tái)上,這樣就形成了一個(gè)完整的半開放生態(tài)環(huán)境。”

具體來說,微軟會(huì)根據(jù)已有合作伙伴的實(shí)踐,將該戰(zhàn)略的實(shí)施分為三個(gè)部分:首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺(tái)的自有AI。其次,微軟小冰作為該合作平臺(tái)的輔助AI,融入該平臺(tái)生態(tài)。第三,微軟通過技術(shù)、產(chǎn)品與運(yùn)營,圍繞該合作平臺(tái)的差異化特點(diǎn),推出合作的應(yīng)用和產(chǎn)品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6554

    瀏覽量

    103896
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28105

    瀏覽量

    205854
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46666

    瀏覽量

    237102

原文標(biāo)題:GGAI 頭條 | 微軟小冰6代出道:是時(shí)候表演一下驚人的唱歌本領(lǐng)了

文章出處:【微信號(hào):ggservicerobot,微信公眾號(hào):高工智能未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    聯(lián)想推出第六代垂直液冷技術(shù)AI服務(wù)器

    在今日舉辦的聯(lián)想2024年度全球創(chuàng)新盛會(huì)Tech World上,聯(lián)想集團(tuán)震撼發(fā)布了其第六代Neptune垂直液冷產(chǎn)品——ThinkSystem N1380 Neptune,這款產(chǎn)品專為生成式AI計(jì)算量身打造,再次彰顯了聯(lián)想在高性能計(jì)算和液冷技術(shù)領(lǐng)域的卓越實(shí)力與創(chuàng)新能力。
    的頭像 發(fā)表于 10-16 17:15 ?547次閱讀

    SK海力士開發(fā)出第六代10納米級(jí)DDR5 DRAM

    SK海力士宣布了一項(xiàng)重大技術(shù)突破,成功開發(fā)出全球首款采用第六代10納米級(jí)(1c)工藝的16Gb DDR5 DRAM。這一里程碑式的成就標(biāo)志著SK海力士在半導(dǎo)體存儲(chǔ)技術(shù)領(lǐng)域的領(lǐng)先地位。
    的頭像 發(fā)表于 08-29 16:39 ?615次閱讀

    字節(jié)跳動(dòng)豆包大模型已支持實(shí)時(shí)語音通話

    字節(jié)跳動(dòng)火山引擎今日隆重推出創(chuàng)新對(duì)話式AI實(shí)時(shí)交互解決方案,該方案以火山方舟大模型服務(wù)平臺(tái)為核心,全面升級(jí)語音交互體驗(yàn)。該方案深度融合火山
    的頭像 發(fā)表于 08-12 16:13 ?678次閱讀

    單工、半雙工全雙工傳輸模式的區(qū)別

    傳輸模式主要分為單工(Simplex)、半雙工(Half-Duplex)和全雙工(Full-Duplex)。這三種模式在數(shù)據(jù)傳輸能力、通信效率和應(yīng)用場(chǎng)景等方面存在顯著差異。
    的頭像 發(fā)表于 08-07 14:32 ?844次閱讀

    全雙工與半雙工技術(shù)解析

    A到B的同時(shí)可以B到A。這種通信方式極大地提高了數(shù)據(jù)傳輸?shù)男屎?b class='flag-5'>實(shí)時(shí)性。在手機(jī)通信中,全雙工模式的應(yīng)用尤為突出,使得電話的兩邊的人在同一時(shí)刻都可以說話發(fā)送數(shù)據(jù),實(shí)現(xiàn)了真正的雙向通信。 全雙工模式的優(yōu)點(diǎn)在于能夠?qū)崿F(xiàn)高
    的頭像 發(fā)表于 06-16 10:18 ?680次閱讀

    百度攜手江鈴新能源推出第六代Robotaxi車型

    百度近日宣布,其自動(dòng)駕駛出租車業(yè)務(wù)“蘿卜快跑”正式推出第六代車型——頤馳06,這是百度Apollo與江鈴新能源的聯(lián)合力作。新車出廠價(jià)定為20.46萬元,首批交付量高達(dá)1000輛。
    的頭像 發(fā)表于 05-20 14:36 ?2699次閱讀

    谷歌發(fā)布第六代TPU芯片Trillium,挑戰(zhàn)GPT-4o

    分析人士認(rèn)為,谷歌積極推進(jìn)自主研發(fā)芯片,按照其規(guī)劃,第七和第八產(chǎn)品將分別與聯(lián)發(fā)科、世芯合作生產(chǎn)。此次第六代TPU的推出,有望引領(lǐng)CSP(云端服務(wù)提供商)廠商投入自研芯片領(lǐng)域。
    的頭像 發(fā)表于 05-16 18:05 ?1317次閱讀

    百度Apollo推出第六代無人車頤馳06,定價(jià)為20.46萬元,蘿卜快跑

     據(jù)悉,頤馳 06 搭載了百度 Apollo 第六代智能化系統(tǒng)解決方案,配備了 7 類共 40 個(gè)傳感器,計(jì)算平臺(tái)算力高達(dá) 1200 Tops,且具備全方位安全冗余功能。
    的頭像 發(fā)表于 05-15 11:39 ?910次閱讀

    谷歌將推出第六代數(shù)據(jù)中心AI芯片Trillium TPU

    在今日舉行的I/O 2024開發(fā)者大會(huì)上,谷歌公司震撼發(fā)布了其第六代數(shù)據(jù)中心AI芯片——Trillium Tensor處理器單元(TPU)。據(jù)谷歌首席執(zhí)行官皮查伊透露,這款新型TPU預(yù)計(jì)在年內(nèi)交付,屆時(shí)將帶來前所未有的計(jì)算性能飛躍。
    的頭像 發(fā)表于 05-15 11:18 ?576次閱讀

    全雙工與半雙工技術(shù)解析及其應(yīng)用場(chǎng)景

    及適用場(chǎng)景。 一、全雙工模式 全雙工模式允許數(shù)據(jù)在通信鏈路的兩個(gè)方向上同時(shí)進(jìn)行傳輸,即A到B的同時(shí)可以B到A。這種通信方式極大地提高了數(shù)據(jù)傳輸?shù)男屎?b class='flag-5'>實(shí)時(shí)性。在手機(jī)通信中,全雙工模式的
    的頭像 發(fā)表于 05-11 15:29 ?1110次閱讀

    全雙工音頻對(duì)講模塊-支持空中升級(jí)、多級(jí)無線中繼

    ,支持OTA空中升級(jí)。SA618F30配備1W功率,支持8通道數(shù)據(jù)和全雙工通信。全雙工實(shí)時(shí)雙向通信方式,使得對(duì)講者可以更快地交換想法、傳遞信息。為了提供更好的音質(zhì)對(duì)話
    的頭像 發(fā)表于 05-08 17:13 ?456次閱讀
    <b class='flag-5'>全雙工</b>音頻對(duì)講模塊-支持空中升級(jí)、多級(jí)無線中繼

    小馬智行第六代自動(dòng)駕駛車型在京開啟全無人載客測(cè)試

    小馬智行近日宣布,其搭載第六代L4自動(dòng)駕駛軟硬件系統(tǒng)的豐田賽那自動(dòng)駕駛乘用車(Robotaxi)已經(jīng)獲得在北京進(jìn)行“車內(nèi)無人,車外遠(yuǎn)程”自動(dòng)駕駛載人示范應(yīng)用的許可。這一里程碑式的進(jìn)展標(biāo)志著小馬智行在自動(dòng)駕駛技術(shù)領(lǐng)域的持續(xù)突破和領(lǐng)先地位。
    的頭像 發(fā)表于 02-18 11:12 ?754次閱讀

    恩智浦發(fā)布新一智能語音技術(shù)組合的語音識(shí)別引擎

    恩智浦發(fā)布新一智能語音技術(shù)組合的語音識(shí)別引擎。本文將探討開發(fā)人員在嵌入式語音控制設(shè)計(jì)中面臨的挑
    的頭像 發(fā)表于 01-26 09:15 ?705次閱讀
    恩智浦<b class='flag-5'>發(fā)布</b>新一<b class='flag-5'>代</b>智能<b class='flag-5'>語音</b>技術(shù)組合的<b class='flag-5'>語音</b>識(shí)別<b class='flag-5'>引擎</b>

    雙工全雙工通信模式的比較

    雙工全雙工通信模式的比較? 半雙工全雙工是兩種不同的通信模式,在不同的通信需求下,它們各有優(yōu)劣。下面,我將詳細(xì)介紹半雙工
    的頭像 發(fā)表于 01-09 14:00 ?1663次閱讀

    網(wǎng)絡(luò)傳輸單工、半雙工全雙工的解讀

    在網(wǎng)絡(luò)傳輸中,數(shù)據(jù)在線路上的傳送方式可以分為單工通信、半雙工通信和全雙工通信三種。
    的頭像 發(fā)表于 11-24 16:33 ?3055次閱讀
    網(wǎng)絡(luò)傳輸單工、半<b class='flag-5'>雙工</b>、<b class='flag-5'>全雙工</b>的解讀