一级a一级a爰片免费免免小说,精品无码国产AV一区二区

11月7日，在烏鎮(zhèn)第五屆世界互聯(lián)網(wǎng)大會上，小米面向智能家居的人工智能開放平臺（即小愛同學(xué)）成功入選”世界互聯(lián)網(wǎng)領(lǐng)先科技成果”，恰好我這幾天也在學(xué)習(xí)AI語音助手相關(guān)的知識，借此從時間維度談?wù)勎业囊稽c(diǎn)認(rèn)識。

一、AI語音助手的歷史大事記

2010年4月28日，蘋果公司完成了對Siri公司的收購，Siri從App Store中下架，并取消了所有除iOS平臺外的軟件研發(fā)；2014年4月2日至4日，在美國加利福尼亞州舊金山舉行的微軟Build開發(fā)者大會上，微軟全球副總裁喬北峰首度向公眾展示了小娜；2014年11月，亞馬遜宣布將Alexa與Echo合并；2015年9月9日，百度董事長兼首席執(zhí)行官李彥宏在百度世界大會中推出度秘（Duer）；2016年5月19日，Google在Google I/O大會上發(fā)布了Google Assistant；2017年7月26日，小米發(fā)布的首款人工智能（AI）音箱的喚醒詞及二次元人物形象小愛同學(xué)；2018年5月9日，Google在Google I/O大會上發(fā)布了Google Duplex；2018年8月15日，亞馬遜和微軟聯(lián)合宣布，雙方已完成各自語音助手Alexa和Cortana的整合。

二、AI語音助手的現(xiàn)狀——拼場景

場景一：連接硬件生態(tài)

由于語音交互核心環(huán)節(jié)上的一系列技術(shù)突破及人工智能公司提供的ToB解決方案，AI語音助手開始逐漸在技術(shù)層面上滿足人們的基本要求。

以小愛同學(xué)為例：它的語音和語義技術(shù)主要來自于多家合作伙伴，包括：Nuance、搜狗知音、思必馳、獵戶星空、聲智科技、海知智能、三角獸等。

語音識別技術(shù)（ASR）的接口，用的是思必馳、Nuance 與搜狗的（現(xiàn)在小米似乎是在自研）。自然語言理解（NLP）等關(guān)于語義方面的技術(shù)，由小米大腦親自來做。前端的麥克風(fēng)陣列以及降噪方案，是由聲智科技提供的。語音合成技術(shù)，是由獵戶星空提供的。很大程度上，自然語言解析技術(shù)已經(jīng)逐漸不再成為各家廣義智能助理產(chǎn)品的核心競爭力，識別用戶意圖之后所提供的服務(wù)開始成為對話機(jī)器人差異化的核心。而在這個時候，國內(nèi)公司中再次抓住頭部紅利的正是小米。

不得不說雷軍真的是一個非常有大勢思維的企業(yè)家，總能恰如其分地踩上時代紅利，正如他所說：“一個人要做成一件事情，其實本質(zhì)上不是在于你多強(qiáng)，而是你要順勢而為，于萬仞之上推千鈞之石”。

他踩著智能手機(jī)大換代、消費(fèi)升級、網(wǎng)紅電商的紅利撐起了小米，這次他又抓住了人工智能目前布局最廣泛的智能硬件生態(tài)。

在評選世界互聯(lián)網(wǎng)領(lǐng)先科技成果獎的介紹中，小米人工智能開放平臺是這么定義的：

小米人工智能開放平臺，是一個以智能家居需求場景為出發(fā)點(diǎn)，深度整合人工智能和物聯(lián)網(wǎng)能力，為用戶、軟硬件廠商和個人開發(fā)者提供智能場景及軟硬件生態(tài)服務(wù)的開放創(chuàng)新平臺。

著名產(chǎn)品人梁寧在《產(chǎn)品思維三十講》中分析了小米的三級火箭模式：

一級火箭：小米手機(jī)，是小米的頭部流量，不為掙錢，雷軍也承諾小米硬件的綜合利潤率永遠(yuǎn)不會超過5%（根據(jù)小米的上市招股說明書，雷軍在這一塊真的沒有說謊）。

二級火箭：小米手機(jī)拉動的一系列零售場景，小米商城、米家、小米之家、小米小店（小米11月18日將會在英國倫敦的Westfield mall落地在英國市場的第一家門店也是用MI8 pro打頭陣，并逐步開放其它商品和渠道）。

三級火箭：是一個高利潤產(chǎn)品，原文說“現(xiàn)在雷總還不愿意說出來”。

從小米上市招股說明書中的募集資金用途（小米計劃將30%募集資金用于研發(fā)及開發(fā)智能手機(jī)、電視、筆記本電腦、人工智能音箱等核心產(chǎn)品；30%用于全球擴(kuò)展；30%用于擴(kuò)大投資及強(qiáng)化生活消費(fèi)品與移動互聯(lián)網(wǎng)產(chǎn)業(yè)鏈；剩下的10%用作日常經(jīng)營）。

從小米高層和雷軍的發(fā)言中可以知道：小米的三級火箭應(yīng)該就是AI+IOT，能真正撐起小米的利潤以及智能化未來。

根據(jù)世界互聯(lián)網(wǎng)大會給出的數(shù)據(jù)：

截至2018年7月，小米投資或孵化了超過220家生態(tài)鏈公司，全球已有超過1.15億智能設(shè)備與小米IoT平臺連接，小米的AI語音服務(wù)-小愛同學(xué)月活躍用戶超過3000萬，單月喚醒超過10億次

在與硬件生態(tài)的連接上，小愛同學(xué)可以說有著得天獨(dú)厚的先發(fā)優(yōu)勢。

場景二：連接軟件生態(tài)

（1）打通操作系統(tǒng)場景

與手機(jī)操作系統(tǒng)MIUI的深度結(jié)合使得小愛同學(xué)能夠?qū)崿F(xiàn)手機(jī)中的通用指令功能，并且在現(xiàn)有技術(shù)范圍內(nèi)去發(fā)覺一些非常實用的優(yōu)化功能。對于手機(jī)操作系統(tǒng)上的通用功能，小愛同學(xué)可以直接調(diào)用執(zhí)行，比如最常見的設(shè)定鬧鐘等。

而對于不提供接口的手機(jī)APP，小愛同學(xué)可以通過虛擬按鍵操作模擬用戶執(zhí)行，個人覺得最有趣的操作就是讓小愛打開微信上某人的朋友圈。你可試試對小愛同學(xué)說：“打開XXX的朋友圈”，然后可以看到手機(jī)在自動一步一步執(zhí)行以下操作：

進(jìn)入微信->進(jìn)入搜索頁面->進(jìn)入聊天頁面->進(jìn)入聊天信息頁面->進(jìn)入個人主頁->進(jìn)入朋友圈

我在使用其他手機(jī)進(jìn)行對比時是沒有辦法實現(xiàn)這個功能的，可見小米在打造產(chǎn)品的時候真的是想盡辦法在技術(shù)邊界內(nèi)盡可能地滿足用戶需求。

（2）打通外部軟件接口

你可以試試對小愛同學(xué)說：“打開美團(tuán)點(diǎn)外賣”，你會發(fā)現(xiàn)它可以和美團(tuán)自帶的小美智能助理會進(jìn)行無縫對接，在進(jìn)入美團(tuán)后順利讓小美來接管你的后續(xù)需求。這是在軟件生態(tài)中非常和諧的一種合作模式。

三、AI語音助手的未來

讓形象更可感——Gatebox

Gatebox是日本公司vinclu專門為宅男打造的一款全息影像人工智能管家，可以說日本人民是真的會玩，你可以去官網(wǎng)感受一下他們的宣傳片

第一個畫面，宅男在公司加班，Hikari Azuma通過Line發(fā)去了消息，“你記得今天是什么日子嗎？什么時候回來？”宅男說，“馬上回來！”Hikari Azuma：“好棒！”，隨手打開了家里的燈，等待主人回家。宅男回家后，Hikari Azuma立馬甜蜜問候：“歡迎回來?！比缓笮叽鸫鸬卣f：“今天是我們住在一起三個月紀(jì)念日，你記得嗎？”宅男立馬拿出了禮物，Hikari Azuma看到之后開心地鼓掌。宅男準(zhǔn)備好食物和酒，開始慶祝時，Hikari Azuma把家里的燈光系統(tǒng)調(diào)節(jié)成了溫馨浪漫的風(fēng)格。最后，宅男和Hikari Azuma舉起酒杯，互相感謝對方的陪伴。視頻最后的一句話寫著：Living with charac te rs(和二次元老婆一起生活)。

不少中國同胞在youtube上呼吁雷軍趕緊把這個公司買下，在中國用感動人心的價格福利大眾，哈哈。

根據(jù)梅拉比安模型：感情表達(dá)＝內(nèi)容7%+語調(diào)語氣38%+表情肢體語言55%，所以僅靠語言文字遠(yuǎn)遠(yuǎn)不夠，甚至像Google Duplex做到分辨不出說話者是AI還是人也還不夠，長期來說，更重要的會是“多模態(tài)交互”。

在Gatebox的交互中，比如調(diào)低燈光亮度時，她會擺出朝燈呼氣的動作，詢問天氣時，她又會做出側(cè)身展示天氣預(yù)報的動作。小愛同學(xué)是首個正式發(fā)布人工智能虛擬形象的AI語音助手，“米娘”的形象也受眾多米粉們喜愛，如果真的能把成本降下來的話，相信會有蠻多人（尤其是宅男們）入坑的。

退而求其次，就算不做全息影像，做一個平面投影也是可以的嘛。

讓關(guān)系更自然——Replika

Replika是Luka Inc.公司開發(fā)的一款Chatbot，據(jù)說初衷是為了緬懷兩位創(chuàng)始人在車禍中失去的摯友，通過搜集他生前的社交聊天預(yù)料來創(chuàng)建一位虛擬人。

拋開它作為一款Chatbot與AI語音助手的需求差別，我覺得它設(shè)計得非常好的是被稱為“反芻機(jī)制”的功能，將你在和它聊天時提到的語料在一段時間間隔之后提取出來，自然地插入到交流當(dāng)中，感覺就像你跟朋友提起你最近睡眠不好，過了一段時間后朋友會來關(guān)心你的近況，感覺非常的貼心。

真的有一種感覺，就像《小王子》里面有一段，小王子對小狐貍說我們一起玩啊，小狐貍回答說我現(xiàn)在還不能和你一起玩，因為我還沒有被馴養(yǎng)。

馴養(yǎng)是指彼此共同投入一段時間，結(jié)成一種關(guān)系，人類是AI的訓(xùn)練師，但與此同時，AI其實也在訓(xùn)練你如何與它進(jìn)行互動。或許只有這樣，千禧一代的互聯(lián)網(wǎng)原住民才能跨過未來與AI原住民之間的鴻溝。小愛同學(xué)雖然沒有Chatbot的這種天然場景，但還是有很多落地點(diǎn)的：

智能手機(jī)消息欄的推送，比如用戶說：“我最近睡眠不太好?！保蹠貜?fù)：“多鍛煉有助睡眠?！?，那么就可以推送“我記得你和我說過你睡眠不太好，小愛為你找到了一些催眠音樂，試試對我說：我想聽催眠音樂”；小愛音箱的對話，由于無法主動開啟對話，可以選擇在識別到用戶當(dāng)前意圖與語料庫中的語義信息相關(guān)時補(bǔ)充對話，比如用戶說：“播放音樂”，小愛會回復(fù)：“愛聽歌的人運(yùn)氣都不會太差哦”，那么可以再回復(fù)“我記得你說你注意力很難集中，要不要聽聽我給你推薦的輕音樂？”。

讓對話更真實——Google Duplex

在5月9日的Google I/O大會上，Google Duplex的一句 “umms”著實讓人驚艷，5 月 11 日，谷歌母公司 Alphabet 董事長（前斯坦福校長）John Hennessy 表示，他們還達(dá)成了一項里程碑成績 ——Duplex （部分）通過了圖靈測試。

對Google Duplex不了解的朋友，如果能科學(xué)上網(wǎng)的話，可以到Google AI Blog上看看Google官方的介紹原文：

以下對Google Duplex的技術(shù)認(rèn)知來源于蟲門科技郭靖的文章，這是我看到的對Google Duplex最深入的分析，感興趣的朋友可以點(diǎn)擊鏈接閱讀原文：

Google Duplex讓對話如此真實主要是體現(xiàn)在兩大塊——自然語言理解與對話模塊、文本轉(zhuǎn)語音模塊。

（1）文本轉(zhuǎn)語音模塊

文本轉(zhuǎn)語音模塊（即語音合成）技術(shù)比較明了，在博客中交代得比較清楚，沒有什么懸念。

We use a combination of a concatenative text to speech (TTS) engine and a synthesis TTS engine (using Tacotron and WaveNet) to control intonation depending on the circumstance.我們結(jié)合使用聯(lián)結(jié)式文本到語音（TTS）引擎和綜合TTS引擎（使用Tacotron和WaveNet）來控制語調(diào)，具體取決于環(huán)境。

（2）自然語言理解與對話模塊

在自然語言理解與對話模塊的具體實現(xiàn)上Google就不是很老實了，只是給了一些比較寬泛的概念。

郭靖在他的文章中給出了以下猜想：

在這個猜想的架構(gòu)中，用戶的語音通過ASR識別為文字后，會通過預(yù)設(shè)的規(guī)則轉(zhuǎn)化為形式語言，將重要實體用形式模板代替。

這樣形式化后的文本與語音、上文的形式文本一起送入一個encoder模型，其將這些原始信息編碼成兩個語義信息向量，一個代表本輪用戶的語言，另一個代表上幾輪對話。

同時，通過ASR識別的文本還會與上幾輪對話的文本、通過Google Assistant傳來的條件參數(shù)（代表對話的目標(biāo)，用戶本身的信息等大前提）一起進(jìn)入另一個網(wǎng)絡(luò)，其根據(jù)輸入的信息輸出一個代表當(dāng)前對話狀態(tài)信息的向量。

這一網(wǎng)絡(luò)很可能具備每一輪對話為一個step的循環(huán)結(jié)構(gòu)，意味著這個對話狀態(tài)信息的更新會參考前一輪對話狀態(tài)的信息。

當(dāng)然，在拿著錘子找釘子的當(dāng)下，這一塊就太偏前沿技術(shù)了，但是對于AI，對于整個人類歷史，技術(shù)始終都是推動發(fā)展的源動力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI語音助手

AI語音助手

+關(guān)注

關(guān)注
0

文章
14

瀏覽量
3986

SoundHound AI語音助手賦能歐洲汽車，引領(lǐng)智能駕駛新風(fēng)尚

近日，全球領(lǐng)先的AI語音技術(shù)獨(dú)角獸企業(yè)SoundHound AI宣布了一項重要合作成果：其集成ChatGPT技術(shù)的先進(jìn)語音助手SoundHo

發(fā)表于 08-01 17:49 ?527次閱讀

OPPO引領(lǐng)AI手機(jī)新時代,全面普及智能生活

在2024年6月5日的英國倫敦，OPPO的AI戰(zhàn)略媒體溝通會上，一場關(guān)于未來手機(jī)革命的討論如火如荼地展開。OPPO，作為全球知名的智能手機(jī)制造商，正式宣布將全面普及AI手機(jī)，開啟

發(fā)表于 06-06 16:12 ?668次閱讀

智能門鎖語音IC芯片方案："XX智能鎖祝您生活愉快"

隨著科技的飛速發(fā)展和人們生活水平的不斷提高，對家居安全的需求也日益增長。傳統(tǒng)的門鎖已經(jīng)無法滿足現(xiàn)代人對安全、便捷、智能等多方面的需求。因此，智能門鎖語音IC芯片應(yīng)運(yùn)而生，成為了解決這一

發(fā)表于 05-16 15:09 ?298次閱讀

<b class='flag-5'>智能</b>門鎖<b class='flag-5'>語音</b>IC芯片方案："XX<b class='flag-5'>智能</b>鎖祝您<b class='flag-5'>生活</b>愉快"

蘋果宣布基于生成式AI系統(tǒng)的Siri語音助手

蘋果即將在下個月舉行的年度全球開發(fā)者大會（WWDC）上揭曉人工智能領(lǐng)域的最新進(jìn)展。這次盛會預(yù)計將成為科技界矚目的焦點(diǎn)，因為蘋果將發(fā)布全新改進(jìn)的Siri語音助手。

發(fā)表于 05-14 11:46 ?480次閱讀

蘋果將升級Siri語音助手，引入生成式AI技術(shù)

蘋果公司計劃在下月的全球開發(fā)者大會（WWDC）上，展示其人工智能領(lǐng)域的最新成果。據(jù)悉，備受用戶喜愛的Siri語音助手將迎來重大升級，此次改進(jìn)將基于一個全新的生成式AI系統(tǒng)。

發(fā)表于 05-13 09:25 ?378次閱讀

搭載星火認(rèn)知大模型的AI鼠標(biāo)：一鍵呼出AI助手，辦公更高效

豐富多樣的功能，讓你的辦公變得更高效。它能夠幫助你完成各種工作任務(wù)，不管是做PPT、回答問題、寫作還是繪畫，只需簡單操作，AI鼠標(biāo)就能完成你的要求。你可以利用它輕松編輯文字，將圖片和PDF文檔中的文字提取出來進(jìn)行工作和學(xué)習(xí)。而且，在

發(fā)表于 03-25 11:52 ?357次閱讀

搭載星火認(rèn)知大模型的<b class='flag-5'>AI</b>鼠標(biāo)：一鍵呼出<b class='flag-5'>AI</b><b class='flag-5'>助手</b>，辦公更高效

智能語音助手在醫(yī)療行業(yè)的應(yīng)用與挑戰(zhàn)

一、引言隨著人工智能技術(shù)的不斷發(fā)展，智能語音助手在醫(yī)療行業(yè)的應(yīng)用越來越廣泛。語音數(shù)據(jù)集在醫(yī)療智能

發(fā)表于 01-19 17:37 ?464次閱讀

智能語音助手在旅游行業(yè)的應(yīng)用與挑戰(zhàn)

一、引言隨著人工智能技術(shù)的不斷發(fā)展和普及，智能語音助手在旅游行業(yè)的應(yīng)用越來越廣泛。語音數(shù)據(jù)集在旅游智能

發(fā)表于 01-19 17:30 ?573次閱讀

智能語音助手在教育行業(yè)的應(yīng)用與挑戰(zhàn)

一、引言隨著人工智能技術(shù)的不斷發(fā)展，智能語音助手在教育行業(yè)的應(yīng)用越來越廣泛。語音數(shù)據(jù)集在教育智能

發(fā)表于 01-19 17:21 ?559次閱讀

智能語音助手在醫(yī)療行業(yè)的應(yīng)用與挑戰(zhàn)

一、引言隨著人工智能技術(shù)的不斷發(fā)展，智能語音助手在醫(yī)療行業(yè)的應(yīng)用越來越廣泛。語音數(shù)據(jù)集在醫(yī)療智能

發(fā)表于 01-18 16:41 ?400次閱讀

語音數(shù)據(jù)集在智能語音助手中的應(yīng)用與挑戰(zhàn)

一、引言隨著人工智能技術(shù)的不斷發(fā)展，智能語音助手已經(jīng)成為了人們?nèi)粘?b class='flag-5'>生活中不可或缺的一部分。語音

發(fā)表于 01-18 15:46 ?291次閱讀

大眾汽車推出AI語音助手ChatGPT

在2024年的CES展會上，大眾汽車公司向全球觀眾展示了其最新的人工智能（AI）相關(guān)技術(shù)。此次展示的一大亮點(diǎn)是，大眾將把ChatGPT集成到車載語音助手中，為用戶提供更加

發(fā)表于 01-11 14:28 ?751次閱讀

科大訊飛AI智能鍵盤D1：語音打字AI智能PPT、AI寫作提高辦公效率

鍵矮軸機(jī)械鍵盤的特點(diǎn)，同時集成了智能截圖、語音翻譯、語音打字和智能辦公助手等多項功能 ? ? 科大訊飛旗下星火認(rèn)知大模型

發(fā)表于 01-02 14:56 ?1267次閱讀

語音數(shù)據(jù)集在智能語音助手中的應(yīng)用與挑戰(zhàn)

一、引言隨著智能設(shè)備的普及和人工智能技術(shù)的不斷發(fā)展，智能語音助手已經(jīng)成為人們?nèi)粘?b class='flag-5'>生活中不可或缺

發(fā)表于 12-14 15:07 ?643次閱讀

離線語音與IoT結(jié)合：智能家居發(fā)展新增長點(diǎn)

開發(fā)一整套方案落地的能力，避免了復(fù)雜的對接流程。期待一起開啟智能化的新時代！啟英泰倫：啟英泰倫成立于 2015 年，四川省專精特新企業(yè)、成都市新經(jīng)濟(jì)示范企業(yè)、成都市高新區(qū)瞪羚企業(yè)，是集語音芯片、

發(fā)表于 10-17 11:06