自蘋果Siri問世以來,智能語音似乎就是一場持續(xù)不斷的技術戰(zhàn)。亞馬遜推出自然生態(tài)語音操控產(chǎn)品Echo智能揚聲器,通過整合Alexa智能語音助手,進一步推動智能語音嵌入式平臺發(fā)展,微軟緊隨其后推出自家Cortana小娜語音助理。為了追趕亞馬遜的步伐,谷歌今年I/O大會上也推出了新一代智能語音Assistant,三星在今年年終的時候也加緊推出Bixby。各家智能語音應用對第三方開發(fā)者開發(fā)更是在年底集體爆發(fā),智能語音大戰(zhàn)一觸即發(fā),未來誰會在智能語音嵌入式平臺獲得長足的進展?
?
蘋果(Siri)
Siri是一家語音公司,成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務為主,隨后通過與全球最大的語音識別廠商Nuance合作,Siri實現(xiàn)了語音識別功能。
2011年,蘋果發(fā)布Siri語音助理,并集成到iPhone 4S中,作為iOS移動操作系統(tǒng)的一部分。
2012年6月12日,蘋果正式發(fā)布Siri中文版本,這是一款定位蘋果產(chǎn)品上的智能語音應用軟件(語音助手),產(chǎn)品涵蓋蘋果iPhone4S、iPad3及以上版本。通過使用Siri語音助手,用戶可以通過聲控、文字輸入方式快速讀取文字語音短信、了解附近餐廳、詢問天氣情況、設置語音鬧鈴等等。
據(jù)悉,iPhone 4S、iPad3、The new iPad的Siri支持中文語音需要iOS6.0及以上版本。
Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預報、日程安排、搜索資料等應用,還能夠不斷學習新的聲音和語調(diào),提供對話式的應答。
在人機互動方面,Siri提供十分生動的對話接口,其針對用戶詢問所給予的回答,也不至于答非所問,有時候更是讓人有種心有靈犀的驚喜。例如使用者如果在說出、輸入的內(nèi)容包括了『喝了點』、『家』這些字(甚至不需要符合語法,相當人性化、、、),Siri 則會判斷為喝醉酒、要回家,并自動建議是否要幫忙叫出租車。
具體來說,Siri有以下幾大功能:
1、用 Siri 播放隨機音樂
通過用戶導入本機音樂到“最愛”播放列表,開始播放音樂并告訴Siri播放哪一首歌、哪一個歌手曲目,Siri將會自動匹配最愛歌曲列表,實現(xiàn)歌曲隨機播放功能。
2、告訴Siri想去哪
查找路線還需要手動輸入文字?Siri會自動根據(jù)用戶語音調(diào)取Google地圖來尋找最優(yōu)路線方案,并及時反饋給用戶。
3、Siri代替手輸發(fā)送短訊
在外走路的時候不方便手動輸入短信息,想輸入短訊內(nèi)容時調(diào)取Siri語音即可。
4、Siri天氣預報
想知道最近天氣如何?問問Siri就知道了,一般情況Siri都能夠正確理解。
5、Siri智能鬧鐘
按住蘋果Home鍵并告訴Siri幾點叫醒,到預定時間Siri將會準點叫醒。
6、支持新浪微博發(fā)送
7、Siri地點提醒
Siri除了“家”和“上班”兩個地點精準定位外,用戶途徑某個經(jīng)常光顧的地方,說“這里”并設置好提醒,Siri在往后預定時間內(nèi)將會再次提醒。
8、使用Google日歷安排日程
9、Siri進行答疑解惑
比如說:珠穆朗瑪峰現(xiàn)在多高?美國去年的GDP是多少?等諸如此類的科普、生活問題,Siri都會通過知識引擎尋找答案并給你反饋最終結(jié)果。
10、尋找一家合適的咖啡廳
另外,在今年6月的WWDC 2016大會上,蘋果發(fā)布了面向開發(fā)者的最新語音助手SiriKit,Siri不再局限于剛開始的基本聊天、打電話發(fā)短信基礎功能。SiriKit演進到用戶可以通過喚醒語音
,并能把用戶語音識別及語意分析后,進行應用調(diào)取、聯(lián)系人郵件匹配發(fā)送、照片搜索、個人照片搜索、個人付款、外出打車車載語音應用控制等多種應用,用戶語音意圖識別度方面也會更精確、更加匹配。
今年10月份,蘋果Siri在iOS10發(fā)布時,正式開放了部分第三方應用。
亞馬遜(Alexa)
亞馬遜開發(fā)Echo以及Alexa服務的項目可以追溯到2011年,這遠遠早于產(chǎn)品公之于眾的時間。Alexa機器學習的副主管兼首席科學家Rohit Prasad表示:“創(chuàng)建Alexa的靈感來源于Star Trek計算機?!睋Q句話說,亞馬遜希望創(chuàng)造出一個可以與有智慧的人類進行交流的計算機界面。
亞馬遜認為,Echo不應當僅成為一個聲控揚聲器,而是應該要徹底摒棄顯示屏。這意味著Alexa不單強調(diào)通過聲音進行控制,還依靠聲音進行100%控制。同時,Alexa項目的開發(fā)要求Alexa需要增強在機器學習及人工智能領域的專業(yè)技能。
2014年11月6日,亞馬遜正式推出Echo智能揚聲器以及聲控助手服務Alexa。據(jù)悉,Echo智能揚聲器是亞馬遜第一款引進支持Alexa語音助手設備。與當時蘋果推出Siri語音助理不同的是,亞馬遜將Echo定位為一款可以回應簡單指令的智能揚聲器。用戶通過重復喚醒詞匯來叫醒Alexa,通過Echo遠場麥克風的作用,捕捉每一個任何位置發(fā)出的正常對話聲音,并在Alexa獲取相關語音指令之后作出相應回復。
Alexa設備相比于從口袋中拿出手機更加方便,只需要在房間內(nèi)直接配備麥克風即可。
2015年7月,亞馬遜正式對所有用戶公開出售Echo智能揚聲器,如今Echo已經(jīng)成為一個炙手可熱的消費類電子設備。根據(jù)第三方市場研究表示,Echo市場份額已經(jīng)已經(jīng)超越了頂尖的揚聲器制造商,如Bode、Logitech以及Sonos等。
從2016年1月份開始,Alexa掌握的技能已經(jīng)從原來的135個,增加到如今的4000個。譬如:你可以支付Capital One信用卡賬單,你可以要求獲得BBC的新聞簡訊,你可以詢問Good Housekeeping如何去除地毯上的紅酒污漬,你還可以讓Alexa假裝發(fā)出放屁聲。
亞馬遜推出Echo之后,繼續(xù)大力推廣Alexa。這跟谷歌的做法類似:在推出開發(fā)系統(tǒng)安卓平臺以后,就相繼推出了谷歌Nexus系列手機。谷歌做手機的目的從來就不是要成為智能手機的主要制造商,而是想利用Nexus來證明安卓的出色性能,并鼓勵其他手機制造商也使用安卓系統(tǒng)。Alexa智能揚聲器的新設計,將Alexa智能語音控制嵌入到許多智能音箱產(chǎn)品中,未來也會在很多電子設備上面看到嵌入的Alexa語音界面。
Alexa在無須打開屏幕或是按下按鈕就可以啟動,但同時也存在一系列的使用問題。如克服一些技術、設計以及社會性的難題。比如隱私問題,為了確保Alexa能被喚醒詞匯時候能夠聽到,就必須保持一直聆聽的狀態(tài),雖然亞馬遜方面表示用戶在說出“喚醒詞匯”之前的任何對話都不會被記錄及存儲下來。而且Alexa目前還無法獲悉能完成多少技能,這或多或少需要Alexa變得更加人工智能后可以準確預測用戶需要的技能,并在對話中直接告訴你。
微軟(Cortana)
Cortana中文名字叫做“小娜”,是微軟隨win10系統(tǒng)推出的個人語音助理。
據(jù)悉,安卓版“小娜”公測beta版早在2015年8月的時候已經(jīng)推出,針對iPhone版的Cortana app測試也在當年11月初開始公眾測試版本。
2015年12月10日,微軟小娜Cortana的iOS、Android以及CM系統(tǒng)版本正式版已經(jīng)在國內(nèi)5家主要應用商店——騰訊應用寶、百度手機助手、小米手機助手、華為應用市場和360手機助手聯(lián)合首發(fā)。Cortana推送僅限于中國和美國兩國使用,并且僅支持iOS 8及以上版本的iPhone,以及Android 4.1.2及以上版本的Android設備。
根據(jù)微軟官方表示,智能機跟PC端的小娜一樣,擁有同樣的智能。既可以查收各類信息,又可以提供有用的建議。不過在iOS和Android系統(tǒng)上,Cortana在部分功能和喚醒方式上還是打了折扣。例如iOS系統(tǒng)上無法實現(xiàn)Windows手機包括控制系統(tǒng)設置的選項、打開各類應用程序、以及在系統(tǒng)內(nèi)的任意位置通過“你好,小娜”的語音來喚醒微軟小娜。
微軟小娜“能夠了解用戶的喜好和習慣”,“幫助用戶進行日程安排、問題回答等”。Cortana 可以說是微軟在機器學習和人工智能領域方面的嘗試。它會記錄用戶的行為和使用習慣,利用云計算、搜索引擎和“非結(jié)構(gòu)化數(shù)據(jù)”分析,讀取和“學習”包括手機中的文本文件、電子郵件、圖片、視頻等數(shù)據(jù),來理解用戶的語義和語境,從而實現(xiàn)人機交互。
2016年12月9日,微軟發(fā)布了安卓版Cortana2.0.1版本更新,新的安卓版微軟小娜采用了全新的UI設計,更加簡潔易用。此外在功能上,可以關聯(lián)手機日歷賬戶,同步日程安排等。
全球四大科技巨頭都在爭食智能語音控制市場,微軟小娜Cortana自然也不會落后,在今年12月中旬,微軟Alexa已經(jīng)對第三方硬件正式開放,這意味著外部設備也能夠利用Alexa進行操控。
微軟宣布將面向外部設備廠商提供相關的開發(fā)包(New Devices SDK),從而讓他們植入小娜。比如外部廠商Harmon Kardon將會在明年推出基于小娜的智能音箱產(chǎn)品。
此處Cortana對外開放,微軟Cortana推出New Skills Kit和Devices SDK,兩者基本對應于亞馬遜Alexa的技能工具包和語音服務。第三方硬件制造商也可以利用Cortana Devices SDK,來構(gòu)建包含Cortana板載的小工具,從而開發(fā)出其定制化的設備。
谷歌助手(Assistant)
谷歌今年在智能語音方面發(fā)生了一個非常重要的大事,大家猜猜看是什么?沒錯,就是2016年谷歌I/O大會上,谷歌正式發(fā)布了其首款智能語音系統(tǒng)Google Assistant(谷歌助手),此處發(fā)布也是谷歌史上的一個重要轉(zhuǎn)折點。Assistant正式登場,也為谷歌接下來的新產(chǎn)品,奠定了語音識別與人工智能的基調(diào)。
Google Assistant 可以控制智能手機、智能手表以及其他設備,通過使用自然語言與用戶對話,用于尋找信息、播放媒體內(nèi)容、執(zhí)行買電影票等任務。它能夠在不斷對話之中為你解決問題,而不像之前那樣只能用簡單的提問和回答。它還能完整地理解上下文語境,圍繞一個話題陪你一直聊下去,而不是你問一句它回一句。應該說,這是目前最為智能的語音助手。從發(fā)表的 DEMO 來看 Google Assistant 能幫你尋找頭條新聞,幫你尋找最快的路徑,打電話給聯(lián)絡人,甚至直接在照片應用 app 中尋找并向朋友分享照片。
其中一個例子是,當你問 Google 今晚有什么電影時,Google Assistant 先會告訴你答案,緊接著當你說會有孩子要去看電影時,Google 還會自動排除限制級的影片,當你口頭確定后,Google 不僅把取票二維碼發(fā)給你,還會為你呈現(xiàn)電影的影評。
Google Assistant 可以兼容第三方服務,包括 Ticketmaster、Spotify、Uber 以及 Whatsapp 等,但是亞馬遜的 Alexa在這個領域已經(jīng)占據(jù)優(yōu)勢。分析師認為 Google Assistant 可以幫助谷歌更有效地與亞馬遜Echo設備對抗,同時與其他個人助理 Siri、Cortana 以及 Alexa 競爭。
12月8日,谷歌還推出了Conversation Actions系統(tǒng)工具,該工具可以幫助開發(fā)者構(gòu)建與Google Assistant配合使用的聊天機器人。據(jù)了解,通過讓第三方與聊天機器人進行與Google用戶互動的方式,聊天機器人可以進行問答,最終則能幫助銷售,做一些預訂方面的事。
12月9日,谷歌正式準備面向第三方應用程序開發(fā)商開放其語音助手Assistant。通過與第三方應用程序整合,會讓谷歌Assistant在迅猛發(fā)展的語音助手領域變得更有競爭力。
三星(Bixby)
本來只有蘋果、亞馬遜、微軟、谷歌四家科技巨頭在智能語音領域方面占據(jù)主導,但不得不提的是三星今年在智能語音控制方面也投入了不少的精力,在人工智能領域,發(fā)力的可不僅僅只是老生常談的幾家,眾多廠商已經(jīng)意識到智能語音領域未來潛在的無限能力和發(fā)展前景。
今年10月份,三星正式收購美國機器學習虛擬助手初創(chuàng)公司Viv Labs Inc。同時,還收購了Harman,位于美國紐約哈曼集團旗下一個專門生產(chǎn)家用及車用音響的品牌,這些舉措進一步表明三星未來在人工智能語音方面做大的決心。
Viv Labs是蘋果Siri創(chuàng)始團隊之一,也是一家專做人工智能和虛擬助手的公司。被三星收購后,Viv Labs也帶去了最新的人工智能語音助手產(chǎn)品Viv。
據(jù)了解,Viv Labs由Siri 之父”戴格·吉特勞斯創(chuàng)辦,是一家致力于打造開放式人工智能助理平臺。
在三星的一份未來計劃報告中顯示,2017年Viv Labs旗下人工智能平臺Viv即將整合到蓋樂世智能手機中,并將語音輔助服務拓展至家電及可穿戴高科技設備。
根據(jù)最新消息稱,三星明年4月發(fā)布的三星Galaxy S8將使用上全新人工智能語音助手Bixby,Bixby基于Viv人工智能引擎,并會出現(xiàn)在Galaxy S8幾乎所有預裝應用中,實現(xiàn)系統(tǒng)級的整合,全面取代現(xiàn)在的S Voice。
同時,Galaxy S8人工智能助理將面向開發(fā)者開放,從而能夠集成更多的新功能,并與第三方服務進行交互。
屆時,Bixby語音助手更加先進和智能,可以根據(jù)使用環(huán)境提供答案、輔助,比如在相冊中,你可以讓它展示滿足特定條件的照片和視頻。
小編總結(jié)
隨著四大科技巨頭蘋果Siri、亞馬遜Alexa、微軟Cortana、谷歌Assistant,還有后來者三星Bixby紛紛入局智能語音控制,智能語音嵌入式界面將會是打通語音控制的一個重要的接入點。智能語音開源將是未來語音平臺發(fā)展的下一代計算平臺,人工智能技術的崛起也將進一步帶動智能語音的迅速發(fā)展。
評論
查看更多