云知聲對比科大訊飛人工智能語音技術
隨著科技的進步,人工智能在今天,早已不是一個現(xiàn)實中難以觸及的概念,伴隨智能家居、車聯(lián)網(wǎng)、甚至是VR產品的涌現(xiàn),人工智能的未來也有了更多可探索的方向。
從人機交互形式出發(fā),語音識別無疑是人工智能產品與用戶之間,最便捷有效的交流形式。
12月16日,年關將至,專注人工智能領域,擁有全球頂尖語音識別技術的業(yè)界新銳云知聲,在京舉辦了年度品牌發(fā)布會,以“看見聲音的價值”為主題解釋了語音技術對人工智能非凡的含義,而聲音價值的背后,毫無疑問,是不斷升級的技術。
當今的移動互聯(lián)網(wǎng)領域,語音服務已經(jīng)變得越來越重要,在移動端,語音輸入由于具有相對于敲字鍵入的便捷與高效性,無疑已經(jīng)成為趨勢。而在不少創(chuàng)業(yè)者和投資人眼中,傳統(tǒng)的搜索已成為過去時,基于語音、語義的搜索和應用服務才是未來。
近日國內知名企業(yè)搜狗,對于語音服務技術支持的選擇也成為業(yè)內的焦點話題,其推出的“搜狗語音助手”首先選擇了一家新興企業(yè)——“云知聲”,隨后又植入第二家公司——“科大訊飛”作為支持,筆者將會在下文中對二者的表現(xiàn)做一些簡單的對比測試,讓大家能夠深入了解其性能。
近日筆者在業(yè)內發(fā)現(xiàn)殺出一匹黑馬,一家開放共贏的新興企業(yè),有一個詩情畫意的名字——云知聲。這家在2012年6月成立的公司,并沒有“國企范兒”,而是秉承開放的心態(tài),作為技術服務提供商,提供根植于移動互聯(lián)網(wǎng)的專業(yè)語音識別服務。
主流語音識別對比小測試
日前,國內知名企業(yè)搜狗與科大訊飛、云知聲合作,推出“搜狗語音助手”插件。據(jù)有關人士透露,搜狗也曾在兩家公司之間難于選擇,畢竟云知聲作為一家成立只有半年多的創(chuàng)業(yè)公司,在業(yè)內還未得到足夠的重視,相較于發(fā)展10余年的科大訊飛,云知聲的成績還是鮮為人知。但兩家公司在技術實力方面旗鼓相當,在同款“搜狗語音助手”上的表現(xiàn)也不相上下。最終的結果是,搜狗在2012年11月首發(fā)時是選擇了云知聲,數(shù)月后才又加上了科大訊飛。
接下來,筆者將兩家公司對于同款產品“搜狗語音助手”的技術服務支持做一個對比小測試,看一家從2009年開始從事語音識別技術的老牌企業(yè)——科大訊飛,與一家容納國內10年實驗室技術團隊的新銳企業(yè)——云知聲,在反應速度、識別能力和譯字準確率方面的表現(xiàn)如何。
在本次的測試中,筆者的全部語音是使用相同循環(huán)錄音進行輸入,以保證對比的公平性和準確性。
【測試1】首先我們來看看在“搜狗語音助手”中,二者的集成方式有何區(qū)別。具體顯示結果:
圖1、云知聲語音輸入界面圖2、科大訊飛語音輸入界面
測試1結果:從上圖中我們可以清晰地看到,科大訊飛采用了傳統(tǒng)語音輸入的模式,彈出獨立對話框進行語音輸入。而云知聲則是可定制的界面,在搜狗語音助手中是完全嵌入式語音輸入,在同一界面中即可完成輸入。當然,這樣集成方式上的區(qū)別,就見仁見智了,筆者還是更傾向于嵌入式的音頻顯示,看起來更加清晰明了,不會覆蓋前面的對話內容。
【測試2】專業(yè)詞匯。詞匯類別:軟件開發(fā)。測試語句為:“軟件設計包括設計軟件的功能和實現(xiàn)的算法和方法、軟件的總體結構設計和模塊設計(普通話)”,得到以下測試結果,
測試2結果:通過專業(yè)詞匯測試看出,二者對于中文普通話的識別率比較高,只要發(fā)音夠標準,云知聲的語音識別準確率幾乎可達100%,另外對于整句話的邏輯性和條理性也非常清晰,專業(yè)詞句也能夠準確識別,并沒有出現(xiàn)任何錯別字。但科大訊飛在這輪的比拼中卻略顯劣勢,邏輯性欠佳,并有錯別字出現(xiàn)。
另外在測試中,筆者可以感受到云知聲的反應速度是很快的,而科大訊飛可能要稍遜一籌。
【測試3】循環(huán)演說。測試內容為:“在微博網(wǎng)友中流傳著一種‘黃金雞蛋‘做法,讓不少人躍躍欲試。瘋狂地晃動你手中的生雞蛋,將蛋黃和蛋清混合,帶殼煮熟后,你就得到了一個’黃金雞蛋‘!這種蛋兒童更易使用,不會把蛋黃末弄得到處都是。但是經(jīng)過不少網(wǎng)友實踐,似乎很難將蛋黃蛋清搖勻!求專家解答!你試過嗎?(普通話連續(xù)說兩遍)”,這樣大段的內容陳述,看看結果如何
測試3結果:從測試結果上來看,科大訊飛的輸入時間是有一些限制的,對于大段文字的輸入,訊飛可能還要擴充一下輸入時間的限制范圍。另外,在識別準確度上,云知聲變現(xiàn)的更為突出,幾乎沒有錯別字的出現(xiàn)。細心的朋友可能還會發(fā)現(xiàn),用云知聲輸入的內容,有很好的“斷句”,不會有冗長的句式出現(xiàn)。
【測試4】方言測試。方言語種為武漢話,測試語句為“搜狗語音輸入插件”。測試結果
測試4結果:通過方言測試看出,兩款插件對方言的識別情況欠佳,識別出來的語句基本沒有任何調理和邏輯性。這也不奇怪,就算在現(xiàn)實溝通中,一個北方人到南方,也會經(jīng)常有一些聽不懂南方地區(qū)方言的情況出現(xiàn)。
【測試5】中英文混淆測試。測試內容為:“ipad mini真好看,I want to buy it”,這樣大段的內容陳述,看看結果如何,如圖11、圖12:
測試5結果: 從中英文混淆輸入的測試結果中我們可以看到,科大訊飛能夠準確辨別中英文,做出正確的判斷及輸出。而新生的云知聲在對于中英文混合的識別準確率還有待提升。相比之下,科大訊飛不愧是有著數(shù)年的積累,云知聲還應該繼續(xù)努力,積累完善自己的技術。
-
語音技術
+關注
關注
2文章
225瀏覽量
21260 -
科大訊飛
+關注
關注
19文章
789瀏覽量
61147 -
云知聲
+關注
關注
0文章
163瀏覽量
8359
發(fā)布評論請先 登錄
相關推薦
評論