10月24日已是昨日,但屬于開發(fā)者的1024一直都在——2018 AI開發(fā)者大會就是你的1024。11月8-9日,現(xiàn)場聆聽國內(nèi)外AI大牛的深知灼見,與工業(yè)界AI應(yīng)用思維緊密同步,收獲60+技術(shù)大咖的干貨分享。掃碼填寫大會注冊信息表,就有可能獲得專屬定制版門票(含主會+任一半天分論壇),僅限10人。
毫無疑問,搜狗的大部分 AI技術(shù)已嵌入到搜索和輸入法這兩大“拳頭”產(chǎn)品中。
語音技術(shù)最大的一個落地產(chǎn)品當(dāng)屬搜狗輸入法,它集成了搜狗的語音輸入功能、語音翻譯功能。而在搜索上,主打搜索直達功能背后的智能匹配技術(shù)可以在用戶提出問題后在首條就直接給出最為匹配的答案,而不再單純給出多種結(jié)果。
除了在雙引擎上落地 AI 技術(shù),搜狗也在發(fā)力 B 端政企領(lǐng)域,打造相應(yīng)的 AI 解決方案,比如為一些行業(yè)提供定制的輸入法以及智能客服產(chǎn)品。
當(dāng)然,與其他諸多互聯(lián)網(wǎng)巨頭一樣,搜狗也開始發(fā)力 AI 硬件。比如搜狗的翻譯機,其中結(jié)合了語音識別功能、拍照翻譯功能。翻譯機只是個開始,搜狗 AI 事業(yè)部總經(jīng)理張博告訴AI科技大本營,搜狗接下來會推出幾款不同的智能硬件,這些智能硬件都是搜狗 AI 技術(shù)的大集成、大載體,并且也會著力在 AI 硬件上做一些拓展,爭取讓硬件成為搜狗接下來收入的一個重要來源。
9 月初,在浪潮集團承辦的 2018 人工智能計算大會(AICC )上,張博接受了 AI科技大本營的采訪,講述了搜狗在翻譯機等 AI 硬件上的技術(shù)、產(chǎn)品認(rèn)知和發(fā)展戰(zhàn)略,以下為對話內(nèi)容:
▌翻譯機是搜狗做 AI 硬件的起點
AI科技大本營:無論是翻譯機還是會務(wù)翻譯系統(tǒng)的離線翻譯效果都不太好,與在線翻譯相比主要有哪些技術(shù)挑戰(zhàn)?
張博:離線翻譯確實不好做,它在沒有網(wǎng)絡(luò)的情況下,不能調(diào)用云端的 API 推理接口,只能在終端實現(xiàn)所有計算。
我們知道,翻譯機使用的其實是跟手機類似的 SoC 芯片,而在手機端上要實現(xiàn)一套完整的語音識別、語音合成、機器翻譯和 OCR 這套流程,計算量是非常大的,這種情況下效果一定是比在線要差,因為數(shù)據(jù)、算法都會有一些裁減,包括本身的算力也會低一些。
有了專用 AI 芯片后,離線的翻譯技術(shù)是不是更好?其實不是這樣的,目前國內(nèi)外主流的 AI 芯片公司第一步做的是與圖像相關(guān)的 AI 加速,但沒有跟語音和 NLP 相關(guān)的加速。語音這塊其實是有一些坑的,比如所有 AI 芯片廠商目前都久攻不下 CNN。
那離線情況下怎樣實現(xiàn)更好的結(jié)果?比如一代搜狗翻譯機的手段是專注于旅行這個場景,其實就是我們把數(shù)據(jù)裁減成(與旅行相關(guān)的)數(shù)據(jù)集,就可以得到比較好的結(jié)果。
接下來其實就是拼算法能力,相當(dāng)于在更小的空間復(fù)雜度和時間復(fù)雜度里去做更好的效果,這就看算法工程師的能力了,我們也可以做產(chǎn)學(xué)研的道路,跟學(xué)校做聯(lián)合研發(fā)和攻關(guān)把這件事做好。
提問:現(xiàn)在做翻譯機的企業(yè)都強調(diào)說自己的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)多么好,支持的語音翻譯種類是最多、準(zhǔn)確率最好。但這套說辭太泛了,關(guān)于具體實現(xiàn)條件和使用環(huán)境好像沒有一個比較統(tǒng)一的標(biāo)準(zhǔn)?
張博:這個問題問的很專業(yè)。目前大部分人工智能技術(shù)都沒有一個標(biāo)準(zhǔn)的評測規(guī)范和手段,可能像人臉檢測這種安防領(lǐng)域公安部做了一些標(biāo)準(zhǔn),比如在一個什么樣的條件下,輸入多少張圖片,這些圖片中有多少男、女,多少戴眼鏡。但以語音技術(shù)為核心的領(lǐng)域,目前國內(nèi)沒有什么權(quán)威的評測的機構(gòu)。這個問題正在得到一步一步解決,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟也在推動這種標(biāo)準(zhǔn)的建立,標(biāo)準(zhǔn)的建立有利于整個行業(yè)發(fā)展。
提問:現(xiàn)在翻譯機功能有離線翻譯還有拍照翻譯,甚至嵌入了語音助手等功能,對這款硬件產(chǎn)品來說,以后的發(fā)展走向是更多功能集于一身,還是根據(jù)細分應(yīng)用場景做出適當(dāng)?shù)挠布a(chǎn)品?
張博:這跟整個社會、整個用戶的使用習(xí)慣有關(guān)系,我們知道移動互聯(lián)網(wǎng)之所以能打敗 PC 互聯(lián)網(wǎng),跟智能手機的普及有很大關(guān)系。在智能手機普及之前,大家也沒有意識到手機竟然成了我們?nèi)松铌P(guān)鍵的一部分?,F(xiàn)在其實就已經(jīng)有這樣的爭論,我們已經(jīng)有手機了,為什么還要再去做一個翻譯機。有翻譯機了為什么還要加語音交互,你就會發(fā)現(xiàn)越做越大,越做越亂。
退一步想,如果拿一個翻譯硬件來解決所有交互方式是不是最合理的?我覺得不一定,所以搜狗也在致力于解決這個問題,接下來會推出一系列新的爆款的智能硬件,很有可能就能解決交互的方便性,以及解決到底是再來一個翻譯機還是再來一個手機的問題,結(jié)果就是可能不同的場景有不同的硬件。
提問:一代翻譯機和翻譯筆銷量大概是多少?有道翻譯蛋說賣了 10 萬個。
張博:差不多也是這個數(shù)量,因為這個市場其實目前處于一個早期市場,大家的宣傳還沒有完全打開。
▌比智能音箱體驗要好的智能硬件?
提問:剛剛您提到搜狗會做其他的智能硬件,為什么搜狗到現(xiàn)在都沒有推出智能音箱?
張博:搜狗在某些方面有特立獨行的點,我們既然要發(fā)展智能硬件,肯定會做一些比智能音箱體驗還要好的產(chǎn)品,因為智能音箱從根源上來講畢竟還是跟風(fēng)因素更多一些,大家可能看智能音箱很火,目前國內(nèi)不說上百家也有幾十家智能音箱產(chǎn)品了。但現(xiàn)在智能音箱的發(fā)展情況看起來不是那么樂觀,太亂了。
提問:搜狗認(rèn)為的不樂觀具體指的是什么?
張博:主要是這個產(chǎn)品感覺上用起來其實不一定那么自然、那么爽,它的使用場景有局限。畢竟這里面涉及到的遠場交互、方言這些東西并不一定能得到很好的解決,包括個人隱私也都存在一些問題。
提問:可以介紹一下新的智能硬件?
張博:這個不方便透露,但肯定是跟搜狗核心語音相關(guān),其次它會大幅提升交互的方便性和自然性,翻譯機提升的不夠大,還可以更大。
提問:大概什么時候會發(fā)布?
張博:不超過半年時間。
-
智能硬件
+關(guān)注
關(guān)注
205文章
2328瀏覽量
107392 -
AI芯片
+關(guān)注
關(guān)注
17文章
1851瀏覽量
34860 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1250瀏覽量
24210
原文標(biāo)題:不只翻譯機,搜狗將在半年內(nèi)推數(shù)款智能硬件產(chǎn)品
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論