王小川介紹,AI開(kāi)始使得搜狗搜索和輸入法更上一個(gè)臺(tái)階,搜狗要打造以語(yǔ)言為核心的人工智能布局。本次會(huì)議,王小川還發(fā)布兩款A(yù)I產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆。
搜狗有兩大核心產(chǎn)品:搜狗搜索和搜狗輸入法。搜狗搜索是中國(guó)第二大搜索引擎,搜索份額占17.8%,也是全球第三大搜索引擎。同時(shí)搜狗搜索也在非??斓卦鲩L(zhǎng),最近三年在移動(dòng)端搜索流量上漲470%。
搜狗輸入法是全球最大的輸入法,每年有超過(guò)900億次中文輸入次數(shù),是手機(jī)第三大應(yīng)用,僅次于微信和QQ,過(guò)去三年移動(dòng)端日活用戶增長(zhǎng)136%。
1月24日下午,2018搜狗合作伙伴大會(huì)在北京國(guó)貿(mào)大酒店舉行。搜狗CEO王小川難掩內(nèi)心之愉悅與輕松。因?yàn)榫驮谝粋€(gè)多月前(確切地說(shuō)是2017年11月9日),搜狗成功登陸紐交所,首日市值53億美元。
王小川介紹,AI開(kāi)始使得搜狗搜索和輸入法更上一個(gè)臺(tái)階,搜狗要打造以語(yǔ)言為核心的人工智能布局。本次會(huì)議,王小川還發(fā)布兩大AI產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆。
以語(yǔ)言為核心的人工智能布局
搜狗以語(yǔ)言為核心,分成兩個(gè)層面。一方面叫做自然交互,即語(yǔ)音識(shí)別、語(yǔ)音合成,還有圖像識(shí)別和合成;另一方面是知識(shí)計(jì)算,比如問(wèn)答技術(shù)、翻譯技術(shù)。這些技術(shù)在搜狗里面進(jìn)行落地,并且開(kāi)放給一些合作伙伴共建這樣生態(tài)。
具體而言,搜狗的AI布局可以分為五個(gè)方面:聽(tīng)覺(jué)、視覺(jué)、對(duì)話、問(wèn)答、翻譯。
1、聽(tīng)覺(jué)
包括語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別。王小川介紹,搜狗語(yǔ)音識(shí)別是全球最大在線語(yǔ)音識(shí)別提供商,每天有三億次語(yǔ)音識(shí)別請(qǐng)求,服務(wù)量數(shù)據(jù)巨大,輸入法也有豐富的場(chǎng)景。
除語(yǔ)音識(shí)別以外,搜狗也會(huì)做語(yǔ)音合成技術(shù),在語(yǔ)音合成當(dāng)中也有個(gè)性化能力,還提供核心的情感遷移技術(shù)。
2、視覺(jué)
包括OCR/識(shí)圖、唇語(yǔ)識(shí)別和狗臉識(shí)別。圖像識(shí)別和合成也是和語(yǔ)言相關(guān)的能力,第一方面就是OCR,搜狗每天有超過(guò)兩百萬(wàn)次OCR請(qǐng)求,搜狗提供語(yǔ)音輸入、輸入鍵盤(pán)和OCR,只要一拍一掃描,就能用文字高速識(shí)別和輸入。
唇語(yǔ)識(shí)別即將語(yǔ)音和圖像結(jié)合,去年在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上搜狗發(fā)布了唇語(yǔ)識(shí)別系統(tǒng),這套系統(tǒng)通過(guò)圖像,不需要麥克風(fēng),只需要攝像頭打在你的嘴上,通過(guò)后面圖像模型和后面語(yǔ)言模型獲得所有內(nèi)容。今天唇語(yǔ)識(shí)別能力大大超越超過(guò)人。
跟圖像更多有關(guān)系的地方,是定向的個(gè)性優(yōu)化,做狗臉識(shí)別,給你愛(ài)犬拍照,系統(tǒng)會(huì)精確告訴你是什么狗,搜狗會(huì)把這個(gè)技術(shù)放在搜索引擎里面去提供能力。
3、 問(wèn)答、對(duì)話
王小川說(shuō):“在過(guò)去十年中我們做了很多,包括問(wèn)答技術(shù)、對(duì)話技術(shù),不斷跟我們搜索引擎和輸入法進(jìn)行結(jié)合?!?/p>
輸入法會(huì)走向?qū)υ?,IPO那會(huì)兒,他每天一起床就有上千條微信發(fā)過(guò)來(lái),如果輸入法能夠根據(jù)上下文,以個(gè)性化方式生成有自己特色的回答,讓人選擇,會(huì)非常有幫助。
經(jīng)過(guò)高考人都知道,我們做填空題比選擇題難度更大,選擇題讓你選輕松很多,輸入法其中一個(gè)路徑是把這樣一個(gè)讓大家輸入的填空題,變成了選擇題。
4、翻譯
王小川表示,翻譯技術(shù)走向?qū)嵱没粊営谌祟惏l(fā)明電,同樣是歷史突破,今天各個(gè)國(guó)家沖突,各個(gè)之間不信任是因?yàn)檎Z(yǔ)言和文化引起,一旦翻譯技術(shù)被解決掉,我們可以很容易獲得全球信息,國(guó)外人也知道我們的內(nèi)容,世界會(huì)發(fā)生變化。
搜狗的使命是讓表達(dá)和獲取信息更簡(jiǎn)單,有了翻譯技術(shù)之后有了新的更大的進(jìn)展,實(shí)現(xiàn)讓跨國(guó)表達(dá)和獲取信息變得更簡(jiǎn)單。
發(fā)布兩大AI產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆
目前市場(chǎng)上的AI翻譯產(chǎn)品大部分是云端翻譯,難以解決上網(wǎng)要漫游費(fèi)和網(wǎng)絡(luò)不穩(wěn)定的問(wèn)題。搜狗旅行翻譯寶、搜狗速記翻譯筆結(jié)合了神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯、語(yǔ)音識(shí)別、麥克風(fēng)陣列、圖像識(shí)別等多項(xiàng)技術(shù)。
王小川說(shuō),搜狗有自己的離線翻譯技術(shù),而且使得這樣一個(gè)技術(shù)在終端設(shè)備里面執(zhí)行,在離線模式下壓縮,使離線模型壓縮是在線模型的五分之一,在手機(jī)或者其它終端里面,壓縮程度為三十五分之一。這樣儲(chǔ)存問(wèn)題和識(shí)別得到解決,模型精度接近無(wú)損,并且實(shí)時(shí)響應(yīng),這也是業(yè)界領(lǐng)先的神經(jīng)網(wǎng)絡(luò)壓縮技術(shù)。
搜狗旅行翻譯寶主要解決了出境旅游時(shí)翻譯APP存在的“網(wǎng)絡(luò)不好”與“翻譯不準(zhǔn)”兩大痛點(diǎn),支持文本翻譯、對(duì)話翻譯、語(yǔ)音翻譯、實(shí)景翻譯等多種翻譯模式,中英離線翻譯能力讓用戶在未聯(lián)網(wǎng)時(shí)也能使用。
在離線圖像識(shí)別里面,要求服務(wù)器在沒(méi)有網(wǎng)絡(luò)情況下也可以工作,而且要解決很多實(shí)景問(wèn)題,比如在拍路牌和菜單的時(shí)候,圖片里面會(huì)有復(fù)雜背景,有光線問(wèn)題,圖片還可能扭曲有弧度,搜狗是先在翻譯APP里面做嘗試,進(jìn)行數(shù)據(jù)優(yōu)化,然后放在離線翻譯機(jī)里面。
翻譯筆則針對(duì)了外語(yǔ)學(xué)習(xí)場(chǎng)景,同傳語(yǔ)音翻譯實(shí)現(xiàn)實(shí)時(shí)對(duì)話,即說(shuō)即翻的功能。兩款產(chǎn)品均搭配了雙麥克風(fēng)陣列降噪,讓語(yǔ)音識(shí)別與翻譯更準(zhǔn)確,同時(shí)提供英日韓俄德等17種翻譯語(yǔ)言,覆蓋主要出游國(guó)家。目前,搜狗旅行翻譯寶定價(jià)為1498元,搜狗速記翻譯筆定價(jià)299元,將于3月12日在京東首發(fā)。
-
搜狗
+關(guān)注
關(guān)注
0文章
90瀏覽量
13907 -
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268103 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237073
原文標(biāo)題:王小川:搜狗以語(yǔ)言為核心的人工智能布局
文章出處:【微信號(hào):gh_211d74f707ff,微信公眾號(hào):重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論