云知聲創(chuàng)始人黃偉
黃偉中,科大博士,上海交大生命科學(xué)技術(shù)學(xué)院博士后,畢業(yè)后任職摩托羅拉中國(guó)研究中心資深研究員,期間開(kāi)發(fā)出了世界第一款手機(jī)聲紋認(rèn)證系統(tǒng)。后出任盛大創(chuàng)新院核心高管,并創(chuàng)建了語(yǔ)音分院。2013年底加入國(guó)內(nèi)人工智能引領(lǐng)企業(yè)云知聲任職首席執(zhí)行官,負(fù)責(zé)云知聲發(fā)展戰(zhàn)略和運(yùn)營(yíng)管理戰(zhàn)略規(guī)劃。自1999年起參與項(xiàng)目研究至今已獲得涉及醫(yī)療、管理信息系統(tǒng)、自然科學(xué)、語(yǔ)音、游戲等多個(gè)領(lǐng)域的產(chǎn)品成就,例如在2002到2004年間參與美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)署說(shuō)話人識(shí)別評(píng)測(cè)(NIST SRE)項(xiàng)目獲SRE主任務(wù)第一名,并獲得當(dāng)年最高的“金星獎(jiǎng)”,也是現(xiàn)如今唯一一位能夠在NIST評(píng)測(cè)中連續(xù)兩年做keynote speaker的華人。獲MIT TR35 2007年度提名,2009年獲上海市十佳科技創(chuàng)業(yè)領(lǐng)軍人才。
云知聲創(chuàng)始人黃偉的成就
當(dāng)你還無(wú)法察覺(jué)的時(shí)候,很多改變?nèi)祟?lèi)的新技術(shù)已經(jīng)在無(wú)聲無(wú)息中蛻變、成長(zhǎng),誕生于上世紀(jì)50年代的人工智能就扮演著這樣的角色。
“互聯(lián)網(wǎng)女皇”瑪麗·米克爾在報(bào)告中大篇章的描述了語(yǔ)音識(shí)別交互帶來(lái)的改變,人工智能成為科技發(fā)展的重頭戲已經(jīng)毋庸置疑,物聯(lián)網(wǎng)場(chǎng)景下的應(yīng)用需求在不斷擴(kuò)大,智能語(yǔ)音技術(shù)在智能家居、智能汽車(chē)、教育等領(lǐng)域的應(yīng)用逐步深入,帶動(dòng)著智能語(yǔ)音產(chǎn)業(yè)規(guī)模的持續(xù)快速增長(zhǎng)。
黃偉表示,PC互聯(lián)網(wǎng)時(shí)代,聯(lián)網(wǎng)設(shè)備主要是PC,移動(dòng)互聯(lián)網(wǎng)時(shí)代,聯(lián)網(wǎng)設(shè)備主要是手機(jī)或平板。而到IOT時(shí)代,一切設(shè)備都可能聯(lián)網(wǎng),IOT聯(lián)網(wǎng)最大的特點(diǎn)是沒(méi)有屏幕,不像手機(jī)平板那樣以觸碰為主,第二,設(shè)備離人比較遠(yuǎn),這時(shí)候我們就希望用一種完全自然的,像人和人對(duì)話的方式來(lái)控制它們,所以,語(yǔ)音識(shí)別就成了解決這一痛點(diǎn)的最佳方案。
兩年的技術(shù)探索
2012年成立云知聲的時(shí)候,我們的具體方向仍然未定。當(dāng)時(shí)看到了移動(dòng)設(shè)備的飛速發(fā)展,我們認(rèn)為可能未來(lái)在智能設(shè)備上,聲音會(huì)成為一種重要的交互方式。
當(dāng)時(shí)的數(shù)據(jù)庫(kù)非常的小。于是我們便一邊做數(shù)據(jù)搜集,一邊升級(jí)我們的算法。云知聲2012年6月成立,3個(gè)月后我們發(fā)布了基于傳統(tǒng)統(tǒng)計(jì)模型的第一代引擎。
我們的第一代引擎,將準(zhǔn)確率提升到了85%。當(dāng)時(shí)業(yè)界的領(lǐng)軍者科大訊飛(55.330, -1.79,-3.13%)的準(zhǔn)確率是80%。
2個(gè)月后我們的深度學(xué)習(xí)引擎上線,準(zhǔn)確率提升到了91%。基于這個(gè)引擎,我們開(kāi)發(fā)了微信上第一款語(yǔ)音輸入插件。插件上線第一周,激活用戶(hù)數(shù)超過(guò)5萬(wàn)。
我們開(kāi)發(fā)了一個(gè)開(kāi)放的平臺(tái),任何人、任何組織只要在我們的平臺(tái)上注冊(cè),就可以免費(fèi)使用我們的SDK(軟件開(kāi)發(fā)工具包)。在你的APP里接入我的SDK,就可以免費(fèi)調(diào)用我們的服務(wù)。
2013年底,我們的這個(gè)平臺(tái)上,接入的企業(yè)客戶(hù)數(shù)量達(dá)到接近一萬(wàn)家。我們靠著這些用提供的數(shù)據(jù),不斷的進(jìn)行數(shù)據(jù)迭代和算法優(yōu)化,我們的準(zhǔn)確率提升到了94%。如今,這個(gè)平臺(tái)上的企業(yè)客戶(hù)數(shù)達(dá)到了三萬(wàn)家。
依托物聯(lián)網(wǎng)的商業(yè)化之路
云知聲成立之初的2年,主要精力都用在對(duì)技術(shù)模式的探索上。到了2014年,我們逐漸意識(shí)到,再好的技術(shù),只有當(dāng)它變成對(duì)用戶(hù)有價(jià)值的產(chǎn)品時(shí),它才有商業(yè)價(jià)值。于是我們開(kāi)始考慮商業(yè)化的路應(yīng)該怎么走。
2014年時(shí),我們開(kāi)始規(guī)劃云之聲未來(lái)的定位,定位是產(chǎn)品模式和業(yè)務(wù)模式的基礎(chǔ)。我們發(fā)現(xiàn)留給創(chuàng)業(yè)者的空間不多了,APP的紅利期已過(guò),流量掌握在BAT手中。做與科大訊飛雷同的業(yè)務(wù),我們沒(méi)有科大訊飛身后強(qiáng)大的政府支持,很難在競(jìng)爭(zhēng)中勝出。
最終,我們決定做物聯(lián)網(wǎng)(LOT)。物聯(lián)網(wǎng)在當(dāng)時(shí)是一個(gè)新興業(yè)務(wù),當(dāng)時(shí)BAT沒(méi)有涉及,科大訊飛也沒(méi)有相關(guān)的布局。再加上行業(yè)內(nèi)沒(méi)有已經(jīng)成功的壁壘,我們由此切入再適合不過(guò)。
此外,移動(dòng)互聯(lián)網(wǎng)總有觸及天花板的一天。 當(dāng)移動(dòng)互聯(lián)網(wǎng)觸及天花板的時(shí)候,一定會(huì)有新的機(jī)會(huì)出現(xiàn)。我們認(rèn)為物聯(lián)網(wǎng)可能就是這個(gè)機(jī)會(huì)。
做物聯(lián)網(wǎng)一定會(huì)面臨新的挑戰(zhàn),表象上的模式不同,基礎(chǔ)的模式也會(huì)不同。首先便是終端的變化,終端變得更加多元化,家里的冰箱、空調(diào)、洗衣機(jī)等,都將是智能化的。
因此,做物聯(lián)網(wǎng)一定要與硬件結(jié)合,甚至要與芯片結(jié)合。而很多設(shè)備是不插電的,這就要求同時(shí)做到低能耗。這種模式的轉(zhuǎn)變,需要許多底層的基礎(chǔ)變革來(lái)支撐。
所以2014年,為了做物聯(lián)網(wǎng),云知聲完成了兩個(gè)重要的舉措。首先是引入高通成為云知聲的戰(zhàn)略投資方。再加上內(nèi)部架構(gòu)的調(diào)整,成立了LOT事業(yè)部,占云知聲總?cè)藬?shù)的一半以上。
具體來(lái)說(shuō),我們還確定了新的產(chǎn)品形態(tài)。我們根據(jù)用戶(hù)場(chǎng)景倒推,未來(lái)用戶(hù)的形態(tài)應(yīng)該是,比如,在客廳的沙發(fā)上,自然的與空調(diào)對(duì)話,而不需要湊上去和它交流。
場(chǎng)景設(shè)定好之后,倒推需要什么樣的產(chǎn)品,里面需要哪些技術(shù)。我們第一個(gè)落地的客戶(hù)是樂(lè)視,樂(lè)視的第三代TV,也是國(guó)內(nèi)第一款做遠(yuǎn)距離自然語(yǔ)音交互的TV,2015年5月份開(kāi)始在市場(chǎng)上銷(xiāo)售。
現(xiàn)在我們的產(chǎn)品已經(jīng)被國(guó)內(nèi)幾乎所有的大廠接受,像格力、美的、海爾、海信、TCL等都是我們的客戶(hù)。而且,到目前為止,我們是國(guó)內(nèi)唯一能做到這個(gè)的廠商。
落地醫(yī)療行業(yè)
除了硬件方面的探索,另外我們希望選擇一些垂直行業(yè)進(jìn)行落地,最終我們選擇了醫(yī)療行業(yè)。
之所以選擇醫(yī)療行業(yè),首先,醫(yī)療是一個(gè)很大的市場(chǎng)。并且,目前平均每個(gè)醫(yī)生每天整理病例要花掉3.5到4個(gè)小時(shí)。我們開(kāi)發(fā)了一套系統(tǒng),醫(yī)生可以利用麥克風(fēng)輸入病例。北京的協(xié)和醫(yī)院引進(jìn)我們的系統(tǒng)后,平均每個(gè)醫(yī)生每天整理病例的時(shí)間從超過(guò)3小時(shí),降低到了1個(gè)小時(shí)。
另外,在和協(xié)和醫(yī)院院長(zhǎng)聊天的過(guò)程中,他告訴我,其實(shí)有80%的誤診是模板拷貝造成的。每個(gè)人的體質(zhì)不同,病癥不同,模板無(wú)法準(zhǔn)確的記錄病人的情況。利用我們的系統(tǒng),醫(yī)生可以因人而異的進(jìn)行病理錄入。
未來(lái)我們希望將這個(gè)產(chǎn)品集中精力和資源,把醫(yī)療行業(yè)做深、做透。目前我們的產(chǎn)品已經(jīng)進(jìn)入了包括北京協(xié)和醫(yī)院在內(nèi)的幾十家醫(yī)院。而國(guó)內(nèi)僅三甲醫(yī)院就有1500家,中醫(yī)診所四萬(wàn)多家,還有更多的非三甲醫(yī)院。我們可以看到,未來(lái)這個(gè)市場(chǎng)是非常龐大的。
另外,我們可以將這個(gè)產(chǎn)品復(fù)制到任何需要文字錄入的行業(yè),比如,司法領(lǐng)域可以,傳媒領(lǐng)域也可以。
目前云知聲的精力主要用在三個(gè)方面,一是,核心技術(shù)的儲(chǔ)備與研發(fā);二是,業(yè)務(wù)的成長(zhǎng),過(guò)去2年的商務(wù)探索,我們的產(chǎn)品形態(tài)和業(yè)務(wù)模式都相對(duì)比較清晰了,未來(lái)要做的是盡快的擴(kuò)張;三是,加強(qiáng)公司治理。
堅(jiān)持才有收獲
作為一家專(zhuān)注于物聯(lián)網(wǎng)人工智能服務(wù)的公司,自2012年6月成立以來(lái),云知聲利用機(jī)器學(xué)習(xí)平臺(tái),在語(yǔ)音技術(shù)、知識(shí)計(jì)算、大數(shù)據(jù)分析等領(lǐng)域建立了領(lǐng)先的核心技術(shù)體系。而在應(yīng)用層面,已形成「云端芯」生態(tài)閉環(huán)。
云知聲曾連續(xù)兩年入選福布斯中國(guó)最快科技成長(zhǎng)公司50強(qiáng)企業(yè),同時(shí)也是中國(guó)AI行業(yè)成長(zhǎng)最快的創(chuàng)業(yè)公司之一。
今年3月,云知聲推出的專(zhuān)門(mén)針對(duì)智能家居的AIOS@Home(人工智能操作系統(tǒng))。
此次,雷鋒網(wǎng)新智造采訪了云知聲創(chuàng)始人黃偉,跟他聊了聊過(guò)去一年云知聲的發(fā)展、現(xiàn)狀、公司今年的目標(biāo)以及他對(duì)人工智能行業(yè)前景的看法。
創(chuàng)業(yè)維艱,尤其對(duì)處在萌芽階段的AI行業(yè)更是如此。云知聲創(chuàng)始人黃偉稱(chēng)創(chuàng)業(yè)五年來(lái)每一年都如履薄冰,每一天都過(guò)得非常煎熬。
因?yàn)樽鳛橐患夜镜腃EO每天都要考慮很多事情、作出決定,每一個(gè)重大決定都有可能關(guān)乎公司未來(lái)發(fā)展方向。這不是原來(lái)他在大公司單純的作技術(shù)leader時(shí)只是負(fù)責(zé)一些工作安排所能比較的,現(xiàn)在他更多要考慮公司出路、人事和柴米油鹽等方方面面的事情,復(fù)雜程度不可同日而語(yǔ)。
在聽(tīng)起來(lái)很「高大上」的AI行業(yè),實(shí)際的發(fā)展卻困難重重。AI行業(yè)的產(chǎn)品難以落地,造成的結(jié)果是大多數(shù)AI公司都處于虧損狀態(tài)。作為一家AI創(chuàng)業(yè)公司,如果沒(méi)有其他業(yè)務(wù)反哺,就很難在像Google和Amazon這些巨頭們的夾縫之中存活下來(lái)。
而這些公司要想獲取生存空間,就需要把有限的資源投入到公司正確的戰(zhàn)略方向上,把技術(shù)做得更加商業(yè)化并持續(xù)產(chǎn)出。要做到這些并不容易,「到目前為止,我也不認(rèn)為這個(gè)問(wèn)題得到了很好的解決」,黃偉說(shuō)。
即便如此,黃偉向雷鋒網(wǎng)新智造表示2016年他的收獲還是很大,過(guò)去一年云知聲的發(fā)展讓他信心十足。
“我們從技術(shù)的迭代到產(chǎn)品模式的探索,再到商業(yè)模式的探索,去年我們算是初步走通了,至少我們把技術(shù)變成了產(chǎn)品,而且把這個(gè)產(chǎn)品形成了主營(yíng)業(yè)務(wù),這個(gè)是比較大的收獲。當(dāng)然,過(guò)程是煎熬的,AI技術(shù)現(xiàn)在還是不成熟的,把不成熟的技術(shù)變成可商業(yè)化的產(chǎn)品,這是個(gè)比較大的挑戰(zhàn)。產(chǎn)品比較新,客戶(hù)對(duì)這個(gè)是沒(méi)有統(tǒng)一標(biāo)準(zhǔn)的,你要不斷滿(mǎn)足他會(huì)對(duì)你提出的無(wú)休止訴求。今天你看到商業(yè)落地的背后,其實(shí)是經(jīng)過(guò)無(wú)數(shù)糾結(jié)和不斷地打磨后的結(jié)果,我們對(duì)落地是非常有信心的。”
「創(chuàng)業(yè)的過(guò)程中重要的是堅(jiān)持」,在信心這一點(diǎn)上,團(tuán)隊(duì)的凝聚力和戰(zhàn)斗力也給了他很大支持。只要戰(zhàn)略方向明確,他相信堅(jiān)持下去才會(huì)有所收獲。
AI的落地有諸多障礙,但技術(shù)領(lǐng)先于整個(gè)行業(yè)
在具體的業(yè)績(jī)方面,黃偉表示對(duì)去年云知聲的業(yè)績(jī)比較滿(mǎn)意。
但過(guò)程中會(huì)有一些困難,一方面是云知聲在硬件上的考慮不足,他們?cè)诠?yīng)鏈和成本等方面遭遇了一些障礙。
另一方面,產(chǎn)品標(biāo)準(zhǔn)主要由客戶(hù)主導(dǎo),這個(gè)標(biāo)準(zhǔn)要遠(yuǎn)遠(yuǎn)高于同行業(yè)其他公司,而嚴(yán)格的產(chǎn)品測(cè)試也拉長(zhǎng)了生產(chǎn)周期。
除了產(chǎn)品標(biāo)準(zhǔn)高,云知聲在技術(shù)上的優(yōu)勢(shì)也領(lǐng)先于整個(gè)行業(yè)。尤其在智能家居領(lǐng)域的技術(shù)指標(biāo)上,和其他公司對(duì)比,黃偉稱(chēng)云知聲的優(yōu)勢(shì)「幾乎是碾壓式的」。
“事實(shí)上,云知聲在AI領(lǐng)域的落地,不只是戰(zhàn)略上的提前布局,更是用行業(yè)領(lǐng)先的技術(shù)去撬動(dòng)這個(gè)市場(chǎng)?!?/p>
營(yíng)收年內(nèi)將突破9位數(shù),業(yè)務(wù)在不斷擴(kuò)張
據(jù)黃偉透露,云知聲今年的營(yíng)收預(yù)計(jì)會(huì)突破9位數(shù)。在融資方面,今年會(huì)啟動(dòng)新一輪融資。云知聲獨(dú)立IPO也會(huì)很快提上議程,他希望能在兩三年內(nèi)上市。
黃偉也透露了云知聲今年的業(yè)績(jī)目標(biāo),他表示所有的目標(biāo)都是可預(yù)期的,其中大部分都在執(zhí)行去年已有的訂單。
雷鋒網(wǎng)新智造了解到,在教育評(píng)測(cè)領(lǐng)域云知聲之前大約每天1億次的調(diào)用量,而整個(gè)平臺(tái)的調(diào)用量每天2億多次,這在國(guó)內(nèi)排在前三位;智能車(chē)載領(lǐng)域,云知聲覆蓋到了600多萬(wàn)臺(tái)終端,占據(jù)整個(gè)后裝市場(chǎng)接近70%的份額;在醫(yī)療服務(wù)方面,目前已跟全國(guó)30多家醫(yī)院簽約;而在智能家居上,云知聲也在眾多AI公司中遙遙領(lǐng)先。
“今年云知聲計(jì)劃在智能家居達(dá)到100萬(wàn)臺(tái)的出貨量,教育評(píng)測(cè)平臺(tái)調(diào)用量上達(dá)到3~4億次,醫(yī)療領(lǐng)域會(huì)新增100家醫(yī)院進(jìn)行合作,智能車(chē)載會(huì)覆蓋到1000萬(wàn)臺(tái)終端。”
黃偉告訴雷鋒網(wǎng)新智造,雖然云知聲業(yè)務(wù)在不斷擴(kuò)張,但公司目前暫時(shí)不會(huì)擴(kuò)展到其他領(lǐng)域,而是依靠品牌優(yōu)勢(shì)先在已有項(xiàng)目上進(jìn)行深度挖掘,從而擴(kuò)大市場(chǎng)占有率。在人員配備方面,公司目前200人左右,但他表示并不會(huì)貿(mào)然大規(guī)模招攬人才,人員會(huì)適度擴(kuò)張10%左右。
看到AI前景不是瞎蒙的,真正的AI絕對(duì)不止是深度學(xué)習(xí)
在2012年黃偉決定創(chuàng)業(yè)伊始,當(dāng)時(shí)APP創(chuàng)業(yè)正如火如荼,但云知聲的定位就是IOT(物聯(lián)網(wǎng))的AI服務(wù)商,從而一直堅(jiān)持到如今AI的浪潮襲來(lái)。
黃偉認(rèn)為,在現(xiàn)在看來(lái)很有遠(yuǎn)見(jiàn)的堅(jiān)持是在當(dāng)時(shí)理性而清楚地考慮后形成的結(jié)果。在當(dāng)時(shí)不被投資人看好的情況下,毅然決定做toB,因?yàn)樗宄卣J(rèn)識(shí)到這一波AI創(chuàng)業(yè)潮里有工業(yè)技術(shù)背景的并不多,而他在大學(xué)畢業(yè)后就加入了摩托羅拉等公司,他們?cè)诩夹g(shù)和市場(chǎng)上有一定了解和積累。
在2006年深度學(xué)習(xí)鼻祖Hinton教授提出這個(gè)概念之后,微軟在2011年間將它應(yīng)用到語(yǔ)音識(shí)別領(lǐng)域,當(dāng)時(shí)黃偉的師兄俞棟在意大利佛羅倫薩交流時(shí)曾告訴他這是趨勢(shì),這給了他一些啟發(fā)。
而在2012年12月28日云知聲的深度學(xué)習(xí)引擎上線后,它也隨即成為了國(guó)內(nèi)深度學(xué)習(xí)的引領(lǐng)者。
“我們看到AI的前景并不是瞎蒙的,而是我們的技術(shù)背景和對(duì)這種趨勢(shì)的敏感。”
談到AI未來(lái)的發(fā)展,黃偉悲觀和樂(lè)觀兼而有之。悲觀的一點(diǎn)是,「在AI行業(yè)有江湖騙子在欺騙大家」,黃偉對(duì)此直言不諱。他認(rèn)為人們嘗試用深度學(xué)習(xí)解釋一些東西,但大腦并不是這樣的,「人會(huì)舉一反三,可以自學(xué)習(xí),但機(jī)器不會(huì)。」
黃偉還稱(chēng)真正的AI不是深度學(xué)習(xí)或者絕對(duì)不止是深度學(xué)習(xí),強(qiáng)人工智能還離我們比較遠(yuǎn),但也不排除在我們有生之年實(shí)現(xiàn)的可能,因?yàn)樗耐黄撇还馐撬惴ㄉ系耐黄疲€包括計(jì)算能力和知識(shí)結(jié)構(gòu)上的突破。
另一方面,黃偉的樂(lè)觀在于對(duì)AI行業(yè)里面一些良心企業(yè)的信心,他認(rèn)為這些公司會(huì)取得技術(shù)突破,從而帶動(dòng)和加快AI的發(fā)展進(jìn)程。在技術(shù)的迭代上,他的態(tài)度較為理性。
“跟機(jī)器人談戀愛(ài)這是很難實(shí)現(xiàn)的,但讓機(jī)器像助理一樣解決問(wèn)題,這在三年之內(nèi)很容易實(shí)現(xiàn)。估高(AI)預(yù)期的目標(biāo)我是比較悲觀的,但很多可執(zhí)行的方向我認(rèn)為比我們想象的可能都要快。”
-
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
38文章
1712瀏覽量
112503 -
云知聲
+關(guān)注
關(guān)注
0文章
163瀏覽量
8359 -
黃偉
+關(guān)注
關(guān)注
0文章
3瀏覽量
1747
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論