這次A.I.浪潮看著眼花繚亂但實(shí)際上只有四個(gè)可能的落地方向:
一是語音、語義的突破導(dǎo)致語音交互最終真的成為可能;
二是計(jì)算機(jī)視覺的突破導(dǎo)致AR這樣的混合了現(xiàn)實(shí)空間和虛擬空間的顯示方式;
三是計(jì)算機(jī)視覺的突破讓自動(dòng)化得以升級(jí),出現(xiàn)自動(dòng)駕駛汽車、機(jī)器人這樣的高度自動(dòng)化產(chǎn)品;
四是機(jī)器學(xué)習(xí)提供了新的數(shù)據(jù)處理方式。(最后一種方式的基本創(chuàng)業(yè)模式參見此前文章:谷歌DeepMind剛做的兩件事所帶來的AI創(chuàng)業(yè)啟示)
前三種的創(chuàng)業(yè)模式又可以分為:產(chǎn)品系,從軟到硬以及從硬到軟。這篇文章探討這三種模式的優(yōu)劣。
產(chǎn)品系
我們耳熟能詳?shù)?a target="_blank">人工智能創(chuàng)業(yè)公司基本上是產(chǎn)品系,比如國內(nèi)的出門問問、Rokid機(jī)器人,國外的Jibo、Savioke、Knightscope、Meta等。這類創(chuàng)業(yè)公司的根本特征是嘗試借用人工智能上的技術(shù)突破,打造具有新奇體驗(yàn)的新產(chǎn)品(帶語音交互或者AR等),并跑出漂亮的銷售曲線。
那什么是漂亮的銷售曲線?它大概會(huì)像下面這樣:
漂亮的銷售曲線意味著新產(chǎn)品的市場一旦啟動(dòng),那在之后的三年里,銷售曲線是倍增(可能高于2倍)的,而不是每年增加百分之十這類緩慢遞增。
反過來講這意味著這些創(chuàng)業(yè)公司的決勝期實(shí)際上只有三年。不管你之前做了多少,一旦你錯(cuò)過這三年,那所有努力工作可能就變得沒有價(jià)值。
那多久市場才會(huì)從早期市場變得真的啟動(dòng)呢?這沒人知道,趨勢是可以用邏輯推演判斷的,但具體的啟動(dòng)時(shí)間點(diǎn)其實(shí)都是瞎猜??赡苁?年,也可能是2年,甚至5年,10年。
這樣一來所有產(chǎn)品系的ai創(chuàng)業(yè)者們要把握的關(guān)鍵點(diǎn)就只有兩個(gè):
在一個(gè)不可清晰預(yù)測長度的預(yù)熱期做好充足的準(zhǔn)備,包括產(chǎn)品、銷售渠道、生產(chǎn)制造能力等。
2.一旦市場啟動(dòng),那跑出上面那種銷售曲線。
如果第一點(diǎn)沒做好,那就是老羅和他的錘子科技,如果第二點(diǎn)沒做好那其實(shí)會(huì)像某些大企業(yè),比如摩托羅拉,什么都不缺但就是干不成事。如果兩點(diǎn)都做好了那就必是新的獨(dú)角獸企業(yè)。
這里必須強(qiáng)調(diào)的是達(dá)成上述兩個(gè)目標(biāo)時(shí)真正重要的是產(chǎn)品體驗(yàn)而不是技術(shù)的先進(jìn)性,也就是說這種模式更需要喬布斯這樣能用好技術(shù)的人而不是謝爾蓋布林這樣能創(chuàng)造技術(shù)的人。
哪怕所有技術(shù)都是別人的,但只要不影響用戶體驗(yàn),那其實(shí)關(guān)聯(lián)不大,但實(shí)際上由于這一代AI的創(chuàng)業(yè)者都非常聰明和野心勃勃,他們都不想純粹的變成組裝型企業(yè),所以這類創(chuàng)業(yè)公司通常會(huì)在初期就嘗試卡住技術(shù)上的某幾個(gè)關(guān)鍵點(diǎn),比如ASR等。這里面比較極致的是出門問問,根據(jù)各種信息來看,出門問問全線打造了自己的ASR、NLU甚至搜索。
這就導(dǎo)致產(chǎn)品系創(chuàng)業(yè)很像爬珠穆朗瑪峰的北坡,成了必是一番大事業(yè),但成功非常艱難。高風(fēng)險(xiǎn)來自于這樣兩個(gè)方面:
預(yù)熱期的時(shí)長高度不可預(yù)測。拋開AI不論,到現(xiàn)在為止這個(gè)模式下里國內(nèi)比較成功的一家企業(yè)是大疆。大疆的銷售開始起飛大約是2013年(暫時(shí)沒有官方數(shù)據(jù),只有Dronelife的猜測數(shù)據(jù))。
那大疆哪一年成立的呢?2006年,也就是說大疆等待產(chǎn)品起飛等待了差不多7年。
2.成本因想卡住關(guān)鍵技術(shù)點(diǎn)而大幅增加。前面提到過,新一批創(chuàng)業(yè)者們通常并不想自己成為單純的組裝和銷售公司,所以會(huì)在早期就把握住幾個(gè)關(guān)鍵的技術(shù)點(diǎn)。這對(duì)產(chǎn)品起量后企業(yè)發(fā)展有利,沒有這些點(diǎn)上的控制權(quán)即使成了也可能變成現(xiàn)在的某類PC和手機(jī)企業(yè)。
這未必不對(duì),畢竟亞馬遜為了做Echo也收購了三家公司完整搭建自己的技術(shù)體系,但無疑,這對(duì)創(chuàng)業(yè)公司而言會(huì)顯著增加成本和風(fēng)險(xiǎn),會(huì)導(dǎo)致企業(yè)長期處在收入沒著落但支出比較高的狀態(tài)。
從硬到軟
不管從硬到軟還是從軟到硬,說的都是公司本身不做產(chǎn)品、而是為做產(chǎn)品的公司提供服務(wù)。從硬到軟說的是公司認(rèn)為公司優(yōu)勢必須從前端(比如麥克風(fēng)陣列)開始,延伸到后端(云端)。
從軟到硬則是說公司認(rèn)為云是智能的核心,前端優(yōu)先級(jí)較低。當(dāng)然我們可以講最好兩端都強(qiáng),但創(chuàng)業(yè)公司由于資源、創(chuàng)始人背景限制通常只能先強(qiáng)調(diào)某一部分。這兩種模式又可以分別落在語音交互與計(jì)算機(jī)視覺上,但由于很難雜在一起說的清楚,所以下面會(huì)拿語音交互這個(gè)方向做例子先把這兩種模式說清楚,最后再總的分析下這兩種模式。
國內(nèi)語音交互人工智能創(chuàng)業(yè)公司里走從硬到軟賽道的公司還比較稀少,最典型的應(yīng)該是聲智科技(這公司是我Portfolio公司,所以比較了解),聲智科技是從最底層的聲學(xué)陣列開始,先做噪聲抑制、混響消除、回聲抵消等,反過來再考慮上面的ASR等,與云知聲等的道路正相反。
這種模式的好處是可以站到產(chǎn)業(yè)鏈的最前端,容易落地,是數(shù)據(jù)的必經(jīng)之路。而數(shù)據(jù)本身是未來ASR甚至NLU的核心驅(qū)動(dòng)力,所以后勁比較足。
壞處是短期需要用硬件獲取客戶,并且需要組織硬件的生產(chǎn),需要較多的啟動(dòng)資金。
可以講產(chǎn)品系創(chuàng)業(yè)公司的成功事實(shí)上有兩個(gè)外部要求:一是趨勢要來,其次是產(chǎn)品要經(jīng)得起市場檢驗(yàn)。從硬到軟的公司也有兩個(gè)外部要求,一是趨勢要來,二是要技術(shù)過硬,有價(jià)格優(yōu)勢。2B的公司所面臨的客戶通常非常理性,很多花哨營銷反倒是作用不大。
從軟到硬
語音交互上從軟到硬比較典型的創(chuàng)業(yè)企業(yè)則是云知聲,這種模式選擇和公司定位甚至從名字上就可以看得出來。
從軟到硬的好處是更容易覆蓋已有的成熟計(jì)算平臺(tái),比如所有的 App 都需要一個(gè)自己的Siri,那云知聲這樣的企業(yè)只要做好技術(shù)壁壘,等著攜程、今日頭條上門就行了。這個(gè)方向上主要的挑戰(zhàn)在于要和大公司(比如百度和訊飛)直接競爭。我們這篇文章主要關(guān)注的是新硬件產(chǎn)品上落地,所以這點(diǎn)不再展開。
壞處則是在新硬件產(chǎn)品(Echo、汽車、機(jī)器人、AR等)上很難落地,因?yàn)闉榱嗽谛掠布a(chǎn)品上落地,中間必須加入陣列那一層,否則效果會(huì)很差。而一旦無法落地,其技術(shù)優(yōu)勢就很容易被突破。
語音識(shí)別的精度骨子里是數(shù)據(jù)驅(qū)動(dòng)的,但顯然不做陣列等硬件,你沒法落地,沒法落地就沒有數(shù)據(jù),也就很難獲得數(shù)據(jù)、技術(shù)、精度、場景上的正反饋,也就不容易解決真實(shí)環(huán)境的語音識(shí)別精度問題。
云知聲等顯然認(rèn)識(shí)到了這一點(diǎn),所以也在積極往這一方向擴(kuò)展。這時(shí)候通常會(huì)碰到軟件企業(yè)跨界做硬件的一般性問題,比如供應(yīng)鏈侃價(jià)搞不定會(huì)導(dǎo)致同樣的產(chǎn)品成本會(huì)高個(gè)百分之幾十等。
路線差異起源于對(duì)計(jì)算架構(gòu)的認(rèn)知
上面拿語音語義的企業(yè)做了個(gè)例子,但事實(shí)上在計(jì)算機(jī)視覺上同樣成立,只不過細(xì)節(jié)會(huì)有差異,比如Movidus的芯片可能在端上就把圖像識(shí)別處理完了,而不需要像麥克風(fēng)陣列那樣自己處理后再把結(jié)果傳到云端。這種模式選擇背后隱含的共通的東西是對(duì)計(jì)算架構(gòu)認(rèn)知和假設(shè)。
到現(xiàn)在為止這種假設(shè)和認(rèn)知一共有三種:
一種是為保證體驗(yàn)(速度等)端始終要扮演重要的角色,云用來輔助端完成計(jì)算。所有我們用的硬件產(chǎn)品:手機(jī)、Pad等基本都是這種模式;
一種是計(jì)算應(yīng)該大部分發(fā)生在云上。Google主推的ChromeBook是這種模式,以前銀行里的終端也是這種模式;
一種是正在興起的傳感器+Fog computing+云架構(gòu)。這種可以看成是第一種架構(gòu)的擴(kuò)展,比如智能家居里所有的設(shè)備都直接連云上計(jì)算成本太高,那就不如家里有一個(gè)中樞先把能處理的處理了(比如天冷開空調(diào),下雨關(guān)窗戶就不傳到云端了),實(shí)在不行的再連云。
前兩種架構(gòu)在現(xiàn)實(shí)里經(jīng)常會(huì)發(fā)生PK,并且導(dǎo)致很嚴(yán)重的后果,下面說兩個(gè)例子:
一次PK發(fā)生在PC上,那時(shí)候Oracle等嘗試做的Network Computer骨子里的含義就是把各種計(jì)算轉(zhuǎn)移到后端,讓前端就變成輸入輸出設(shè)備。這種嘗試顯然失敗的慘不忍睹,但有意思的是20幾年后當(dāng)PC這個(gè)品類足夠成熟后仍然走這條路線的Chromebook卻看到了些成功的曙光。
一次發(fā)生在Native APP和HTML5上,當(dāng)時(shí)Facebook是很希望主推HTML5,那時(shí)候扎克伯格想用Web App來打破iOS和Anroid的壟斷,但實(shí)際上Facebook差點(diǎn)死在在這個(gè)選擇上,因?yàn)檫@選擇幾乎讓它錯(cuò)過移動(dòng)互聯(lián)網(wǎng),后續(xù)的Instagram與WhatsApp大額收購很可能與這種錯(cuò)誤路線的選擇有關(guān)。
我個(gè)人對(duì)此的基本認(rèn)知是:對(duì)于新品類硬件產(chǎn)品剛出現(xiàn)的時(shí)候,首先是端要足夠強(qiáng)大,把體驗(yàn)做到極致,隨著應(yīng)用、帶寬等的逐步發(fā)展,那端上的計(jì)算量可能會(huì)轉(zhuǎn)移到云上,因?yàn)槟菚?huì)有成本優(yōu)勢,但這需要一個(gè)漫長的過程,PC走了20幾年剛看到這可能性。
如果這是對(duì)的,那意味著在新硬件產(chǎn)品上,首先成立的會(huì)是從硬到軟的模式,而不是從軟到硬。
AR、自動(dòng)駕駛等都和前面說的語音交互一樣要先解決終端上的問題,讓產(chǎn)品能夠快速準(zhǔn)確的進(jìn)行實(shí)時(shí)響應(yīng),確保用戶體驗(yàn),之后再談其它。也可以換個(gè)角度來考慮這問題,在新產(chǎn)品上更可能是先有iPhone才有Android手機(jī),而不是掉過來,因?yàn)閕Phone給用戶的沖擊更強(qiáng),更容易樹立起一個(gè)新的品類,但iPhone不可能用HTML做出來的。
但確實(shí)從硬到軟的模式對(duì)創(chuàng)始人提出更復(fù)雜的要求,比如聲智科技的陳孝良首先是聲學(xué)專家,同時(shí)也是語音識(shí)別專家所以才會(huì)選擇這種從前端開始,結(jié)合后端的路線。而云知聲的CTO是計(jì)算機(jī)科學(xué)家,更擅長的是算法,深度學(xué)習(xí),所以先天上就會(huì)傾向于用數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)算法和大幅增長的計(jì)算能力(從云計(jì)算到HPC)來解決問題。轉(zhuǎn)到重視端的這條路上來同時(shí)需要跨越思維和技術(shù)壁壘,也許不太容易。
小結(jié)
下面這兩件事情是高度確定的:
1.AI的浪潮來了。
2.一定會(huì)有新的硬件產(chǎn)品出現(xiàn)。
所以一定會(huì)有新的獨(dú)角獸從產(chǎn)品系中誕生。
如果你認(rèn)為新硬件產(chǎn)品必須端的強(qiáng)大做支持,確保體驗(yàn),而新品類的基本出現(xiàn)次序也是先有 iPhone,才有 Android,那很可能你會(huì)同意有獨(dú)角獸會(huì)先從從硬到軟的模式里出現(xiàn)。(我曾經(jīng)和很多人講過這些觀點(diǎn),但很巧的是直到最近才碰到一個(gè)做投資的美女和我認(rèn)知非常一致,不會(huì)說我是抄襲她觀點(diǎn)吧。。。。。。)
必須強(qiáng)調(diào)的是這篇文章里主要探討的是新的硬件產(chǎn)品下的可能狀態(tài),數(shù)據(jù)分析類不在這篇文章覆蓋范圍內(nèi)(數(shù)據(jù)分析是純粹的云端計(jì)算),主要面向現(xiàn)有平臺(tái)(手機(jī)、Pad等)的產(chǎn)品或服務(wù)也不在這文章覆蓋的范圍內(nèi)。
評(píng)論
查看更多