專訪科大訊飛博士對于人工智能的看法
大?。?/span>0.6 MB 人氣: 2017-10-09 需要積分:1
標簽:人工智能(227935)
步入“能聽會說”的智能世界 專訪科大訊飛王智國博士2016-07-22 15:16前言:科大訊飛是國內頂尖智能語音與人工智能公司,在人工智能技術產品化方面有著成功的商業(yè)實踐。王智國先生分享了科大訊飛在技術研發(fā)、人才培養(yǎng)方面的最佳實踐,但身為人工智能專家的他預測,未來二十年內機器還不會全面超越人類。
科大訊飛,這家成立于1999年的高科技公司,在技術產品化方面有著成功的商業(yè)實踐。它一端依托國內頂尖研究資源,另一端聯(lián)結著成千上萬的產業(yè)應用和企業(yè)客戶,這一獨特定位使其技術創(chuàng)新能快速落地、實現(xiàn)產品化,創(chuàng)造出經濟價值。為了一探科大訊飛技術產品化的秘訣,《展望》雜志專訪了科大訊飛聯(lián)合創(chuàng)始人、訊飛研究院副院長王智國先生。此外,作為人工智能領域的專家,王智國先生還深入淺出地解釋了弱人工智能和強人工智能的區(qū)別,并預測,未來二十年內機器還不會全面超過人類。
“從產品中來到產品中去”
《展望》:科大訊飛在技術產業(yè)化方面有著非常好的實踐,而訊飛研究院又是科大訊飛基礎技術研發(fā)中樞。請介紹一下訊飛研究院的定位及作用。
王智國:訊飛研究院是科大訊飛的核心部門,因為科大訊飛從創(chuàng)立伊始就希望做源頭技術創(chuàng)新,創(chuàng)新有很多種,比如商業(yè)模式創(chuàng)新、產品創(chuàng)新,但是訊飛的定位是依靠核心技術創(chuàng)新,具體而言就是通過人工智能技術創(chuàng)新來培育出新的產品和行業(yè),或是改造現(xiàn)有行業(yè),這就是訊飛的基因。
圍繞這樣一個愿景,我們要做一個很長的產業(yè)鏈:首先要有源頭技術,然后把源頭技術跟應用對接起來,跟周圍的產業(yè)合作伙伴對接起來,形成一個生態(tài)圈,真正用人工智能去改造一個行業(yè),讓這個行業(yè)變得更美好。而訊飛研究院承擔著核心技術創(chuàng)新的重任,可以把它比喻為整個集團的創(chuàng)新發(fā)動機。
《展望》:為什么科大訊飛一開始就定位于源頭技術創(chuàng)新?
王智國:一個公司的基因跟創(chuàng)始人有關,最高創(chuàng)始人的理念好像一顆種子,無論公司后來如何枝繁葉茂,它的種子決定了它的基因??拼笥嶏w創(chuàng)始人、現(xiàn)任董事長劉慶峰原本是一個非常優(yōu)秀的科研人才,1998年他在科大語音評測實驗室讀碩士的時候就憑借著
KD863語音合成系統(tǒng)拿到了國家863語音合成評測比賽的冠軍,并且是業(yè)界首次把合成系統(tǒng)的自然度做到了3.0分,觸及了可應用的門檻。碩士畢業(yè)時,他選擇了帶領師弟們進行創(chuàng)業(yè),他和他的團隊堅信在中國可以基于核心技術創(chuàng)新做出一番事業(yè),當時科大訊飛成立提出的口號是做中國的“貝爾實驗室”,意思是向世界最高技術水平看齊。
《展望》:請介紹一下科大訊飛的核心技術及其最新研究進展。
王智國:科大訊飛過去的核心技術立足于語音領域,讓機器能聽會說,現(xiàn)在擴展到了人工智能領域,讓機器還能理解會思考。人工智能分為感知智能和認知智能兩個階段。感知智能就是人的感官,包括語音和圖像;認知智能涉及理解能力,主要是自然語言理解相關的技術。
感知智能方面,科大訊飛的語音合成和語音識別等技術都做到了國際領先。認知智能方面,科大訊飛的口語翻譯技術在IWSLT2014、NIST2015國際口語翻譯大賽中連續(xù)斬獲冠軍,目前科大訊飛牽頭研發(fā)的863類人答題高考機器人項目是認知智能領域的一項難題,雖然這個項目難度非常高,但在技術研發(fā)過程中,我們也有一些應用落地。比如要實現(xiàn)高考答題,機器人首先要能理解題目,能看懂文字的內容和邏輯,目前這個技術已經實現(xiàn)了,基于這項技術我們開發(fā)出閱卷機器人,可以為中英文作文題進行評分。
過去,一篇作文會請兩個專家評分,現(xiàn)在只需要一位專家來評分,另一個由機器來評。如果出現(xiàn)專家評分與機器評分差距過大的情況,再找第三方專家完全中立的情況下評閱,結果在幾千份評測結果不一致的試卷中,第三方專家評分接近機器的大概占了85%,接近另外一位人工專家的僅占到15%,可以說機器評分的準確率已經超過人工專家了。目前這一技術已經具備大規(guī)模應用的基礎了。
《展望》:這是一個技術成功轉化為商業(yè)應用的案例。請談一下技術產品化的過程及其難點,在這個過程中是用技術去找應用還是反之?
王智國:技術產品化是雙輪驅動,剛開始做一個技術,可能還想不到如何去應用,但在技術研發(fā)過程中我們會逐漸思考它潛在的應用方向,然后技術的應用就會明朗化。另一方面,當我們開發(fā)一個應用的時候,可能會碰到很多難題,這會反推技術研發(fā)去解決這些難題。
技術和應用是辯證關系,如果純粹看重技術,只盯著某個技術點去做,最后很可能變成“paperwork”。目前中國的論文數(shù)量在全球都數(shù)一數(shù)二,但真正能夠轉化為實際生產力的很少。而如果只看應用不考慮技術,那么應用有可能太想當然,沒有考慮技術發(fā)展的規(guī)律性,如果技術上實現(xiàn)不了,那應用再炫也是無源之水、無本之木。
我們做的技術研究跟一般的paperwork有很大不同。在技術產品化過程中最關鍵、也是最難的一環(huán)是對問題的定義。我們一定要找到現(xiàn)實中的應用案例,同時根據(jù)對技術發(fā)展規(guī)律的深刻理解,把這個問題定義清楚。比如說作文評分,中間利用到掃描、光學字符識別技術,識別完以后組成作文,再根據(jù)很多維度對它進行打分,這就需要對問題進行定義,比如怎么提高識別率,如何提高打分準確性。前面的光學掃描識別再準,也會有2%到3%的錯誤,2%到3%的錯誤如何兼容等等,能夠把這些問題定義清楚非常關鍵。訊飛研究院有一個口號“從產品中來到產品中去”。我們做研究的人一定要很敏銳地看到,這個產品哪些地方是值得用核心技術去改造的,如果這個不清楚的話,就很難。
“漣漪效應”推動迭代創(chuàng)新
《展望》:科大訊飛一頭連接了國內研究機構、高校;另一頭連接著客戶群,能否介紹一下科大訊飛這一生態(tài)鏈中的角色?
王智國:科大訊飛承擔著橋梁作用。因為有好多技術秀得很酷,但是應用起來有很多坑,這時候就需要一些真正很懂技術的人,因為他們既了解技術本身是怎么回事也知道如何去迭代優(yōu)化。技術要真正實現(xiàn)實用化需要一個過程,我們稱之為“漣漪效應”。這是訊飛研究院做研究的另外一個理念,即用大數(shù)據(jù)的漣漪效應來做研發(fā)。
由于移動互聯(lián)網很發(fā)達,當我們做出來一個技術,一個產品之后,并不需要特別完美,只要能夠達到一定的使用門檻就可以給客戶用。比如語言識別技術剛推出時識別率只有60%多,但還是會有用戶去使用。產品推出去以后,只要有客戶在用就會貢獻數(shù)據(jù),就可以提出反饋意見,而研發(fā)人員可以掌握客戶使用時的一手數(shù)據(jù),然后基于客戶反饋進行迭代優(yōu)化。
如果沒有漣漪效應,研發(fā)就會變成閉門造車。好多人都有一個誤區(qū),認為必須要把產品做到非常完美之后才給用戶用,現(xiàn)在其實完全不是這樣的,移動互聯(lián)網的開放性使得客戶獲取成本很低。當產品尚不成熟的時候,可以選擇免費給客戶使用,用戶隨時可以卸載。
再回到“漣漪效應”上來,具體指什么?當一滴水滴下去以后,第一個波紋影響面比較小,它的使用范圍、使用場景也比較窄,但第一個波紋完成后,把這一批數(shù)據(jù)收上來,技術人員就可以做產品升級,到了第二波的時候它的應用場景和應用范圍就會擴大,比如原來有一萬用戶,擴大到第二個圈就會有10萬用戶,新增的這9萬用戶,他們看到的產品和特性會更好。隨著漣漪效應越來越大,到一定程度之后,產品性能和用戶體驗已經變得非常好了,比如說當擴大到第1000萬個用戶的時候,產品會非常好用,但前面已經有999萬個用戶都為此做出了貢獻,如果閉門造車,技術人員永遠做不到這個程度。
《展望》:從第一個圈到第二圈的反饋周期是多長時間?
王智國:一般看產品迭代速度,其實現(xiàn)在講究越快越好,幾個月就搞一個。漣漪效應的創(chuàng)新能力雖然不難理解,但是要真正具備這樣的能力并不容易,坦白地說,目前很多實驗室和大學都不具備這一能力,這就是我們的優(yōu)勢所在,我們不僅有自身的核心技術,還具備整合其他技術的能力,針對合作伙伴的技術,我們能夠通過類似漣漪效應這樣的創(chuàng)新條件,幫助他們去做迭代和產品化。
人工智能+
《展望》:凱文?凱利(Kevin Kelly)曾預言,未來人工智能技術會變成一個云服務,然后任何東西都可以與之連接,成為人工智能+。作為這一領域的專家,您如何看?
王智國:人工智能未來能夠改造各行各業(yè),就像目前的移動互聯(lián)網一樣。科技創(chuàng)新有兩種做法,一種是看準一個垂直行業(yè),深入進去,把這個行業(yè)全整合了,比如訊飛在教育行業(yè)就是這么做的,訊飛在教育方面除了技術之外還有很多優(yōu)勢資源,能夠打得很通。
其他很多行業(yè)怎么改造呢?就需要第二種做法,即把技術用開放平臺提供出來,然后行業(yè)內愿意使用相關技術的有識之士很容易就能跟我們對接起來,這就是訊飛人工智能開放平臺所承擔的角色,一旦成功的話,其影響會非常深遠,因為一個行業(yè)的創(chuàng)新必須是行業(yè)積累與應用技術的結合,單談技術其實是沒用的,技術必須要轉化成生產力。
具體合作形式比較多,實際上通過這個開放平臺,所有的技術就有了調用接口,合作伙伴的應用可以集成我們的技術,集成我們的接口,把我們人工智能的云特性、感知特性、認知特性集成到他們的應用里面去,現(xiàn)在我們已經有11萬多家合作伙伴。
《展望》:對合作伙伴有無門檻要求?
王智國:沒有門檻,但是實際上我們無法滿足所有的定制化開發(fā)需求,即使一個人對接一個合作伙伴,也需要11萬人來對接,這并不現(xiàn)實。所以我們支持企業(yè)當中共性的應用。一定要把最具共性化的東西定義出來、設計出來,至于個性化的合作就有一個遴選的過程,如果合作伙伴實力非常強,需要個性化技術把行業(yè)做透的話,我們也不是一概拒絕,具體問題具體分析。目前我們在銀行、電信、汽車、醫(yī)療、建筑等行業(yè)都有這種實力很強的合作伙伴。
《展望》:人工智能技術會對現(xiàn)有行業(yè)帶來顛覆性影響嗎?比如訊飛聽見對會議速記行業(yè)帶來的沖擊。
王智國:人工智能技術會改造一些行業(yè),但我認為不是替代關系,而是產業(yè)升級。比如速記行業(yè),其實是機器去干臟活累活,人去干點金的工作。機器現(xiàn)在還做不到什么呢?它可以把人說的話轉換成文字,但把文字變成一篇邏輯性很強的文章還是需要人的智慧。機器能夠幫人們提高工作效率,讓人集中在創(chuàng)造性工作上。從產業(yè)層面來看,就是產業(yè)升級,往高端走,低端的、適合機器干的工作交給機器去完成,充分發(fā)揮人的主觀能力和創(chuàng)造力。
人工智能一個方向是跟人相結合,取代一部分低端重復性工作以及部分腦力工作,比如說閱卷,其實這些都屬于弱人工智能,那強人工智能是什么呢?比如大人教小孩認東西,其實是一個很復雜的過程,大人跟小孩講這是一只貓,或者這是一只小狗,教他一兩次之后,日后他不論見到各種體型、各種毛色的貓和狗都能認出來。但是機器人與人的認知過程不同,根據(jù)現(xiàn)在的技術水平,機器需要找盡可能多的貓、狗照片,然后收集足夠多貓和狗的信息,今后再出現(xiàn)一只新貓時,它認出這是只貓的概率就會提高,這就是利用深度神經網絡,把各種各樣的大數(shù)據(jù)給機器學習的過程,這也是現(xiàn)在人工智能的一些主流方法,但這跟人類智能不一樣,還屬于弱人工智能。
《展望》:未來有可能出現(xiàn)強人工智能嗎?或者機器超過人的情況?
王智國:人是一個綜合體,其實如果從某個專業(yè)性的角度來看,機器很多方面已經超過人類了,因為機器不知疲倦,沒有情緒,比如在下圍棋、閱卷方面其實已經超過人類了。人會受到自己情感因素的干擾,會有盲點,但是機器可以持續(xù)改進,而人的盲點有時很難改進。機器一旦出現(xiàn)錯誤,就讓它學那個東西,把這個點迭代進去,基本上就能夠實現(xiàn)全覆蓋。但是,作為一個綜合體的話,人有運動能力、協(xié)調能力,最關鍵還有靈感、意識,這些東西至少近二十年內機器很難超過人,大家不用擔心一些科幻電影上的情節(jié),目前我們發(fā)展人工智能的目的是讓機器更好地服務于人類,讓人類的生活更美好。
《展望》:現(xiàn)在的企業(yè)家需要在人工智能方面做怎樣的準備和布局?
王智國:作為一個有追求的企業(yè),還是要重視源頭技術創(chuàng)新。當企業(yè)賺了很多利潤以后,應該回頭看看業(yè)界的風口在哪里,特別是技術驅動型的升級在哪里。人工智能不能包打天下,每個行業(yè)都有這種源頭性、革命性的技術,企業(yè)首先要對這些技術趨勢保持敏感,特別是領導者要站得高、望得遠,了解業(yè)界大勢,然后再看自己的企業(yè)有沒有可能做這樣的事情。
《展望》:能否把人工智能理解為賦能性技術,需要跟行業(yè)性技術結合起來?
王智國:對,人工智能是賦能性技術,這個定位還是比較準確的。沒有單獨的人工智能行業(yè),人工智能一定是跟傳統(tǒng)行業(yè)結合在一起,比如說人工智能跟客服、醫(yī)療、教育、家電行業(yè)結合在一起。而且,人工智能經常需要和其他技術結合在一起才能產生新的革命性應用。例如現(xiàn)在VR很熱,3D或者是全息技術,跟人工智能的自然交互相結合,就有可能產生出完全不同的產品體驗,改造我們的電影、游戲產業(yè)等。只有跟行業(yè)性技術真正融合在一起,才能真正誕生出一個革命性的產品,優(yōu)秀的企業(yè)要追求這樣的東西。
“選、用、育、留”的人才迭代法
《展望》:對于高科技企業(yè)而言,人才是保持企業(yè)持續(xù)競爭力的關鍵,請介紹一下科大訊飛的人才培養(yǎng)戰(zhàn)略。
王智國:企業(yè)一定要有人才庫,背靠幾個大學很關鍵。具體到訊飛,合肥這里有中國科技大學、合肥工業(yè)大學、安徽大學等高等學府。企業(yè)與大學的合作不能流于形式,而是要深入進去。在訊飛,我們有一套學生的選、用、育、留機制,稱之為“人才迭代法”。
我們首先會篩選出一批學生,然后從訊飛的產品應用角度或未來發(fā)展方向出發(fā),與老師在一些前瞻性科研項目上展開合作,選出來的這批學生也會參與到研究中來,這個過程中,他們個人能力和研究水平都會得到鍛煉和提高,這個過程是“育”。當培育有了成果以后,我們覺得某個學生各方面都很不錯,就要對他進行“用和留”。經過與老師協(xié)商,我們會讓學生來公司實習,承擔比較重要的項目,與此同時,也會跟他深入去聊未來的追求和價值觀,特別是他未來的發(fā)展方向是否跟訊飛一致。如果這些都沒有問題后,我們會用訊飛配套的激勵措施,比如期權、人才金等把他留下來,這就是完整的人才“選、用、育、留”機制,這個機制能保證源源不斷的新鮮血液流到我們的研究隊伍中來。
《展望》:科大訊飛的科研人員基本都是這個途徑招聘進來的嗎?有社會招聘嗎?
王智國:也有,但是通過
“選、用、育、留”機制招聘過來的人才,成才效率明顯要高。因為他們一開始就有科大訊飛的基因,而通過社會招聘的話,短短兩小時的面試,很難完全了解一個人。通過人才培養(yǎng)機制,大家已經有過兩三年的長期合作,能把一個人了解得非常透。而訊飛又是非常強調價值觀的企業(yè),致力于尋找志同道合的人才加盟。
其實,無論是與學校的研究合作,還是人才的“選、用、育、留”,最終都是雙贏,既為企業(yè)源源不斷提供高質量的人才,也在幫學校培養(yǎng)復合型人才。這批研究人才即使未來不進入科大訊飛,進入其他科研機構或者企業(yè)也會非常優(yōu)秀。因為他們能夠用正確的方法做有用的研究,而不僅僅是發(fā)表論文,他們是經過實實在在的行業(yè)實訓的研究人才,將來必能成為業(yè)界棟梁。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
專訪科大訊飛博士對于人工智能的看法下載
相關電子資料下載
- 如何創(chuàng)建FPGA控制的機器人手臂 49
- 怎樣延長半導體元器件的壽命呢? 181
- 智能時代的三大核心技術 57
- 研華推出EPC-B3000系列嵌入式工控機,搭載先進X86架構CPU,助力邊緣人工智能應用 91
- 探索可觀測性未來:基調聽云產品VP陳靖華揭秘新一代可觀測性工具 129
- 異構時代:CPU與GPU的發(fā)展演變 143
- RISC-V要顛覆GPU嗎? 210
- 韓國半導體10月早期出口數(shù)據(jù)一年來首次回暖,工信部推動通用人工智能與物聯(lián) 193
- AI可在數(shù)秒鐘內成功設計出行走機器人 28
- 因「盒」而來︱英碼科技「深元」的AI重構與工具革命 58